基于双层动态网络的语言竞争微观仿真模型

2022-06-24 10:01王志萍毕贵红张寿明曾振华
计算机应用与软件 2022年4期
关键词:弱势双语词汇

王志萍 毕贵红 张寿明* 曾振华

1(昆明理工大学信息工程与自动化学院 云南 昆明 650500) 2(昆明理工大学电力工程学院 云南 昆明 650500) 3(中国人民银行岳阳市中心支行 湖南 岳阳 414000)

0 引 言

目前,96%的人口使用大约4%的语言,而25%的语言使用者不到1 000人[1]。此外,语言学家估计,除非目前的趋势发生变化,否则到本世纪末,目前所说的约6 000种语言中有90%可能会面临濒危甚至消亡[2]。

通过构建语言演化的模型来研究语言濒危和调控的机理是目前常用的方法,目前研究语言演化问题计算模型主要有宏观建模和微观建模两种方法。Abrams等[3]提出基于微分方程的系统动力学方程(AS模型)描述两种语言竞争与演化问题,语言竞争模型的动力学分析认为两种语言共存不是一种系统演化的稳定状态。Stauffer等[4]给出了一种基于agent的微观仿真模型(SAS模型),考虑了d维网络上的系统演化特征,验证了微观仿真模型可以得到与宏观建模方法相同的动力学特性。Castelló等[5]在Stauffer模型的基础上进行了一定的扩展(CAS模型),模型引入双语者agent和小世界网络结构。研究认为小世界网络结构和双语者的引入并不能保证语言竞争系统中语言的多样性,反而加速了语言单一化进程。Minett等[6]同样给出了考虑双语者和社会网络的微观AS改进模型(MWAS模型),模型中的社会网络结构包括全连接网络和局域世界网络两种,并利用语言地位作为调控政策措施来分析系统演化趋势。曾振华等[7]在CAS模型和MWAS模型的基础上引入语言的内部词汇结构和社会圈子动态网络,给出一种新的动态微观语言竞争传播与政策调控的社会仿真模型(ZAS模型)。研究了在不同社会开放程度等条件下语言地位作为调控政策的动力学特性。

上述这些研究使语言竞争的动力学机制越来越完善,更接近实际,但是与社会语言学家的理论研究和实际调查研究还有较大的脱节,甚至有矛盾,主要体现在以下几个方面:(1) 社会网络的影响。实际研究表明,强连接关系社会网络有利于弱势语言的保存,弱连接关系的社会网络不利于弱势语言的保存[8]。由于交通和通信的便利、城镇化的加速,人们的社会网络结构也在发生着变化,跨区域远距离流动和通信联系成为常态,人们的社会关系范围扩大、强度弱化,这样的社会网络对语言保持提出了重要挑战,构建的语言竞争网络社会网络模型应该考虑弱连接关系。(2) 语言地位和语言态度的影响。人们倾向于选择语言地位高的语言学习,同时倾向于选择语言交流网络中多数人使用的语言学习。之前的研究者主要基于以上两点来构造语言演化模型,并且大多以语言地位作为可改变的政策调控参数。近年来的研究表明,语言地位或语势是短期内不可改变的,不适合作为可变的调控参数。陈保亚[9]认为,影响语言竞争的主要因素是语势(即通常所指的语言地位),一种语言的语势由该语言的使用人口数、词汇量、拥有的文献数量决定,所以语势或语言地位很难在短期内改变,不能作为政策调控参数。邓秋[10]指出语言态度是影响个人选择语言行为的重要因素,可以通过教育等措施来改变,所以语言态度可以作为系统调控的参数。实际调研也表明,语言态度对语言保持有重要影响[11]。(3) 双语教育的影响。双语教育对于改善语言生态环境具有重要影响,有利于形成强有力的内部适应机制,这是改善和保护语言生态环境的最为有效措施[12]。教育是人们语言学习的三个途径(社区、家庭或学校)之一,由于强调对强势语言的单语教育,更加快了弱势语言的消亡。双语教育因素也是人们在语言保护中可以采取或改进的措施。

构建了新的社会网络,网络中既有社区内强连接关系,也有跨社区远距离弱连接关系。在个体语言水平和垂直传播模型中同时考虑了语言地位、语言态度和网络连接关系对语言学习和遗忘的影响。增加了以教师节点与学习者节点构成的星型教学网络来开展双语教学。研究语言态度和双语教学作为调控政策条件下系统的语言竞争动力学特性,即在不同政策调控下系统的长期演化趋势。

1 已有语言竞争模型及其动力学特性

语言竞争演化系统中以强势语言单语者比例NX、弱势语言单语者比例NY、双语者比例NZ为系统演化的考察变量,来分析系统长期演化的动力学特性。系统的动力学机制是指在系统初始和政策调控条件下,X、Y、Z三种语言人口比例从时间t=0到t=∞系统演化的最终状态(包括稳定和不稳定两种均衡点)。在系统演化过程中NX+NY+NZ=1。理论上系统最多有四个均衡点:(1,0,0)对应于系统中只有单语者X;(0,1,0)对应于系统中只有单语者Y;(0,0,1)对应于系统中只有双语者Z;(x,y,z)对应于系统中三种语言共存或者强势语言和双语共存。

AS模型[3]给出了两种语言竞争的宏观动力学模型。模型的分析结果与实际的濒危语言案例中数据保持一致。模型的成功推动了社会计算方法在语言竞争问题中的应用。研究得到该模型的动力学特性为:系统的演化结果有两个稳定均衡点(1,0)、(0,1),一个不稳定均衡点(x,y),不稳定均衡点会按一定概率迁移到稳定点。所以系统的演化结果表明两种语言共存不是一种稳定态,系统最终只有一种语言在竞争中胜出。

CAS模型[5]构建了引入双语者和社会网络结构的微观agent复杂网络仿真模型。网络中语言者节点agent有三种可能的状态:单语X、Y及双语Z。模型分析结果表明:系统有两个稳定均衡点(1,0,0)和(0,1,0),一个系统不稳定均衡点为(x,y,z);系统不稳定均衡点的位置由系统的语言地位和初始人口比例决定;双语者和小世界网络社会结构不能改变系统最终演化结果,系统最终仍然只有一种语言保留。

MWAS模型[6]同样在AS模型的基础上引入双语者和社会网络结构(包括全连接网络和局域世界网络)构建了语言竞争微观复杂agent网络模型,模型以语言地位作为动态调控政策分析了语言竞争系统动力学特性。研究认为在无政策调控下系统的动力学特性与CAS结果相同,通过对系统演化过程中的语言地位进行动态调控可以使系统的不稳定点改变为稳定点,实现语言共存。

ZAS模型[7]采用两个长度为F的二进制字串表达agent的语言内部结构,并引入社会圈子网络给出一种新的动态微观语言竞争社会仿真模型。计算实验表明:给出的新模型具有与MWAS模型相同的动力学特性,在合适的时间窗口对语言地位实施动态调控可以将系统不稳定均衡点转变为稳定均衡点,实现两种语言共存。文献[13]在此基础上构建了具有整数字符串结构的复杂agent网络微观社会仿真模型。模型计算实验结果表明新模型与ZAS模型具有相同的动力学特性和调控机制,同时具有更丰富的表达能力。

2 新型语言竞争传播模型

2.1 语言竞争传播网络

2.1.1社会圈子网络生成原理

Hamill等[14]提出一种基于agent社会圈子网络理论来构建动态社会网络的方法。网络中的agent赋予不同的社会半径,以个体agent在二维平面的位置为圆心,以其社会半径长度构成的圆作为其社会圈子。当两个agent中心坐标点的连线的长度Q小于等于连线两端agent较小的社会半径r时,表示两个个体agent都处于对方社会圈子内,互相认识,agent间将建立连接关系,否则不建立连接关系。如图1(a)中Q>r,个体不会建立连接关系,图1(b)中Q

(a) agenti和agentj不产生联系 (b) agenti和agentj产生联系

(c) 多社会半径联系图1 社会圈子网络生成原理

2.1.2远程社会网络

图2 远程连接

2.1.3具有弱连接关系的社会网络参数度量验证

依据上述改进的社会圈子网络生成模型如图3(a)所示,圆形节点表示单语者X,正方形节点表示单语者Y,三角形节点代表双语者Z,星形节点代表无语者W,“—”代表连线两端的个体建立连接关系。拥有三种不同社会半径的agent度分布整体都呈现出泊松分布特性,如图3(b)所示。现实社会中,由于人的交际范围不同,所以个体的社会圈子大小也因人而异,只有极少数人的社会圈子会很大。有远程连接的社会圈子网络度分布比没有远程连接的社会圈子网络度分布高度更低,整体往右,说明有远程连接的节点平均度更大,即与其相连的邻居节点数更多,个体的平均网络规模增大,度相对较低的个体的数量减少。聚类系数分布如图3(c)所示,整体网络个体聚类系数平均值在0.57左右,具有较高的聚类系数,加入远程连接后的聚类系数分布曲线整体往左偏移,平均值聚类系数值为0.42。聚类系数是一个人的任意两个朋友之间互为朋友可能性的定量描述,是社会网络关系强弱的一个重要属性。加入远程连接的网络比没有加入远程连接的网络平均聚类系数要低,相当于弱化了朋友关系的强连接,强化了弱连接。计算出网络没有加入远程连接和加入远程连接后的Pearson系数分别为0.4和0.263,具有度度正相关特点,度度相关虽然仍为正相关,但相关度减小,表示弱连接增强。无远程连接网络的平均路径为6.08,符合社会网络平均路径短,即六度分离原则,反映了实际人际关系社会网络的“小世界”特性[16],加入远程连接的网络平均路径为3.19,大大缩短了路径。无远程连接网络的网络密度为1.18%,具有密度低的特点,加入远程连接,网络密度提高1.78%,但总体而言还是很低,满足社会网络低密度特征。

(a) 社会圈子网络

(b) 度分布

(c) 聚类系数图3 社会圈子网络及度量参数

2.1.4双语教学星型网络

双语教育对于保护濒危语言具有重要影响,为了体现此影响,在建立好的网络中增加教师节点,设置其数量和教学半径,使其在二维空间网格中均匀分布。教师节点的数量可以根据需要增加或者减少,通过改变教师节点的数量可以增大或减小双语教学的力度。如图4所示,教学半径内所覆盖的所有节点都和教师有教学边相连接,表示教师所负责的教学区域,教师节点数和教师半径配合,可以确定双语教学的覆盖面。

图4 双语教学星型网络

2.2 新型agent微观模型

2.2.1agent语言内部结构与语言类型

借鉴文献[17]中agent的词汇用二进制位串进行表达的方式,社会语言网络中agent存在四种语言类型:(1) 单语者X(只掌握X一种语言):agenti(X);(2) 单语者Y(只掌握Y一种语言):agenti(Y);(3) 双语者Z(掌握X、Y两种语言):agenti(Z);(4) 无语者W(未掌握任何一种语言):agenti(W)。语言者拥有两个长度为F的二进制位串LX(v)与LY(v),v∈[1,F],本文中的F设定为20。图5中,对于agent而言,位串中的1代表相应位置的词汇是已知的,0代表相应位置的词汇是未知的。

(a) 单语者X

(b) 单语者Y

(c) 双语者Z

(d) 无语者W图5 agent的语言内部结构

语言类型规定:(1)LX(v)中1的个数大于3并且LY(v)中1的个数小于3,规定为单语者X;(2)LX(v)中1的个数小于3并且LY(v)中1的个数大于3,规定为单语者Y;(3)LX(v)和LY(v)中1的个数都大于3时,规定为双语者Z;(4)LX(v)和LY(v)中1的个数都小于3时,规定为无语者W,对应式(1)-式(4)。

(1)

(2)

(3)

(4)

2.2.2考虑语言态度的语言水平传播规则

模型中,agent间进行词汇学习或遗忘需要满足:(1) agent间具有图3(a)中的边连接关系;(2) 在(1)的前提下满足交流率(Exchange),语言交流率是在社会网络中有连接关系的两个agent间进行语言交流的概率,表征agent间语言交流机会的大小。网络中有边连接的两个agent节点满足交流率时,agent个体间进行词汇学习或遗忘。根据前人研究[3,5-6],语言学习与语言地位成正比,遗忘与语言地位成反比,在此基础上本文引入了语言态度的影响。社会语言学表明:语言态度越积极,态度转变为行为的可能性越高,人们倾向于以更积极的态度学习某种语言,对该种语言学习效率高,遗忘的可能性减小。所以本文近似认为语言学习获得某一词汇的概率与语言态度成正比,而遗忘的概率与语言态度成反比,在此基础上给出新的水平传播模型,如式(5)-式(12)所示。

X民族对X语言词汇的学习及遗忘公式:

PX(LX)=P×PXX×SX

(5)

QX(LX)=q×(1-PXX)×SY

(6)

X民族对Y语言词汇的学习及遗忘公式:

PX(LY)=p×PXY×SY

(7)

QX(LY)=q×(1-PXY)×SX

(8)

Y民族对X语言词汇的学习及遗忘公式:

PY(LX)=p×PYX×SX

(9)

QY(LX)=q×(1-PYX)×SY

(10)

Y民族对Y语言词汇的学习及遗忘公式:

PY(LY)=p×PYY×SY

(11)

QY(LY)=q×(1-PYY)×SX

(12)

式中:p代表学习率(p∈[0,1]);q代表遗忘率(q∈[0,1]);SX(SX∈[0,1])和SY(SY∈[0,1])分别表示X语言和Y语言的语言地位,并且SX+SY=1;PXX代表X民族对学习X语言词汇的态度;PXY代表X民族对学习Y语言词汇的态度;PYX代表Y民族对学习X语言词汇的态度;PYY代表Y民族对学习Y语言词汇的态度。

图6(a)为X民族对X语言词汇的学习及遗忘过程,agenti为X民族,agentj为X民族或Y民族,个体agenti与其具有连接关系的agentj对应位置的X词汇掌握情况不同(位串中的二进制数不同):(1) 学习:agenti中未知该词汇(位串中的数字为0)而agentj已知(位串中的数字为1),则agenti中对应位串中的数字将以PX(LX)的概率由0变为1(式(5));(2) 遗忘:agenti中已知该词汇(位串中的数字为1)而agentj未知(位串中的数字为0),则agenti中对应位串中的数字将以QX(LX)的概率由1变为0(式(6))。图6(b)为X民族对Y语言词汇的学习及遗忘过程,agenti为X民族,agentj为X民族或Y民族,个体agenti与其具有连接关系的agentj对应位置的Y词汇掌握情况不同(位串中的二进制数不同):(1) 学习:agenti中未知该词汇而agentj已知,则agenti中对应位串中的数字将以PX(LY)的概率由0变为1(式(7));(2)遗忘:agenti中已知该词汇而agentj未知,则agenti中对应位串中的数字将以QX(LY)的概率由1变为0(式(8))。agenti为Y民族的词汇学习和遗忘原理如同X民族,考虑语言态度的词汇学习和遗忘公式见式(9)-式(12)。

(a) X民族对X词汇的学习和遗忘过程示意图

(b) X民族对Y词汇的学习和遗忘过程示意图图6 X民族对X、Y语言词汇学习与遗忘过程

2.2.3语言垂直传播规则

社会人口数量的动态变化可以通过人口的出生和死亡来体现,此过程需要考虑父辈语言的遗传以及子辈对语言的继承,语言的垂直传播规则可以反映这一过程。模型通过设置出生率以及死亡率来体现社会人口数量的动态变化。

CAS[5]、MWAS[6]和ZAS[7]模型中子代传承父辈的语言规则为:父辈为单语者x(或y),则子代也只能传承单语x(或y);当父辈为双语者Z时,子代传承x(或y)单语的概率受到x(或y)的语言地位以及网络邻域中单语者x(或y)比例的影响。我们基于新的语言竞争机制,给出改进的垂直传播规则:(1) 个体对双语的态度越积极,双语遗传给子代的概率越大;个体对双语的态度越不积极,双语父辈遗传单语给子代的概率越大。(2) 个人社会网络邻域双语人群越多,子代继承双语的可能性越大;个人社会网络邻域某种单语人群比例越高,子代继承该种单语的可能性越大。(3) 父辈双语者的语言中,某种语言地位越高,该种单语言遗传给子代的概率越大,反之越小。

基于以上规则给出改进的垂直传播公式,如式(13)-式(17)所示。(1)当父辈为单语者时,子代只能直接继承父辈的单语,如式(13)和式(14)所示。(2) 父辈为双语者,在满足概率P(Z→Z)条件下,子代继承父辈的双语特性,如式(17)所示。(3) 父辈为双语者,在不满足P(Z→Z)概率条件下,如果满足概率P(Z→X)时,子代仅继承单语X;如果满足概率P(Z→Y)时,子代仅继承单语Y,如式(15)和式(16)所示,公式表明,双语遗传单语与该种语言的语言地位、人口密度和对双语的不积极态度成正比。

P(X→X)=1

(13)

P(Y→Y)=1

(14)

(15)

(16)

P(Z→Z)=1-P(Z→X)-P(Z→Y)

(17)

式中:nX代表agent社会半径圈子内讲X语言的人的个数;nY代表agent社会半径圈子内讲Y语言的人的个数;nZ代表agent社会半径圈子内讲双语的人的个数;nS代表agent社会半径圈子内所有人的个数;Pa代表人们对学习双语的态度,子代继承父代双语的概率与Pa成正比,在这里Pa=min{PXX、PXY、PYX、PYY};(1-Pa)表示对双语的不积极态度。

2.2.4agent双语教学规则

语言教学发生在教师节点agent与语言学习者agent有边连接的两个节点之间,教学规则满足如下:

(1) 设置教学的时间间隔(teachtime=3),即一次教学与下次教学之间间隔的时间步长,教学不是每个时间步都会发生,只有处在教学步时才会进行双语教学,反映教学分频次。

(2) 设置的教学边是一种单向的教学(即教师只教不学),在这里有两种教学方式,一种是仅对教学半径内弱势语言所在的民族(Y)进行双语教学;另一种是对教学半径内的所有人进行双语教学,不管其民族。

(3) 设置教学率(teachrate=5%),由于人们在学习过程中会出现遗忘现象,在此设置教学率来表征每次教学成功的概率。一旦满足该概率,教师节点会将自己词汇表中的词汇随机选择一位自己已知人们未知的词汇进行教学,人们相应未知的词汇就会变为已知。图7为X语言词汇的教学过程,Y语言词汇的教学过程与X语言相同。

图7 X语言词汇的教学过程

2.3 语言竞争agent网络演化模拟模型

(1) 生成peoples节点并设置其属性:创建一个250×241范围内的二维空间网络,在网络中随机生成nofArea个agents,在创建的agent中分配X单语者和Y单语者的人口比例(nofx、nofy),且nofx+nofy=1;设置单语者X的民族为X,设置单语者Y的民族为Y,设置两种语言的语言地位,SX代表X的语言地位,SY代表Y的语言地位,且SX+SY=1;设置agents身份为people,为peoples分配社会半径并设置三种社会半径的人口分布比例(Spop、Mpop和Bpop)且Spop+Mpop+Bpop=1。

(2) 建立教师节点并设置其属性:创建nofteachers个agents均匀分布在二维空间网络中,设置其语言类型为双语Z,并设置其身份为teacher;设置教学半径(teachingcircle)、教学率(teachrate)、教学间隔(teachtime)的大小。

(3) agents词汇设置:agents拥有两个长度为20的二进制位串LX(v)与LY(v),v∈[1,20],1表示已知词汇,0表示未知词汇。为peoples节点每种语言分配高中低三种词汇占比,设置单语者X的LX(v)中1的个数大约为17个的占比为h,1的个数大约为14个的占比为m,1的个数大约为10个的占比为l,LY(v)中全为0。设置单语者Y的LY(v)中1的个数大约为17个的占比为h,1的个数大约为14个的占比为m,1的个数大约为10个的占比为l,LX(v)中全为0,且h+m+l=1。设置teachers节点二进制位串LX(v) 与LY(v)中1的个数大约为19个。教师节点的语言类型和所掌握的词汇一旦初始设置,在程序运行过程中不会发生改变。

(4) 生成社会网络:peoples类型agent根据自身的社会半径建立社会网络,如图3(a);teachers根据自身圈子大小建立星型网络,如图4所示。

(5) 个体语言交流:个体的语言交流首先满足在彼此的社会半径范围内,其次要满足交流率(Exchange)。当达到上述条件下,进行语言的内部词汇交流,具体如式(5)-式(12)。

(6) 人口流动与网络更新:设置日常移动和长距离移居比例,peoples根据此比例进行移动,移动后个体agent根据其社会半径和社会圈子连接规则重新生成社会网络。设置远程连接的比例、远程连接的社会半径和远程连接的时间,构建远程社会网络。

(7) 判断死亡/出生人口并分配后代语言:遍历网络中的所有agent,当满足出生概率时个体繁殖后代,当满足死亡概率时个体死亡。当父辈为单语时(X或Y),子代也为同类型单语者,并继承父辈的全部词汇。当父辈为双语个体Z时,并满足双语遗传概率P(Z→Z)时,子代也为双语者类型,并继承父辈的全部词汇;当父辈为双语个体Z时,在不满足双语遗传概率的前提下,如果满足概率P(Z→X)时仅继承单语X,即LX(v)中的词汇全部继承,LY(v)中的词汇全为0;如果满足概率P(Z→Y)时仅继承单语Y,即LY(v)中的词汇全部继承,LX(v)中的词汇全为0。

(8) 重构社会语言网络:经过移动、人口出生、死亡后,利用社会圈子生成原理及其改进方法重新更新语言交流网络,利用星型网络原理重新生成双语教学网络。

(9) 双语/单语者的判定:根据式(1)-式(4),判断和统计agent的语言类型。

(10) 网络的动态更新:随着时间的增加,反复执行步骤(5)-步骤(10),直到达到预设的时间网络停止更新。

3 模型计算实验

本模型研究在混居的条件下,通过构建具有远程连接关系社会网络和双语教学网络双层混合网络,研究语言态度和双语教学作为调控政策条件下系统的语言竞争演化规律。该网络模型以NetLog[18]为平台,主要参数的初值借鉴了文献[5,14,19]中的设定,如表1所示。

表1 模型主要参数的初值

续表1

3.1 轨迹图与系统演化状态

在文献[3,5]中,系统演化的结果有稳定和不稳定两种均衡点,不稳定点会随机按一定的概率滑向稳定点。弱势语言最终会消亡,系统不能达到共存状态,模型用微分方程构建,其动力学特性由系统的方向图来描述。在文献[6]中,通过干预机制调控语言地位可以使系统的不稳点变为稳定点,强势语言和弱势语言在系统可以达到共存状态。构建的语言竞争微观模型首次利用轨迹图分析系统解的空间状态,认为轨迹图与方向图高度近似,可以用轨迹图代替方向图分析系统的演化特征。语言竞争演化系统中以强势语言单语者比例NX、弱势语言单语者比例NY、双语者的比例NZ为系统演化的考察变量,来分析系统长期演化的动力学特性,由于系统中NZ=1-NX-NY,在此用系统的轨迹图来描述系统的动力学机制,系统的轨迹图是指系统中X、Y语言人口比例(NX、NY)随时间增长演化的轨迹,如图8所示,轨迹图是在二维坐标中从起点到终点每个点对应系统时序演化的一个时刻。系统主要的仿真参数设置如表1所示,经过大量实验表明,在表1初始条件下,系统大部分情形通过t=800步左右而达到稳定状态,最长的演化情形在t=1 200步左右进入稳定状态,即系统演化状态不再发生改变。所以我们认为t=2 000可以近似看成系统在t=∞时的演化状态。在系统演化过程中,存在不稳定均衡点,即在相同初始条件下,有不同的最终演化结果,如图8所示。图8(a)显示了随时间增长三种语言人口比例的演化趋势,图8(b)是对应于图8(a)的轨迹图,在这次运行中,系统迅速收敛到均衡点(x,y,z),即三种语言共存;图8(c)显示了与图8(a)相同的初始条件下系统的演变,通过轨迹图8(d)可以看到系统最终收敛到均衡点(0,1,0),即系统中只有单语者Y;图8(e)与图8(a)的初始条件相同,系统通过轨迹图8(f)可以看到收敛到均衡点(1,0,0),即系统中只有单语者X。

(a) 不稳定均衡点情形一

(b) 对应于图8(a)的系统轨迹

(c) 不稳定均衡点情形二

(d) 对应于图8(c)的系统轨迹

(e) 不稳定均衡点情形三

(f) 对应于图8(e)的系统轨迹图8 系统在不稳定均衡点处的演化趋势

3.2 不同条件下仿真实验

经过大量的实际调研表明,我国的少数民族语言大部分存在衰退情况,部分存在濒危现象。根据其所处地理社会环境不同,可以分为母语保持型(聚居)、母语衰退型(杂居)和母语濒危型(高度杂居)三类。某一地区的语言使用状况是各种因素相互作用的结果,主要影响因素除了语言地位外有居住地理环境、语言态度、社区语言环境、家庭语言环境、学校采用单语或双语教学等。这些因素相互影响,导致不同区域的语言态势不同。如表2所示的云南里山乡彝族语言使用状况显示同时存在三种母语保持类型[11],具有广泛的代表性。可以看出,母语保持较好的类型存在于交通偏远、地理隔离、人口流动少的区域;而杂居和汉语包围型杂居区域母语态势主要以衰退和濒危态势为主。而随着社会进步、交通发达,人们的社会流动和社会网络正在发生快速变化,地球村越来越明显,靠地理隔离实现少数民族语言保持的区域正在快速消失,更多的区域向语言衰退和濒危态势转变,语言保护形势快速恶化,寻找更有力的语言保护方案时不我待。下面将对这三种类型及其政策改进情形下的语言演化趋势进行仿真计算实验。

表2 云南里山乡彝族语言的使用现状

3.2.1仿真情形一

由于社会经济发展不均衡,仍有部分地区交通闭塞,处于相对封闭的环境,人口分布密度较高,远离汉文化中心,汉语文化教育处于相对落后的状态,少数民族语言在生活领域中发挥着巨大的作用。例如表2中的第一种类型,在该情形下,汉语为强势语言,少数民族语言(彝语)为弱势语言;不同民族的语言态度为:彝族对母语认可度高,对汉语认可度一般,汉族对汉语的认可度高,对彝语的认可度一般;社区学校仅进行汉语单语教学。参照以上情形,主要的仿真参数设置如下:强势语言的社会地位SX=0.6,弱势语言的社会地位SY=0.4,强势语言民族对母语的态度PXX=0.7,对弱势语言的态度PXY=0.3,弱势语言民族对强势语言的态度PYX=0.3,对母语的态度PYY=0.7。以下将以该情形为基准分析系统解的状态空间,以及改善语言态度和加入教师节点进行双语教学调控后系统解状态空间的变化。图9(a)系统的最终状态取决于单语者X、Y的初始比例。当单语者Y的初始占比大于等于0.7时,系统最终收敛到(0,1,0),系统中只剩弱势语言Y,弱势语言完全保持;当单语者Y的初始占比范围在0.6~0.7时,系统收敛到(x,y,z),是一种三语共存状态,但是实际中很难保持这样的条件实现均衡稳定,是不稳定点;当单语者Y的初始比例低于0.7时,系统最终收敛到(1,0,0),只剩强势语言X。图9(b)为在此基础上加入教师节点仅对弱势语言所在的民族(Y)进行双语教学,当单语者Y的初始人口占比大于等于0.7时,系统最终收敛到(x,y,z),NX范围在0.22~0.55之间,NY范围在0.05~0.25之间,是一种三语共存状态,即以强势语言和双语占比为主,少量弱势语言的共存态;当单语者Y的初始人口占比小于0.7时,系统最终收敛到NX轴上,NX范围在0.68~1.00之间,即强势语言X和双语Z共存,共存状态可以在大部分条件下实现。图9(c)为在基准情形下加入教师节点对区域内所有人进行双语教学,系统最终收敛到(x,y,z),NX范围在0.3~0.6之间,NY范围在0~0.2之间,以强势语言和双语占比为主,少量弱势语言的一种共存态,弱势语言可以很好地以双语的形式保存下来。横向对比,在图9(a)中,双语的存在是一种不稳定均衡点。在图9(b)中,双语几乎全部是由弱势语言转化而来,双语比例范围在0~0.55之间,波动范围广。在图9(c)中,双语比例较图9(b)增多,双语比例范围在0.40~0.54之间,波动范围相对集中;双语不仅仅是由弱势语言转化而来,强势语言也有一部分会转化成双语。

(a) 基准情形

(b) 仅对弱势语言所在的民族进行双语教学

(c) 对区域内所有人进行双语教学图9 情形一下的系统轨迹

随着社会发展,交通便利,开始重视汉文化教育,对汉语的认识普遍提高,弱势民族对强势语言的态度也在逐渐改善。在上述主要的仿真参数不变的情况下,仅将弱势语言民族对强势语言的态度PYX从0.3提高到0.7,以下以该情形为基准分析系统解的空间状态,以及改善语言态度和加入教师节点进行双语教学调控后系统解空间状态的变化。从图10(a)中可以看出无论单语者X和单语者Y的初始人口占比是多少,经过2 000步,系统最终都收敛到(1,0,0),只剩强势语言X,并且随着单语者X的初始占比越大,到达最后的平衡态所需要的时间就会越短。与图9(a)相比,系统在演化过程中出现更多的双语者Z,弱势语言Y不能保持。图10(b)为在此基础上加入教师节点仅对弱势语言所在的民族(Y)进行双语教学,系统最终几乎都收敛到NX轴上,NX范围在0.39~1.00之间,即强势语言X和双语Z共存。与图9(b)相比,无论单语者X和单语者Y的初始人口占比多少,弱势语言Y最终都会消亡;随着单语者X的占比越大,系统最终共存态中双语者Z的占比就会越小,弱势语言很难保留下来。图10(c)为在基准情形下加入教师节点对区域内所有人进行双语教学,系统最终收敛到(x,y,z),NX范围在0.32~0.54之间,NY范围在0~0.05之间,以强势语言和双语为主,少量弱势语言的一种共存态。与图9(c)相比,弱势语言民族对强势语言的认可度提高,系统最终状态的动态变化范围变小。

(a) 提高PYX

(b) 仅对弱势语言所在的民族进行双语教学

(c) 对区域内所有人进行双语教学图10 情形一下改变态度之后系统的轨迹

3.2.2仿真情形二

当今社会经济发展迅速、交通发达、人口流动大、汉文化渗透较快,大部分少数民族地区以汉语为主,本民族语言趋向消亡,该种现象越来越普遍。例如表2中的第二种类型和第三种类型,在该情形下,汉语为强势语言,少数民族语言(如:彝语)为弱势语言,不同民族的语言态度为:彝语对母语认可度低,对汉语认可度高,汉语对汉语的认可度高,对彝语的认可度低,社区学校仅进行汉语单语教学。主要的仿真参数设置如下:强势语言民族对母语的态度PXX=0.7,对弱势语言的态度PXY=0.3,弱势语言民族对强势语言的态度PYX=0.7,对母语的态度PYY=0.3。以下将以该情形为基准分析系统解的空间状态,以及改善语言态度和加入教师节点进行双语教学调控后系统解空间状态的变化。从图11(a)中可以看出无论单语者X和单语者Y的初始人口占比是多少,经过2 000步,系统最终都收敛到(1,0,0),只剩强势语言X,并且随着单语者X的初始占比越大,到达最后的平衡态所需要的时间就会越短;图11(b)为在此基础上加入教师节点仅对弱势语言民族(Y)进行双语教学,系统最终都收敛到NX轴上,NX范围在0.6~1.0之间,即强势语言X和双语Z的一种共存态,共存态中单语者X的占比远高于双语者Z的占比,并且随着单语者X的占比越大,系统最终共存态中双语者Z的占比就会越小;图11(c)为在基准情形下加入教师节点对区域内所有人进行双语教学,系统最终收敛到NX轴上,NX范围在0.54~0.72之间,即强势语言X和双语Z的一种共存态,共存态中强势语言的占比更高。横向对比,在图11(a)中,在演化的过程中会出现双语,但系统最终的状态是强势语言胜出,双语不能长时间存在。在图11(b)中,双语大部分是由弱势语言转化而来,少部分是由强势语言转化而来,双语比例范围在0~0.4之间,波动范围相对较广。在图11(c)中,双语比例较图11(b)增多,双语比例范围在0.40~0.54之间,波动范围相对集中,双语是由弱势语言和强势语言共同转化而来。

(a) 基准情形

(b) 仅对弱势语言所在的民族进行双语教学

(c) 对区域内所有人进行双语教学图11 情形二下的系统轨迹

现实生活中仍存在一些特例,强势语言和弱势语言之间相互兼用,形成一个语言和谐的社会,这种兼用不是来自法律法规的要求,而是来自生活的需要,属于“自然兼用型”,这样的语言社会,双方对两种语言的态度都很积极。在上述主要的仿真参数不变的情况下,仅将强势语言民族对弱势语言的态度PXY从0.3提高到0.7,弱势语言民族对强势语言的态度PYX从0.3提高到0.7,其他仿真参数不变。以下将以该情形为基准分析系统解的空间状态,以及改善语言态度和加入教师节点进行双语教学调控后系统解空间状态的变化。从图12(a)中可以看出,当单语者Y的比例大于等于0.8时,系统收敛到(x,y,z),即强势语言和双语的一种共存态;NX范围在0.08~0.27之间,NY范围在0.06~0.16之间,是一种三语共存状态,即以双语占比为主,少量单语的共存态;当单语者Y的比例小于0.8时,系统最终收敛到NX轴上,NX范围在0.29~1.00之间。与图11(a)相比,系统不再是强势语言X胜出,在单语者Y占比高的情况下,弱势语言Y可以转化为双语很好地保存下来。随着单语者X的占比越大,系统最终共存态中双语者Z的占比就会越小。图12(b)为在此基础上加入教师节点仅对弱势语言民族(Y)进行双语教学,系统最终收敛到NX轴上,NX范围在0~1之间,即强势语言X和双语Z的一种共存态,动态变化范围很大。与图11(b)相比,共存态中不再是单语者X的占比更高,在大多数情况下,共存态中双语者Z的占比更高。图12(c)为在基准情形下加入教师节点对区域内所有人进行双语教学,无论单语者X和单语者Y的初始人口占比是多少,系统最终收敛到NX轴上,NX范围在0.07~0.17之间,NX值很小,NY几乎为0。与图11(c)相比,系统最终讲单语的人很少,几乎达到了一个全民双语的状态,弱势语言Y可以很好地保存下来。

(a) 同时提高PXY和PYX

(b) 仅对弱势语言所在的民族进行双语教学

(c) 对区域内所有人进行双语教学图12 语言和谐下系统的轨迹

3.3 动态调控仿真实验

前面研究了系统不同初始条件下动力学特性,即系统的演化趋势,本节研究动态调控措施对正在演化的系统动力学特性的影响。动态调控是指系统在某个初始条件下的演化过程中,在某个时刻开始对系统进行政策调控干预,即从该时刻改变系统某些参数的值看政策调控干预对系统演化趋势的影响。在这里我们对设定初始条件下的系统演化过程的弱势语言的比例(包括双语者)进行监控,当该区域的弱势语言人口比例低于设定的阈值时,启动政策调控,然后观察政策调控对系统演化的影响。

通过对上述模型参数的分析,改变民族对语言的态度和加入教师节点进行双语教学,可以明显地改变系统的演化态势,变不稳定均衡点为稳定均衡点,实现弱势语言保持。为了验证此模型的有效性,以图11(a)为基准进行分析,探讨在NX=0.5、NY=0.5的初始人口占比的条件下,弱势语言者和双语者两者的比例低于30%时(大约360步的时候)进行调控来看系统未来演化趋势的变化,寻求合适的调控时机和力度来阻止弱势语言的消亡。(1) 如图13所示,仅改变一个态度(PYY从0.3变为0.7)和改变两个态度(PXY从0.3变为0.7,PYY从0.3变为0.7),调控后比调控前在弱势语言灭亡的时间上进行了延长,图14(a)为无调控的平均词汇量,图14(b)为仅改变一个态度的平均词汇量,词汇演化的趋势几乎没有太大的变化,速度会变慢,改变两个态度的平均词汇量与图14(b)非常类似,在此没给出。实验表明,当弱势语言有濒危迹象的时候再去改变对弱势语言的态度只能延缓弱势语言的灭亡,而不能扭转其灭亡的结局。(2) 在改变态度的基础上加入教师节点(教学率为5%(Y)),仅对Y民族的群体进行双语教学,在2 000步时,单语者Y和双语者Z的总比例达到了32.94%,几乎都是由Y民族的人转化而来。图14(c)中,Y民族的Y词汇平均个数为4.01个,数量很低,只能适用于一些简单的交流场合,X民族的Y词汇平均个数几乎为0。如果教师节点是对区域内的所有人进行双语教学(教学率为5%(S)),单语者Y和双语者Z的总比例达到了58.88%,数量上面有了明显的提高。图14(d)中,X民族Y词汇的平均个数增加到了2.79个,Y民族Y词汇平均个数为4.69,变化不大。(3)将教学率提高到15%,仅对Y民族的人进行双语教学(教学率为15%(Y)),单语者Y和双语者Z的总比例为53.56%。图14(e)中,Y民族Y词汇的平均个数为8.48个,X民族Y词汇的平均个数为1.39个,当教师节点对区域内所有人进行双语教学(教学率为15%(S)),单语者Y和双语者Z的总比例为84.37%,几乎相当于全民双语,与教学率为5%相比,词汇的平均个数也有了很大的改善,Y民族Y词汇的平均个数为9.62个,X民族Y词汇的平均个数为7.03个。综上所述,该模型可以让语言人口比例和平均词汇量保持在比较理想的状态,改变语言未来的演化趋势,使弱势语言能够以双语的形式保存下来。

图13 不同调控政策下单语者Y和双语者Z总人口比例的变化

(a) 无调控平均词汇量

(b) 仅改变一个态度的平均词汇量

(c) 教学率为5%(Y)的平均词汇量

(d) 教学率为5%(S)的平均词汇量

(e) 教学率为15%(Y)的平均词汇量

(f) 教学率为15%(S)的平均词汇量图14 平均词汇量

4 结 语

本文引入虚拟镜像概念构建了新的社会网络,网络既有社区内强连接关系也有跨社区远程弱连接关系。增加了教师节点与学习者节点构成的星型教学网络,教师agent可以对网络中学习者agent实施双语教学。以二进制字串代表agent的内部词汇结构,给出改进的agent语言水平传播和垂直传播公式,传播公式综合考虑了语言态度、语言地位和网络连接关系类型,构建了语言水平、垂直传播网络和语言教学网络组成的二层语言竞争动态社会网络微观仿真模型。模型研究语言态度和双语教学作为调控政策条件下系统的语言竞争动力学特性,重点分析当代社会网络条件下典型弱势语言生存环境情形下系统的演化趋势,以及改变语言态度和加入教师节点进行调控后系统演化趋势的改变。大量的仿真实验表明:在社会网络远程弱连接增强的趋势背景下,即使是弱势语言人口占绝对优势,也很难避免弱势语言消亡的趋势;社区保护弱势语言要提高全民对弱势语言和双语的态度,同时在社区构建双语价值社会,实施全民双语教育可以引导系统向稳定的全民双语型演化。而这些政策及其组合已经被社会语言学研究证明是行之有效的,本文的仿真模型解释和验证了政策的作用机制和有效性。但模型的许多方面仍需改善,没能将语言水平考虑在内,每个人的语言态度因语言水平而异,未来的研究将在此基础上进一步改进模型以便更加切合实际社会。

猜你喜欢
弱势双语词汇
农村消费者弱势地位及其改善策略
农村消费者弱势地位及其改善策略
一个“弱势”教师说:孩子,我为什么越来越不愿意管你
词汇小达人
词汇小达人
词汇小达人
词汇小达人
强势妻子容易逼出“弱势”丈夫
多元智力理论下数学教学方式浅谈
快乐双语