基于元胞自动机各语言人口分布分析

2018-09-07 06:06汪榆淋
信息记录材料 2018年10期
关键词:元胞权值汉语

汪榆淋

(西北农林科技大学 陕西 咸阳 712000)

1 引言

目前地球上大约有6900种语言。全球大约一般人口将下列十种语言之一(按大多数人)列为母语普通话(标准中文),西班牙语,英语,北印度语,阿拉伯语,孟加拉语,葡萄牙语,俄语,旁遮普语和日语。然而,世界上许多人口也有一门第二语言。当考虑到讲一种特定语言的总人数(包括以此为母语的人以及以此为第二或第三语言的人),该语言及其排序会在提供的本地语言列表中发生改变。由于当地政府使用的官方语言和/或推动普及的语言、学校使用的语言、社会压力等各种因素的影响,一种语言使用者的总数可能会随着时间的变化而增加或减少。

2 各种语言的人口分布模型

2.1 元胞空间初始状态的确定(以汉语为例):

根据2017年讲汉语的总人数为1090*106以及每一个元胞代表的人数为1*106计算出网格中有1090个元胞的状态为1,其余的元胞的状态为0,查阅资料可得汉语的使用者主要集中在中国、新加坡、来西亚、印尼,根据世界各个地区华人比例得到状态为1的元胞所处的数目(中国1068个元胞、新加坡4个元胞、马来西亚7个元胞、印尼11个元胞),其中汉语是分区域的,其他语言是离散分布的。设置状态为1的元胞的初始T值为5到9之间的随机值,设置状态为0的元胞的初始T值为1~4之间的随机值。

2.2 元胞的演化过程

设定元胞演化规则的时候将政府的使用以及其他因素的影响量化为影响权重w来表示每一个元胞对周围元胞影响的大小。因为w的确定和各种因素的影响密切相关,显然将各个影响因子的作用简单叠加显然是极不合理的,不同影响因子的影响应该有强弱之分,为了区分各个影响因子的重要程度,将它们赋予不同的权值。由于层次分析法可以将层次内诸因素两两比较,确定对上一层对同上一层次的权值,它合理地将定性与定量决策结合起来,按照思维、心理的规律把决策过程层次化、数量化,对此问题权值的确定极具优势,所以选择层次分析法将各个影响因子两两比较,进行一致性检验,最后得到各个因素的最后权值。

2.3 权重的确定

影响因素分为如下9种:政府的使用或推广,学校的使用,社会压力,文化群体的迁移或同化,外来移民的迁入迁出,国际商务联系,国际旅游的增加,电子通讯与社交媒体的使用,语言翻译技术分别记为A1,A2,……A9。最后得到的权值分别记为W1,W2,……W9。

每个影响因子对每一种语言使用人数的变化都有推动作用(包括正向推动和负向推动)。这种推动有大小之分,视为推动效应,记为我们对每一个因素对26种语言的推动大小进行排序,排名靠前的推动作用大,对排名1到26的推动效应赋值为26到1。

然后我们利用各个影响因子的权值与该影响因子的推动效应相乘得到每种语言的传播倾向值初始值,记为:w1,w2,……w26。运用层次分析法对26种语言各个影响因子的推动效应排序并计算传播倾向值,得到表1。

表1

3 仿真以及结果分析

采用qt来模拟某种语言的演化过程,具体步骤为:建立一个100*100的元胞空间;根据实际情况,赋给每个元胞关于T(0到10之间)和W(0到1之间)的初始值。以汉语为例,该语言在中国拥有1068个元胞,即在网格中央某个稍大于1068的矩形区域随机产生1068个状态为1的元胞,类似地,在网格中其他三个区域产生状态为1的元胞,见图1。

图1

根据结果预测了未来50年后15种语言的排名,根据图表发现未来50年后使用这15种的语言的总人数会出现较大幅度增加,使用各种语言的人数占全球人数的比例会发生比较大的变化。其中Mandarin Chinese、English和Hindustani语言占世界语言的比例明显增加,Bengali明显减少,其他语言基本持平。排名前十名的语言排名没有被其他语言替代。预测五十年后法语使用者总数会超过Bengali和Portuguese成为第八位。

4 策略

根据以上结论,提供了一个可靠的策略:选择以下六个城市作为新增的办事处选址:悉尼,巴黎,伦敦,东京,柏林,多伦多对于巴黎,东京,柏林我们建议要求办事处员工除英语外掌握当地的本土语言,分别为法语,日语,德语。对于悉尼,伦敦,多伦多我们建议办事处员工除英语外掌握当地的第二广泛使用的语言分别为阿拉伯语,阿拉伯语,法语。

猜你喜欢
元胞权值汉语
基于元胞机技术的碎冰模型构建优化方法
一种融合时间权值和用户行为序列的电影推荐模型
学汉语
CONTENTS
轻轻松松聊汉语 后海
基于MATLAB的LTE智能天线广播波束仿真与权值优化
基于元胞自动机下的交通事故路段仿真
基于元胞自动机下的交通事故路段仿真
追剧宅女教汉语
汉语不能成为“乱炖”