网络视角下的唐诗

2017-07-07 02:16李甍娜郭进利常宁戈陆睿敏
复杂系统与复杂性科学 2017年4期
关键词:超度韵脚押韵

李甍娜,郭进利,卞 闻,常宁戈,肖 潇,陆睿敏

(上海理工大学管理学院,上海 200093)

0 引言

从Watts发表的关于小世界网络的文章[1]以及Barabási发表的关于随机网络中标度涌现的文章[2]开始,人们对于复杂网络的研究日渐深入。目前,复杂网络已经应用到如交通网络、生物网络、社会网络等各种现实网络的研究中[3-5]。随着复杂网络的发展,人们也在寻求对网络更为合适和准确的描述方法,如超网络。2002年Nagurney[6]开始明确超网络的定义。王众托[7]对基于超图的超网络进行了描述。Liu等[8]根据知识传播的特点提出了知识传播超网络模型。Wang等[9]提出了基于微信用户不同的超网络演化模型。倪子建等[10]基于维基百科超网络构建了维基内容本体超网络,并对其拓扑结构和演化模式进行了研究。

近年来,许多有趣的问题也通过网络的视角进行研究,如语言、文字等问题。Motter A E等[11]研究发现英语语言概念网具有小世界特性。Ferrer i Cancho R等[12]基于规模为107个词次的英语国家语料库,构造了一个英语词同现网络,并发现该网络表现出小世界效应和无标度特性。马宏炜,陆蓓等[13]基于大规模微博语料库,构建了3个词同现语言网络;刘海涛[14]构造出两种不同语体的汉语真实文本句法网络,并采用复杂网络理论对各自的网络结构进行了分析。Yu等[15]基于真实文本和词典,发现音素网络具有连通度高,平均距离短的特点,其节点度服从正态分布,加权度服从幂率分布。并且定量分析了语音系统在通讯交流中的高效性和可靠性。唐诗在中国文化中具有重要意义。无论是五言唐诗和七言唐诗,还是绝句和律诗都要服从一定的押韵规则。如果以汉语拼音中的韵母为基础对唐诗的押韵情况进行统计,以此探求唐诗之间的关系或者在押韵过程中不同韵母之间的关系将是一个有趣的问题。本文给定了一套唐诗韵脚韵母在押韵过程中的统计规则,并建立了唐诗超网络和韵母复杂网络。根据对网络特征的分析,发现唐诗在押韵规则下的规律与联系。

1 唐诗超网络

1.1 唐诗韵脚韵母数据收集

押韵是诗词等韵文的语言特点之一。它是指在韵文的创作中,在某些句子的最后一个字都使用韵母相同或相近的字或者平仄统一。这些使用了同一韵母字的地方,称为韵脚。普通话相对于古代汉语在读音上发生了变化,但是完全用古音读古诗是不可能实现的[16-17]。以普通话诵读唐诗,大部分仍然具有押韵的规律,这主要与构成韵脚的韵母有关。为简化网络模型,对于语音变化而变得不押韵的韵脚以及韵脚韵母不同的情况都视为转韵。本文对《唐诗精华注译评》[18]收录的762首唐诗进行统计,记录了每首诗韵脚的韵母信息,通过该信息对762首唐诗建立联系,并以此作为根据构建唐诗超网络。在进行信息数据收集之前,首先对24个韵母进行了编号,韵母编号信息如表1所示。

本文对每首唐诗韵脚的韵母信息给定了统一的统计规则,规则如下:

1)如果偶数句诗句韵脚韵母相同则将该四句诗句(包括以逗号结尾的两句诗)归为同一段,否则分为两段。以此类推,将整首诗分段。

2)记录。统计时只记录每个诗段偶数句诗句韵脚出现的韵母编号。

3)整合。当一首诗较长时可能出现两个诗段所记录的韵母编号相同的情况,所以统计完每个诗段的韵母编号后,对相同的韵母信息进行合并。

1.2 唐诗超网络构建模型

将每首诗作为节点,每个韵母作为超边。根据每首诗的韵母统计信息,如果第i首诗出现了第j个韵母,那么超边j就包含节点i。这样就构成了762个节点,24条超边的超网络。其中唐诗是按在《唐诗精华注译评》中的编排顺序来进行编号的。如第1首诗是虞世南的《蝉》,根据1.1节的统计规则记录的韵母是“ong”和“eng”;

第2首诗记录的韵母是“i”、“ui”、“ei”;第3首诗记录的韵母是“ui”和“ei”,则该超网络图如图1所示。

表1 韵母编号信息Tab.1 vowel code list

图1 唐诗超网络的构建Fig.1 Supernetwork for Tang poetry

1.3 唐诗超网络的特性分析

1.3.1 超度与超度分布

超度指节点所在的超边数量[19]。节点超度在唐诗超网络的意义是,每首唐诗的韵脚所出现不同韵母的种类数目。超度的大小能在一定程度上衡量一首唐诗转韵的频繁程度。

所有节点超度的平均值称为超网络的平均超度,用于描述整个网络的性质,记为〈k〉,即

(1)

其中,k(i)为节点i的点超度,N为超网络中节点的总数。

节点超度分布P(k)为超度为k的节点占整个网络节点数的比例,即:

(2)

其中,Nk表示超度为k的节点个数。

图2所示为唐诗超网络的超度分布,其中图2a和2b分别使用线性坐标和双对数坐标显示结果。

由图2可知,大部分唐诗韵脚都只出现一种或者两种韵母,而只有少部分唐诗韵脚会出现多种韵母。这与唐诗的字数有一定关系,大部分的唐诗只有4句,这类诗转韵的情况相对更少,而字数多的唐诗却很少,这类诗转韵的情况也相对更多。另外,这也与唐诗本身的成诗规律有关,即在转韵和不转韵中诗人们更倾向于后者。唐诗超网络的节点超度在双对数坐标下呈现出一条直线,即服从幂律分布,幂律指数为-2.19。该超网络中平均超度〈k〉为2.15,这说明平均每首唐诗韵脚会出现两种不同的韵母。

1.3.2 余平均度

为刻画节点之间的联系,本文引入余平均度指标。节点i的余平均度定义为节点i的所有邻居节点的平均超度[20],即:

(3)

其中,Γ(i)表示邻居节点集合。

假设网络中超度为k的节点为v1,v2,…,vi,那么超度为k的节点的余平均度可计算如下:

(4)

图3所示为唐诗超网络的余平均度与超度的关系图,可以看出随着超度k的增大,余平均度呈下降趋势,即〈knn〉(k)是k的减函数。这意味着平均而言,超度大的节点倾向于与超度小的节点连接,唐诗超网络为异配网络。也就是说如果两首唐诗韵脚出现的韵母种类的数目相同,它们所出现的韵母种类却往往不同。对于拥有高超度的节点来说,高超度意味着它的韵脚的韵母种类数目多,从而更容易与低超度节点韵脚的韵母种类重合。

图2 唐诗超网络的超度分布Fig.2 Super-degree distribution for Tang poetry

图3 唐诗超网络超度与余平均度的关系Fig.3 Degree and complement-degree for Tang poetry

1.3.3 聚集系数

节点之间联系的紧密程度通常用聚集系数[1]来表述。节点i与Di个节点通过超边直接相连,Di个节点间实际存在的超边数为Mi,这Di个节点间可能存在的最大超边数为Di(Di-1)/2,由此定义节点i的聚集系数Ci为

(5)

假设网络中超度为k的节点为v1,v2,…,vi,那么超度为k的节点的平均聚集系数为

(6)

图4所示为唐诗超网络的聚集系数与超度的关系图,由子图4b可以看出C(k)具有幂律形式,这一形式反映了网络具有层次结构。另外,该网络的平均聚集系数为0.87,说明唐诗超网络具有很高的聚集特性。这与押韵规律有关,在762首唐诗中89.24%的唐诗在统计时韵母种类都小于等于3种,即不出现转韵或者转韵次数少。在唐诗超网络中这一部分节点与其邻居节点组成的团体连接得也更加紧密,聚集系数均在0.5以上,从而导致了网络的平均聚集系数很高。

2 唐诗韵脚韵母网络

2.1 韵母网络的构建

本文在对762首唐诗进行统计时发现,按照统计规则,韵脚只出现一种韵母、两种韵母和3种韵母的唐诗所占的比例分别为45%、36%和8%,这3种情况占到了所有唐诗的89%。为进一步了解不同情形下韵脚韵母出现的规律情况,本文将其分类统计。图5展示了唐诗在以上3种情形下不同韵母出现的比例情况,并与总体情形进行比较。

图4 聚集系数与超度的关系Fig.4 Clustering coefficient and super-degree

图5 不同情形下唐诗韵脚韵母的分布情况Fig.5 The vowels distribution of Tang Poetry in different situations

由图6可以得出以下结论:

1)总体而言,对于所有的唐诗,韵脚很少出现编号为13、14、15、20的韵母“ie”、“üe”、“er”、“ün”。

2)尽管编号为4的韵母“i”在所有唐诗中出现的比例最高,但是对于韵脚只有一种韵母的唐诗来说,更可能出现的韵母是编号为16的韵母“an”。也就是当一首唐诗一韵到底时,通常韵脚会使用韵母是“an”而不是“i”的字。

3)如果一首唐诗韵脚出现两种韵母,那么出现的韵母中很有可能包含编号为22的韵母“eng”。

4)韵脚出现3种韵母的唐诗并不多,只占总诗数的8%,但这些韵母却集中出现在了编号为4、8、9、17的韵母“i”、“ei”、“ui”、“en”上。

为进一步分析唐诗在押韵规则下韵脚不同韵母之间的关系,本文对韵脚出现两种韵母的情形通过复杂网络的思想进行了分析研究。

图6 韵脚出现两种韵母情形下的韵母网络Fig.6 Vowels network for two vowels in rhyme

对于韵脚出现两种韵母的唐诗,将每一种韵母作为一个节点,节点编号为韵母编号。如果同一首诗韵脚出现两种不同的韵母,那么就在这两种韵母之间连一条边,并将出现这两种韵母的唐诗数量作为该边的权重。

2.2 韵母网络的特性分析

对于韵脚出现两种韵母的唐诗,说构造的复杂网络有24个节点、44条边。图6所示为该网络的网络图,图中给出了节点编号信息与边的权重信息,权重越大边的宽度就越宽。

表2 韵脚出现两种韵母情形下的韵母网络特征Tab.2 The characteristics of vowels network in the case of appearing two vowels in rhyme

由图6可知,权重最大的3条边分别为节点22与节点23之间的边、节点11与节点12之间的边、节点22与节点24之间的边。这说明当一首诗韵脚有两种韵母,这两种韵母最有可能是编号为22和23的两个韵母“eng”和“ing”,其次是编号为11和12的两个韵母“ou”和“iu”。也就是当一首诗需要从韵脚韵母为“eng”进行转韵时,最有可能转到韵母为“ing”的字上。正因为韵脚韵母成对出现的频率较高,导致了在唐诗超网络中韵脚出现两种韵母的唐诗节点更容易落在同一个超边中,这也促使了唐诗超网络具有更高的聚集系数。

表2展示了该网络中节点度、介数、点强度的信息。

由表2可知,节点4的度值和介数是24个节点中最大的,这说明韵母为编号4的韵母“i”的汉字在诗的转韵规则中有着重要的作用,尽管在转韵中不是最容易用到的字,但是却能使诗从多数不同的韵母成功转韵。编号为22的韵母“eng”点强度最大,这意味着对于韵脚出现两种韵母的唐诗,韵母为“eng”的汉字最容易出现在韵脚,但是该节点的度值只有2,介数为0,说明当诗要从以其它韵母的汉字转韵时很难转到以韵母“eng”构成的汉字上。

3 结论

本文以唐诗韵脚的韵母作为桥梁研究了押韵规则下唐诗之间的关系。以唐诗为节点,24个韵母为超边建立了唐诗超网络。研究发现唐诗超网络的超度分布服从幂律分布,即P(k)~k-2.19。而且该网络为异配网络。

总体而言,对于所有的唐诗,韵脚韵母很少出现“ie”、“üe”、“er”、“ün”,最容易出现的是“i”。但是对于韵脚只有一种韵母(不转韵)的唐诗来说,韵脚韵母最容易出现“an”,而不是“i”。

对于韵脚只出现两种韵母的唐诗,建立了以韵母为节点的韵母加权复杂网络。对该网络进行研究,发现该网络存在某两种韵母关系较其他韵母来说更为密切的情况,即两种韵母往往同时出现在同一首诗的韵脚中,如“eng”和“ing”,“ou”和“iu”。另外,该网络中度值和介数最大的是韵母“i”,点强度最大的是韵母“eng”,这说明了这两种韵母在唐诗转韵中所起到的重要作用。对于韵脚只出现两种韵母的唐诗,“eng”是最容易用到的韵母,“i”是最能使诗从多数不同的韵母成功转韵的韵母。

[1]Watts D J, Strogarz S H. Collective dynamics of ‘small-world’ networks[J]. Nature, 1998, 393(6684): 440-442.

[2]Barabasi A L, Alabert R. Emergence of caling inrandom networks[J]. Science, 1999, 286(5439): 509-512.

[3]Orosz G, Wilson R E, Stepan G. Traffic jams: dynamics and control[J]. Phil Trans Royal Society A, 2010, 368(1928):4455-4479.

[4]Barabasi A L, Gulbahce N, Loscalzo J. Network medicine: a network-based approach to human disease[J]. Nature Review Genetics, 2011, 12(1):56-68.

[5]Pickard G, Pan W, Rahwan I, et al. Time-critical social mobilization[J]. Science, 2011, 334(28): 509-512.

[6]Nagurney A, Dong J. Supernetworks: Decision-Making for the Information Age[M]. Cheltenham: Edward Elgar Publishing, 2002.

[7]王众托. 关于超网络的一点思考[J]. 上海理工大学学报, 2011, 33(3): 229-237.

Wang Zhongtuo. Reflection on supernetwork[J]. Journal of University of Shanghai for Science and Technology, 2011, 33(3): 229-237.

[8]Liu J G, Yang G Y, Hu Z L. A knowledge generation model via the hypernetwork[J]. Plos One, 2014, 9(3): e89746.

[9]Wang F H, Guo J L, Shen A Z, et al. Evolving hypernetwork model based on We Chat user relations[J]. Computer Science, 2015.

[10] 倪子建, 荣莉莉, 刘泉. 基于超网络的维基百科内容知识本体演化研究[J]. 管理科学学报, 2013, 16(12): 68-78.

Ni Zijian, Rong Lili, Liu Quan. Study on evolving hypernetwork model of Wiki ontology[J]. Journal of Management Sciences in China, 2013, 16(12): 68-78.

[11] Motter A E, Moura A P, Lai Y C, et al. Topology of the conceptual network of language[J]. Physical Review E, 2002 , 65 (2): 065102.

[12] Ferrer i, Cancho R, Solé R V. The small world of human language[J]. Proceedings Biological Sciences , 2001 , 268 (1482) :2261.

[13] 马宏炜, 陆蓓, 谌志群,等. 微博语言的复杂网络特征研究[J]. 计算机工程与应用, 2015, 51(19): 119-124+193.

Ma Hongwei, Lu Bei, Chen Zhiqun, et al. Research on micro Blog language characteristics based on complex network[J]. Computer Engineering and Applications, 2015, 51(19): 119-124.

[14] 刘海涛. 汉语句法网络的复杂性研究[J]. 复杂系统与复杂性科学, 2007, 4(4): 38-44.

Liu Haitao. The complexity of chinese syntactic network[J]. Complex Systems and Science, 2007, 4(4): 38-44.

[15] Yu S Y, Liu H T, Xu C S. Statistical properties of Chinese phonemic networks[J]. Physica A, 2011, 390(7): 1370-1380.

[16] 程亚恒. 再谈为押韵而以古音诵读古诗不可取[J]. 语文建设,2011,(10):46-47.

Cheng Yaheng. Talk about the irrationality of reciting ancient poems with ancient sounds for rhyming[J]. Language Construction, 2011, 4(10): 46-47.

[17] 尹喜清. 也谈“斜”字在古诗中的读音[J]. 铜仁学院学报,2016,18(5):124-126.

Yin Xiqing. A talk of the pronunciation ofXiein ancient poems[J]. Journal of Tongren University, 2016, 18(05): 124-126.

[18] 张国举. 唐诗精华注译评[M].吉林:长春出版社, 2010.

[19] Wang J W, Rong L L, Deng Q H, et al. Evolving hypernetwork model[J]. The European Physical Journal B-condensed Matter and Complex Systems, 2010, 77(4): 493-498.

[20] Pan X L, He S L, Zhu X Y, et al. How users employ various popular tags to annotate resources in social tagging: an empirical study[J]. Journal of the Association for Information Science and Technology, 2016, 67(5): 1121-1137.

猜你喜欢
超度韵脚押韵
押韵押出韵味儿
悲悯
墙壁
《笠翁对韵》韵脚分析
根雕
韵脚怎么押?
还诗歌教学的本义
我给小鸡起名字
锤炼汉语发音的三种方法
Watch Out