儒法两家经典的共词分析与研究*

2015-02-20 06:34天津市哲学社会科学研究规划项目儒法两家经典词频及共现分析与研究编号TJTQ13013的成果之一
大学图书馆学报 2015年2期
关键词:高频词法家词频

天津市哲学社会科学研究规划项目“儒法两家经典词频及共现分析与研究”(编号:TJTQ13-013)的成果之一。

儒法两家经典的共词分析与研究*

天津市哲学社会科学研究规划项目“儒法两家经典词频及共现分析与研究”(编号:TJTQ13-013)的成果之一。

摘要以儒家经典及译文为数据来源,借助计算机对原文及译文词语进行挖掘、整理,建成词语频率数据库,采用词频分析软件,应用词频分析方法,对高频词进行多角度的比较研究,探讨儒法思想精髓及其异同点,开拓我国儒法经典以及古典文献研究的新途径。

关键词儒法经典词频分析词频研究 共词分析是对内容相关的学科文献中存在相同对的现象进行分析,词对共现的频率越高说明这个两个 对进行聚类、关联、词频等的统计, 可以揭示出该学科研究成果的总体特征、各子领域之间的内在联系以及学术研究的发展脉络与发展方向,有助于专家对学科研究进行客观评价,同时也方便情报人员挖掘文献集中所隐含的知识。 关系越密切。由于 能反映学科的研究内容,对 进行共现分析,可以发现研究对象之间的亲疏关系,挖掘隐含的或潜在的有用的知识。两个词汇在一篇文献中共现显示了它们所代表的概念间的联系,相同词汇多次共现展现了同一研究主题的文献之间的联系[2]。由此可以形成对该领域学科结构以及与相关领域的联系的描述,获得关于学科发展、交叉、渗透和兴衰的趋势的知识[3]。

我国正处在转型和改革的关键时期,如何更好地推进改革、促进国家快稳发展,是摆在我们目前的重要课题。吸收和借鉴古代的治国谋略,古为今用,确是一条好的途径和方法。

中国古代治国方略以儒、法两家为最有代表性。儒家主张“以德治国”,法家强调“以法治国”。两家治国方略各具特色,在政治实践中应兼采并用,各取所长,优势互补,以实现国家的长治久安。总之,从维护和保障社会的稳定来说,法律和道德有着同样重要的作用。它们相互联系、相互补充。道德规范和法律规范应该相互结合,共同发挥作用,从而保证社会主义市场经济的健康发展,促进整个民族素质的提高。

我们要以科学的态度、运用科学的方法,加强对儒法经典文化的挖掘、整理和分析,取其精华、去其糟粕,汲取和借鉴儒法创制的经验,对建设中华新文化,无疑具有明显的启迪作用。

本文采用的词频共现分析法,是一种通过词频关联来探视内容本质的定性与定量相结合的研究方法。它的主要原理是对同一篇文献中的词汇或名词、短语共同出现的次数进行统计,以此为基础对这些词进行分层聚类,揭示出词之间的亲疏关系,进而分析它们所代表的学科和主题的结构变化[1]。

利用共词分析既可以横向和纵向地分析领域、学科的发展过程、特点以及领域或学科之间的关系,又可以反映某个专业的科学研究水平及其发展历史的动态和静态结构,评价研究的投入和产出的关系。

1研究来源、方法和过程

下载整理儒家经典“十三经”的全文及译本的电子文本;下载整理法家管仲、商鞅和韩非子的经典著作的原文及译文的电子版。自编词语、短语挖掘软件和字词频率统计工具,利用数据挖掘和文本抽词方法、古籍词频词表对比方法,析取儒法经典全文中的高频词语,输入计算机,构建儒法高频词语料库。利用SPSS软件和Salton、Jaccard共现指数公式对儒法经典词语、短语进行综合比较,最后筛选出共现核心词、短语,为儒法经典分析和研究提供基础数据。采用定性和定量相结合、内容同特征相结合的分析方法,对大量数据进行分析研究,找出儒法经典的精髓及其异同点,探讨儒法经典学科的发展规律及结构状况,为儒法经典的深入研究及古典文献的研究提供理论依据和实用性帮助。

由于研究目的是揭示儒法经典的思想,而非专门的语言文学研究,为了便于通过词语分析儒法经典的主导思想,特采用儒法经典原文和译文统一进行词频共现研究。以便于更准确和全面地把握儒法经典的思想。

2儒法经典的词频共现、聚类分析

从表1可以看出,儒法经典词条数量和词频数量存在较大差距。用SPSS软件按词频数量进行聚类后,自然划分成了6个级类(见图1)。总体来看,《管仲》的词频量最多。第二类是《韩非子》和《仪礼》,合计词频数量114502个,占总词频量的26.72%。第三类是《孟子》、《周易》、《左传》和《商鞅》,合计词频数量90922个,占总词频量的21.22%。第四类是《礼记》、《论语》和《尚书》,合计词频数量32889个,占总词频量的7.68%。第五类是《公羊传》、《孝经》和《谷梁传》,合计词频数量14013个,占总词频量的3.27%。第六类包括《诗经》、《周礼》和《尔雅》,合计词频数量仅有6196个,占总词频量的1.45%。通过儒法经典的词频数量变化的比较,可以清晰地了解到儒法经典之间的关联情况。

表1 儒法经典词和词频数量表

图1 儒法经典词频数量聚类图

3儒法经典共词矩阵聚类分析

通过对16种儒法经典的下载、转换、整理等工作,对全文及译文进行数据挖掘,析取出大量高频词语、短语(两字节及以上),进行词频汇总,最终按词频和共现量得出一个16×16的中文儒法经典词频共现观察值矩阵表(如表2所示)。

从表2可以看出儒法经典之间的词频共现程度。共现频次越高,说明儒法之间相依发展和学术关联程度越强;共现频次越低,则说明关联程度越弱。儒法经典观测值矩阵表中的高频词共计428515频次,儒法经典之间共现频率高达202056次,占总频次的47.15%,可见儒法经典之间的共现率是比较高的。

儒法两家的词频数量、词频共现数量以及所占百分比存在较大差别,词频数量最高的是法家经典《管仲》,词频169993次,最低的是儒家经典《尔雅》,词频349次,二者相差400多倍;儒法之间词频共现最高的也是法家经典《管仲》,共计34829频次,词频共现最低的是儒家经典《尔雅》,共计共现1034频次,两者相差33倍。词频共现在本学派占比最高的是儒家经典《尔雅》,占比高达296.28%;而最低的是法家经典《管仲》,词频共现在本学派占比只有20.49%。两者相差14倍。在词频和词频共现百分比的比较中,法家《管仲》和儒家《尔雅》出现较大落差的反比现象,说明儒法两家的关联程度是低的。

表2 儒法经典词频共现矩阵

表3 儒法十六部经典词频与共现顺序排列

从表中看出,儒法经典词频及其共现成三种状态。第一种是稳定型,即词频数量和共现数量的顺序一致。儒法经典《管仲》、《韩非子》、《诗经》、《周礼》和《尔雅》都属于这种类型。第二种是活跃型,即词频数量排序落后于共现数量的排序,如《仪礼》、《礼记》、《左传》和《公羊传》。第三种是静止型,即词频数量排序高于共现数量排序,有《孟子》、《周易》、《商鞅》、《尚书》、《论语》、《孝经》、《谷梁传》。通过三种类型的划分更能清晰地认识儒法经典的活跃程度和儒法之间的内在联系情况。

在16部儒法经典中,共现频次超过平均百分值6.25%的有8部,超过10%的有2部,是法家经典《管仲》和《韩非子》。2部经典的共现词频数量达到64486次,占16部经典的31.9%;词频共现最少的是《尔雅》,为1034次,占儒法经典总数的0.512%。词频共现次数越大,说明该经典与其他经典的联系越强。

按照词语共现频次,划分成5个区,即词语共现1-500频次为低频区;词语共现501-1000频次为中频区;词语共现1001-2000频次为高频区;词语共现2001-3000频次为超高频区;词语共现3001-10000频次为高频核心区;词频区限的划分能更加清晰地揭示儒法经典之间的关系。

从表2可以看出,第一组词语高频共现核心区有4组儒法经典,《韩非子》和《管仲》共现9855次,《管仲》和《孟子》词频共现3806次,《商鞅》和《管仲》词频共现3597次,《韩非子》和《孟子》词频共现3080次。这组词频共现高达20338次,占儒法经典词频共现总频率202056次的10.07%;第二组超高频共现区域,《管仲》和《周易》词频共现2889次,《管仲》和《仪礼》词频共现2800次,《韩非子》和《商鞅》词频共现2652次,《管仲》和《尚书》词频共现2508次,《韩非子》和《周易》词频共现2294次,《韩非子》和《仪礼》词频共现2167次,《管仲》和《论语》词频共现2073次,《周易》和《孟子》词频共现2063次,《韩非子》和《尚书》词频共现2051次。这组共有9种儒法经典词频共现。共现频次高达21497次,占总频次的6.18%;第三组词语共现高频区域共有18组儒法经典词频共现,包括《管仲》、《韩非子》、《商鞅》、《尚书》、《仪礼》、《礼记》、《论语》、《左传》、《孟子》、《孝经》、《周易》。词频共现高达24224次,占总频次的11.99%;第四组为中频区,共有25组儒法经典词频共现,除了《尔雅》和《周礼》外,涉及儒法经典14种,共现词频17156次,占总频次的8.5%;第五组为低频区,共有62组儒法经典词频共现,涉及全部儒法经典16种,共现词频14343次,占总频次7.1%。通过词频分组情况可以看出,法家三部经典和儒家的《孟子》、《周易》、《仪礼》、《尚书》、《论语》,词频共现比较活跃,词频共现达2000次以上。而《尔雅》和《周礼》的词频共现比较低,都在500次以下,另外《诗经》只有一次共现超过500次,也属低频共现范围。通过词频共现方法探讨儒法经典的关联程度,比主观判断更具有客观性和可靠性。

4儒法经典词频矩阵共现分析

儒法16部经典共有428515个词条,共现高频词为71466条,占总数的16.6%。表3按照词频数量递减排列。由于篇幅限定,只选取前50位,总词频在700次及以上的,进行词频共现分析。

表4 儒法经典词频矩阵观察值共现分析

41节操79522100000009400431321742就是783000000380361011103812152843轻信76932914003238190004081918044刑罚7632756000030042000487148045有节75310297000210000005081443446天地719101331023343601079181207237247禅让7124154015388352639602491532148揖让7080000002860060039512814549七月700223584430282222239303231131750孝敬7004012212301171806100027510536

相同点分析。从高频词共现表中可以看出,前50个高频词中有6个在16种经典中都出现共现,占50个共现高频词的12%,而这6个共现高频词的词频共计达到16069次,占50个共现高频词的22.5%,说明儒法经典的内容有一定的相似性。这6个共现高频词是君主(4276次)、天下(3188次)、治国(3163次)、统治(2607次)、赏罚(1739次)和等级(1096次)。这6个共现词是连接儒法经典的桥梁,是儒法思想的相交点。从以上的高频词共现可以得出,儒法两家的宗旨是趋向一致的,都是为君主专制政治制造理论依据,追求天下大治的理想境地,为统治者提供治国方略。儒家的德治和法家的法制的目的都是为了维护君主专制和等级制度。儒家以“三纲五常”、“忠孝节义”为指导思想,法家以“依法治国”、“中央集权”为根本制度,皆追求稳定的传承和长久的统治。在国家治理方面,儒家和法家都提倡赏罚制度。在等级制度上,儒家提倡等级,法家则认为法律面前人人平等,法不阿贵。

在50条高频词中,儒家经典的高频词多于法家经典的高频词。主要分五个大类,第一类为忠知类,计4个词条,占总词条50条的8%,词频4089次,占总频次71466的5.7%,主要有忠信、忠诚、忠言和愚忠;第二类是孝信类,词频2352次,占总词频的4.92%,为孝悌、孝敬、轻信和信道;第三类是仁爱类,词频10698次,占总词频的14.96%,这类是高频词核心表中词频最高的类别,也最能反映儒家经典的主导思想。主要有仁德、仁政、仁义和天下;第四类是人物类,词频共计5900次,占总词频的8.25%,有孔子、司马、大夫、奴隶主和公孙;第五类是礼节类,共有11条词条,词频9838次,占总词频的13.76%,主要有节操、有节、礼让、礼法、祭祀、节制、孝敬、禅让、礼节、心智和揖让。

法家经典高频词主要有6条,词频8836次,占总频次的12.36%,主要有法制、农业、刑罚、专制、地主和军队。对前50个儒法经典的高频词进行对比分析,能更加清晰地了解儒法两家经典的内在联系。

应用词频统计和共现分析法研究儒法经典的精髓及异同点,可以开拓传统文化研究的新途径,也为古典文献的研究开辟出新方法。

参考文献

1张勤,马费成.国外知识管理研究范式——以共词分析为方法.管理科学学报,2007,(6):65-75

2邬爱其,李生.外部创新搜寻战略与新创集群企业产品创新.科研管理,2012,33(7):1

3Gupta,A K; Smith,K G; Shalley,C E.The interplay between exploration and exploitation.Academy of Management Journal,2006,49(4):693-706

作者单位:天津医科大学图书馆,天津,300070

Co-word Analysis and Study on Confucian and Legalism

Ma Shijie

Abstract:Based on Confucian classics and the translation, by using computer application system to dig and sort the words from the original text, a high-frequency words frequency database has been developed. By using word frequency analysis software and method systemic and comprehensive comparison among high frequency words has been made. The essence, similarities and differences of Confucianism and Legalists has also been discussed and the new research approach to study the classical literature of Confucian and Legalism has been explored. This paper analyzes the new information environment the university students are facing and points out that under the new information environment the information retrieval course teaching mode has 4 shortages which are lack of attention on students’ network information management ability development, failure of curriculum design following the changes of students’ information demand; failure of full use of online education platform, failure of university digital library to play a sufficient role, and etc. It then puts forward relative optimization strategies.

Keywords:Classical literature of Confucian and Legalism; Word Frequency Analysis; Word Frequency Study University; University Library; Information Retrieval Course; Information Environment

(接第99页)

Optimization Strategies for University Information Retrieval Course Teaching Mode under the New Information Environment

Lu HejianJiang Fengwei

收稿日期:2014年8月15日

通讯作者:□马世杰*马世杰,OCRID:0000-0002-7380-2851,mashijie@tijmu.edu.cn。

猜你喜欢
高频词法家词频
30份政府工作报告中的高频词
省级两会上的高频词
基于词频分析法的社区公园归属感营建要素研究
28份政府工作报告中的高频词
省级两会上的高频词
小小书法家
小小书法家
小小书法家
小小书法家
词频,一部隐秘的历史