先秦出土文献话题类型调查的语言学价值探析

2019-11-30 14:04罗曼
文教资料 2019年26期

罗曼

摘    要: 本文以先秦四种出土文献为例,提出一种认定出土文献语料类型的研究思路,即对先秦出土文献逐字意义描述后,根据既设的一个能全方位反映语言交际内容的语义分类体系,分类统计相关文献中各类语境字义单位的出现频率、语境字义单位数等,确定每种文献的话题热点、盲点及盲点边缘区的情况。话题热点是文献语料类型的重要判定标准。通过话题类型的调查,一方面可从历时视角比较不同文献在话语分布上的差异,揭示不同文献的语料属性,另一方面可从共时视角审视同时期相同文献内部语言文字单位使用的异同,凸显文献内容的特殊性。

关键词: 先秦出土文献    话题类型    义类

一、问题的提出

先秦时期语言面貌的真实呈现,以往的研究成果主要是从先秦传统典籍或出土文献入手,前者多认为其在传抄、流传过程中存在篡改,不足以反映先秦时期真实的语言情况,后者因时、地明确,故认为其对判定先秦时期语言面貌具有足够的说服力。然而在以往的专书研究中,一般将某种文献的所有语言现象等同于该文献所处时代的语言面貌,比如将甲骨文等同于殷商时代、西周铭文等同于西周时期的语言面貌等,但这种表述可能还是值得深思的。比如就殷商时代的甲骨文而言,其所记录的内容主要与殷王的占卜活动有关,故内容多涉及祭祀、渔猎、战争等,甲骨文献中亦多此类词语,可见这并不是殷商时代全民语言的整体呈现。若以此论断甲骨文献就是殷商时代的语言面貌,确实是值得质疑的。笔者作大胆设想,认为只有某一文献的话题热点才能够揭示其所处时代的真实语言面貌,主要原因是“历史文献的语言表达,是通过文献用字的意义组合来实现的,其话题热点的形成决定了话语表达中语言文字单位的使用状况,谈论农耕之事,必多用稼穑类字词;谈论征战之事,必多涉杀伐戎类字词”[1](209)。

二、研究思路及材料说明

(一)研究思路

从话题热点判定出土文献的语料类型,这是一种全新的大胆尝试。既然话题热点的形成取决于话语表达中语言文字单位的使用状况,笔者设想,借用词汇学中常用的义类分析法,即先构建一个比较适用于出土文献的语义分类体系,然后将所考察的文献用字单位逐一根据其意义进行分类描写,最终借助数字化的检索系统就可以将话题热点、盲点、盲点边缘等一一呈现。这一思路不仅可能有助于精准把握文献的话题热点,而且可能有助于从汉语史视角把握不同出土文献在表达同一概念意义时所使用语言单位的异同,甚至可能有助于从语言学视角探究文献内部不同篇章内部的差异。

(二)概念明确及材料说明

1.概念明确

由于本篇文章是对出土文献材料的一种全新的研究尝试,部分观点的提出与以往略有不同,因此要在此对其作简要的说明:

语境字义。从字面看,明显可见其与一般所言的“字义”或“词义”不同,此種界定首先是基于本文的研究对象是“字”而不是“词”,之所以选择“字”,主要是考虑到出土文献的语言特点,“某些双音节乃至更多音节组合的单位究竟属于‘词还是‘词组,多有见仁见智的判断分歧,而‘字的选择则可有效避免此种可能由于主观判断而导致的不确定性”[2](549)。而且从语料库的实际操作情况来看,以“字”为单位更便于计算机处理,只要标准统一,结论一般就不会出现差错。此外,本文所说的“字义”是强调“文字在投入文献语言记录过程中表达的意义,实为‘语境字义。虽然文字记录的文献语言单位主要是词,但是‘语境字义不等于词义,这主要是因为文献用字和文献用词并不是完全对应的。当然,‘语境字义不等于一般意义的‘字义,这主要是因为一般所谓‘字义可以是文字记录文献语言动态过程中表达意义的静态归纳,而并不能专指文字投入文献语言记录过程中表达的意义”[2](549)。

话题热点、盲点。“话题是语篇分析中的一个重要概念,是解读语篇的关键所在”[3](42),它的目的主要是指明“整个语篇所要传达的信息和信念”[4](40)。我们将其运用到历史文献的研究中,主要是为揭示文献所反映的实际历史交际内容,这与“话题”的本来目的是趋于一致的。因此,本文在研究中借用了“话题”之说,但与语言学的说法有所区别,我们是将历史文献语言单位意义的聚合体称为“话题”。这样界定的理由是历史文献内容的表达,主要是通过文献用字的意义组合实现的,话题的形成主要表现为与人类世界观相对应的一个庞大的语言系统中一个局部概念范畴的语言单位相对集中地得到运用,也就是说文献语言话题热点的形成主要取决于话语表达中语言文字单位的使用状况。基于这点考虑,某类语言文字单位在文献中大量相对集中地频繁出现,即可以定性为“话题热点”,反之,某类语言文字单位在文献中零出现就可以判定为“话题盲点”。

2.材料说明

先秦出土文献种类繁多,研究成熟度不一,故为有效开展此项研究。本文在选取研究材料时主要从文献的系统性、语言文字单位的数量及文字考释的成熟度等方面考虑,最终选取殷商的小屯南地甲骨文献、西周的铭文文献、战国楚简文献(郭店楚墓竹简和上海博物馆藏战国楚简一~八)、秦代的睡虎地秦简四种不同时期的代表文献作为主要研究材料。然而,四种文献由于年代久远、残泐程度不一,文献中存在多处无法释读或歧释的文字,所以最终能作为研究的字量与原文献存在差异:小屯南地甲骨文献的总语境字义单位数为36001、西周金文为27062、楚简为37999,秦简为32722[5](553)。

三、先秦出土文献语料类型异同分析

(上表中A表示文献在此类中所分布的语境字义单位使用频率,B为所占文献比重)

从上表中可以看出四种文献在话题类型分布上皆全部具备,但话题热点分布上存在差异:甲、秦分布在“时空”、金为“生物体”、楚为“虚字”。这种分布差异可以反映四种不同时期历史文献内容及话语表达上的差异:除楚简文献外,其他三种文献的话题热点主要集中于表示具体意义的语言文字单位上,楚简文献却集中于意义相对虚化的“虚字”上,这种显著的差异化特征一方面反映了汉语语法化的发展历程:殷商、西周虚字的使用频率较低,战国中晚期虚字出现频率高且大量新的虚字出现,另一方面揭示了不同文献类型特点造就了虚字使用情况有别,如楚简文献和秦简文献相比,前者明显多于后者,这与秦简文献本身的属性有关。

(上表中A表示文献在此类中所分布的语境字义使用频率和所占文献比重;B表示文献在此类中包含的语境字义单位数)

从上表可以看出:在“虚字”类中,楚简文献相比其他文献,不仅文献所占比重最高,而且表示相关语法意义的语境字义单位数量最多,尤其是“助词”在甲骨文献、金文文献中皆未见,楚简中大量出现,且语境字义单位数达到55个,这是话语表达方式的又一发展形式。

此外,其他话题类型分布在四种文献中也存在不同:

(一)甲骨文献之话题热点乃其他文献之话题盲点或盲点边缘

(上表中A表示文獻在此类中所分布的语境字义单位使用频率,B为所占文献比重。下表同。)

从上表可以看出“家畜、干支历日、祭祀、卜筮”四类中,甲骨文献的分布数量远远高于其他文献,比如“干支历日”类,甲骨文献中此类占文献总量的18.24%,其他三种文献比重皆较低:金1.64%、楚0.007%、秦8.83%。出现此种显著差异的原因主要与文献本身的话题类型特点有较大关系,甲骨文献和秦简文献主要记载的内容多与祭祀、卜筮的活动有关,干支历日作为其重要组成部分,其语言文字单位理当频繁现身。但楚简文献中多为战国时期思想学说的记载,几乎不论祭祀、卜筮活动,故干支历日仅出现3处,而且仅见于《容成氏》篇中。

(二)楚简文献之话题热点乃其他文献之话题盲点或盲点边缘

从上表中可以明显看出,楚简文献在“心理活动”“能愿动作”“文化教育”三类中所占文献比重远远高于其他文献,尤以“能愿动作”“文化教育”的情况最突出,甲骨文献零分布,金文文献和秦简文献皆少量分布:金86、30;楚610、731;秦233、27。此类分布不均衡的现象主要与所考察的楚简文献内容多与思想学说、历史事件等有关,而且从“心理活动”类中可以窥见古人语言思维能力不断增强,对人类内心世界的认知更深入。甲骨文献中仅出现225处,所占文献比重为0.62%,至战国中晚期的代表性文献楚简文献中多达1436次,所占文献达到了3.78%。

(三)秦简文献之话题热点乃其他文献之话题盲点边缘

从上表可以发现“天体、年月时刻、刑事诉讼”三类在四种文献中所呈现的差异化。以“刑事诉讼”而言,秦简文献中此类语言文字单位相对集中使用,所占文献比重达3.18%,其他文献皆较少,分别是:0.02%、0.33%、0.33%。又以“年月时刻”而言,前文有言甲骨文献内容多祭祀、卜筮活动,故用“干支历日”纪时,但秦简文献除了在祭祀卜祷内容上用干支纪时外,其他内容上仍以一般时间单位用语为常。

四、以“代词”类为例探讨语料类型研究在汉语史中的价值

前面主要从宏观层面把握文献的话题热点进而确定该文献具有语言研究价值的点,其实这种研究思路的尝试对汉语史的构建有着重要意义。以往探讨某一类词主要从专书出发,但为何选择此书中的某类词研究,少有人说明原因。或是研究某类词在某一时期的使用情况,在选取调查材料时仅选取几部具有代表性典籍,对文献本身的语料类型很少探究。基于此,本文从语义分类视角出发,通过比较多种文献,依托数据支撑并明确某种文献中某类词具有重要价值,似乎可以有效避免“眉毛胡子一把抓”的现象出现。下面将以“代词”为例说明此种研究尝试的重要意义,之所以选取“代词”,一方面是因为四种文献在此类中都包含一定量的语言文字单位,且“虚字”又在楚简文献中出现的频次最多,便于从历时角度作比较,另一方面是语言三要素中语法的发展变化相对较小,且内部成员简单,可以全方位考察。

(一)代词类语境字义使用频率及单位数量的差异化

(A表示文献出现频次及所占文献比重;B表示语境字义单位数)

从上表中可以看出楚简文献在“代词”类中所分布的语境字义单位数最多,共86个,且占文献比重约6.19%。其他三种文献的语境字义单位数和所占文献比重分别是5,0.85%,32,3.09%,57,5.56%。由此可知要探究先秦时期“代词”的发展情况,楚简文献是不可回避的材料之一。

(二)历时层面的代词发展情况描写

代词用来指称人或事物,在汉语史的发展历程中其变化特征较为明显,不同时期所使用的代词或是表示同一概念义的代词出现频次有别。学界对“代词”的分类一般将其分为人称代词、疑问代词、指示代词三种,三种代词当中以“人称代词”的时代特征最明显。笔者将由此入手,描写其在四种不同时期的出土文献中的发展情况:

从上表可以看出四种不同时期文献中人称代词的分布数量及出现频率明显有别。这种差异化的呈现,可以较好地体现出人称代词在先秦不同时期的发展脉络:

1.数量分布的差异化

考察上表,可以发现甲骨文献中仅具备第一人称代词,第二、三人称皆未出现,其他文献三种人称代词皆具备。而且,以金文文献和楚简文献的人称代词居多,秦简文献仅出现4个人称代词,且使用频率较低,这种差异的显现主要与实用文献的属性、文献内容有很大关系,秦简文献主要是关于日书、律法等内容的记录,在表述人称时多用一般称谓词。

(1)以第一人称而言,四种文献分布皆有差异:甲骨文献分布有“我、余、朕”3个;金文文献是“朕、余、我、吾”4个;楚简文献是“吾、我、余、朕”4个;秦文献是“我、吾”2个。还可以看出部分人称代词处于逐步消亡的阶段,如“朕”“余”发展至秦简文献时,已不可见。

(2)以第二人称看,甲骨文献零分布,金文和楚简文献皆分布有“乃、汝、尔”3个,秦简文献仅分布有“尔”。

(3)以第三人称看,甲骨文献零分布,金文文献分布有“厥、其”2个,楚简文献则分布有“厥、其、彼”3个;秦简文献仅出现“彼”1个。

2.高频分布的差异化

从使用频率的视角考察,可以窥见人称代词在不同时期的使用情况,提取其常用词。通过上表,可以发现:

(1)第一人称代词中高频词的分布不同:甲骨文献是以“我”居多,共5处;金文文献以“朕”最多,共7处;楚简文献以“吾”最多,共129处;秦简文献是以“我”居多。可以看出不同时期表示第一人称“我”的含义时常用词的使用有别。

(2)第二人称代词中,金文文献以“乃”“汝”的出现频率最高,共6处;楚简文献以“尔”居多,42处;秦简文献仅出现“尔”1个。可知,“汝”“乃”开始逐渐减少。

(3)第三人称代词中,金文文献以“厥”居多,27处;楚简文献以“其”的出现频率最高,共729处,这正好与后代文献多用“其”来表示第三人称而“厥”渐渐退出历史舞台的情况一致。

(三)共时层面的内部差异化描写

历史层面的考察重在梳理四种文献中人称代词的更替发展,共时层面的描写主要目的是考察同一种文献内部人称代词的分布异同,从而揭示出土文献内部语言差异的特性。本文拟选取同一属性的同时期材料《郭店简》和《包山简》作为研究材料,且主要以第一人称代词为研究对象考察其内部差异。

1.《郭店简》《包山简》第一人称代词分布情况

通过对包山简中代词分布情况的考察,发现其第一人称代词是零分布,而且代词仅仅局限在第三人称代词中。由此可以发现同时期不同文献内容的两种文献,它们的语言文字单位的使用情况是有差异的。

2.《郭店简》第一人称代词的文献分布特点

郭店楚简中第一人称代词主要分布有我、吾、余3个,尤以“我”的出现频率最高,达到25次。然而,通过对郭店楚简18篇文献的考察,发现第一人称代词仅分布在12篇文献中,其他6篇文献零分布。而且,第一人称代词在12篇文献中的分布也存在差异化,具体情况如下:

我:老甲4、老丙1、缁衣10、成闻1、六德2、五行1、语一、语三4、语四1

吾:老甲2、老乙4、缁衣2、鲁穆2、语二1

余:成闻2

从上面的分布情况可以看出:

(1)从文献分布数量来看,“我”主要分布在9篇文献中,“吾”分布在5篇文献中,“余”仅出现在《成闻》篇,且其出现频率略多于“余”,这与其他文献存在较大差异,原因是《成闻》篇中两处出现“余”的地方主要……

(2)以12篇文献来看,老甲、缁衣、成闻3篇文献分布有两个第一人称代词,其他文献仅分布1个。而且,老乙、鲁穆、语二3篇中的第一人称代词仅用“吾”,老丙、六德、五行、语一、语三、语四6篇文献只用“我”。从这种分布的差异中,可以发现郭店楚简文献内部语言文字单位的使用存在差异化。

五、结语

本文是对出土文献材料研究的一种全新尝试,相关术语、研究思路可能存在不明晰之处。然而,本文的主要目的是借助已较为成熟的语义分类方法,尝试立足于语义框架探究不同文献的语料类型,确定文献语言研究价值所在。此外,也可以从汉语史视角探究文献内部不同篇章之间在语言文字单位上使用的异同性,从而为学术史视角的文献学派归属提供可靠的理论和数据支撑。

参考文献:

[1]刘志基.基于语料特点判断的上古出土文献某字存否研究——以“信”字为例[J].华东师范大学学报(哲学社会科学版),2015(5).

[2]刘志基.中国文字发展史(商周文字卷)[M].上海:华东师范大学出版社,2015.

[3]刘景霞,柳萍.语境中的主观因素及其对语篇话题的阐释[J].安徽理工大学学报(社会科学版),2012(1).

[4]任紹曾.语篇的多维分析[J].外国语,2012(3).

[5]刘志基.中国文字发展史(商周文字卷)[M].上海:华东师范大学出版社,2015.

基金项目:湖北省教育厅人文社会科学研究项目“基于语料库的楚简文献词语专题研究”(15Q137)。