释义元语言研究的三个阶段*

2022-10-31 07:45刘宇红王怿旦
外语学刊 2022年1期
关键词:词频语言学学术

刘宇红 王怿旦

(南京师范大学外国语学院,南京 210097)

提 要:释义元语言研究从通用词汇开始,到通用学术词汇,再到专门学科学术词汇。 这一进程体现知识体系从一般到具体、从通用到专用学科的逻辑顺序。 语言学由于自身的学科定位和研究专长,应该成为专门学科领域释义元语言研究的领跑者。 对语言学学科的个案研究,有助于推动和引领各专门学科领域的释义元语言研究,也有助于探讨各学科欧美学术传统的本土化,促进国内相关学科的学术发展,以及各学科领域高等教育的发展。

1 引言

自公元前6 世纪元语言概念进入学术视野以来,元语言研究已经取得长足的发展,但是对于元语言研究从内容和学科关联方面进行分类,并从学科发展的内在逻辑总结其发展规律和若干的发展阶段,到目前为止学术界还没有相关的研究。本文正是在这一背景下的研究。

释义元语言是元语言的下位概念,始于李葆嘉(2002)对元语言4 个等级的划分。 李葆嘉(2002) 认为,元语言包括探讨认知能力的习义元语言,用于辞书编纂和语言教学的释义元语言,用于义场建构和义征(即结构语义学派的语义成份)分析的析义元语言,以及用于获取人类普遍概念和跨语言对比的认知元语言。 释义元语言是单义的、数量最简的释义基元(primitive)。

释义元语言的释义对象是词典和教材等文本,所以在内容上远比日常话语中的定义更丰富。在日常话语中,一个定义往往只是一句话,即采取“种差+ 邻近的属概念”的方式来下定义,比如“人是会创造和使用劳动工具的动物”,其中“种差”是“会创造和使用劳动工具”,这是其他动物所不具有的能力,表示人同其他动物的差别(即“种差”),“邻近的属概念”是“动物”,在生物学上“动物”是比“人”高一层次的属概念。 与此相反,百科词典或教材中的词条或章(节)的内容可以是几百字,上千字,甚至上万字,所以被称作“定性叙述”(黄鸿森1980)。

接下来,我们要提出并介绍释义元语言的3 个发展阶段。 在3 个阶段中,前两个阶段已完成相对完备的理论建构和相关词汇表的产出,但是第三个阶段还处在起步阶段。 我们将以语言学学科为例,探讨针对专门学科领域的释义元语言研究。

2 释义元语言的3 个阶段简述

2.1 第一阶段:通用词汇表

通用词汇表对应通用知识(即百科知识)。最早的通用词汇表出现在1928 年,当时Ogden 列出850 个“基础英语”词汇,它的用途是词典释义;1932 年出版的《基础英语词典》 (Webster 1932)收录2 万词条,全部用这850 个词汇来释义。 后来,West(1953)编制了包含2000 个词汇的“通用词汇表”(General Service List,常缩写为GSL),是一个比较成熟的也被广泛应用的释义元语言词汇表,《朗文当代英语词典》(1978)就是采用这2000 个基础词汇来解释5.6 万个词条。 所以Michael West 本人也被Dolmaci 和Ertas(2016)赞誉为“词汇研究的先驱”。 1955 年,法国学者Gouenheim 研制了1475 个法语词汇的通用词汇表,用来编写《基础法语》 课本(Gougenheim 1955)。 后来扩大一倍略多,《基础法语词典》(1958)采用三千余个释义元语言词汇。

中国国内的通用词汇表研究,始于张津和黄昌宁(1996)的《从单语词典中获取定义原语方法的研究及现代汉语定义原语的获取》,是汉语释义元语言专题研究的第一篇文献,并且引领安华林(2005,2009)、苏新春(2005)等学者在通用知识领域的释义元语言研究,他们研制了高度完备的通用词汇表,数量都在3000 词左右。

2.2 第二阶段:通用学术词汇表

从通用词汇表到通用学术词汇表,是一个很自然的发展过程。 随着二战后学术的迅猛发展,学术文本的数量也空前地增加,为了指导和规范学术话语,需要开发基于学术英语(English for Academic Purposes:EAP)的通用学术词汇表。 认定通用学术词汇的标准,是它们出现在学术语境中的频率远大于非学术的语境(Malmstrom et al.2018:29)。

从上世纪70 年代开始,不同版本的通用学术词汇表一个接一个地出现,比如美国大学词汇表(American University List:AUL)(Praninskas 1972)和大学词汇表(University Word List: UWL)(Xue,Nation 1984)都是用于学术目的的词汇表。 进入21世纪以来,又出现Coxhead (2000)的Academic Word List(AWL),Gardner 和Davies(2013)的Aca⁃demic Vocabulary List(AVL),以及Simpson⁃Vlach和Ellis(2010) 的Academic Formula List(AFL)。在这些词汇表中,Coxhead (2000) 的AWL 影响最大,自问世以来,在过去十来年里成为英语教育领域主要的词汇参照表(Gardner, Davies 2013)。

国内学者在这方面所做的工作并不多,检索可见程齐凯等人(2019)的论文《领域无关学术文献词汇功能标准化数据集构建及分析》,所谓的“领域无关”是指“通用学术领域”,作者立足于情报科学这一学科平台,关注重点是对研究问题和解决方法的统计,所以没有发现通用学术领域的释义元语言的词汇表。

2.3 第三阶段:专门学科的学术词汇表

进入21 世纪以来,对于通用学术词汇的批评越来越多,批评的焦点是通用学术词汇的学科针对性不够,所以它的有效性,或者说对于专门学科领域文本用词的覆盖率太低,比如Hyland 和Tse(2007:235)认为“不同学科的文本各不相同,有损于词汇表的实用性”,Durrant (2016:50)也认为“没有一个词汇表可以满足各个学科学生的需求”。 在通用学术词汇表的应用方面,Hyland 和Tse(2007)、Ward(2009)还认为,教师和教材不应该误导学生,让学生以为有一个跨越学科的通用的学术词汇表,他们认为除了通用的学术词汇表之外,还应该有各专门学科领域的学术词汇表。

除定性的批评之外,还有学者做过很多定量研究,对问题的严重性做过更清晰和更直接的认定,比如:Hajiyeva(2015)以AWL 和BNC(British Na⁃tional Corpus)的词频语料为基础,通过对508,802字的学术语料的统计分析,发现AWL 词汇具有6.5%的覆盖率。

在中国国内,知网项目负责人董振东等人(2007:5)撰文指出,知网只关注“通用的知识”,而“专门领域的知识只能留待专门领域的专家来研究和建设”。 在实际操作方面,国内学者基本上还没有起步。 检索唯一可见王世杰和赵玉华(2019)自建小型的中医英语语料库,统计词汇频率,总结1000 词的高频英译词汇,这是专门学科领域学术词汇表研制的有益尝试,对于中医领域的翻译工作有一定的指导意义,但它不是中医领域的释义元语言词汇表。

董振东等人(2007)指出专门学科领域释义元语言研究的发展方向以及研究者的主体认定,即各专门学科领域的释义元语言研究不可能由一个百科全书式的学者来包揽,而只能由各个学科领域的学者自主完成。 我们认为语言学可以也应该成为吃螃蟹的先行者,因为语言学以语言和元语言为研究对象,它应该责无旁贷地开启语言学语域的释义元语言研究,研制出一个专门针对语言学学科的数量有限、单义的具有语义基元性质的释义基元词汇表。

3 实施专门学科领域的释义元语言研究

中国大陆的语言学研究不同于欧美传统,它没有独立的、统一的学科和专业建制,而是分为两部分,一是汉语界的“语言学及应用语言学”研究,二是外语界(主要是英语学科)的“外国语言学及应用语言学”研究,所以本节也分两个方面来探讨语言学语域的释义元语言研究。

3.1 英语学科中的语言学释义元语言研究

在英语学科中开展语言学语域的释义元语言研究,在方法上可以借鉴早期的通用词汇研究和通用学术词汇研究的方法,即通过真实学术文本的统计,总结出基于释义词汇词频数据的词汇表。这样的方法在通用学术领域中是一种比较成熟的操作手法,比如:Coxhead(2002)统计400 多个作者共414 篇学术文本,总字数达3,513,330 词汇实例(token),共70,377 个词汇类型(type),涉及4 个领域,即艺术、商业、法律、科学,语料涉及学术期刊、大学教材等,编制成享有盛誉的AWL.在AWL 的基础上,Gardner 和Davies (2013) 使用9 个学科共1.2 亿字的学术语料,编制成“新学术词汇表”(new AWL)。 Dolmaci 和Ertas(2016)统计人文、教育、经济、法律、自然科学等多个领域的57 本教材,统计出土耳其语学术词汇表(Academ⁃ic Turkish Wordlist)。

在语料的取舍原则上,也有现成的方法可以借鉴,比如Hajiyeva(2015:139)在统计11 本大学教材时,把语料取舍原则归纳为:(1)采取词族(word family)(Bauer and Nation, 1993)统计方法,一个词族包括一个词的屈折、派生等变体形成,比如stimulate, stimulative, stimulation, stimu⁃lator, stimulatory 可以算作一个词族。 (2)为了确保词汇统计的可靠性,去掉文本中所有的参考文献、表格、索引、附录,由于所涉及的课程较多,人名、地名、机构名称等专有名词只属于各特定学科,所以也都去掉。 (3)所有用连字符表示的合成词,都拆开来统计,如long⁃term, common⁃sense,decision⁃making 和child⁃friendly. 不拆分的合成词如:socio⁃historical, ad⁃hoc, grapho⁃phonemic, walsy⁃palsy, wishy⁃washy.

在具体的操作上,可以以一本权威的英文版语言学词典为基础语料,比如以Bussmann(1996/2000)的Routledge Dictionary of Language and Lin⁃guistics 为基础语料(总字数近34 万),扫描后运用OCR 软件转换成为DOC 文档,人工校对后,分别运用hanlp, jieba, thulac 软件进行分词操作,再通过人工比对和校正,把句子分解为词或词组,建立“释义元语言词频统计表”。 将“释义元语言词频统计表”与West(1953)的“通用词汇表”(GSL)中的2000 个词汇进行对比,在总词频表中排除2000 个通用词汇后,即获得语言学语域的专用学术词汇,即《语言学语域的释义元语言词汇表》,再将它与Coxhead (2000) 的AWL 进行比对,估计两者的交叉部分属于次高频词汇,词频最高部分是语言学语域特有的术语和与研究方法有关的元语言词汇。

再以胡壮麟(2017)的《语言学教程》作为英语语言学的教材样本,在扫描和分词操作后进行释义元语言词汇的统计,对比国外原版的语言学词典与国内教材在释义元语言使用上的差异,总结国内教材(样本)在释义用词方面有哪些变化,重点关注释义用词的数量和词频数据,并在对比的基础上,优化《语言学语域的释义元语言词汇表》。

3.2 汉语学科中的语言学释义元语言研究

在《语言学语域的释义元语言词汇表》完成之后,再以《现代汉语词频词典》(最新版)和安华林(2009)的“汉语释义元语言词表”为参照,把英文版的“释义元语言词频统计表”翻译成汉语,将翻译后的目标词控制在3000 左右,以便进行英、汉释义元语言的比较。 对于超出部分,将参照《现代汉语词典》和《新编同义词反义词词典》(均取最新版),把低频词替换为高频词,如果替换产生明显词义差别,则保留低频词。

英汉语释义元语言的语际对比,拟采用叶蜚声与徐通锵(2018)的《语言学纲要》作为汉语语言学的语料样本,在扫描和分词操作后进行释义元语言词汇的统计,再将它与胡壮麟(2017)的《语言学教程》的释义元语言进行对比,统计英、汉语教材在释义元语言上的语际差异,并与“释义元语言词频统计表”(英汉双语)对比,总结英、汉教材在释义元语言使用上的差异,并探讨产生这种差异的认知原因、文化原因与语言类型学原因。

英汉语的释义元语言比较,需要克服“英语中心主义”(Anglocentrism)。 所谓英语中心主义,是一种基于种族中心主义(ethnocentrism)的认知取向上的偏好,它使得语义的取向、价值观、语义范围等偏向于特定的人群,并把这些偏向性的内容强加于另一人群。 在当今以英语为主导的学术格局中,人们默认认知、心智、颜色、情绪、评估、意识、行为、信息、交流、社会、隐私等都是中立于特定文化的科学工具,它让人们自以为可以通过不带偏见的、客观的方式来谈论人类认知(Wierzbicka 2011:192)。 在此基础上,Carsten(2019)对于如何避免元语言研究中的英语中心主义做了实际的探索,比如英语的mind 一词,是认知语言学、心理语言学、神经语言学等领域的基本概念,在丹麦语中最接近的概念是sind,但是sind 和mind 是完全不同的两个概念单位:mind 包含3 个语义特征,即它是人的一部分,与身体(body)相对;它确保一个人可以思维;它是人类思想的加工中心。 与此不同的是,丹麦语的sind 是19 世纪末20 世纪初身份种族主义(identity nationalism)文本中的常用词,即一个丹麦人要么具有“丹麦思维”(of Da⁃nish sind),要么具有“德国思维” (of German sind),所以sind 表示“个性”和“倾向”,人们要么具有“轻思维”(lyst sind 对应英语的light mind),即具有乐观的人生,要么具有“暗思维”(mørkt sind 对应英语dark mind),即具有悲观、消沉的人生。 所以sind 体现一个人心理上的平衡,而且与英语的mind 表示“理智”不同,sind 还表示情感,比如在丹麦语中当sind 受到某种挑逗时,它是可以沸腾的。 所以,mind 只适用于英语,它不是普适的超越文化、认知和语言的普遍概念,sind 在文本中有明显的语义差别,我们在认知语言学中可以谈论the embodied mind 和the mind and cogni⁃tion,但是不能说the embodied mind,或the mind and the cognition.

基于上述的分析和语例,我们认为,在释义元语言的制订和翻译过程中,必须通盘考虑英、汉两种语言的概念结构。 比如,worker 对应“工人”,但是“工人”在汉语中显然激活了“工厂”框架,所以linguistic worker 不能对译为“语言学工人”,只能译成“语言学工作者”。 同样,linguist 不严格地对应“语言学家”,因为前者可以指任何从事语言工作的人员,包括语言教师,不一定要有很高深的学术造诣,而后者则是指语言学研究领域的专家。

4 专门学科领域释义元语言的应用价值

4.1 降低英语教材的难度

英语专业本科生的“普通语言学”或“英语语言学”课程,是被学生抱怨最多的一门课。 吴庄和文卫平(2009)对252 名受访者对课程的看法进行描述,出现词语121 个,共744 次。 词频在10 次以上的依次为“难”( 118 )“枯燥”( 92 )“深奥”(74)“抽象”( 72 )“有用”(36)“没用”(28)“乏味”(26)“复杂”(26)“晦涩”(18)“有趣”(16)“广泛”(16)“单调”(14)“理论化”(12)。

不只是学生的负面评价多,外语界的学者也都持有相同的观点,比如王怡宁(2019:58)认为“英语语言学课程的理论性很强,基础概念与抽象概念偏多”。 梅松竹(2015:282)也认为,高校英语专业语言学教材,“没有用一些简单易懂的词汇和语句,而是用抽象的理论性语言、原著中的语言或者是用复杂的图表进行解释,这样一来反而更加深教材内容,学生学习起来难度很大,只有一小部分同学能够理解”。 可见,英语语言学教材的释义内容可能确实存在较大的问题,主要表现为教材作者借鉴和引用语言学研究专家的诸多话语和词汇,没有充分考虑英文的原版学术专著和作为非本族语者教材之间的语体和用词差异,使得语言学教材的难度偏大,而且,偏难的教材又影响到教师的课堂话语和词汇选择。 所以,通过对语言学语域的释义元语言词汇进行规范,选取高频释义词汇作为编写教材的基本用词,并且简化和规范课堂话语的释义词汇,才有望改变这一局面。

4.2 改进语言学论文撰写的用词数量和用词规范

此前的通用学术词汇,“只能满足学生的接受性需求(receptive),即满足学生阅读学术文本的需要,专业性的学术写作(productive)所用的是另一种规范”(Nation 2008:129),所以很难规定出某种学生必须达到的写作水准。

在学术创作上,又可以分为两种情况,一种是“成熟的学科创作”(established disciplinary writ⁃ing),是一种“成熟的目标”(established target),另一种是“成长中的学科创作”(emerging discipli⁃nary writing), 只能被理解成为一个“过程”(process)(Gardner, Davies 2016: 63)。 要完成对于接受性词汇和创作性词汇的区分,以及对于“成熟的学科创作”和“成长中的学科创作”的区分,在现有的通用学术词汇表(如AWL)的基础上是无法实现的,因为它们对于语言学的专门领域覆盖率太低,只有针对语言学的专门学科制订出专门的学术词汇表,并对专门的学术词汇按词频分级,来实现如下两个目标:在创作时能熟练使用高频词,在阅读时要能熟练使用次高频和中频词;在初级的专业学术写作中能使用高频词,在较高层次的学术写作中能使用次高频词和中频词。

4.3 促进英、汉语言学学科的交流与融合

编制语言学语域的释义元语言,可以促进英语语言学与汉语语言学的交流与互鉴,在教材编写上取长补短,培养学贯中西的下一代语言学专家,才有望破除吕叔湘(1980:13 -14)提出的语言研究的“两张皮现象”,即两个学科在研究方法和研究内容上各搞一套。

要对“两张皮现象”进行系统化的描述,并且找到两个学科的最大公约数,一个比较可行的切入点是发现两个学科共同的释义元语言词汇表,并在此基础上总结两者所用的释义元语言词汇表的差异,再从认知习惯、文化传统和语言类型学特征等方面分析产生这一局面的原因。

5 结束语

释义元语言研究历经3 个发展阶段,即从通用知识领域的通用词汇,到通用学术知识领域的通用学术词汇,再到专门学科领域的专门学术词汇。 这一发展顺序体现出人类的认知发展顺序,也体现了知识体系从一般到具体、从通用到专用的逻辑顺序。 专门学科领域的释义元语言研究尚未起步,语言学由于自身的学科定位和研究专长,应该成为专门学科领域释义元语言研究的领跑者,所以本文以语言学作为例子分析专门领域释义元语言发展的操作方法,包括英、汉语对应学科(即英语语言学与汉语语言学)的发展规律,也探讨它在3 方面的应用前景。

对语言学学科的举例性论证,完全适用于其它学科,因为各现代学科(如心理学、社会学、法学、人类学等)的发展轨迹都必须面对欧美学术传统的本土化以及与此相应的“两张皮现象”,在学术研究与本土人才培养领域也存在类似的关系问题,所以对语言学学科的个案研究,以及该学科领域的专门化释义元语言研究,能够对其它学科的释义元语言研究起到示范作用,并最终引导和规范释义元语言研究第三个阶段(即专门学科领域的释义元语言研究)的全面展开。

猜你喜欢
词频语言学学术
Chinese Traditional Medicine
语言学研究的多元化趋势分析
A Pragmatic Study of Gender Differences in Verbal Communication
毛泽东话语的词语特征
书讯《百年中国语言学思想史》出版
The Influence of Memetics for Language Spread
词频,一部隐秘的历史
董进霞 治的是学术 过的是生活
梳理学术渊源 审视发展空间