基于语料库的sad近义词对比研究
——以语域和搭配行为为视角

2020-11-25 18:24
现代英语 2020年22期
关键词:语域近义词语料库

梁 凯

一、引言

英国著名语言学家D.A.Wilkin(1972)曾指出“没有语法,人们只能传递一点信息;没有词汇,人们则无法传递任何信息。”可见,词汇是语言表达的主要载体,这与Vermeer(1992)所认为的学习一门语言最重要的部分就是学习词汇不谋而合,词汇学习的重要性不言而喻。众所周知,英语从其他语言中借用了大量词语,使得英语近义词特别丰富,近义词从而成了英语词汇体系的重要组成部分。英语词汇教学中,近义词辨析一直是教师和学生关注的焦点和难点,教师通常使用学生熟知的简单近义词来解释新单词。多数词典采取的也是这种“通过近义词下定义”的方式来解释新单词(Ilson,1991)。近几十年来,随着语料库技术的快速发展,大规模的语料库相继建立(徐秀玲,许家金2017),近义词辨析的方法得到了扩展,其中一种学者广泛采用的是基于语料库的方法(corpus-based approach)。语料库可以“作为定量证据的宝贵来源”(Tognini-Bonelli 2001),基于大量真实语言数据的研究有助于描述和揭示近义词使用的典型特征和规则(徐秀玲,许家金2017),以及许多隐性差异,这是传统近义词辨析方法难以提供的。语料库证据显示每一个单词都有其独特的语域使用环境和搭配行为(Partington 1998),近义词一般只在概念意义上相同或相近,它们在搭配词的选择上不能随意替换(Conzett 1997)。例如,在英语中powerful经常和car一起搭配,strong则习惯性与tea搭配,而powerful tea和strong car则不符合英语表达习惯(Halliday 1976)。因此,采取基于语料库的方法,从语域和搭配行为角度进行近义词研究具有实用价值(陆军2010),语料库的出现,为英语近义词的辨析提供了一种有效可靠的新方法。文章将基于COCA语料库对sad近义词进行辨析研究。

二、背景介绍

(一)语域

语言学中,语域(register)指的是语言使用的场合或领域。韩礼德(M.A.K.Halliday)曾指出,语言变体可以按照其使用情况划分为语域。语言使用的领域种类很多,例如:办公用语、口头话语、课堂讲座用语、广告推销用语、演讲语言、新闻广播、解说用语、家庭话术用语、军事用语、法律用语等。COCA语料库涵盖范围(语域)广泛,包括博客语域、网页语域、电视语域、口语语域、小说语域、杂志语域、报纸语域、学术语域。近义词会因为语言使用的环境不同而带有特有的语域倾向性。比如,在某一组近义词中,有些词偏向于出现在口语中,有些词则高频地出现在各种书面语中,有些词汇会显得比较正式或者带有一定的专业性,会较高频地出现在文学作品或者学术著作中。

(二)搭配

英国语言学家Firth(1957)正式提出搭配(collocation)这一专业术语,其著名论断“由词的搭配可知其词”表明词与词之间存在一种搭配使用关系。随后,Sinclair等人扩展延伸了搭配的概念。比如,Mc Intosh(1967)提出了搭配范围(collocational range)这一概念,认为任何词语都有其一定的搭配范围。Halliday(1976)和Sinclair(1991)都将词的线型共现作为搭配的重要界定标准,并指出搭配是词与词之间的一种线性组合关系。一些学者(如 Nattinger&De Carrico 1992;Bahns 1993;卫乃兴 2002)也将词语搭配定义为具体的线性词语序列。此外,还有学者(如Partington 1998;Xiao&Mc Enery 2006;卫乃兴 2002 等)偏向于使用搭配行为(collocational behavior)一词来对搭配词的分布进行描述。本研究亦将采用该术语来描述近义词。

(三)前人研究

国内外众多学者采用基于语料库的方法研究英语近义词辨析的成果颇多。在国外,Biber(2000)对近义词的使用语域开展了研究。同年,Kennedy(2000)对between和through之间的差别进行了研究。Thomas(2001)对比了keep和get用法的不同。在国内,任培红(2008)对common和ordinary进行了教学探讨。王春艳(2009)对 real和 true进行了辨析探讨。陆军(2010)对学习者英语近义词搭配行为进行了研究。庞杨和杨玉晨(2012)对begin、start和commence触发模式进行了解释。方子纯和陈坚林(2014)对近义词形容词进行了研究。薛立风(2019)对中国英语学习者使用a little和a few情况进行了对比研究。这种基于真实的母语者语料库进行研究的方法弥补了传统英语教学中仅仅依靠“下定义”进行区分的弊端,有效地帮助英语非本族语者在英语学习过程中更好地进行近义词区分和运用。

(四)词典定义

Sad、sorrowful、distressing 和 heartbroken 是常用的四个表达“悲伤”的英语近义形容词,它们既可以做前置定语修饰后方的名词或名词词组,亦可直接做表语表达主语所处的状态。参照牛津词典,它们在词典中的定义分别为:

1.Sad:unhappy or showing unhappiness

2.Sorrowful:very sad

3.Distressing:making you feel extremely upset,especially because of sb's suffering

4.Heartbroken:extremely sad because of sth that has happened

据此可以看出,根据牛津词典的解释,学习者在区分这四个单词时,会下意识地认为当想表示“悲伤的”或者“不开心”时,它们之间是可以互换的,唯一的不同仅仅是程度而已。比如,当表达“我不开心”时,可以是I'm unhappy或者I'm sad;当表达“我很不开心”时,学习者会自然地认为是I'm very sad或I'm very sorrowful抑或I'm very heartbroken。可是,殊不知如此一番翻阅词典的学习后,学习者已错误地学习了这四个单词的使用。

三、研究设计

(一)研究问题

1.这四个近义词的使用语域分布情况如何?

2.这四个近义词的名词搭配行为如何?

(二)语料来源

本研究以当代美国英语语料库(COCA)为语料来源,在COCA中,所有词的用法都是来自英语母语者,真实地反映了英语母语者对近义词的词义区分。同时,COCA涵盖范围(语域)广,包括博客、网页、电视、口语、小说、杂志、报纸、学术,数据覆盖全面可靠。

(三)研究工具

本研究以其官网检索平台为研究工具。语域分布研究采用平台的CHART模式进行检索,搭配词语检索采用COLLOCATE模式进行。

(四)研究对象

本研究采用基于语料库的方法,以sad、sorrowful、distressing和heartbroken为研究对象,它们带有比较明显的语域使用和搭配行为差异,在英语本族语和学习者语料库中基本都高频出现,有利于保证研究结果的可靠性。

(五)研究步骤

第一,关键词语域定位。在CHART模式中逐一检索四个近义词,得出英语母语者在不同语域下使用这些词的频率,分析出它们使用语域的差异。

第二,名词搭配词提取。在COLLOCATE栏中设置左右检索跨距均为4,设置检索结果的词性为名词,逐一进行四个词的名词搭配词检索,观察各自高频名词搭配频率及其位置。

第三,对结果进行整体分析和讨论。

四、结果与讨论

(一)语域差异

从CHART栏检索结果发现 sad、sorrowful、distressing和heartbroken的使用总次数分别是51798次,776次,1680次和1565次。首先可以看出,sad出现的次数远高于其他三个词,说明sad在悲伤类的词语中是最常使用的。此外,从语域分布情况看,sad除了在杂志、报纸、学术这些比较正式的语域中使用频率较低外,在其他语域中出现的频率都较高且频率都比较平衡,其中尤其在博客、小说、网络、电视语域中使用频率较高。Sorrowful除了出现在小说语域频率高之外,在其他语域中出现的频率都很低且比较均衡。Distressing除了在电视语域频率低之外,在其他语域出现的频率都比较均衡,其中在学术语域中频率最高。Heartbroken除了出现在学术语域频率极低之外,在其他语域出现的频率都比较平衡,其中在小说语域中频率最高。

据此,可以总结出:

1.Sad较少用于语言比较正式的语域;

2.Sorrowful较多用于小说类的文学作品语域;

3.Distressing除了很少用于电视语域外,其他语域均可以使用;

4.Heartbroken除了几乎不用于学术语域,其他语域均可以使用;

或者,换种更直观的表述:

1.从口语程度看:sad≈heartbroken>distressing>sorrowful;

2.从文学程度看:sorrowful>heartbroken≈sad>distressing;

3.从学术程度看:distressing远远大于其他单词。

(二)搭配行为差异

检索 sad、sorrowful、distressing和 heartbroken 的名词搭配词后,选取其中前十个高频名词搭配词得出。通过数据统计可知,与sad最常用的名词搭配是song,出现了507次,且sad偏向于出现在名词搭配词的左侧。Sorrowful最常用的名词搭配词是face和eye,分别出现了33次和30次,且sorrowful倾向于出现在名词搭配词的左侧。Distressing最常用的名词搭配是news和event,分别出现了47次和38次,且distressing倾向于出现在名词的左侧。Heartbroken最常用的名词搭配是parent和loss,分别出现了24次和20次,且在与loss搭配时,heartbroken更倾向于出现在其左侧,在与其他名词搭配词时无明显的位置倾向性。

据此,可以总结出 sad,sorrowful,distressing和heartbroken的最高频前十词搭配词各有不同,且sad、sorrowful和distressing均倾向于出现在名词搭配词的左侧,即更多地用作前置定语修饰后方的名词,而heartbroken除了在与loss搭配时倾向于用做前置定语外,与其他名词搭配词时无明显的位置倾向性,即用做前置定语和表语均可。

(三)综合分析

使用Collocate栏进行检索得到词汇的常用搭配词后,平台会随机呈现100条该搭配词在原文中的具体句子,结合各自的高频搭配词和对应语境检索行进行整体分析可以得出:

1.Sad在句子中常用作定语修饰truth、story、song、commentary、affair、tale、ending 等名词,可以推断出 sad通常用来对某一事物进行客观的情感评价。由于所修饰的这些名词和所使用到语境都是比较生活化的,因此sad一词在杂志、报纸、学术这些正式语域中使用的较少。同时,sad常与smile和eyes一起搭配使用于小说语域中对人物进行刻画描写,有很重的文学色彩。此外,sad还常直接用作表语,表达主语的内心悲伤状态。

2.Sorrowful通常只出现在小说等文学作品中,带有浓重的文学色彩,常用做前置定语用于与人体/人物相关的词汇前,对人物进行刻画描述,如 eyes、face、tone、voice、heart、soul、sound、expression、sigh 等。因此,该词并不是生活中常用词汇,而是文学作品词汇,比较书面化。

3.Distressing出现的时候更多的是指外部环境中所发生的事情/事件引起的内心情感上的伤痛,这些事情一般和自己没有直接关系,仅仅是一种站在第三方角度进行的客观情感评价,如听到的新闻、看到的事件等。此时,distressing的使用比较生活化,在小说、口语、博客、网页语域都会使用到。另外,distressing也常用于表示某一客观处境、状况或经历对自己产生的直接负面影响,从而使得自己内心产生担忧、忧虑、痛苦。最后,distress也常用于正式地对某一客观状况、总结、形势进行客观评价,因此,此时distressing一词在学术语域中使用频率较高,比较书面化。

4.Heartbroken用法更多的是体现关系比较密切的亲人、朋友、恋人、家庭等之间所发生的事情引起的内心情感上的伤痛,这些事情一般都和自己密切相关,如恋人间的分手、亲朋好友的去世、家庭的财产损失等。由于学术语域强调客观性、科学性,很少涉及亲朋好友相关的主观情感事件叙述,因此,heartbroken一词在学术语域中极少出现。

五、结语与启示

文章选取了英语中的一组近义词sad,sorrowful,distressing和heartbroken,对比了它们在本族语者语料库COCA中的语域分布和搭配行为的差异。结果发现,它们在这两个方面都表现出较明显的差异,这些差异仅仅依靠词典的话将得不到准确体现。

鉴于英语词典中一般不会体现词汇的语域分布和搭配行为等潜在关联信息,为避免或减少近义词的错误运用,教师应鼓励学生学会使用语料库证据来总结近义词组在语域和搭配行为方面的差异,透过近义词意义相近的表面,去关注它们的内在差异,从而让知识内化。而不是仅仅依赖词典上的简单解释,或者仅仅依赖于直觉经验,即便是英语本族语者仅凭直觉也难以觉察这些内在差异(Louw 1993;Partington 1998)。同时,通过语料分析有助于英语学习者更主动更直观地观察近义词的差异,即语料库可以促进学习者的数据驱动式学习(data-driven learning),增进学习者的学习意识,对学习者掌握近义词用法和提高近义词使用能力具有实用价值(陆军2010)。

猜你喜欢
语域近义词语料库
基于语料库的清末民初日源外来词汉化研究
怎样辨析近义词
找找近义词
运用语料库辅助高中英语写作
科技术语的语域传播论纲
语域下土木工程英语词汇文体特征
基于语料库的近义词辨析
语料库与译者培养探索
利用语域预测功能突破听力语言焦虑