医学英语语料库研究现状综述

2015-04-15 16:38康勇王翠莲
关键词:建库语料语料库

康勇,王翠莲

(皖南医学院,安徽 芜湖 241002)

医学英语语料库研究现状综述

康勇,王翠莲

(皖南医学院,安徽 芜湖 241002)

随着语料库的快速发展,医学英语语料库研究已引起国内学者的关注。本文从其分类、构建及其应用研究回顾医学英语语料库在国内的研究现状,分析了该领域研究的不足,并对今后的研究进行了展望以期对医学英语教学研究提供思考。

医学英语;语料库;实证研究

一、语料库研究现状

语料库(corpus)是对海量的自然语言进行存储、检索以及统计分析的资料库。凭借于它,人们可以轻而易举地处理大量的文本并准确地分析不同类型文本之间语言特征上的差异性。因此,语料库给语言研究带来了一场革命性的变革—语言研究模式从“凭直觉”转向“让语料库说话”。语料库语言学以大量精心采集而来的真实文本(authentic texts)为研究素材,主要通过概率统计的方法得出结论,因此语料库语言学从本质上讲是实证性的(empirical)。[1]

近几十年来,诸多国家相继创建了大型的语料库。如:20世纪六、七十年代世界上最早创建的BROWN语料库—代表当代美国英语;在英国以兰卡斯特大学为倡导的LOB语料库—代表当代英国英语用法;1975年建成的伦敦—朗德语料库LLC—代表英语口语,该三大经典语料库为语料库语言学奠定了坚实的基础。20世纪80年代,Sinclair主持创建的柯林斯—伯明翰大学国际语料库COBUILD于2003年扩容到五亿词次,堪称当今规模最大的语料库。紧接着九十年代建成具有代表性的语料库为英国国家语料库BNC和国际英语语料库ICE等。然而,当前在我国建成具有代表性的英语语料库,包括上海交通大学科技英语语料库JDEST、国际学习者英语语料库ICLE中国子语料库、中国学习者英语语料库CLEC、中国学习者英语口语语料库COLSEC、中国学生英语口笔语语料库SWECCL、中国大学生英汉汉英口笔译语料库PACCEL、英语专业学习者语料库CEM以及中国英语语料库CEC等。

20世纪90年代以来,我国英语语料库的建设已取得了一定程度上的进步,此外语料库方法在语言教学与研究以及词典编纂等领域已深入展开且相继建立了一些应用于不同领域的学科专业语料库。如:解放军外国语学院的“军事英语语料库”、大连海事大学的“海事英语语料库”、黑龙江大学的“商务英语语料库”以及国家语委建设的“计算机专业双语语料库”等等。但是整体来看,具有影响力的语料库还是为数不多。由于各建库单位和机构间缺乏深入的交流与合作,重复建设的状况较严重。此外,由于缺乏统一的规范和标准等问题,众多专业英语语料库的利用率非常低,从而造成资源的极大浪费。

二、语料库的分类

根据研究目的的不同,语料库包括多种类型,以代表各式各样的语言、语言变体或文类。依据语言素材类型可分为口语语料库和书面语语料库;依据语料时间特征可分为共时语料库和历时语料库;依据语料语种可分为单语语料库和多语并行语料库以及平行/双语语料库;依据语料作者为本族语者还是非本族语者可分为本族语者语料库和学习者语料库;依据语料赋码与否可分为未赋码语料库和已赋码语料库;依据语料代表一种语言的全貌还是某个特定领域可分为通用语料库和专用语料库;依据语料后续增补与否可分为封闭语料库和监控语料库;依据语料选取方式可分为全文语料库和抽样语料库;依据语料文体类型可分为单文体语料库和多文体语料库;依据语料是原文还是译文可分为原文语料库和翻译语料库。尽管分类依据不同,但彼此并不矛盾。换言之,一个语料库可以被归为不同的类型。例如:BROWN语料库既是书面语语料库、共时语料库、单语种语料库、本族语者语料库和未赋码语料库,同时又是通用语料库、封闭式语料库、抽样语料库、多文体语料库和原文语料库。[1][2]

三、医学英语语料库建设及其应用研究现状

相比之下,医学英语语料库的建设及应用研究在我国却才刚刚起步。通过国家图书馆检索到的医学英语语料库相关论文寥寥可数。经过整理,现将国内该领域的研究概况梳理如下:

1.理论设想阶段的研究方面。闻永毅、樊新荣(2003)和薛学彦(2004)提出了建立中医英语语料库的设想;[3][4]张文青(2008)则提出了建立医学英语写作语料库的设想。[5]

2.语料库建库原则的研究方面。王连柱(2009)、闵楠(2011)以及傅顺、罗永胜(2012)探讨了医学英语语料库的建库原则。[6][7][8]此外,倪传斌(2005)探讨了中医英语语料库的建库原则。[9]

3.医学英语语料库的应用研究方面。王京(2006)基于医学研究论文语料库,借鉴了Coxhead的学术词汇表(AWL)的建立模式,通过研究学术词汇在医学研究论文中的使用范围以及频率并构建一个服务于医学英语教学的医学学术词表(MAWL)。[10]王连柱、王兰英、张瑞君、雍文明(2008)依据当前医学英语教学现状,探讨了语料库及检索工具在医学英语词汇教学实践中的应用以期改变目前医学英语研究方法滞后的问题。[11]王连柱(2011)探讨了基于语料库的高频医学英语词汇和词素的筛选以及医学英语词汇教学。该研究运用定量和定性相统一的方法,凭借语料库及其检索软件,同时通过人工辨认来筛选出医学英语中的高频医学词汇和词素。[12]王兰英、王连柱、雍文明、张帆、刘真真、丁君、平文江(2011)通过比较中美两国生物医学期刊研究论文英文标题语言特点的异同,揭示国内医学论文英文标题存在的种种问题,发现中美医学论文英文标题在形符、标题平均长度、平均词长方面相近;在标题的类符、词频、结构、词语搭配方面的差异;在副标题的应用和英文拼写错误方面存在较大的差距。[13]齐晖(2012)基于自建的医学学术论文英文摘要语料库,多维度地研究摘要中的动词,其中包括动词语态使用特征、高频动词的搭配、类联接、语义趋向以及语义韵。[14]蔡美兰(2012)基于自建小型语料库,分析了国外英文医学期刊中的典型词块,其中包括名词性词块、介词性词块以及动词性词块。[15]王世杰、武永胜、赵玉华、张文奕(2012)基于自建语料库来提取、整理、统计与分析医学英语文体中的高频词块,以期发现医学英语文体中的词块在数量、包含词数、与医学紧密相关的词块所占比例等方面的特征。[16]雍文明(2013)基于wordsmith的单词列表和主题词功能以及range的主要功能,研究在编纂医学英语教材时,如何实现素材以及语言特征学习选择。[17]傅顺、罗永胜、杨劲松(2013)基于教学过程、教学辅助工具以及教学研究来探讨教学型医学英语语料库在医学英语教学中的应用。[18]彭咏梅、李萍凤、龚研(2014)基于自建的中医药论文英文摘要语料库,提取、统计以及分析了词汇语块并发现了词汇语块在结构以及功能分类的特征。[19]此外,李丽丽(2014)基于西安交通大学医学研究论文语料库,探讨了医学语块表的编制以及医学英语学术语块的特征并创建了一个包含211个四词语块的医学语块表—MLCL。[20]

四、今后的展望

综上所述,前期研究虽然取得了一定的成效并为后人的研究奠定了基础,但仍处于摸索阶段,因此该领域的研究面临诸多的问题与挑战。一是当前国内的医学英语语料库的库容量偏小,无法体现医学专业英语的全貌特征;二是先前的研究并没有对医学英语语料库的建设和应用提出系统的理论分析以及深入系统的挖掘;三是目前国内尚无公开的医学英语语料库,对于医学英语的教学与研究具有很大的被动性与局限性。鉴于此,笔者将一一攻克以上问题并极力整合学校各部门的资源与力量来自主创建一个能够符合医学英语教学与研究的“医学英语书面语语料库”已迫在眉睫和势在必行。该语料库以语料库语言学为理论基础,首先自主创建一个库容不少于300万词次的“医学英语书面语语料库”,然后将该语料库真正行之有效地应用于医学英语教学与科研实践中。该语料库的建成将对医学英语教学、翻译、教学大纲制定、教材编写以及词典编纂等领域产生一定的影响。之后还将按照当初的建库原则设计定期加以扩容。为此,笔者在今后的研究中将继续努力,不断探索。◆

[1]梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社,2010,(3):4-5.

[2]毛文伟.日语语料库建设的现状综述[J].日语学习与研究,2009,(6):42.

[3]闻永毅,樊新荣.中医英语语料库建设可行性探讨[J].上海中医药杂志,2003,(4):45-46.

[4]薛学彦.中医英语语料库建立的设想[J].广州中医药大学学报,2004,(6):482-485.

[5]张文青.医学英语写作语料库建设的构想[J].吉林工程技术师范学院学报,2008,(7):61-63.

[6]王连柱.医学英语语料库的建库原则探析[J].新乡学院学报(社会科学版),2009,(4):131-132.

[7]闵楠.关于我校医学英语语料库的建库原则[J].首都医科大学学报(社科版),2011,(2):206-207.

[8]傅顺,罗永胜.教学型医学英语语料库的界定及其建库原则[J].长春大学学报,2012,(9):1164-1166.

[9]倪传斌.中医英语语料库的建库原则[J].上海中医药大学学报,2005,(3):5-6.

[10]王京.基于医学研究论文语料库的医学学术词表的构建[D].第四军医大学,2006.

[11]王连柱,王兰英,张瑞君,雍文明.语料库及检索工具在医学英语词汇教学实践中的应用研究[J].中国医学教育技术,2008,(10):427-430.

[12]王连柱.基于语料库的高频医学英语词汇和词素的筛选与医学英语词汇教学[J].中华医学教育,2011,(1):217-220.

[13]王兰英,王连柱,雍文明,张帆,刘真真,丁君,平文江.基于语料库的中美医学期刊英文标题文本对比研究[J].中国科技期刊研究,2011,(5):784-787.

[14]齐晖.基于语料库的医学论文摘要动词语言特点探析[J].福建医科大学学报(社会科学版),2012,(2):68-72.

[15]蔡美兰.国外英文医学期刊中典型词块研究—基于自建小型语料库的研究[J].中国高等医学教育,2012,(6):15-16.

[16]王世杰,武永胜,赵玉华,张文奕.基于语料库的医学英语词块研究及其教学[J].甘肃中医学院学报,2012,(4):77-82.

[17]雍文明.语料库辅助医学英语教材编写[J].新乡医学院学报,2013,(3):238-240.

[18]傅顺,罗永胜,杨劲松.教学型医学英语语料库的应用研究[J].广东医学院学报,2013,(1):101-103.

[19]彭咏梅,李萍凤,龚研.语料库驱动的医学英语词汇语块研究[J].湖北科技学院学报,2014,(8):94-96.

[20]李丽丽.医学语块表的研制与医学英语学术语块的特征[D].广西大学,2014.

A Review on Current Studies of Medical English Corpus

Kang Yong&Wang Cuilian
(Wannan Medical College,Wuhu Anhui,241002)

With the rapid development of corpus,studies onmedical English corpus have captured attention from scholars in China.This paper reviews its currentstudies in China in termsof its classification,construction and application studies,analyzes the shortages in this sphere aswell asmakes a prediction of its future development for the purpose ofproviding implications for pedagogical research ofmedicalEnglish.

medical English,corpus,empirical study

H195

A

1674-0416(2015)04-0136-03

[责任编辑:王靖宇]

2015-04-14

本文系安徽省高校人文社会科学研究重点项目“医学英语书面语语料库的创建及其应用研究”(编号:SK2014A416)的研究成果。

康勇,男,1983年生,安徽含山人,讲师,英语语言文学硕士;王翠莲,女,1964年生,安徽芜湖人,副教授,语言学与应用语言学硕士。

猜你喜欢
建库语料语料库
《语料库翻译文体学》评介
面向建库与制图一体化的规则研究
基于语料调查的“连……都(也)……”出现的语义背景分析
中文期刊回溯建库的实践与思考——以贵州省图书馆为例
华语电影作为真实语料在翻译教学中的应用
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
建设用地节约集约利用评价数据库建库流程:以西安市为例
基于数据字典的空间数据库通用建库技术