药学学术英语料库的构建与应用

2020-12-17 03:29李楠肇彤
科教导刊·电子版 2020年18期
关键词:学术英语语料库

李楠 肇彤

摘 要 本文首先研究了药学学术英语语料库建设的必要性,介绍了沈阳药科大学自建药学专业学术英语语料库的情况,并分析了药学学术英语语料库的应用。最后对药学专业学术英语语料库的前景和发展进行了美好的展望。

关键词 药学英语 学术英语 语料库

中图分类号:H314文献标识码:A

1建立药学学术英语语料库的必要性

语料库是需要依照一种采集标准采样来的,可以代表一种语言的变体文本的多种种类的文本电子采集。同时可以为语言的研究者和学习者提供很多真实可靠的语言学习和研究的材料,并从某种程度上反应出学习者的学习和使用情况,进行进一步的统计。语料库最主要的三大功能:(1)检索(concordance):查询和统计词汇和短语在某个文本中的出现频率;(2)单词列表(wordlist):确定常用的词汇或语块(clusters),而哪些相对少用;(3)主题词(key word):是分析文本内容和语言特征的重要工具。运用计算机的强大统计能力,研究者能各角度、多层面地研究语料的词、句子和语篇。因此,可以运用于词典编纂、语言学研究和语言教学当中。语料库是新兴的语言研究工具,用数据驱动和实证研究的方式来颠覆传统语言研究的模式。

语料库发展日益成熟,为学术英语语料库提供量化的可靠统计信息。从20世纪80年代开始,我国出现了专业语料库。例如中国石油大学于1987年构建了石油语料库,共41万词;香港科技大学和广州外语外贸大学合作共建了科技英语语料库,库容50万词等等。

20世纪70年代至今,药学的发展比以前更加迅速,也就必然要求更加系统全面地掌握药学英语,药学英语的研究也会影响国药学的国际交流。我国的药学研究成果想走向全世界,就需要药学研究者掌握更加地道的药学英语的语言知识和写作技巧。而语料库正是为这样语言的要求提供了实证的基础和工具。

然而,一些大型的通用语料库检索里,不能反映检索词在药学文本中的重要应用信息。例如group, 在BNC的语料库检索中,得到50多个经过筛选的检索行,在这些用法中,并没有一个涉及到group在药物化学中可以表示“基因”这样的用法。由此可见,通用的语料库不能满足专业英语检索统计的需求。那么,建立专业的语料库对于各专业发展应该是势在必行。

2药学学术英语语料库的构建

2.1语料采集

语料文本的采集工作是构建一个语料库基本的环节。在开始采集语料文本工作之前,首先要确立采集工作的准确标准。所以本课题组设立了几个语料采集的标准:真实性、平衡性和权威性。本项目研究的语料来源覆盖了药学英语的统编教材和一些权威的药学英语学术文章和材料,库容可以达到十万词。里面的内容覆盖面很广包括药物化学,药理学,药物分析,生物化学,天然药化等等。同时我们考虑到语料库建设时代性的要求,全文录入了药学领域近几年SCI的几个国际期刊共达15篇的学术论文。

在语料库的建设中,应时刻注意几点:

(1)真实性:为了保证真实有效,我们采取随机抽样的方式,对语料进行筛选,必须从正规出版材料或者是从比较权威正式的网站上所发布相关的文献对符合条件的语料库进行选择。

(2)平衡性:①学科:划分一级学科和二级学科,并且在二级学科里面设置出“其他二级学科”,用来放一些新兴学科类别的语料。②比例:基于权威的语料库各种文献资料,对于各大学院和专业的设置学科进行整理和统计,来确定语料库中语料的准确比例。③语域:该语料库涉及到学术出版物、论文、著作、教材以及一些读物。④期刊:参考了权威药学期刊、最新药学信息库以及各种药学专业的数据库,采取了等距抽样原则,抽取文本进行全文的录入。

2.2语料录入

(1)完整性:针对语料的完整性,笔者准确录入对语料的标题、摘要、关键字、作者、参考文献等原始信息以及篇章结构,进行全文录入。并且将很难输入的符号、公式及图表存到图库当中。

(2)准确性:为了保证语料库的准确性,笔者对文本进行人工除噪处理,并且进行两次的人工校对。

2.3语料库逻辑结构

语料库的逻辑结构是指语料库事宜计算机进行阅读处理数据结构也就包括原数据和语料本身。CPE(药学英语语料库)原数据是语料的出处和学科类别等的内容。一系列的原数据加一条语料就构成了一条完整的语言记录。

2.4语料库物理结构

在线的药学英语语料库是浏览器或者服务器的,可提供远程取阅的方式。对于语料录入的格式,CPE(药学英语语料库),因为在药学英语的文献中,一些符号、公式、图表,输入数据库的方式是string,对于word可以识别的符号,来进行人工的输入。对于那些word不可以识别的符号及图表等,采用截图的方法,放到图库里,确保文章全文的录入完整性,也方便用户们进行浏览全文内容。

3药学学术英语语料库的应用

药学学术英语语料库是可以用于教师英语教学和英语自主学习,也是为了研究者提供一种新型的英语研究工具。下面举例说明以上功能在药学英语词汇学习中的应用。

3.1学习药学专业英语词义

药学专业应用中的名字往往与通用英语中词的含义不一样,而是具有一些特殊的意義。例如suspension,在通用英语中表示“暂停或者悬挂”等意思,但是在药学英语语料库中检索后,可以得到47项检索记录。对这些检索记录进行分析后发现,suspension意思是“混悬物”。然而在通用英语中却没有发现这个专业的意思。

另一个例子是administer,在通用英语中的意思是“管理,给与”。而在药学英语语料库中检索后,找到了四项检索记录,但是结构是只有第一条检索记录意思是“管理”,之后的检索行都不能用管理来准确的解释,而在药学英语中administer的意思是“用药,给药”。

基于以上两个例子,可以发现:用于统计和实证的工具,英语语料库可以很大程度地反应真实文本中实际的应用情况。这样不仅可以改进英语的教学方法,也可以培养学生自主探索式学习的能力。

3.2掌握英语词汇与功能词的搭配

英语词汇的固定搭配是英语教学中的重点,英语语料库的实证式研究提供了学习者和研究者的真实语言学习环境,能帮助学习者更全面地掌握英语词汇的各种搭配,下面列举了identical的例子,来说明这个问题。

在通用英语中,identical经常和to, with这样的介词进行搭配。而通过药学英语语料库的检索中发现,identical的功能词搭配不只是这两种。在所有搜索的就当中,找到了30多种identical+PREP的搭配结构,还有46条identical+N的结构。

由此可见,能够和identical 搭配的功能词还有between,in,at for等等。这样的功能词和名词构成identical 之后的状语结构,也就构成了identical 加状语的结构。例如:nd the Shank PDZ used in this study are identical with the human homologs.通过自主地探究语料库,可以更多样化的表达英语,以拓展对于词汇的认知。

3.3发现英语的固定名词搭配

通过对于检测词的检索,来发现搭配功能较高的词。研究者以behavior为例,用CPE进行检测得出的结果发现,homosexual behavior的出现频率特别高。回归原文可以发现,这个词多出现在药物经济学科当中。从词汇的角度可以推测,药物经济学的研究热点之一就是同性行为。除此之外,thermo tropical behavior和transient behavior等等出现的频率也是非常高的。根据语料库得到大量真实的范例,可以找出一段时期之内某专业学科的研究热点和研究重点,这能够积极地指导和启发该项研究工作。

4藥学学术英语语料库的展望

随着中国医药行业的进一步发展,日益增加了国内外的交流,建立双语的平行中英文语料库势在必行。需要构建一个药学英语专业平行语料库,为药学英语专业的写作和翻译提供更多的数据和统计支持。

由于医药行业的发展,口语语料库的需求越来越多,因此,药学英语的口语语料库的探索,迫在眉睫。

在线英语语料库将首次结合口语和笔语、中英文双语并结合自主学习的语料库软件不断更新的药学学术英语专业语料库。

5总结

基于英语语料库进行英语教学和研究是目前应用语言学领域的研究热点,并为学术英语语料库提供了新的研究视角。本文简要介绍了药学学术英语语料库的构建过程,并且对语料库的检索进行了例证分析。目前的建设和研究还处于起步阶段,还会有很大的的发展空间。

基金项目:2019年10月辽宁省社会科学规划基金办公室“药学学术英语论文语料库的创建和研究”(项目编号:L19BYY017)。

作者简介:李楠(1980.7-),女,汉族,吉林省吉林市人,硕士,讲师,研究方向:英语应用语言学;肇彤(1977.1-),女,满族,辽宁省抚顺市人,硕士,副教授,研究方向:学术英语教学;语料库语言学。

参考文献

[1] 吴春福.药学概论[M].北京:中国医药科技出版社,2002.

[2] 杨惠中.语料库语言学导论[M].上海:上海外语研究出版社,2002.

[3] 王建新.计算机语料库的建设与应用[M].北京:清华大学出版社,2005.

[4] 曹合建.基于语料库的商务英语研究[M].北京:对外经济贸易大学出版社,2008.

猜你喜欢
学术英语语料库
《语料库翻译文体学》评介
基于语料库“隐秘”的词类标注初步探究
大学英语教育教学改革实践路径分析
以学术英语为新定位的大学英语教学转型问题的对策研究
基于JAVAEE的维吾尔中介语语料库开发与实现
基于网络语料库的“给力”研究
语料库语言学未来发展趋势