基于语料库的中医英语词汇遴选

2019-09-18 11:15王世杰赵玉华
牡丹江教育学院学报 2019年7期
关键词:词汇表词表医药学

王世杰 赵玉华

(甘肃中医药大学国际教育学院,兰州 730000)

近年来随着中医药学逐渐走向世界,我国中医高等院校纷纷开设了中医英语课程。然而,目前的中医英语教学,由于缺乏中医英语词汇大纲,教材编写、教学设计等在很大程度上受到了制约[1][2]。中医英语在词汇、句法、语义、语用等方面的文体特点主要是通过词汇体现出来的,而体现中医药学内容或主题的是专业词汇,所以中医英语词汇教学的重点应该是专业词汇。另一方面,中医药学涉及中医理论基础、诊断、针灸、药学等各个方面,同时,近些年来中医现代化进展又促使中医药学和现代医学密切结合,促生了中医药理学、中医食疗学、中西医结合耳鼻喉科学等中医亚学科,这使得中医英语词汇丰富又庞杂。因此,在教学中必须优先学习最常用的词汇。基于语料库提取目标语料的词汇及其频率信息,遴选常用词汇,制作一个切实可行的中医英语词汇表,可以较好地解决中医英语教学中“教哪些词”的问题[3]。

一、语料库研究法和语料准备

语料库是在一定原则下收集的批量口头或笔头语篇素材,能够代表一种语言或者某种语言的一种变体或文类的电子文本集。语料库法基于代表性的批量语料提取数据展开研究,所得结果较为客观地反映了语言使用的实际情况,因而具有实证性。基于语料库的中医英语词汇遴选,按照语料中词汇的频数(复现次数)来选择常用词汇,而不是主观的或直觉性的选择。基于语料库的研究过程大致可以分为三个阶段:建库、词频信息提取、信息加工与分析三个主要阶段。由于本研究没有现成的语料库可资利用,需要自建语料库来完成研究[4][5]。

本研究精选近些年国内外大型出版社出版的经典中医英语译著或核心教材,电子化后作为备选语料。这些著作包括Unschuld主译的《黄帝内经·素问》[6],世界卫生组织编著《WHO西太平洋地区传统医学名词术语国际标准》[7]、石学敏主编的《针灸学》[8]、张廷模主编的《中药学》[9],王天芳主编方廷玉主译的《诊断学》[10]、孙广仁等主编的《中医基础理论》[11],胡鸿毅主编的《中医专业英语》[12]中的英语文本。收集的语料以纯文本格式保存,保存前进行了文本清洁,剔除其中不合规范的符号、格式等,以保证检索结果的信度。

语料库建成以后,运用软件AntConc进行了检测。测得该语料库共有24557词型(即不同的单词)、1350860词数(即词型复现的次数)。点击该软件各个窗口,如索引行、词频表、关键词表等,反应迅速,界面检索结果显示,没有无法识别的字符。检测证明,目标语料规范,所选软件AntConc使用流畅,可以进入实际研究阶段。

二、词频表提取与分析

词频表(Word List)是语料库软件的一项基本技术,是一个语料库中所有词型及其频数的列表。运用此技术,可以把目标语料中的高频中医英语词汇(即常用词汇)遴选出来。加载中医英语语料,利用语料库软件AntConc的词频表功能,按频数由高到低排列,生成词频表。根据梁茂成等“关注语言共性看高频词汇”与“关注实体内容及语言使用者水平看中段词汇”的观点,我们选取词表中第1-10词(高频词汇)和第1001-1010词(中段词汇)为例,加以分析(如表1所示)。

表1

观察表1,第1-10词中功能词占绝大多数,实词有1个(即qi);第1001-1010词全部为实词,其中一些与中医药学密切相关,如Yangming(阳明)、lips(唇)、tinnitus(耳鸣)等,其余则是普通实词,如inch、fine等,与中医药学不是很相关。可见频数渐降,由功能词逐步过渡到实词。功能词和普通实词不具有主题或内容区别功能,不属于专业词汇的范畴,应予以剔除,而频次相对较低的qi(气)、Yangming(阳明)等承载中医药学信息,是遴选的目标词汇。因此,词频还需要进一步的加工。

三、词频表加工

词频表加工在这里指的是去除其中不需要的词汇。方法有二:停用词表和词形还原。停用词表就是预先准备好的词表,包含不希望出现在最终词表中的单词。停用词表主要包括功能词,如冠词、代词、助动词、连词、数词、介词、时间副词、地点副词等,另外还包括一些搭配能力强但不具有实际意义的动词,如do、take、give、make、have, put、run等。词形还原就是把一个单词的不同形式还原为一个单词,如diagnose,diagnoses,diagnosed,diagnosing归并成diagnose。

表2

经过加载词形还原和停用词表之后,词频表(如表2所示,限于篇幅,仅选前20词为例)中剩下的词汇按照来源可分为三类: 第一类是表示中医名词概念的西医词汇,如blood(血)、disease(病)、syndrome(证)、spleen(脾)、liver(肝)、kidney(肾)等;第二类是表示中医名词概念的普通名词,如heat(热)、wind(风)、herb(草药)、deficiency(虚)、vessel(脉、络)等。这两类词汇都属于专业词汇,选入中医英语词汇表毫无争议。第三类词汇是音译词,表示中医名词概念,如qi(气)、yang(阳)、yin(阴),但是Wang,Bing根据什么音译,不能确定,通过检索语料库,发现Wang主要用在人名Wang Bing(王冰)、药名Wang Bu Liu Xing(王不留行)中、Bing主要用在书名Wen Bing Tiao Bian (《温病条辩》)、Shang Han Za Bing Lun(《伤寒杂病论》),和药名Bing Lang(槟榔)中。表示人名和书名等的专有名词音译词自然不必选入,而表示中医药学概念的音译词,是否选入,有待进一步探讨。

音译词,在本语料库有相当大的数量。近些年来,译界音译负载独特文化内涵的中医药学术语渐成主流,使得中医英语文本中出现了越来越多的音译词,但遗憾的是,中医药学术语音译词,仅有为数不多的几个被中外学界普遍接受且被英美原版词典收录,成为普通英语词汇,如qi(气)、yang(阳)、yin(阴),ginseng(人参)等,而更多的音译词并未被收录,如yangming(阳明)、taiyin(太阴)、bi(痹)、jiao(焦),ashi(阿是)、Shi Gao(石膏)、Dang Gui(当归)等,说明其广为接受尚需时日。所以我们最终将被原版英语词典收录的音译词选入词汇表中。

四、高频中医英语词汇遴选

如前所述,基于语料库遴选的中医英语词汇是高频的,反映主题内容的。掌握这些词汇有助于迅速了解一篇中医药学类文章的主要内容,但是词汇表通常有数量的限制,即遴选出来的中医英语词汇表数量要适中,切合教学,因为数量过小难以满足专业需求,数量过大超出学生接受能力。《柯林斯Cobuild高阶英语学习词典(第8版)》[13]附录中的“学术词汇表”包含570个单词(在2000常用词汇表之外),并按频次由高到低分为10个次表。另外《牛津高阶英汉双解词典(第7版)》[14]附录的“专业术语”(牛津3000词汇表以外)栏目中包含250词的文学艺术词汇表、250词的“自然科学词汇表”和250词的商业和金融词汇表。鉴于中医药英语词汇的庞杂性和上述词汇表数量,拟将中医英语词汇表的数量初步确定为1000词。

借助《新汉英中医学词典(第二版)》[15]和《英汉汉英医学词典》[16],剔除人名、地名、非医学相关词汇,遴选出1000个高频中医英语专业词汇。仿照前述学术词汇表,我们也将其分为10个次表,每个次表100词,第一个次表是频数最高的词汇(见附录),第二个次表是频数少于第一个次表的词汇,以此类推。

五、结语

本研究基于自建的中医英语语料库遴选并制成中医英语词汇表是一次重要的尝试,目的是为中医英语教学提供一个较为客观的教学依据。遗憾的是,语料库中的音译词,除了为数不多的几个之外,几乎全部未能选入词汇表,尤其是负载独特文化内涵的中医药学术语。虽然这些音译词的规范统一尚需时日,但是表示的概念却是核心的,在中医药学语境下书面或口语交际时是无法绕开的。因此,如何在教学中对待中医药学术语音译词,需要进一步研究。

猜你喜欢
词汇表词表医药学
面向分级阅读的分级词表研制*
Peritoneal dissemination of pancreatic cancer caused by endoscopic ultrasound-guided fine needle aspiration: A case report and literature review
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
浅述葛洪及其医药学
中医药学名词
基于语料库的词表创建原则及方法研究
常用联绵词表
云南省高校中医药学分子生物学重点实验室简介
词汇表
词汇表