杰弗里·利奇的语料库研究之路

2014-03-11 09:04北京外国语大学黄俊编译
语料库语言学 2014年2期
关键词:卡斯特英语语法语言学

北京外国语大学 黄俊 编译

杰弗里·利奇的语料库研究之路

北京外国语大学 黄俊 编译

编者按

2014年8月19日,英国学术院院士、著名语言学家兰卡斯特大学荣休教授Geoffrey Leech病逝,享年78岁。

Leech教授一生在英语语法、语义学、语用学、文体学、语料库语言学等诸多方面都作出了杰出贡献,是一位具有世界影响的语言学家。

Leech教授与中国有着不解之缘。他于1994年受聘为北京外国语大学名誉教授,并多次来华讲学。

Leech教授早年毕业于英国伦敦大学学院(University College London),并参与了Randolph Quirk教授主持的著名的“英语用法调查”(Survey of English Usage)项目。Leech教授整个学术生涯都十分注重对真实语用的描写,注重对意义的研究。他主要完成或合作完成的代表作有:《英语语法大全》(A Comprehensive Grammar of the English Language,1985)、《语义学》(Semantics,1974)、《语用学原理》(Principles of Pragmatics,1983)、《小说的文体》(Style in Fiction,1981/2007)和“英国国家语料库”(British National Corpus,BNC,1994)。

《英语语法大全》,俗称“夸克语法”,长期以来是我国语法教学界的权威基准;《语义学》中列举的7种意义已成为语言学方向学生的专业常识;《语用学原理》中提出的“礼貌原则”是礼貌研究的重要基石;《小说的文体》是文体学领域当仁不让的第一教材;“英国国家语料库”是近20年来语料库领域的业界标杆。若一位语言学者拥有一项重要代表作就可称为知名语言学家的话,Geoffrey Leech则名副其实称得上世界级语言学家。况且这里举出的不过是他等身著述之一隅。

学术而外,Leech教授最为人称道的是其为人平易谦和,真可谓学者典范。

本期特设纪念专栏,深切缅怀Geoffrey Leech教授。

本文编译自《利奇应用语言学自选集》一书的前言,感谢外语教学与研究出版社授权编译。

1.UCL求学之路(1936-1962)

1936年1月16日,利奇出生于英格兰西部的格洛斯特。他的父亲在格洛斯特附近的图克斯伯里(Tewkesbury)小镇担任银行经理。中学时期,利奇就读于有四百多年历史的图克斯伯里文法学校。之后,利奇曾在英国皇家空军服役两年。

利奇从小就对语言感兴趣,进入大学之前他的梦想是学习法语。非常巧合的是,当时伦敦大学学院(University College London,UCL)的英语教授A.H.Smith在图克斯伯里附近有一所乡间别墅,周末经常来度假,利奇的父亲在酒馆里喝酒时认识了这位教授。应利奇父亲的请求,Smith教授在自己的别墅中给了利奇一次入学面试的机会。利奇在交谈中表示希望学习法语,Smith教授却给了他一个学习英语的机会。终于,1956年利奇在UCL正式开始了他的求学之路。

本科阶段,利奇对课程中的语言部分尤其感兴趣,选择了当时被称作“B大纲”的课程计划。该大纲中包含了大量的语言课程,尤以古代语言为重。它要求学生学习全本《贝奥武甫》(Beowulf)原著,选修古英语、中古英语、古挪威语、英语语言学和语音学等课程。其中,语音学由UCL的资深教授、著名的语音学家A.C.Gimson 和 J.D.O’Connor讲授。期间,利奇也曾聆听过英国第一位语言学教授J.R.Firth有关“语境论”的系列讲座和著名语音学家Daniel Jones有关“音素”的系列讲座。利奇于1959年本科毕业,同时获得了UCL英语语言文学专业学士学位。

2.攻读硕士学位(1959-1962)

本科毕业后,利奇留在UCL攻读硕士学位,并对现代语言学产生了兴趣。遗憾的是语言学当时在英国影响不大,英语系没有老师可以在这个领域给他提供充分的指导,他只能研究与语言学相关的其他课题。1959年,传播学在UCL得到重视。学院举办了一次传播学的跨学科研讨会,还成立了一个新的传播学研究中心(Communication Research Centre,CRC)。但是这个中心的工作开展得并不顺利。既没有足够的经费,也缺乏研究人员。另外,学者们对于传播学的定义和研究方法有很大分歧。

在CRC开展研究工作的只有英语系的三名研究生,利奇便是其中之一。他们研究公共传播中的语言使用,利奇负责的课题是电视广告中的语言使用。因为不确定应该使用何种方法,也没有人指导,他们的进展非常缓慢。利奇的信心因此备受打击,他决定离开大学,开始在一所中学任教。接下来的18个月中,他住在伦敦附近的一个外迁安置房,一边教着英语,一边在业余时间尽量维持硕士课题的研究工作。

1962年1月1日,利奇的课题获得了一项来自ATV商业电视公司的助研金。尽管每年只有750英镑,不及他教书的收入,利奇还是欣然接受了。他放弃了教职,全职投入到学术研究中去。但是他仍然需要面对研究方法方面的困扰。这时,Randolph Quirk即将从杜伦大学回到UCL英语系。他通过利奇的导师得知CRC面临研究方法方面的困难,于是建议他们学习美国的“新语言学”。他认为这可以为描写电视中的广告语言提供最好的分析方法。当时Quirk推荐的书籍现在大部分已经被人们遗忘,比如Paul Roberts、W.Nelson Francis、A.A.Hill和James Sledd的英语句法。这些书都是美国结构主义语言学的产物。我们知道后来乔姆斯基的生成语法取代结构主义成为美国语言学的主流。

3.在UCL任教(1962-1969)

1962年夏天,UCL英语系有一个助理讲师的职位出现了空缺。系主任Smith教授有意让利奇接手这个职位,但是他把决定权给了刚刚回到UCL英语系的Quirk教授,让他审核利奇是否有资格出任。面试之前利奇未曾见过Quirk教授,但是对他的声望却早有耳闻,他怀着忐忑的心情来到面试地点。等待他的将是怎样的命运呢?让利奇感到惊喜的是Quirk教授非常热情地接待了他,而他的表现也令Quirk教授感到满意,最终他获得了这个职位。

开始执教之后利奇接到了一个重要任务,为一年级的学生设计和讲授一系列修辞学的讲座。之前,这门课程主要讲授古典文学的修辞传统,学生普遍认为这是英语系开设的最枯燥无味的课程。英语系给了利奇最大的自由,他可以用自己认为妥当的任何方式讲授这门课程。利奇大胆改革,抛弃了之前传统修辞学的视角,选择从现代语言学的角度解释文学语言,尤其是诗歌的语言。

同时,利奇继续研究他的硕士课题,并于1963年完成了他的硕士论文《商业电视广告的语言》(The Language of Commercial Television Advertising)。Quirk教授看好利奇的学术潜力,给了他很多帮助和鼓励。当时Quirk教授正在编辑一套丛书《朗文英国语言丛书》(Longman English Language Series)。他鼓励利奇在他硕士论文的基础上进一步拓展,更为全面地阐述广告语言,并写成专著加入他正在编辑的丛书出版。1966年,利奇完成并出版了这部著作,书名是《广告英语:英国广告的语言学研究》(English in Advertising: A Linguistic Study of Advertising in Great Britain)。

相比广告英语,利奇更为感兴趣的课题是从现代语言学的角度研究文学语言。这不仅体现在他新开设的修辞学课程当中,也是他写作另一部专著的动机,那就是1969年出版的《英语诗歌的语言学指南》(A Linguistic Guide to English Poetry)。这本书同样得到了Quirk教授的鼓励,是《朗文英国语言丛书》中的一部。

利奇在UCL英语系担任助理讲师和讲师期间(1962-1969)主要建树表现在三个学术领域,语域(广告语言)和文学语体是其中两个。另外一个便是语义学。

1963年,M.A.K.Halliday被任命为CRC的主任,成为利奇的领导。之后不久Halliday成为UCL的语言学教授,并建立了语言学系。在Halliday的影响下,利奇开始对语义学产生兴趣。Halliday研究语义的基础是“情景”和“语境”,这与他的老师J.R.Firth的“情景语境”有关。利奇则另辟蹊径,试图创立融合成分分析法和逻辑语义学的新理论。

1964-1965年利奇作为哈克尼斯研究学者(Harkness Fellow)在美国麻省理工学院访学一年。在那里,他的主要兴趣是语言学。当时的麻省理工学院是全世界语言学研究的发动机,以乔姆斯基的转换生成语法为代表的形式主义语言学在那里占据统治地位。尽管利奇对转换生成语法不能全盘接受,但是他在MIT接触到了很多有用的语言学思想。

回国之后,利奇继续语义学领域的探索,但是并不顺利。他在英国语文学会宣读了一篇语义学的论文,会上他的新语义学理论招致了一些怀疑和反对。之后他把文稿发给剑桥大学的John Lyons,试图在刚创刊的Journal of Linguistics上面发表,也遭到了冷遇。后来,利奇把他的语义学理论写成了一部专著,但还是没有能够发表。于是他打算以这部专著为基础撰写博士论文。从1965年到1969年,利奇继续思考和发展他的语义学理论,直到最后写成了题为《现代英语中位置、时间和情态的语义学研究方法》(An Approach to the Semantics of Place, Time and Modality in Modern English)的博士论文。这篇论文经过修改之后于1969年正式出版为《朗文语言学文库》中的一部专著——《论英语的语义描述》(Towards a Semantic Description of English)。

在UCL英语系任教期间,利奇还非常幸运地成为“英语用法调查”(Survey of English Usage,SEU)语料库项目的重要成员。SEU对利奇的学术生涯产生了重大影响,这一影响比MIT的影响更为实际,更加持久。SEU研究中心由Randolph Quirk于1959年建立,隶属于UCL英语系。它早期最主要的任务就是编纂和分析包含大量现代英语文本的语料库。它的重要成员还包括David Crystal、Jan Svartvik和Sidney Greenbaum。这三人都是英语语言学领域中的知名专家。后来Quirk、利奇、Svartvik和Greenbaum四人合作,在SEU研究的基础上撰写了《当代英语语法》(A Grammar of Contemporary English, GCE),于1972年由朗文出版公司出版。

4.在兰卡斯特大学成立新系(1969-1974)

1969年利奇成功申请了兰卡斯特大学的高级讲师职位。这所新大学位于英格兰北部,伦敦西北大约240英里处。到兰卡斯特大学就任时,利奇晋升为英语Reader(相当于副教授)。在那之后,兰卡斯特大学一直是利奇的家,直到他去世。

初到兰卡斯特的几年,利奇仍然花了大量的时间与Quirk、Greenbaum和Svartvik一起合作撰写《当代英语语法》。他还继续了语义学方面的研究,1971年出版了《意义和英语动词》(Meaning and the English Verb),1974年出版了《语义学》(Semantics)。

1975年利奇和Svartvik合作出版了《英语交际语法》(A Communicative Grammar of English)。这本语法书提出了较为新颖的语法观。他们认为语法需要为学习者服务,需要服务于“交际”的目的。为了达到这一目的,语言的形式和结构必须与它们的意义和用法相联系。这本书是利奇发行量最大的一部著作。

利奇初到兰卡斯特时,这所大学成立只有5年时间,正处在迅速发展的时期,新的学科、新的院系、新的建筑不断地涌现。在英语系,利奇领导的语言学学科取得了迅猛的发展,1974年升级成为语言学与现代英语系。它和另外两个系一起组成了新的英语学院。新系成立的时候,利奇晋升为语言学与现代英语教授。同时,兰卡斯特大学开设了语言学本科专业,跻身第一批授予语言学学士学位的大学。

5.计算机语料库语言学的开始(1970-1978)

早在1970年,语言学系还没有成立之时,就有几个年轻的语言学者聚到一起,商量如何让兰卡斯特大学在世界语言学地图上划出自己的位置。在利奇的倡导下,他们决定开发一个英国英语的计算机语料库,使之与布朗大学的美国英语语料库媲美。那时,布朗大学语料库的开发刚刚完成,是世界上第一个现代英语的计算机语料库。他们设想中的“兰卡斯特语料库”跟布朗大学语料库规模相当,包含一百万词以上的不同语域的书面英语。在领导这个项目的过程中,利奇花费了很多心血,但是进展却非常缓慢,他们碰到了很多困难。他们的计算机设备非常简陋。虽然从朗文等出版商和英国学术院获得了一些经费,但是很快就用完了。还有他们不得不面对的版权问题,几乎成了一个无法逾越的障碍。到1976年,利奇准备放弃整个项目。这时,Jan Svartvik以前的学生,一位名叫Stig Johansson的瑞典学者提出把这个项目迁到挪威,在那里完成语料库的开发,因为他刚刚在那里晋升为教授,可以提供充足的研究经费。1978年,在兰卡斯特、奥斯陆和卑尔根三所大学的共同努力之下,这个英国英语语料库终于完成了。它被称作兰卡斯特-奥斯陆/卑尔根语料库(the Lancaster-Oslo/Bergen Corpus),或者LOB语料库(the LOB Corpus)。LOB语料库面世之后,在全世界得到了广泛的应用,其地位与布朗语料库不相上下。

LOB语料库面世的前一年,也就是1977年,利奇和几位英语专家(包括Randolph Quirk、Jan Svartvik、W.Nelson Francis和Stig Johansson)在奥斯陆开会,成立了“国际现代及中古英语计算机文档库”协会(the International Computer Archive of Modern and Medieval English, ICAME)。这个机构的目标是发展和推广计算机语料库在英语研究中的使用。让人匪夷所思的是,最初成立这个机构的动机竟是为LOB语料库扫清版权方面的障碍。1976年,伦敦的出版商和作家经纪人们似乎商量好要和兰卡斯特大学的语料库项目作对,他们再三拒绝免费授权,要求兰卡斯特大学为每一篇2000词的样本支付费用。后来利奇他们发现,为了说服这些出版商和版权所有者免费授权给他们,更有效的办法是从挪威的地址给他们写信,而且写信人的身份是“国际现代及中古英语计算机文档库”协会(ICAME)秘书长,这比以一个国内学者的身份从兰卡斯特的地址写信有效得多。成立ICAME解决了LOB语料库的版权问题。更重要的是ICAME作为一个推广语料库研究的机构其事业也越来越兴旺。它每年召开一次会议,有专门的刊物(ICAME Journal),在卑尔根大学有它的信息传递中心,为世界各地的研究者提供语料库、软件和相关文献。ICAME见证了语料库从一开始遭到鄙视到后来成为主流研究方法的历史过程,这种转变既发生在计算语言学领域,也发生在英语语言研究领域。目前只有理论语言学的某些流派对计算机语料库的作用持怀疑态度。

6.走向学术生涯的顶峰(1976-1987)

1977年利奇完成了语言学与现代英语系系主任的三年任期。之后,他和兰卡斯特大学达成协议,只花一半时间为大学工作,另一半时间则用于研究自己感兴趣的课题。这个协议持续了八年时间。利奇利用这八年的时间完成了很多自己满意的研究,发表了很多专著,也得以发展他在计算机方面的兴趣。

利奇继续在语言意义方面进行探索,这一时期他更关注语用学。他在1980年出版了专著《语义学和语用学探索》(Explorations in Semantics and Pragmatics),1983年又出版了《语用学原理》(Principles of Pragmatics),其中广为人知的部分是关于礼貌的理论阐述。文体学方面,他和兰卡斯特的同事Mick Short合作于1981年出版了具有重要影响的《小说的文体:英语小说的语言学导论》(Style in Fiction: A Linguistic Introduction to English Fictional Prose)。这部著作受到了广泛的好评,利奇自己也认为这是他比较满意的一部作品。

从1978年开始,利奇和Quirk、Greenbaum、Svartvik一起开始准备《当代英语语法》的第二版。《当代英语语法》第一版于1972年问世之后,关于语法的学术思想以及英语语法的知识有了很大的发展,而且学术界发表了很多关于这本书的评论,对它的优点和缺点都有深入的探讨。作者们觉得有必要出一个新版。准备过程中,他们发现整本书都需要重写,不仅需要改变原书的结构,而且需要纳入很多新的SEU研究成果。就这样,《当代英语语法》的第二版演变成了一部新书。这就是1985年朗文出版公司出版的《英语语法大全》(AComprehensive Grammar of the English Language, CGEL)。

《英语语法大全》的出版把利奇送到了他学术生涯的顶峰。这本书产生了巨大的影响,被视为英语语法的权威之作。它的出版给利奇带来了巨大的荣誉,1987年利奇当选为英国学术院院士,同年他被隆德大学(University of Lund)授予荣誉博士学位。1988年利奇成为他的母校UCL的研究员,1989年他当选为欧洲科学院院士(member of the Academia Europaea)。

7.基于语料库的计算语言学研究黄金时期(1978-2000)

20世纪70年代末,计算机英语语料库的标注和自动处理成为利奇最感兴趣的研究课题。他和兰卡斯特大学计算机系的负责人一起建立了“英语计算语言学研究中心”(Unit for Computer Research on the English Language,UCREL),开展与语料库相关的计算机技术方面的研究。从那时起直到利奇退休,UCREL团队一直是他工作的重心。

1978年LOB语料库完成研发之后,利奇的团队幸运地从社会科学研究协会获得一笔研究经费,课题是语料库的自动语法标注。具体而言就是为语料库中的每一个词都加上一个标签,说明它的词性。为了达到这个目的,他们需要编写复杂的计算机程序。他们与奥斯陆大学Stig Johansson的团队合作,于1983年完成了这个项目。他们合作开发的软件CLAWS1是第一个使用统计算法的词性标注软件,其算法和隐马尔可夫模型(Hidden Markov Model)相似。这个算法由利奇团队的成员Ian Marshall发现,它使得计算机自动标注的准确率由77%上升到96%。这是一个很大的突破。他们的做法是,把已经标注好的布朗语料库用作训练语料库,让CLAWS1从布朗语料库学习频率信息,然后应用到对LOB语料库的自动标注中。用今天的术语来说,布朗语料库是训练语料库,而LOB语料库则是测试语料库。这种区分训练语料库和测试语料库的方法由利奇的团队首先使用,如今已经成为语料库自然语言处理的基本方法。

1983年利奇的团队从科学和工程研究协会(the Science and Engineering Research Council)获得资助。这次他们需要面对一项更具挑战性的课题,即语料库的自动句法标注(automatic parsing)。首先,他们需要手工对语料库进行句法标注,用来充当训练语料库。第一个完成句法标注的语料库是由兰卡斯特大学的学者Geoffrey Sampson制作的,被称作“树库”(Treebank)。尽管兰卡斯特大学最早建立树库,并使用Treebank这个词,但是他们在语料库的自动句法标注这个课题上进展却非常缓慢。到1990年,只有13%的LOB语料通过统计的方法获得了准确的句法标注。他们缺乏更大规模的树库,更好的句法模型,更强大的计算机设备。

事实上直到今天,对任意文本的准确自动句法标注仍然是一个未被攻占的学术高地。利奇他们也知道只靠自己团队的力量不足以解决这个难题。1987年,IBM托马斯•沃森研究中心(the IBM Thomas J.Watson Research Center)的Fred Jelinek找到利奇要求与他们合作。当时IBM是自然语言处理技术的领路人,它拥有最先进的语音识别技术、最前沿的统计方法、超过三亿词的电子文本库。利奇的团队和IBM开展合作,在80年代末开发出了三百万词以上规模的大型树库,可以为自动句法标注提供更充足的统计信息。因为资金和数据都来源于IBM,利奇的团队不能自由地与别人分享他们研制出的树库,也不能自由地发表研究成果。20世纪90年代,他们在树库方面的研究被宾夕法尼亚大学Mitchell Marcus的团队超过。今天更多人知道的是Penn Treebank,而不是IBM/Lancaster Treebank。利奇团队与IBM的合作产生了一部论文集《统计驱动的计算机英语语法》(Statistically-Driven Computer Grammars of English: The IBM/Lancaster Approach),由Rodopi出版社于1993年出版。

20世纪90年代,UCREL不断地获得项目经费,语料库技术的研究进入黄金时期,继词性标注之后,语义标注、回指标注、平行语料库对齐等课题相继涌现。由于IBM公司在1991年遭遇财务困境,他们终止了与利奇团队的合作。但是同一时期UCREL不乏其他的合作者,比如电信商ART Kyoto、朗文出版集团、牛津大学出版社等。与企业合作减轻了竞争公共研究经费带来的尴尬,但是这种商业性质的合作也给他们带来了巨大的压力。不论研究过程中出现什么样的困难,他们需要按时提交成果。此外,在发表和使用研究成果方面,他们也受到诸多限制。

利奇领导的最大的一个合作项目就是英国国家语料库(British National Corpus,BNC)项目。他们的合作者包括三家出版社、牛津大学和英国国家图书馆。项目过程中利奇团队承受了巨大的压力和困难,最终超时一年完成了这个语料库。BNC的容量超过一亿单词,它既包括口语语料也包括书面语语料,是目前世界上最具代表性的当代英语语料库之一。BNC的开发是一个巨大的成就,很多国家效仿BNC开始了本国语言语料库的开发。

20世纪90年代,国际上出现一股语料库热潮,英语之外很多其他语种也开始建立语料库并进行标注。利奇和他的同事Roger Garside、Tony McEnery一起参与了欧洲委员会资助的研究。他们和欧洲大陆的研究者合作,开发了英语、法语和西班牙语平行翻译语料库。利奇还参与了EAGLES(Expert Advisory Group on Language Engineering Standards)的工作,担任多个委员会的主席和多个文件的主笔。他参与起草了欧洲语言语料库标注的指导原则。从1993年到1999年,利奇参与了三个此类项目,分别与词性标注、句法标注、对话标注有关。

8.隐藏的失落(1986-1999)

20世纪80年代中期,利奇对计算机语料库的热爱几近痴迷。他把几乎全部时间都投入到这方面的研究,同时也从中获得了极大的精神满足。在他自己看来,这有几个方面的原因。首先,与其他学者合作开展研究对文科出身的利奇来说是一种新奇的体验。其次,在一个快速发展的全新领域开辟道路、引领潮流让利奇感到振奋。第三,通过语料库研究,UCREL在自然语言处理领域建立了一定的声望,并与世界各地的语料库研究者建立了广泛的联系。目前,一个语料库语言学的研究者共同体已在世界范围内建立起来,基于语料库的研究方法在语言学的各个领域被广泛接受和应用。

当然,语料库研究也有它的缺点。很大一部分工作是单调乏味、耗时费力的辛苦活,而不是挑战智力的研究。长期从事这样的工作让利奇无暇他顾,只能把以前的一些研究兴趣,比如文体学、语用学,束之高阁。同时,为了保障研究经费,利奇还不得不花时间与赞助商周旋。

很长一段时间,语料库语言学只有一两个期刊可以发表文章,研究成果多以论文集的方式成书出版。与语料库研究早期阶段的各种突破形成对比,到后来要想取得进展变得非常困难。利奇还有一个担心,就是总体而言这个领域的发展非常迅猛,UCREL对于保持曾经拥有的领先地位感到力不从心。语料库方面的资源和软件扩散得非常迅速,UCREL的优势丧失得很快,大有被其他团队超过之势。在美国、英国、或者其他地方,已经有大学院系或者研究团队在资金、设备、人员方面超过了UCREL。UCREL已成为大池塘中的小鱼。利奇对于语料库技术的热爱渐渐退去,把兴趣转向使用语料库研究语言本身。

从1986至1997年利奇编辑了四本论文集,分别是《英语教学与研究中的计算机》(Computers in English Language Teaching and Research,1986),《英语的计算分析》(The Computational Analysis of English,1987),《计算机中的英语口语》(Spoken English on Computer,1995),以及《语料库标注》(Corpus Annotation,1997)。这四本论文集均由朗文出版公司出版。利奇60岁生日时收到了一份意外的礼物,他的同事Mick Short和Jenny Thomas为了庆祝他的生日,编辑出版了一个论文集《用语料库研究语言》(Using Corpora for Language Research,1996)。

9.退休之后(2001-2014)

利奇于2001年12月31日正式退休,成为兰卡斯特大学的荣休教授。退休以后利奇的生活并未发生大的变化,语言学与现代英语系保留了他的办公室。在那里,他继续开展研究,指导博士生,并经常到国外参会、讲学。

德国南部弗莱堡大学和慕尼黑大学的两位学者Christian Mair和Marianne Hundt在90年代中期研发了两个新的语料库。它们的规模和取样标准与Brown和LOB语料库相同,只是选取的语料来自1991和1992年的出版物。因为它们是由弗莱堡大学研发的,所以称作“Freiburg-Brown语料库”和“Freiburg-LOB语料库”,或作Frown和FLOB语料库。利奇与这两位德国学者开展了合作。

从1998年开始,在他的助手Nick Smith的协助下,利奇开展了一项新的语料库研究。他通过比较LOB和FLOB,两个分别代表1961年和1991年英国英语书面语的语料库,试图发现这30年间英国英语书面语的语法变化轨迹。这正是利奇擅长从事的研究——英语语言的描写。这个研究得到了艺术与人文科学研究理事会(Arts and Humanities Research Board,AHRB)的支持。

后来,利奇从利华休姆基金(Leverhulme Trust)获得资助,并与Nick Smith以及Paul Rayson开展合作,继续进行现代英语语法变化的研究。他们计划研发与Brown和LOB设计理念相同的一系列可比语料库。这一类语料库也被称作“布朗家族语料库”。他们完成了一个1931年英国英语书面语的语料库,取名为B-LOB语料库(意思是before LOB)。他们还开始了1901年英国英语书面语语料库的研发,但至今尚未完成。通过比较这些语料库,研究者可以发现从20世纪初到21世纪初的一百年间英国英语语法发生的变化,这是一个宏大的研究设想。

尽管利奇没有能够在有生之年完成他的全部设想,他在这个新领域的探索仍然卓有成效、硕果累累。通过语料库研究语法历时变化的课题也成为语料库语言学研究中的新热点。2009年剑桥大学出版社出版了《当代英语中的变化:语法研究》(Change in Contemporary English: A Grammatical Study)。这部著作集中呈现了利奇晚年关于现代英语语法变化的研究成果。

通信地址:100089 北京市北京外国语大学中国外语教育研究中心/北京市北京外国语大学英语学院

猜你喜欢
卡斯特英语语法语言学
2020年高考英语语法填空命题分析
体认社会语言学刍议
英语语法教学策略谈
《复制性研究在应用语言学中的实践》评介
高考英语语法填空有提示词的题型解析
《神经语言学和心理语言学视角下的二语习得》述评
来,我们说说英语语法
还您一包炒腰豆
英国十大闹鬼城堡
社会语言学名词