我国语料库日语写作研究现状
——基于中国知网期刊(2011—2020)的统计分析

2021-01-02 19:37康艳梅
开封文化艺术职业学院学报 2021年3期
关键词:语料库日语学习者

康艳梅

(四川外国语大学成都学院 亚非语言学院,四川 成都 611844)

一、研究背景

20 世纪60 年代,美国建成了世界上第一个机器可读的语料库——布朗语料库,至今已有近60 年历史。语料库的出现与发展更新了原有的研究工具和研究方法,在语言教学、二语教学、翻译研究甚至人工智能等领域广泛应用并取得了丰硕的成果。

1962 年,日本在『現代雑誌九十種の用語用字』调查中部分运用计算机参与处理,这一般被看作广义的日语语料库应用。进入20 世纪90 年代,日本先后建设了EDR 语料库、日语口语语料库(CSJ)、现代日语书面语均衡语料库(BCCWJ)、多语言日语学习者横断语料库(I-JAS)等语料库。在国内,2002年,北京日本学研究中心开发了中日平行双语语料库。此外,日语学习者书面语语料库、湖南大学日语学习者中介语语料库和北京日语学习者历时语料库(B-JAS)等也相继出现。

2002 年,毛文伟利用语料库统计分析了“~テナラナイ”“~テショウガナイ”“~テタマラナイ”三个语法的区别,这标志着国内学者正式开始使用语料库进行日语研究[1]。2003 年,施建军、徐一平在《语料库与日语研究》中介绍了日语研究的语料库并对如何利用语料库进行日语研究提出了建设性见解[2]。在中国知网期刊页面检索主题“语料库”并含“日语”的文章,获得2002—2020 年发表的论文共334 篇,除去期刊索引13 篇,学院学者介绍5 篇,学界动态、书评及中国语言文学研究各2 篇,剩余310 篇。其中,2011 至2020 年间共275篇,约占整个研究的90%。因此,本文将考察重点放在2011—2020 年的日语语料库研究。

日语教学要求学生同时掌握“听说读写译”五项能力,但是由于写作更多考验的是对已学内容的综合掌握和运用,所以学生的写作水平远远低于其他各项能力。如何利用语料库大量真实的语言素材来提高日语学习者的写作能力,是日语教育者需要考虑的问题。

本文将统计2011—2020 年收录在中国知网的、与语料库日语写作相关的论文,先分析语料库日语写作发展趋势,然后将研究方法与研究主题分类汇总,在把握我国语料库日语写作的研究现状的基础上探讨现有研究的不足之处。

二、研究现状

(一)研究趋势

通过中国知网高级检索,设置主题“语料库”并含“日语”,且主题为“写作”或含“作文”,期刊发表时间为2011—2020 年。经过初步检索,得到相关论文共33 篇,仅占该时期语料库日语研究总量(275 篇)的12%。

自2011 年起,基于语料库的日语写作研究大体呈上升趋势,2013 年达到一个小高峰,共发表论文6 篇;2013 年以后逐步下滑,2018、2019 年最少,均只有1 篇论文;2020 年开始反弹并达到了本文研究范围内的最高峰,年发表论文8 篇。

(二)研究主题

秦朝霞通过使用关键词“大学英语写作”,限定期刊来源为8 家外语类核心期刊,检索汇总了中国知网2000—2007 年国内外的写作类研究成果,并将研究主题归纳为写作教学、写作结果、读者反馈、写作评估、写作过程、写作影响因素和写作研究回顾七大类[3]。

参考上述主题分类,笔者仔细研读发表于2011—2020 年的33 篇论文的摘要发现,语料库日语写作主要涉及的主题分别为写作教学、写作影响因素、写作结果和读者反馈。其中,写作结果研究25篇,占总量的75%以上,写作影响因素研究4 篇,写作教学研究3 篇,读者反馈仅1 篇,暂时并未出现写作研究回顾、写作评估与写作过程方面的论文。

1.写作结果

写作结果研究中绝大部分是词汇研究,偶有涉及句法研究与语篇研究。词汇研究大致分为两类:一是词汇偏误分析,这是整个词汇研究中数量最多的内容,主要涵盖汉字状态副词、汉字假名书写、复合动词、助词等。如王漩、张建华利用日语学习者书面语语料库中收录的917 篇作文,统计调查了国内日语学习者的汉字假名书写错误,并将这些错误分为“汉字书写错误”“送假名书写错误”与“由发音导致的假名书写错误”三类[4]。杨红利用日语作文语料库中收录的专四、专八作文进行统计分析后发现,日语中“汉字状态副词”的偏误主要为错序、词性混淆、近义词误代等错误,日语副词内部的不匀质性与同形现代汉语副词的语义负迁移是出现这些偏误的主要原因[5]。二是通过语料库分析日语学习者对某一类词的使用频率及掌握状况,如日语汉字词汇、作文词汇量及高频词目、接续词的使用特征、中介语和外来语表记等。如毛文伟自建日语本族语语料库并利用日语学习者语料库,从词汇覆盖率、高频词目分布特点入手分析了日语本族语者与中国日语学习者使用日语时的异同点,同时还初步考察了中国日语学习者内部中介语的形成状况[6]。

语篇相关的研究主要涉及时体形式、写作视点、句末语气等。如邓亚晔利用日语学习者书面语语料库,分析了中国学习者在撰写日语作文中时体的使用情况并指出学生在日语时体习得的过程中先掌握“ル、タ”,再习得“テイル、テイタ”[7]。

2.写作影响因素

4 篇语料库日语写作影响因素研究都以学生作文中出现的某一种误用现象来分析汉语母语的负迁移作用。李丹蕊以“の”的过度使用与作文结构的误用为线索,探讨了国内外母语负迁移的先行研究中存在的问题,并提出了自己的见解[8]。刘倩卿利用“可能表达”的使用指出,汉语和日语的视点差异导致了中国的日语学习者在从物的视点出发时容易滥用可能形式[9]。

3.写作教学

3 篇语料库日语写作教学研究主要涉及语料库的创建与应用。吴桐、董鑫将语料库NLT 检索系统引入写作课程,指导日语学习者改变用中文思考、掌握地道的词语搭配,从而增强学生的自主写作能力[10]。和佳分析了在写作教学中创建语料库的必要性,说明了创建方法与步骤,并指出将其应用到实际的写作教学中更能体现以学生为中心的教学方式,可以进一步促进日语写作教学与研究[11]。

4.读者反馈

2011—2020 年关于语料库日语写作读者反馈的研究只有1 项。方正收集了10 篇中国日语学习者撰写的作文,并从文体一致、易懂程度、有趣程度入手对比分析了5 名中国籍日语教师与5 名日本籍教师对这10 篇作文的评价。研究结果表明,由于语言文化差异,对于同样的日语作文,汉语母语者与日语本族语者的评价之间也存在一定差异[12]。

(三)研究方法

根据不同的数据来源,外语研究方法一般分为实证研究与非实证研究两种。实证研究包括数理实证研究和案例实证研究,研究者通过收集整理观察资料并开展研究来提出理论假设或检验理论假设。根据这一定义,笔者进一步仔细研读上述33 篇论文发现,2011—2020 年语料库日语写作相关的实证研究论文30 篇,非实证研究论文仅3 篇,实证研究方法占据主导地位。实证研究论文在研究主体、研究对象与研究方式呈现出了以下特点:

1.研究主体

30 篇论文的研究主体主要为日语专业学生、非日语专业学生、英日双语专业学生与日语本族语者四类。其中,有1 项研究通过自建学习者语料库(2007—2009 年全国日语专四、专八命题作文)与本族语语料库(25 本剧本、20 部论述性书籍、100 部小说),对比考察了本族语者在不同文体、不同阶段学习者、本族语语料与学习者语料之间使用中介语的异同[13]。有6 项研究将日语专业学生与日语本族语者进行了组间对比,以日语本族语者为主体的研究有2 项,以英日专业学生与非日语专业学生为对象的研究各1 项,其余19 项研究均为日语专业学生的组内研究,尚未出现日语专业学生与非日语专业学生的组间对比研究。

2.研究对象

30 篇实证研究论文中使用自建小型语料库的研究19 项,超过总量的63%,且使用的语料文本多为学生作文或论文。如栾孟颖、钟勇利用日语专业学生的90 篇毕业论文与发表在日本各协会或学会刊物上的75 篇学术论文,分别制作了“学习者论文语料库”和“日本期刊论文语料库”[14]。其余研究主要使用了日语学习者书面语语料库、多语言日语学习者横断语料库(I-JAS)、湖南大学日语学习者中介语语料库和北京日语学习者历时语料库(B-JAS)。由此可以看出,当前库容大且设计相对完善的语料库数量严重不足,这在一定程度上会使基于语料库的日语写作研究主题受到限制。

3.研究方式

语言学研究可分为共时研究与历时研究两种,共时研究是提取语言发展阶段中的一个时期点进行横向研究,历时研究是就某一种语言的发展过程进行纵向研究。上述30 篇实证研究论文中,两种研究方式均有涉及,共时研究共26 篇,占绝对多数;历时研究数量极少,仅有4 篇。张佩霞、苏鹰选取日语专业2009 级的9 名学生为主体,在深入分析他们大一到大二四个学期进行的15 次共135 篇作文后指出,作文的平均句子数、平均总字数、平均句子长度都表明在学习过程中学习者的文体特点存在时间上的阶段性差异[15]。费晓东利用北京日语学习者历时语料库(B-JAS),选取学习者大一到大四的5次作文语料后分析发现:受母语汉语的影响,我国日语学习者在初级阶段汉字词汇的使用比例较高,随着学生日语水平的提高,汉日同形、汉日异形词的使用比例逐渐降低[16]。

三、研究不足

(一)语料库不完善

虽然现有研究中有部分使用了上海外国语大学等机构建立的语料库,但大部分研究是根据学生作文自行建立的小型语料库进行的,甚至有部分研究所使用的语料仅有10 篇作文。通过这些小型语料库语料分析得到的结论只能在一定程度上反映某一方面的问题,其研究成果并不具备普遍通用性。

(二)研究领域窄且浅

现有研究成果只涉及写作结果、写作影响因素、写作教学、读者反馈四个方面,而写作过程、写作评估、写作研究回顾在2011—2020 年未出现任何研究成果。而且,相对于275 篇的语料库日语研究,33篇基于语料库的日语写作研究数量并不算多。

同时,语料库日语写作结果研究、写作影响因素研究、写作教学研究以及读者反馈研究中的主题相对来说比较分散,并没有形成系统的、可持续的研究体系。现有语料库日语写作研究多侧重于研究成品作文中出现的表层错误或某些特定词汇的准确性,对于写作教学的研究局限于分析语料库在写作中的必要性以及如何将语料库引入日语写作教学,影响写作结果的因素仅列举了母语负迁移一项,而读者反馈也只考察了教师对学生作文的评价。

结语

从研究趋势来看,我国语料库日语写作研究每年都有成果问世,但是占语料库日语研究的比重并不高,也并没有形成可持续的研究热点;从研究主题来看,我国语料库日语写作研究中写作结果研究数量最多,写作影响因素与写作教学其次,读者反馈略有涉及,写作过程、写作评估与写作研究回顾没有任何成果;从研究方法来看,我国语料库日语写作研究半数以上是根据自建小型语料库进行的组内共时实证研究,研究主体主要涉及日语专业学生、非日语专业学生、英日双语专业学生与日语本族语者。

笔者认为,语料库不完善、研究领域过窄过浅影响了我国语料库日语写作的发展。将来,如果能够建设容量更大、更有针对性的语料库,不断加深、扩大研究领域,语料库日语写作研究定会取得进一步发展。

猜你喜欢
语料库日语学习者
从推量助动词看日语表达的暧昧性
平行语料库在翻译教学中的应用研究
明朝日语学习研究
你是哪种类型的学习者
《语料库翻译文体学》评介
十二星座是什么类型的学习者
青年干部要当好新思想的学习者、宣讲者、践行者
高校学习者对慕课认知情况的实证研究
语篇元功能的语料库支撑范式介入
日常日语