面向产出导向的大学英语教育新模式的构建*

2019-09-03 07:22
计算机与数字工程 2019年8期
关键词:语料库导向节点

余 丽

(渭南职业技术学院基础课部 渭南 714023)

1 引言

产出导向理论的前身是“输出驱动假设”和“输出驱动的输入使能假设”。作为外语教学的“局部”理论,产出导向理论在“输出假设”和语言学习的社会文化视角的基础上,运用了SLA理论的研究成果[1~4]。本文提出了新的基于语料库的产出驱动型教学理念,以提高大学英语单词教学效果。

作为语言学教学的补充工具,语料库可以提供丰富而真实的英语资料,充分保证学习者有充足的真实语料输入,并提供真实的词汇,帮助学生积极探索具有重要前提的目标词的深层意义[5]。语料库可以被广泛使用的一个重要原因是它可以提供关联搜索。与传统的英语教学方法相比,使用语料库练习英语的优势在于摆脱了孤立学习词汇的传统方法。通过使用语料库提供的关联搜索学习单词搭配和上下文语义,可以节省花在词汇深度知识上的学习时间,并且可以快速掌握大量的词汇信息[6~8]。通过对相同语境下同义词挖掘等手段可以提高学习目标词的速度,并为掌握相关词汇和词汇学习奠定良好的基础。从而提高学生的词汇知识水平和词汇应用能力。

大学英语实践训练必须以英语语境为实际,必须精心运用大量的英语培训教材,在实践中可以获得更理想的教学效果[9]。因此,高质量、大规模、多元化的语料库对于推动大学教学的研究与应用具有重要意义。根据不同的标准,语料库分类也各不相同。原始语料库采用仅由手动注释的文本数据集的形式。随着信息能力的提高,研究人员建立了一个大规模的信息语料库,通过信息收集和处理大规模的语料库数据,将语料库的语料从文本格式扩展到大学英语教学。大规模的信息语料库可以广泛应用于大学英语教学。随着现代信息多媒体技术的发展,人们对英语活动性质的认识逐渐增强,出现了多语种语料库。多模式语料库是音频、视频和文本语料库等信息的集合[10~11]。研究人员可以通过多种方式处理、检索和统计相关研究的语料库。本文从词汇知识的深度入手,将基于语料库的数据驱动学习方法与大学英语课堂教学实践相结合,探索如何利用产出导向语料库方法促进大学生词汇深度的掌握,激发大学生自主学习英语的兴趣。

2 基于信息技术的大学英语教学模式

2.1 大学英语实践教学原则

大学英语实践教学过程包括五个方面:教学语料库文档预处理;基于语料库的词表扫描;动态规划方法以找到基于词频的最大分词组合;利用隐马尔可夫模型实现未注册大学英语单词的预测;以及教学效果的评估[12~13]。教学建模过程的具体内容如下。

用动态规划方法找出最大概率路径。根据已经形成的语料库和要教学的句子的有向无环图(DAG),基于语料库的教学模式首先找到语料库中单词的不同组合的频率,然后使用基于词典的反向最大匹配原理来找到最大概率路径按照动态规划方法从待教学的句子的右侧进行计算,最后得到分割组合的最大概率。对于大学英语的教学,句子长度为n,字符串组合为C=C1C2C3Cn,输出字符串为S=S1S2S3Sm,其中m≤n。对于一个特定的字符串C,将会有与该任务对应的各种分词程序S,并且应该从最大值的S概率中找到教学结果,并且这是最有可能的单词所构成的大学英语教学句子。

假定每个单词之间的概率是上下文无关的,那么S概率是

这里,N是语料库中单词的总数。在求解动态规划的过程中,并未预先生成所有可能的方案Si,并且具有最大值并且获得,然后通过回溯方法直接输出Si。

节点Ni的最大概率称为节点Ni的概率:

其中,英语教学节点的末尾是Ni,它被称为Sj和 Ni前体词。这里,prev(Ni)是节点i的紧前词集。StartNode(Wj)是Wj的起始节点,也是节点i的紧前节点。因此,在JIEBA教学中,对于n的长度,最后一个单词是Sm,在教学英语教学句子的教学中,得到 P(Noden)=1:

依此类推,可以得出最大的分割概率P(S)。

2.2 构建英语教学语料库

通过对大学英语教学的分析,处理和分割,以前缀树为思想构建了基于大学英语教学的语料库。前缀树是一个多树结构,它具有三个基本属性:1)根节点不包含任何字符,并且除根节点外的每个子节点都包含单个字符。2)从根节点到其他节点,连接经过该路径的字符,即该节点对应的字符串。3)每个节点的所有句子都包含不同的字符。前缀树的核心思想是使用字符串的公共前缀来减少字符串之间不必要的比较以提高查询效率。基于前缀树构建字典的优点是插入和查询效率很高,并且都具有O(n)的复杂度,其中n是要插入或查询的字符串的长度。同时,前缀树中的不同关键字不会造成任何冲突,并且前缀树可以按照字典顺序对关键字进行排序。

大学英语语料库是以前缀树为代表的关键词。它突出了大学英语语料库的两个特点。一个是它们具有独立的中文词汇的特点,另一个是大学英语的特点。在语料库中,大学英语教学关键字存储在路径中,而不是节点。另外,如果同一路径前缀部分的结构中有两个公共前缀关键字,则是大学英语教学语料库。通过对大学英语教学的统计和处理,完成了基于词频和词性的大学英语教学语料库建设,为后续基于语料库教学模式的改进提供了有力的数据支持。本文认为基于前缀树的字典构造方法可以提高插入的效率,并可以删除和查询英文字典,因为它可以扩展到其他教学英语字典的建设项目中。

2.3 基于语料库方法的大学英语教学实践步骤

通过语料库在大学英语教学中的实验,对英语教学存在的主要问题进行了以下研究:

1)英语教学利用现有的教学体系进行汉语教学。一方面,字典的教学没有被黄金标准所证实,这带来了错误的教学问题。另一方面,词典的数据量超过30万字,对大学英语教学没有多大用处。一些大学英语培训教学词汇和语料库从未出现,后续预测效果不好,整体识别效果约为86%。

2)在将该词典引入产出导向语料库词典之后,尽管整体识别效果仅略微提高,但使用词典模型的教学时间增加,并且HMM模型具有与预测未记录词相同的效果。

3)通过修改JIEBA的教学模式,采用基于英语教学词典的方法,消除了HMM模型的引入,增加了模型初始化时间,略微提高了整体识别效果。但是,模型训练时间过长,并没有大学英语教学的共性。

针对以上问题,本文提出了一种新的大学英语教学方法,这是对JIEBA方法的改进,是一种基于概率英语模型的词典教学方法。对于大学英语教学而言,一方面,大学英语教学的运行时间和准确性都优于JIEBA大学英语教学方法。另一方面,大学英语教学方法的实验证明,运用英语概率统计模型和英语词典教学可以提高英语教学效率的准确性。因此,它具有大学英语教学方法的普及性和普遍性。

本文采用标注语料库和大学英语培训库的两个语料库数据集进行培训。基于JIEBA的大学英语教学建模过程如图1所示。

图1 基于产出导向语料库与训练语料库的实践步骤

基于产出导向语料库的教学模式的方法是将英语模型与英语词典结合应用于大学英语语料库教学。大学英语教学建模过程的具体内容是,在大学英语语料库预处理教学时,首先判断它是否是注册词汇。如果是注册词汇,则使用大学英语词典词将地图扫描,并用DAG语句进入大学英语教学,从而实现初步的块教学。然后,动态规划方法可以计算块的部分的最大概率来实现词典中的教学。对于未注册的词汇,我们使用具有汉语识别能力的HMM模型进行预测。本文认为这种教学模式的方法可以扩展到大学英语其他教学模式。

3 基于信息技术的大学英语教学模式的验证

3.1 英语教学方法评估

本文选择国际计算语言学英语处理协会SIGHAN标准作为教学效果的评估,并用Perl脚本进行测试。SIGHAN标准的三个评估因子包括:准确率、召回率和F值[14]。

Ccorrec表示所有准确提取的候选关键字,Cextract表示提取的关键字总数。Cstandard是所有手动注释的标准关键字答案总数。P=Presison表示准确率,r=Recall表示召回率。

3.2 英语教学法的验证结果

本文的实验环境是Windows10和Anaconda平台,基于产出导向语料库方法是基于Python语言实现的,并且用该语言实现了不同的教学对比实验方法。本文的数据包括基于词典教学方法、基于阅读英语词典的教学方法、基于产出导向语料库的字典教学方法等15种大学英语教学方法。表1显示了四种给定方法的教学效果。图2显示了不同模型的教学结果。

表1 不同模式的大学英语自动教学效果对比

图2 大学英语不同模式的教学效果

本文的测试程序是选择8个大学英语教学与培训语料库,并将包含训练语料的训练语料词典和另外7个语料库一起作为测试语料库,并将未注册词(OOV)的概率设定为15.2%。不同方法的测试结果如图3所示。

图3 基于语料库的大学英语教学效果对比

实验结果表明,基于产出导向语料库的方法在大学英语教学中的召回率、准确率、F值或OOV回忆率方面优于其他的方法。其中,产出导向语料库方法的准确率为93.5%,OOV预测回忆率为90.7%,模型训练速度为其他方法的十分之一。这说明该方法适用于大学英语教学实践,结果更加准确,实验发现使用英语模型和词典可以使英语教学更加准确地教学,因此可以扩展到其他英语翻译。

4 结语

本文研究了基于产出导向语料库和信息技术相结合的大学英语教学模式。研究表明,通过基于产出导向语料库和信息技术相结合的教学方法来提高大学生的词汇知识、单词运用能力、课堂教学效果和以及单词的语境意义的理解是有效和可行的。学生可以通过上下文语境来总结目标单词的灵活运用。基于产出导向理论的语料库和信息技术相结合的英语教学方法优于传统的英语教学方法。通过问卷调查表明,面向产出导向的教学方法有调动学生积极的英语学习态度。在大学英语词汇教学中,引入面向产出导向的信息英语培训教学方法,提高了大学生的英语学习能力和词汇应用水平。同时,他们也将学生的被动学习转变为主动学习。在教师激励的指导下,学生一目了然地观察丰富的语料和语境,找到自己对归纳词汇的用法,探索英语学习的规律,提高大学生英语学习的自主性和积极性。

猜你喜欢
语料库导向节点
基于语料库的清末民初日源外来词汉化研究
基于图连通支配集的子图匹配优化算法
“偏向”不是好导向
基于需求导向的航天青年成长建议与实践
结合概率路由的机会网络自私节点检测算法
面向复杂网络的节点相似性度量*
采用贪婪启发式的异构WSNs 部分覆盖算法*
运用语料库辅助高中英语写作
犬只导向炮
坚持两个导向 顺势而为谋发展