ESP社会属性分类的语篇参数
——基于网络语料库的“一带一路”新闻评论数据分析

2019-07-12 10:05
关键词:语篇形式分类

马 韬

(上海杉达学院 外语学院,上海 201209)

不同社会群体使用同一语言会形成该语言的不同形式变体,因此语言变体具有社会功能属性。接触并习得某一语言,很难覆盖其内部所有社会群体的形式变体,至多是对其某几个变体的灵活运用,并由此与形式变体的社会群体达成语言标准共识。某一语言社会功能的特定形式标准成为诸多社会群体语言标准的交集,两者相对补集的差异就形成了语言沟通用途中“专用”与“通用”的区别。

但是,不仅不同社会群体间为满足其特定社会功能所形成的语言标准存在差异,而且不同社会群体内部的语言标准也并非一成不变,相临近的社会群体常常会出现交换使用对方社会功能语言变体的现象。因此,严格按照社会功能属性对语言变体进行单向分类并不充分,那么是否可以通过分析不同语言变体的形式变化来“逆向”反映不同社会功能属性的差异呢?除了语言社会功能属性的学科定性分类,“专门”与“通用”之间的具体语言差异是否存在一些可量化的形式参数?

一、研究背景

(一)ESP的理念与策略

虽然专门用途英语(English for specific pur-poses,ESP)自提出以来经历了二语习得理论的诸多变化[1],然而目前国内关于“专门”与“通用”之间的路径选择还存在一定争议[2]。其核心问题在于如何处理两者之间的资源分配关系,是采取共存方式[3],还是遵循替代方式[4]。无论是共存还是替代,必须从教学发展、应用机制和社会需求上分析ESP的现实意义。

第一,就外语教学发展而言,ESP策略的出现是一个必然现象[5],其存在本身具有在社会、教学和习得上的多重理据[6]。教学与社会之间的有效联系是评判一种教学方法现实作用的重要标准[7],而ESP的根本目标是使教学供给能够满足社会需求。第二,大学英语学习需求出现了不同程度的变化[8],总体上我国通用英语水平有了很大提高,但大学英语在“专门”与“通用”之间未能及时调整。ESP方法的重要基础是英语信息交流在专业应用过程中的准确操作,在学科发展、职业训练与对外服务上,教师、教材与教法三方面都需要作出相应调整,从而提高学生专业英语的实际应用能力[8]。第三,ESP执行的前提是教学内容与方法的有机组合,时代变迁和社会变革对于大学英语能力提出了差异化的教学要求。就英语教学本身而言,走向多元化与专业化是应对需求变化的现实策略[9]。同时,整体语言教学内容的精准化与定制化是“新时代”对外交流中英语社会功能与形式变体整合的互动条件。

ESP教学中语篇的社会功能分类构成了学科英语的组成部分,专业领域语篇所体现的社会功能属性变化是英语分类教学的重要依据,与时代相适应的语篇特征则具体体现了语言社会功能属性的现实应用,因此语篇的社会功能属性定位是ESP策略准确实施的保障。首先,学习者的专业目标与学习过程之间必须匹配,这意味着不同需求的社会群体有其各自相对独立的教学过程。其次,教学过程与内容之间形成参照关系,这保证教学过程方案与语言内容模块之间达成一致[10]。最后,语篇社会功能属性在语言能力发展上的分布应当保持动态变化,这将使语篇形式特征的认知与特定社会群体的认同之间产生良性互动。当下的ESP理念不仅应满足二语习得的专业化效率要求,还要实现对外交流合作中国际社群的对接与语言资源的分配,ESP“因地制宜”的策略将为语言形式变体的社会功能属性分类提供可行方案。操作上,该如何准确区分语篇社会功能属性的变化呢?

(二)ESP的社会属性分类

语篇是不同社会群体表达其综合语义倾向的复杂结构,语篇形式与社会功能存在对应变化[11],而语篇的整体结构变化在社会群体内呈现一定程度的收敛[12],因此,可以根据语篇形式与社会功能的相互关系对语言专门用途的社会属性开展分类。首先,不同专业领域的从业者和学习者作为社会群体子集,在语言功能的使用上存在潜在差异,所以按照社会群体的边界差异可以区分语篇形式与功能的对应关系。其次,我国大学英语教学体系的整体目标之一是在对外开放中全面提升与各类国际群体的有效沟通交流,而语言变体的社会功能在总体上应当与国家对外政策保持一致,所以按照政策倾向的边界变化可以区分语篇主旨与功能的对应关系。最后,由于语言变体与社会功能属性呈现错综复杂的互动关系,用途对形式的影响决定了外在显性标准对语言变体社会属性的分类,而语言形式的功能固化导致了其社会群体语言表征的产生。这些将反映在不同社会功能的语篇中,也体现在形式特征的数量变化上,所以,按照语篇社会功能的结构变化可以区分语篇结构与社会功能的对应关系。

语篇的地缘政治属性作为语言变体的社会功能属性子集,在语篇形式上存在对应变化[15]。不同地缘政治属性的社会群体通过语篇结构形式变化实现其社会功能的差异化传递,以此标记群体之间的社会边界,所以理解不同地缘政治群体的语篇特征是形成有效区位沟通模式的前提条件。由于国家对外传播需求的时代变化对不同时期的外语资源整合提出了不同的英语专门用途需求,大学英语教学在整体上必须适应国家对外传播需求变化,因此ESP在语篇内容设计的地缘政治分类上应当充分体现国家对外传播需求所赋予的新任务和新要求。

“一带一路”倡议作为“新时代”的重要国家对外政策,在不同地缘政治区域间传播时的语篇形式变化反映了语篇社会功能属性的变化。对此开展的量化分类研究,将不仅为描述和分析不同社会功能属性的语篇形式变化提供分类参数,而且为理解和认识某一对外政策在不同地缘政治区域内的传播特征变化提供语篇批评的量化工具。寻求社会功能属性分类的语篇参数,既为分析社会群体语义与语用倾向变化提供有效的观察手段,也为理解不同语篇形式特征与不同社会群体之间的相互关系建立操作指标。这对拓展ESP语篇社会功能属性的分类与定位具有关键作用,对服务于国家对外交流战略的语言资源有效分配与利用具有启示意义。实证分析“一带一路”新闻评论数据,比较不同地缘政治语篇的形式参数,将积极改良专门用途语篇功能属性的分类方法。

二、研究设计

(一)语篇参数的类比推导

国际主流新闻媒体以英语作为传播手段对国际事务进行具有特定社会功能的专门用途评论,而新闻语篇在不同地缘政治区域内的社会属性存在潜在的差异。如果不同的新闻主题在同一地缘政治区域内产生评论语篇的内在形式差异,那么同一新闻主题在不同地缘政治区域间的语篇形式是否会存在变化呢?语篇形式相对社会功能属性的潜在变化可以通过怎样的方法进行分类?区域语篇之间的潜在差异对ESP社会属性分类会有怎样的启示呢?

首先,语篇分类是整个ESP设计中的关键任务之一。不同语篇形式在不同“专门用途”中会出现聚合效应,而语篇的“专门用途”主要体现在语篇的形式差异与功能差异的相互作用中。其次,同一语言的不同语篇变体在同一领域内的“专门用途”变化要小于不同领域间的“专门用途”变化,而后者的变化也要小于无社会领域功能边界定义的“通用用途”变化,这意味着ESP的语篇分类可以直接通过观察语言形式差异获得语言变体社会功能收敛的明确界限。最后,英语新闻评论语篇作为一种“专门用途英语”在不同地缘政治间的语篇变体差异可以类比为同一领域内的“专门用途”与不同领域内的“专门用途”之间的差异;在有无地缘政治的界定之间,同一主题新闻语篇的差异可以类比为“专门用途”与“通用用途”之间的差异。因此英语新闻评论语篇形式的地缘政治分类比较作为研究对象可以等价为ESP语篇社会属性的分类比较。

(二)语篇变体的比较方法

本研究利用WebCorp在线语料库工具[13],比较“一带一路”英语新闻评论语篇的形式特征参数在不同区域间的变化,从而分析地缘政治语篇变体的相互差异,以此验证ESP专门用途语篇功能属性的参数分类方法。本研究将新闻语篇的地缘政治属性分为四大区域,分别为中国、北美、欧洲和东南亚。以新闻媒体网站域名作为识别语篇数据四个区域的分类标准,比如英国报刊的域名以uk结尾,马来西亚以my结尾。所有新闻文本的标题或副标题均含有“一带一路”的各种英语对等词,比如Belt and Road,One Belt and One Road 或者New Silk Road。本研究将通过计算分析三类语篇参数对语篇的形式特征进行量化分类描述:1)主题词的比例分布;2)句型的比例分布;3)衔接词的比例分布。以下对这三类参数的计算方法进行详细说明。

第一,主题词的比例分布以词汇频率作为观察对象。从单个区域语料中检索出频率最高的10个实词,与四个区域分别检索出的10个频率最高实词进行比对。将四个区域语料中共有的主题词记作“共性词”,将只在单个区域语料中检索出的主题词记作“特性词”,并同时在不同区域内对共性词和特性词的比例分布进行计算,以此分析不同社会功能属性语篇的词汇差异。

第二,句型的比例分布以平均句长、单句和被动句比例作为观察对象。通过对三种句型参数在四个区域与单个区域间的比较,实现不同区域语篇的句法组成分类。理论上,平均句长越长则单句比例越低,两者会呈现反比关系;与之相反,平均句长与被动句比例则会出现正比关系。这些将成为反映不同社会功能属性语篇形式特征的重要指标。同时,单句被动句数量将作为误差比例分别在两个参数的统计结果中剔除。

第三,衔接词的比例分布以因果、转折和递进三种衔接关系词在四个区域间出现的频率作为观察对象。通过对三种衔接参数在四个区域与单个区域间的比较,实现区分不同区域语篇的结构组成差异。这三大语篇衔接关系的子功能分类和其他衔接关系衔接词作为观察误差,暂不考虑在本研究的语篇形式特征分析范围内。

三、研究发现

通过WebCorp在线动态语料库检索后发现,以“一带一路”为主题的英文新闻评论语料数量在四个地缘政治区域之间稍有不同。为使语篇参数在各区域间具有可比性,以随机方式对不同区域的语篇进行优化选取。本研究共搜集了218项独立的“一带一路”新闻评论语篇,其区域分布如表1中“篇数”数据所示。虽然平衡后的各区域语篇个体数量仍然存在差异,但是“型符”数据在区域之间达到基本一致。

表1 型类比与句篇比的区域比较Tab.1 Regional comparison of TTR and SSR

区域进行“专门”分类前,在18万“型符”的语料样本中,“类符”值接近11 000,“类型比”值接近17。然而,表1显示区域分类后的“类符”值均在6 000以内,这说明各区域对同一主题的表述存在巨大的词汇差异。同时,表1中“型类比”数据也验证了区域专门词汇与总体通用词汇存在类型差异。这说明为理解某一社会功能区域语篇的英语学习者,只要掌握通用词汇的一半,就可以顺利阅读其专门文献,换言之,ESP社会属性的准确分类和定位可以提高专业英语学习效率。

表1的“句量”数据显示了结构维度上的语篇形式特征。不同区域间的句量差异说明语篇内部结构组成上的变化。若单个语句的信息量近似,同时单个语篇的信息量也近似,那么单篇平均句量越多,意味着其结构越松散,语篇的语义密度越低;反之则相反。不同语义密度的语篇形成不同的社会功能属性,对学习者语言能力和阅读方法的要求也不尽相同。

教学目标框架下的语篇形式与语言社会功能耦合不可纯粹根据教学经验判断决定,应设定准确的语篇参数以确保语篇形式特征的社会属性准确分类与有效定位,比如在表1中,“句篇比”数据在北美区域与总体之间保持了一致。这个随机事件是不可预知的,也是不可能通过经验判断获取的,只有通过参数计算才能得到语篇形式特征的准确信息。本文将通过计算主题词、句型和衔接三类语篇参数来比较不同区域的语篇特征,以此论证区分专门用途社会属性的语篇参数分类方法。

(一)语篇主题词的分布比较

“一带一路”总体语料中前10个高频主题词分别为:belt,road,infrastructure,development,strate-gy,initiative,plan,project,vision,regional。由于四个不同区域子语料中前10个高频主题词之间存在差异,总体语料与各个区域语料之间的高频主题词频次差异成为区分主题词区域差异的主要标准。在表2中四个区域相同的高频主题词数据记作“共性词”,各个区域语篇中出现其他三个区域语篇中缺失的高频主题词数据记作“特性词”。

表2显示各区域语篇“共性词”数据各有不同,这意味着区域间的语篇主题词存在差异。虽然各区域的“特性词”参数变化相对“共性词”参数变化要小,但是相似的“特性词”数据意味着每个区域语篇都拥有各自区别于其他三个区域的主题词特征,且这种特征的分布比例相似。为了在语篇的词汇共性和特性之间得到一个综合判断参数,“共性词”与“特性词”的比值,简称“共特比”,可以用来解释不同社会属性的语篇主题词特征变化。

表2 主题词参数的区域比较Tab.2 Regional comparison of lexical parameters

即使不同区域的语篇涉及了相同的主题,表2中各区域语篇“共特比”参数的标准差系数变化也可以表明“专门”与“通用”功能属性在主题词分布上的差异。这意味着为实现语篇专业词汇均值的收敛,ESP的语篇分类应当参照由社会属性驱动的语篇参数变化,从而保证专门用途功能变体的分类准确。

(二)句型的区域分布比较

虽然句型的语义分类具有明确的指向性,但是由于关联词分类与句型语义分类在一定范围内会产生相互重合或排斥,比如单句既可以是被动句也可以是主动句,但绝不存在关联词,因此本研究对句型的分类主要集中在以下三个参数:平均句长、单句比例、被动比例。

“平均句长”不仅体现语篇整体的句型复杂程度,同时也反映单个句子的语义组合方式。表3中“平均句长”的数据显示,来自欧洲与东南亚的语篇句长比较相近,而其他两个区域的“平均句长”存在明显差异。这说明“平均句长”只是区分语篇来源的一个近似参数,不同社会属性的语篇句型复杂度和语义组合方式存在差异。

表3 句型参数的区域比较Tab.3 Regional comparison of sentence parameters

首先,“平均句长”数据与表1中“单篇句量”数据对比可以发现,句长参数与句量参数在字符数量相似的单个语篇之间成反比。按照本研究的数据进行分析,两个变量的实际相关系数为0.95。这意味着句长和句量的相互关系是语篇作为信息系统在某一专门用途上的具体功能显现。

其次,表3中的“单句比例”与“平均句长”呈反比,即单句数量越多,平均句长越短。这个比值显示了语篇单句数量对于句长的约束作用。“单句比例”参数与表1中的“单篇句量”对比可以发现两者成正比,即单句数量越多,则单个语篇的句量随之增加,这个比值显示了语篇单句数量对整体句量的递推作用。语句作为语篇的主要组成部分,是整个语篇语义传递的有机组合。若语义平均分布,则不同的句长与不同的句量参数成为区分语篇内在语义分布的重要指标,这些参数在四个区域之间的语篇句型变化中可以得到验证。

最后,表3中的“被动比例”数据显示了施事体句法位置的变化,即受事体取代施事体固有的句法位置。“被动比例”在各区域间的不同分布表明不同语篇的施事体和受事体在主述(Theme)和谓述(Rheme)之间转换的差异。数据分析发现,“被动比例”与“平均句长”呈正比,而与“单句比例”呈反比,两者相关系数分别为0.96和0.97。不同语篇参数在实际观察中所显示的数据呈现具有统计意义的相互关系,这说明语篇个体内部句型变化的整体联系。由于句长和句型比例是语言专门用途在语篇整体形式上的具体显现,而不同的社会群体会以不同的语篇整体形式来实现其语言的社会功能。因此,句型差异是区分语篇社会功能属性的有效参数之一。

(三)语篇衔接词的分布比较

反映语篇内部结构关系变化的一个重要参数是句与句之间的衔接词。本研究关注的衔接词主要涉及以下三大类:1)因果关系衔接词,比如because,given that,therefore,so,as a result,as the result of,because of,due to,owing to,thanks to等;2)转折衔接词,比如but,though,although,nevertheless,how-ever,even if,yet,and yet,on the contrary,on the other hand 等;3)递进衔接词,比如furthermore,moreover,not only…but(also),what’s more,besides,apart from,in addition,above all,as well as等。

对三大类衔接词在区域间相似语料规模内的分布比例统计发现,不同区域的语篇具有不同的衔接词比例。这表明不同区域语篇呈现各自不同的结构关系、逻辑顺序和文体倾向。通过比较表4中的数据发现,“因果关系”在北美和欧洲语篇中的数量要高于中国和东南亚,而“转折关系”在东南亚和北美语篇中的数量要高于欧洲和中国;“递进关系”在中国和欧洲语篇中的数量要高于北美和东南亚。不同衔接关系在不同区域内的分布差异,说明不同社会属性的语篇在衔接结构和语义转换上具有巨大差异,因此“衔接参数”是语篇社会属性分类的重要参数。

表4 衔接参数的区域比较Tab.4 Regional comparison of conjunction parameters

ESP语篇社会属性体现在语篇的语义结构分布中,而衔接词数量反映了语篇集合内部语义结构的变化程度。通过计算可以发现,当语料的社会属性不存在定义时,三种衔接词的数量基本保持一致。这说明如果没有对“通用”语篇开展社会功能属性上的形式特征分类,那么语篇的语义结构差异就无法在专门用途分类中得以体现。衔接词作为语篇语义结构关系的关键,不仅体现个体文本的语义关系和语用立场,而且反映不同专门领域语言逻辑倾向。

衔接词数量在各区域的分布比例差异不仅可以类比“专门”与“通用”语篇所呈现的逻辑和语义特征,不同语义结构的转换数量也反映了不同地缘政治区域对于“一带一路”倡议的新闻立场和政策倾向,比如南亚语篇中的高频转折衔接词和北美语篇中的高频因果衔接词都有其内在含义。衔接词参数的计算和比较不仅有其方法论意义,也存在对语篇功能属性分析的认识论意义,因此ESP社会属性的语篇参数分类,是区分语言变体与社会功能对应关系差异的最大公约数集合。

四、研究结论

本研究通过观察不同区域的语篇参数变化,分析语篇形式特征与社会区域之间的相互关系,说明语篇参数对ESP社会属性分类的作用,以此推导“专门”与“通用”功能的语篇形式差异。研究发现,不同区域的语篇具有不同的语篇形式特征。首先,每个区域对同一主题的论述均出现了各自区别于其他区域的高频主题词;其次,体现每个区域语篇结构差异的衔接词在类型和数量上均出现了分布差异;最后,语篇的句型参数之间和整体参数之间呈现显著相关性。语篇参数定量变化与地缘政治区域定性变化之间的相互关系,说明形式参数与社会属性之间具有内在联系。ESP的核心原则强调语言社会属性的形式表征,ESP教学在符合二语习得规律的同时,将积极服务于语言社会功能属性分类下的国家对外传播战略。

首先,调整针对不同区域的对外传播策略,将外语教学与政策文化传播形成相辅相成的有机整体,将ESP社会属性倾向的教学理念有效地实施于对外传播中。实现该目标的前提是对语篇的社会属性及其内在形式规律之间相互关系开展进一步的深入分析与研究。本文试图说明语篇参数区域分布的科学统计是在语篇形式变化中寻找语言社会属性规律的有效方法之一。

其次,ESP语篇策略遵循“和而不同”的定位原则,即在语篇选择上体现其社会属性的变化对应,同时也要尊重二语习得的一般规律。同理,ESP教学既要保持专门化技术对接,也要服务于国家统一的对外战略。

最后,语篇参数作为语言社会属性定位的重要量化指标之一,其大数据运算对语篇描述和分类具有积极推进作用。然而,除了语言的形式规律,功能规律也是不容忽视的。对功能属性的分类本身体现了不同社会属性的语用倾向,其变化程度和归类范围相比形式属性有更大的不确定性,这对语料库的数据应用提出了新挑战。未来的研究应当关注语篇功能属性归类的精确与可重复,使专门用途语篇的分类与定位有更坚实的实证基础,让基于语言统计分布标准的中国语言教学与研究向“新时代”迈进。

猜你喜欢
语篇形式分类
2022 年本刊可直接使用缩写形式的常用词汇
分类算一算
新闻语篇中被动化的认知话语分析
小议过去进行时
微型演讲:一种德育的新形式
分类讨论求坐标
数据分析中的分类讨论
教你一招:数的分类
搞定语法填空中的V—ing形式
从语篇构建与回指解决看语篇话题