基于复杂动态系统理论的书面语发展研究:语言观与方法论

2023-05-12 05:09朱慧敏刘艳梅
关键词:动态学习者理论

朱慧敏,刘艳梅,王 静

(1.山东英才学院 人文学院,山东 济南 250000;2.山东财经大学 外国语学院,山东 济南 250014)

近年来,随着二语习得研究的不断深入,复杂动态系统理论(complex dynamic systems theory,简称CDST) 逐渐被应用到语言学领域[1],为第二语言动态发展过程研究提供了理论基础。 Verspoor 等《二语发展的动态路径:方法和技巧》论文集的问世①M. Verspoor 等人于2011年出版的论文集A Dynamic Approach to Second Language Development: Methods and Techniques,由John Benjamins Publishers 出版,从第163-197 页,着重介绍了第二语言发展动态研究方法。,为该领域提供了科学的研究方法支撑。 理论基础和研究方法的结合,为研究二语学习者真实语言发展过程中的微观变化提供了可行性[2]。 已有国内外相关领域的实证研究,通常只呈现数据分析的结果,少有研究详细描述数据分析的过程,导致许多读者知其然,但不知其所以然,难以进行同类型的复制研究,影响了研究成果的推广与应用。 本研究将通过回顾复杂动态系统理论的发展历程,阐释复杂动态系统理论视域下的语言发展观,继而探析复杂动态系统理论的特色研究方法,并以二语书面语中的词汇和句法复杂度具体指标为例,对其发展趋势、变异特征及交互特征的数据分析步骤进行细致描述,以期为语言习得研究提供新视角和新思路,从而赋权增能多语言发展研究。

一、复杂动态系统理论的语言发展观

复杂动态系统理论应用于语言发展研究始于20 世纪末,历经二十多年的发展,在理论建树和研究方法上日臻完善,业已形成独特的动态化研究范式,成为国际上颇具影响力的二语发展理论[3]。

(一)复杂动态系统理论的语言研究缘起

复杂动态系统理论(complex dynamic systems theory),发端于混沌/复杂理论(chaos/complexity theory)和动态系统理论(dynamic systems theory),它们名称虽异,但内容趋同,可互换使用[4]7。 图1 展示了复杂动态系统理论的历时演进过程。

图1 复杂动态系统理论的发展历程

混沌/复杂理论源自生态学和气象学,后来由美国应用语言学家Larsen-Freeman 将其应用于语言习得研究[1]。 她认为混沌/复杂理论作为一种关注变化的系统理论,与学习者学习语言有诸多相似之处,因此她率先将该理论与二语习得研究联系起来,用于语言教育研究。 其核心思想可概括为:语言是一个复杂系统,系统各维度间相互联结、交互变化,受外部条件刺激,语言系统会通过自组织性和自适应性,重组新的语言结构和状态[5]。 她认为在复杂理论框架下,学习者也是一个复杂系统,由记忆力、学习动机等子系统构成,且子系统间相互作用,互相影响。 这一思想将“语言学和语言学习两个传统研究中相对分离的领域有效融合”[6],是对传统语言学研究的传承创新。 混沌/复杂理论为语言习得领域的动态发展研究奠定了基础。

动态系统理论源自数学和发展心理学,后由欧洲学者de Bot,Lowie 和Verspoor 等将该理论应用于第二语言习得研究,展示了“外语学习如何通过社会和认知层面的互动促使语言得以发展”[7]。 该理论认为语言行为具有复杂性、交互性和动态开放性。 其一,语言行为通过简单程序的反复迭代,前一个迭代的输出将作为下一个迭代的输入,从而导致语言的复杂性;其二,动态系统各变量(或子系统)间交互发展,一个变量的变化会对系统中其他变量产生影响;其三,复杂系统的发展过程由系统初始状态、承载力类型及认知系统和环境中的资源相互作用所决定。 在发展过程中,某些子系统是其他子系统的先导,某些子系统间也可能存在关联生长点,所以子系统发展所需能量或动力并非等同。

结合上述两个理论的历史发展、使用现状、核心概念及方法论,de Bot 指出混沌/复杂理论与动态系统理论在语言发展过程的根本观点上并无明显差异,主张将美国学派和欧洲学派二者统称为“复杂动态系统理论”[8],具体见图1。 后来,Hiver 和AL-Hoorie 提出了更全面的复杂系统研究方法,使复杂动态系统理论及其研究方法进一步走向完善[9]85-225,为语言发展研究提供了更为坚实的理论基础和方法论依据。

(二)复杂动态系统理论的语言发展观

语言和语言发展在传统上具有不同的学科定位,采用不同的理论范式。 在语言上,语言学理论往往侧重静态能力研究范式;而在语言发展上,心理学或心理语言学理论范式关注学习者语言发展的过程和表现。 复杂动态系统理论有效合并了上述两种不兼容的理论范式。 Larsen-Freeman 强调复杂动态系统理论是一种元理论,一种理论化的方法,而不是语言发展本身的理论,这种元理论更像是一种看问题的世界观、视角,或是一套可在拓展理论和方法时应用的价值观[10]。 若要从复杂动态系统理论视角回答新的研究问题,需在特定内容领域使用新的研究方法。

复杂动态系统理论的语言观主要包括:语言是一个复杂动态系统,其发展具有初始状态敏感性、变异性、交互性、非线性和不可预测性等特征。 语言系统对初始状态具有敏感性,初始水平的微小差异可能导致个体间语言发展的显著差异;系统发展中的变异性是系统行为的重要组成部分和系统发展的重要标志;语言系统各子系统间相互联结、交互变化,在语言发展的不同阶段,子系统间呈现竞争或支持等不同交互模式;语言系统在一定外部条件作用下,通过自组织性适应环境带来的压力,并涌现新的语言结构,呈非线性和不可预测性发展。 因此,动态和变化是该理论的核心。

复杂动态系统理论视角下的语言发展观强调学习者在语言系统的发展变化中学习语言,因为语言系统的若干子系统各发展阶段均处于不断变化中,且子系统间和子系统内组成成分互相作用、相互影响,使得复杂系统以多种不同方式演化和适应。 此外,由于语言系统具有开放性,子系统与内外环境也相互补充能量,存在交互效应。 随时间发展,这种交互效应产生自适应性且更趋复杂化,最终达到内外部生态平衡,从而引起系统变化。 复杂动态系统理论视域下的二语习得过程研究,体现出语言习得的基本特征,即语言学习是一个动态复杂的过程,在此过程中,随环境因素互动和语言输入增强,语言不断自我调整并适应交际需求,学习者才能最终掌握语言。 因此,不能用静态的阶段性观念看待语言发展,其发展不是单向的、逐步向目标语水平靠拢的过程,而是可能伴随进步、停滞、倒退等现象的复杂动态过程。

另外,在研究方法上,传统的定量研究方法无法测量复杂变量间的交互发展变化,而van Dijk 等却提出了解决复杂动态系统问题的可视化研究方法,并指出要研究个体或群体学习者在一段时间内的语言发展过程,数据收集需满足以下三个标准:一是在许多常规测量点密集收集数据;二是在较长时间内纵向收集数据;三是每次收集以个体为单位的数据而不是平均数据[11]。在动态系统发展定量分析上,除使用传统的相关性分析外,主要采用移动极值分析、整体变异度绝对值差计算、局部变异性再抽样计算、蒙特卡罗分析、变点分析、移动相关系数分析等复杂动态系统特有的时间序列数据分析方法,客观呈现群体或个体二语书面语语言动态发展特征。

二、方法论与数据分析方法

复杂动态系统理论广泛应用于二语习得研究,为该领域带来了全新视角。 该理论框架下的研究方法在方法论原则、变量选择和处理、实验设计与数据收集、数据处理与分析方法等方面与传统实证研究不同。 传统二语发展数据分析通常关注平均值、标准差和正态分布,此类测量方法旨在描述语言发展的平均趋势,歪曲了真实语言发展中的变异性,其测量结果对学习者群体而言有推广性,但忽略了个体学习者日常学习时的波动。 在日常习作中,学习者不可避免地会受到写作任务、话题、动机、环境、学习投入等因素影响。 在复杂动态系统理论观照下,这些因素相互依存、相互关联,并非简单的因果关系。 因此,传统研究方法难以充分阐释和分析变量在发展过程中的波动,以及多变量间的复杂逻辑关系,而动态系统研究方法可以追踪研究变量在不同时间节点的动态变异及交互特征。 下面分别阐释复杂动态系统理论下的方法论和数据分析方法。

(一)方法论

其一,基本原则。 复杂动态系统理论持语言使用的语言观,即关注学习者在语言使用和发展过程中所表现的特征及规律。 其方法论遵循以下基本原则:把环境因素作为系统组成部分加以研究;重视系统复杂性;以系统自组织、自适应和涌现为核心;采用互为因果的逻辑;克服原有的二元分析法;避免层次和时间尺度的混淆;重视个体变异性在系统中的核心地位。 简言之,该理论坚持系统各要素的整体观,关注系统的复杂性、动态性和变异性,遵循系统发展的非线性和敏感性,体现系统的自组织性及交互性等。 在研究方法上,提倡对学习者进行历时个案研究,通过密集收集时间序列的数据,以更好地捕捉个体学习者的语言发展轨迹[12]。 通过研究多个子系统的移动交互关系,凸显语言系统发展过程中的交互性[13]125。

其二,变量选择。 复杂动态系统理论采用“互为适应”(co-adaptation)这一概念[14],强调与事件有关的多因素间的相互影响,认为一个系统的变化会导致其他相关系统的变化,强调系统发展的动态性。 研究目标在于发现系统潜能,即描述影响变化的各种因素所构成的网络系统及它们与教学目标的互适应过程。 因此,在同一研究中应选取不同维度并能互补的变量测量研究目标,最好选取能代表独立特征而且相关性不高的变量[15]。 对于书面语发展研究,词汇复杂度和句法复杂度是衡量学习者产出水平的重要维度。 在词汇和句法复杂度测量方面,建议选择细粒度指标,以便能作出更精确的解释[16]。

其三,数据收集。 复杂动态系统理论认为学习者的二语发展路径和速度也是动态系统,可采用纵向个案法、时间序列法和微发展研究法追踪其变化的完整过程。 针对发展研究,分析一段时间内学习者发展情况,纵向收集数据比横断面数据更合适[17]。 纵向个案法和时间序列法将学习者个体放在不同时间段密集考察其发展变化。在采用此类方法时要注意根据系统变化速度确定好取样的均匀时间间隔,通常追踪时间长度为一年或更长的时间,“从而产生多个观察点或数据点”[4]66,依次来考察变量的细微发展变化。此类研究方法要求在较短时间段内增加取样频次获取数据,研究者可在某些时间点直接观察正在发生的变化。 数据收集和分析需兼顾细节性和整体性,案例发展中的细节性分析通常在横向研究方法中被忽视。

其四,数据处理。 计算机技术的发展为应用语言学研究提供了诸多便利,尤其在数据处理和分析方面省时高效。 复杂动态系统视角下对数据的处理和分析,采用了一系列自然科学研究方法。 如利用可视化工具对时间序列的数据进行分析,能客观呈现学习者语言发展变异的过程。纵向个案研究是研究动态系统发展变异性的典型方法[13]130,该方法既可帮助研究者发现发展过程中关键性节点的变化,也便于了解其变化原因,并据此推断出其后较长时段可能发生的变化。 二语书面语动态发展特征可通过绘制趋势线、移动极值图、变点分析图、移动相关系数滑窗图等多种可视化分析方法实现。 此类方法是用定量方法做质性研究,并强调时间维度变化和迭代作用,是对传统二语习得研究方法的有效补充。

(二) 数据分析方法

1.数据提取工具与方法

由陆小飞等研发的词汇复杂度分析器(Lexical Complexity Analyzer, 简称LCA)[18]和句法复杂度分析器(L2 Syntactic Complexity Analyzer,简称L2SCA)[19],无需研究者对语料进行特殊标注,简便易用,近年来被许多研究者广泛用于语言复杂度的研究,其信度和效度均已得到验证[20]。 所以本文着重介绍这两种分析器对语料处理的要求和数据提取方法。

对用于书面语中词汇动态发展研究的语料,按LCA 的要求,将全角字符和中文字符均统一为半角英文字符。 为确保词汇各变量测量的准确度,可以将阿拉伯数字、人名和地名等用相应代词替换,并改正可能会影响测量准确度的拼写错误[21]。 最后以UFT-8 TXT 格式保存,输入词汇复杂度分析器,提取时间序列研究语料的词汇测量指标原始数据,用于词汇复杂度动态发展研究。

Lu 指出句法复杂度分析器适用于基本无语法错误、句子结构完整的较高英语水平学习者的文本语料分析,不适用于包含大量语法错误的初级学习者的语料分析,所以通常在收集和处理加工语料时需要对这些因素进行有效控制,如修正语料中的连写句、错误标点和拼写错误,最终形成无拼写错误、基本无语法错误、句子结构完整的时间序列的研究语料[19]。 最后将每篇作文分别用英文命名,同样生成UFT-8 TXT 格式文本,保存为研究语料,输入句法复杂度分析器,提取时间序列的句法测量指标原始数据,用于句法复杂度动态发展研究。

2.典型数据分析方法

基于上述分析工具提取的原始数据,下面主要介绍复杂动态系统理论下典型数据分析方法,具体操作步骤如下。

(1)绘制发展轨迹平面图

为使二语书面语多维度语言子系统动态发展趋势可视化,使用Microsoft Excel 可以绘制群体均值或个体不同维度多变量发展轨迹平面图。此方法是描述时间序列数据最简单直观的技术,也是Microsoft Excel 软件中的基础工具。 时间序列数据汇集成的发展趋势线,既能展现原始数据整体发展趋势,也能反映局部发展特征。 为了使不同变量能在同一数值区间呈现,可以对各指标时间序列的数据分别进行标准化处理。 数据标准化的目的是通过线性变换的方式消除数据间的计量单位差异,并将原始数据的大小控制在0-1 之间,常用的办法是极小-极大值标准化,计算公式为:标准化数据=(原数据-极小值)/(极大值-极小值)。

(2)绘制移动极小-极大值图

移动极小-极大值图(moving min-max graph)简称移动极值图,是动态研究的典型工具之一,能呈现测量指标的发展趋势和发展变异程度。 移动极值图把发展过程中的变异情况可视化,其原理是通过移动窗口,以连续测量的方式观察时间序列数据的极大值(max)和极小值(min)间的带宽(brand width),从而将发展过程中杂乱无章的变异度可视化[4]77。 此方法既能形象呈现变异整体规律,同时也能保留原始数据发展轨迹。 移动极值图通过极值间的带宽来呈现学习者语言发展变异程度,带宽越大,变异度越大[21]。 移动极值图中的移动窗口设置方法通常根据数据收集总次数来定,如研究观测点为12 次,可设定每3 次为1 个移动窗口(若时间序列点较多,可设每5 次为1 个窗口),对每个窗口进行极小值和极大值运算,然后绘制移动极值图。

具体做法如下:以学习者XL 的12 次词汇复杂度观测指标词汇复杂性(LS)和句法复杂度观测指标T 单位中的子句数量(C/T)为例,使用Microsoft Excel 以每3 次为1 个移动窗口计算极值,绘制移动极值图。 如图2 所示,随时间的推移,LS 带宽的波动较大,C/T 带宽变化不大,因此可以假设学习者的LS 在发展中变异度较显著,有可能是系统发展中有意义的变异或推动系统产生质变的变异,C/T 则可能为无显著性变异。

图2 移动极值图

(3)局部峰值变异性分析

鉴于移动极值图仅能提供直观视觉判断,“难以准确判断发展趋势线中的波峰或波谷是否有统计学意义,还需通过再抽样运算和蒙特卡罗模拟进行概率计算,以检验数据局部峰值变异是否存在显著性”[22]。 局部峰值变异分析考察学习者某一指标的发展,在一段时间内是否发生显著变异。 该分析假设若有一个真实峰值,它不应只是一次孤立或偶然的跳跃,应该有其发生的必然性。 下面仍以学习者XL 的LS 和C/T 为例说明具体操作步骤。

第一步,计算移动平均值。 分别选取学习者XL 的LS 和C/T 的前两次观测数据t1 和t2,取平均值,然后选取t2 和t3,t3 和t4,t4 和t5……以此类推,求取平均数,共得到11 个移动平均值,复制第一个移动平均值补齐12 个数值,作为该数据栏起始。

第二步,计算观测数据点间的最大差值。 计算t2-t1,t3-t2,t4-t3,t5-t4……以此类推,求取2 步差值;计算t3-t1,t4-t2,t5-t3……以此类推,求取3 步差值;计算t4-t1,t5-t2,t6-t3……以此类推,求取4 步差值;计算t5-t1,t6-t2,t7-t3……以此类推,求取5 步差值;计算t6-t1,t7-t2,t8-t3……以此类推,求取6 步差值。 为确定每一栏步差的最大差值,对每一栏步差值求最大值。 选中所有步差平均值,求取最大值,即为学习者观测指标的最大差值,该数据为检验标准。

第三步,进行原始数据重采样。 该分析的零假设是通过对每个人的原始数据重新采样,得到与观察数据集相同的最大差值。 运行Microsoft Excel 里的插件PopTools,选择重采样(resample),在input range 中选中学习者观测指标的原始数据,选取一个空白栏放置重采样后的数据,点击output range。 在方法一栏选择可替换(replacement),意味着在每个模拟中,均从原始数据池中随机抽取一个新集合,并非在每个模拟中选择所有的观测值。 点击运行,即可得到重采样后的数据。 对重采样数据同样进行移动平均值计算和2步差到6 步差的计算,求取重采样数据的最大差值,得到重采样数据的标准。

第四步,进行蒙特卡罗分析(Monte Carlo analysis)。 在得到原始数据的检验标准和重采样数据的检验标准之后,将两个检验标准进行蒙特卡罗模拟运算,计算p值。 继而使用Microsoft Excel 中的加载项PopTools 中的蒙特卡罗分析对群体或个体学习者时间序列的原始数据进行5000 次随机抽样模拟,计算观测值中偶然波动的概率。

蒙特卡罗分析操作步骤如下:首先运行PopTools,选择模拟工具(simulation tools),选择蒙特卡罗分析。 在dependent range 中输入重采样后的标准,在检验标准(test values)中输入原始数据检验标准,设置复制数量为5000 次,检验标准选择大于等于,点击运行。 最后,计算p值。将大于或等于检验标准的值除以迭代次数5000次,即可得到p值。 若p小于等于0.05,就可以拒绝零假设,说明指标的局部峰值不是系统偶然发生的随机波动,而是系统发生了显著性变异。若p值大于0.05,则说明系统的局部波动不具显著性,为系统偶然波动。

(4)整体变异度分析

动态研究方法不仅可以揭示学习者每个指标局部峰值是否产生显著变异,还能提供用于对比群体和个体或个体间相同指标,或同一个体不同指标间的整体变异度的方法。 操作方法以学习者XL 的LS 和群组LS 为例,具体步骤如下。

首先计算绝对差。 若要考察个体XL 和群体的LS 在整体变异度上是否具有显著差异,首先用个体数据中的第二次数据减去第一次数据,即t2-t1,以此类推t3-t2,t4-t3……个体12 次数据共得到11 个绝对差。 取11 次绝对差平均数,即个体的平均绝对差。 对群体均值采取同样操作。 若个体平均绝对差大于群体,说明个体XL的整体变异度大于群体。 但上述分析不能说明是否具有统计学意义。 为考察两者在同一指标上的整体变异度是否有显著差异,还需进行重采样计算和蒙特卡罗分析。

将个体和群体平均绝对差相减,得到检验标准。 然后,运行PopTools,进行蒙特卡罗分析。对个体和群体的同一指标的绝对差数据采样。在input range 中同时选中个体和群体共两栏绝对差数据,选择新的两个空白栏放置重采样后的数据,点击output range。 如果研究希望得到的数据数量与原数据一致,就选择不替换重组(without replacement reshuffle)。 将得到的重采样绝对差分别取平均数,然后将个体和群体重采样后的数据平均绝对差相减,得到dependent range,然后进行蒙特卡罗分析。 在dependent range 中输入个体和群体重采样绝对差平均数之差,在test value 中输入上述检验标准。 同样设置复制数量为5000 次,检验标准选择大于等于,点击运行,进行数据分析,求取p值。 若p值小于0.05,表明个体与群体均值在LS 的整体变异度上存在显著差异。

(5)移动相关分析

为检验学习者二语书面语不同子系统内和不同子系统间是否存在交互发展效应,计算时间序列的移动相关系数,绘制移动相关系数滑窗图,可使每两个指标间的发展交互关系可视化,具体做法如下。

首先,使用标准化数据,利用SPSS24.0 对群体和个体的测量指标分别进行两两相关分析,考察每两个指标间整体上是否存在显著相关性。该分析结果可用来与移动相关系数进行对比和对照,互为补充。 然后以每5 次数据点为1 个移动窗口,利用Microsoft Excel 计算两个指标间的移动相关系数。 以学习者XL 的词汇复杂性LS和子句数量C/T 的12 次时间序列数据为例,将光标放置在移动相关系数输出处,输入指令=Correl,选取标准化的第一个指标前5 次数据LS(t1:t5)作为第一组数值,选取标准化的第二组数据的前5 次指标C/T(t1:t5)作为第二组数值,即可得到两个指标前5 次数据的移动相关系数。 第二个相关系数选取LS(t2:t6)和C/T(t2:t6),以此类推,得到两个指标所有相关系数。 12次数据共得到8 个移动窗(1-5,2-6,3-7,4-8,5-9,6-10,7-11,8-12),即8 个相关系数。 选中8 个数值,插入折线图,可得到两个指标间的移动相关系数滑窗图。 滑窗图的横坐标显示移动窗口,纵坐标显示相关系数,取值范围(-1,1)。 滑窗图可直观展示两个指标间随时间维度的变化交互联动的发展轨迹,揭示指标间在时间维度中竞争或支持的交互关系。

三、结语

本研究通过梳理当代新兴的二语习得理论——复杂动态系统理论的语言发展观,结合该理论用于语言发展研究的主要特征,以学习者书面语中词汇复杂度和句法复杂度中的具体指标为实例,详细描述了复杂动态系统理论应用于语言发展研究先进科学的研究方法。 复杂动态系统的研究方法是一种全新的跨学科时间序列数据可视化分析方法,它“向自然科学、社会科学和应用语言学中的静态观、线性观和简化论提出了挑战”[23]。 运用动态研究方法,能突破传统研究中以均值获取整体发展轨迹的范式,从而能有效检验个体学习者语言系统发展过程中的不稳定性,即变异性。

因此,复杂动态系统的研究方法能有效补充和拓展以往相关领域的研究,进一步对我国本土多语言发展实证研究提供方法上的参考和借鉴。此外,以复杂动态系统理论为框架开展的研究,可进一步尝试使用其他动态系统研究方法,如社会网络分析方法(social network analysis method)和基于设计的研究方法(design-based research method)等[9]139-152。 由于语言系统具有全面联结性,不同语言子系统和次级系统之间组成了多节点枢纽,共同构成了复杂的书面语网络。 因此,这些创新性研究方法同样适用于多语书面语动态发展研究,能为该领域相关研究开拓新的视野、带来新的发现。

猜你喜欢
动态学习者理论
国内动态
国内动态
坚持理论创新
国内动态
神秘的混沌理论
理论创新 引领百年
相关于挠理论的Baer模
你是哪种类型的学习者
十二星座是什么类型的学习者
动态