汉语老年读者的多词单元加工:来自眼动研究的证据 *

2022-06-02 12:21何立媛刘妮娜
心理与行为研究 2022年2期
关键词:首词词组青年人

何立媛 赵 星 白 玉 刘妮娜

(1 教育部人文社会科学重点研究基地天津师范大学心理与行为研究院,天津 300387) (2 天津师范大学心理学部,天津300387) (3 学生心理发展与学习天津市高校社会科学实验室,天津 300387)

1 引言

多词单元(multi-constituent units, MCUs)是指语言中的多词组合,如存在空格的复合词(spaced compund word, 如 teddy bear),二项式短语(binomial word pairs, 如 knife and fork),习语(idiom, 如“炒鱿鱼”)以及常见的短语(common phrases, 如“经济建设”)等(Zang, 2019)。之前一些研究者提出的语块(formulaic language)和主观词(subjective word)等概念(闫国利 等, 2013;易维, 鹿士义, 2013; Wray, 2002)在本质上与多词单元的思想是一致的。Liversedge(2013)和Zang(2019)在一些研究的基础上提出了多词单元假设,认为由多个词构成的语言单元可能已经词汇化并储存在心理词典中,在阅读过程中会作为一个整体得到加工,相对于其他多词组合,读者能够更快地完成多词单元的语义通达,提高阅读效率。大量研究为多词单元假设提供了实证支持(易维, 鹿士义, 2013; Cutter et al., 2014; Yu et al.,2016; Zang, 2019; Zang et al., 2021)。Cutter 等人考察了英语阅读中词N+2 的预视,当词N+1 与词N+2 能够组成复合词(如teddy bear)时,即使词N+1 为长词且非高频词,读者也能够获得词N+2 的预视信息;研究者认为,这是由于读者将副中央凹的两个词作为一个整体加工而获得了词N+2 的信息。与拼音文字不同,汉语是由连续呈现的汉字组成的文本,虽然词在汉语阅读中起着非常重要的作用,但汉语中缺少空格等词边界,再加上汉语读者的词意识模糊,因此很容易将两个甚至多个词看作一个词(Liu et al., 2013)。最近一项研究对汉语主观词这一多词单元的加工优势进行了检验并发现,相比于非主观词(如“对称设计”“对称不是”),读者在加工主观词(如“对称图形”)时的注视时间更短,注视次数更少,而且两个成分词的加工也表现出相同的加工模式。这表明,汉语读者将主观词这类多词单元作为整体进行加工(He et al., 2021)。综上可知,多词单元的加工有利于提高读者的词汇加工效率。

根据相关理论和研究,多词单元的形成和加工会受到读者语言经验的影响。基于用法的理论(usage-based theory)指出,读者对语言的心理表征是基于经验的。当一个词串经常出现,会逐渐形成一个独立的表征储存在记忆中,并作为一个整体得到加工(Bybee, 2006)。也就是说共同出现次数较多的两个词容易成为一个多词单元。基于样例的理论(exemplar-based theory)也强调了语言经验的作用,认为在语言认知中存在“普遍表征”(universal representation),语言的获得和加工中,语言表征的分布均依赖于统计信息(Bod,2006),即一个词串能够作为一个组合得到表征是完全可以通过语言经验计算得到的。以往研究也发现,随着年龄增长和语言经验的逐渐丰富,读者的心理词典中多词单元也越来越多(易维, 鹿士义, 2013)。Wray 和 Perkins(2000)的研究发现,1~2 岁期间,个体的语言是以整体存储的多词单元为主,2~8 岁期间多词单元的比重经过短暂下降后开始回升,18 岁之后多词单元在语言产出中的比重逐渐稳定在高位状态。汉语相关研究也发现,随着年级的增长,小学生切分出来的词单元逐渐增大(付彧 等, 2015)。

本研究推测,老年人作为语言经验较为丰富的群体,其心理词典中的多词单元可能比青年人更多,更倾向于采用多词单元进行加工。然而,研究发现老年人的阅读速度和词汇加工效率显著下降,尤其是汉语老年人还表现出倾向于小单元加工的趋势(Li et al., 2018; Liu et al., 2015)。研究者考察了自然阅读中老年人和青年人加工双字词(如“流浪”)和四字词(如“身无分文”)时的情况(Li et al., 2018),结果发现,相比于青年人,老年人的词长效应更大,在关键词上的单一注视位置更靠近词首,单一注视比率更低,从双字词和四字词上发起的向前眼跳长度无显著差异,呈现出以固定的小步幅向前眼跳的加工特点。该研究认为,这可能是由老年人的加工更具序列性,倾向于将文本划分为比青年人更小的单元进行加工导致的。那么,这里就出现了一个矛盾,一方面老年人随着语言经验的增多会更倾向于使用多词单元来进行阅读;另一方面,实证研究却发现老年人可能更倾向于使用小于青年人的加工单元。汉语老年人在阅读中所采用的加工单元是否发生了变化?对该问题的探讨将有助于揭示老年人阅读效率降低的原因。

为考察老年人阅读加工单元是否变小,本研究将比较老年人和青年人对不同类型多词组合的加工情况。实验选取三类关键词组,一类是通常被作为一个单元进行加工的两个双字词组合(如“固定资产”)为单词组合,第二类是通常被作为两个词加工的双字词组合(如“固定常规”)为双词组合,第三类组合是表达一个整体意义但还没有形成一个独立的单元并储存的组合(如“固定费用”)为模糊组合。根据以往的研究结果(闫国利 等, 2013; He et al., 2021; Yu et al., 2016;Zang et al., 2021),青年人会将多词单元作为一个整体进行加工,即单词组合的加工时间会显著短于模糊组合和双词组合,但在加工模糊词组合和双词组合时并无显著差异。本研究提出假设1:如果老年人倾向于采用较小的单元进行加工,可能将多词单元作为两个或两个以上部分进行加工,那么会出现年龄和词组类型的交互作用,表现为青年人加工单词组合显著快于双词和模糊词组合,而老年人在加工三类词组时不存在显著差异。根据语言经验对多词单元形成和加工的影响(付彧 等, 2015; 易维, 鹿士义, 2013; Bod, 2006;Bybee, 2006; Wray & Perkins, 2000),老年人也有可能采取比青年人更大的单元进行加工,因此,本研究提出假设2:如果老年人倾向采用较大单元进行加工,那么也会出现年龄和词组类型的交互作用,但表现为青年人加工单词组合显著快于其他两类词组,而老年人在加工单词组合和模糊词组合时显著快于双词组合。假设3:老年人的加工单元还可能与青年人相同,都将多词单元作为一个整体加工,会出现年龄和词组类型的主效应。

2 研究方法

2.1 被试

从天津师范大学选取24 名本科生作为青年被试,平均年龄为21.02 岁(SD=1.43 岁)。从天津某社区选取24 名65 周岁以上的老年人作为老年被试,平均年龄为68.23 岁(SD=2.87 岁)。采用蒙特利尔认知测验(北京版)(Yu et al., 2012)对老年被试进行了认知障碍筛查,所有被试不存在认知损伤(测验分数大于等于26 分)。实验前对所有被试进行了视力测试, 老年被试的视力(M=20/36, SD=6.09)显著低于青年被试(M=20/28,SD=3.85),t=2.46,p<0.05,但所有被试视力或矫正视力均在20/40 以上,无视力异常。采用韦氏成人智力测验第三版(WAIS-III)中文版中的词汇知识分测验和数字广度分测验(Wechsler et al., 2002),结果显示,老年人的词汇测验得分(M=14.43,SD=1.69)显著高于青年人(M=13.04, SD=1.71),t=2.8 0,p <0.0 5,老年人数字广度测验得分(M=12.41, SD=1.86)显著低于青年人(M=14.21,SD=1.72),t=3.55,p<0.001。被试母语均为汉语。所有被试均接受过九年以上的教育(包括继续教育),每天都有一个小时以上的阅读经验,均不了解实验目的。

2.2 实验设计

采用2(年龄:青年人、老年人)×3(词组类型:单词组合、模糊词组合、双词组合)两因素混合实验设计,其中年龄是被试间变量,词组类型是被试内变量。

2.3 实验材料

根据相关理论和研究(闫国利 等, 2013; 易维,鹿士义, 2013; Cutter et al., 2014; He et al., 2021),本研究结合多词单元成分词的同现次数和读者的主观判断选择关键词。首先,从《现代汉语词典(第6 版)》中选择57 个双字词作为多词组合中的首词,然后基于CCL 现代汉语语料库,选取57 个经常与首词共同出现且能够表达完整意义的双字词作为尾词构成单词组合,平均同现次数为4367(SD=13305, 范围 3~91838)。同时选取另外57 个在首词后出现次数较少(平均同现次数为129, SD=273, 范围1~1032)但能与首词组合表达完整意义的双字词作为模糊词组合,以及57 个在首词后出现次数极少(平均同现次数为13, SD=71,范围0~533)且不能与首词组合表达较为完整意义的双字词作为双词组合。后面两类词与单词组中的尾词在词频和笔画数上不存在显著差异(Fs<1, ps>0.05)。见表 1。另选取 54 名大学生被试对三类双词组合进行是否是一个词的评定,三类词组被评定为一个词的概率分别是:单词组合,M=0.86,SD=0.05;模糊词组合,M=0.57,SD=0.09;双词组合,M=0.01,SD=0.05。然后将57 组四字组合编入到相同的句子框架中,要求30 名被试进行通顺性评定(7 点评定,“1”为非常不通顺,“7”为“非常通顺”)和预测性评定(包括关键词组的预测性和关键词组尾词的预测性评定),通顺性评定结果分别为:单词组合句子,M=6.28,SD=0.31;模糊词组句子,M=5.76,SD=0.42;双词组合句子,M=5.89,SD=0.29。三类目标词组的预测性均为0,尾词的预测性评定结果为:单词组合为21.1%(SD=3.1%),模糊词组合与双词组合的均为0%。三类组合的预测性和所在句子的通顺性均不存在显著差异(Fs<1, ps>0.05)。

表 1 目标词组属性及句子材料举例

2.4 实验仪器

实验采用EyeLink 2000 型眼动记录仪,采样频率为1000 Hz。被试机屏幕的刷新频率为120 Hz,分辨率为1024×768 像素。被试眼睛与屏幕之间的距离为63 cm,句子以黑色宋体形式在白色背景上呈现,每个汉字呈0.8°视角。

2.5 实验程序

被试熟悉实验环境后,由主试向其介绍指导语,然后进行眼校准,开始实验。每名被试共阅读83 个句子,包含6 个练习句和57 个实验句,以及20 个填充句。实验句和填充句完全随机呈现。其中,24 个实验句后设置了阅读理解问题,要求被试按键进行“对”或“错”的判断。每名被试单独施测,整个实验过程需要20~40 分钟。

3 结果

老年和青年被试回答问题的正确率分别为82.1% 和87.9%,两组被试差异显著,t=2.92,p<0.05,但正确率均高于80%,表明所有被试都认真阅读了句子并正确理解了句子。在分析数据前,按照以下标准对数据进行筛选:(1)删除注视点小于5 个的试次;(2)删除短于80 ms 或长于800 ms 的注视点;(3)每个指标上删除三个标准差以外的数据。

数据分析包括整体分析和局部分析两部分。整体分析是对被试阅读句子情况的分析,包括总阅读时间、平均注视时间、注视次数、回视次数、向前眼跳长度。局部分析是对关键词组以及成分词加工情况的分析,关键词组分析指标包括首次注视时间、凝视时间、第一遍注视次数和总注视时间,成分词分析指标包括首次注视时间、单一注视时间、凝视时间、总注视时间和跳读率(尾词分析中)。在分析词组中的尾词时,只有首词得到注视的数据进入分析。采用R 语言环境下(R Core Team, 2018)的lme4 数据处理包(Bates et al., 2015)对眼动数据进行线性混合效应模型(liner mixed-effects models, LMMs)分析。在数据分析过程中,对注视时间和次数进行log 转换。将年龄、词组类型及其交互作用作为固定因素,被试和项目作为随机因素,运行模型时从包含最大随机效应结构的模型开始,若模型无法拟合,削减模型直至能够拟合。

3.1 整体分析结果

老年人和青年人在句子水平上各指标的描述统计结果见表2。结果表明,与青年人相比,老年人的总阅读时间和平均注视时间更长,注视次数更多,而向前眼跳长度更短,表现出典型的年龄效应,表明老年人存在阅读困难,阅读效率显著下降。

3.2 局部分析结果

3.2.1四字组合分析结果

被试在四字组合上各眼动指标上的平均值和标准误如表3 所示。统计结果发现,年龄主效应在注视时间指标上显著,|b|s≥0.09,|t|s≥2.09,ps<0.05,老年人的注视时间显著长于青年被试。就词组类型主效应来看,相比于单词组合,读者在模糊词组合和双词组合上的注视时间更长,第一遍注视次数更少,|b|s≥0.03,|t|s≥3.37,ps<0.001,单词组合和模糊词组合在首次注视时间上的差异边缘显著,b=0.05,t=1.95,p=0.05。其他主效应及年龄与词组类型的交互作用均不显著,|b|s≤0.04,|t|s≤1.53,ps>0.05。这一结果表明,相比于双词组合和模糊词组合,单词组合存在加工优势,读者很可能将其作为一个单元进行加工。

表 2 句子水平上各眼动指标的平均数和标准误

表 3 青年人和老年人在四字组合上的各眼动指标的结果

3.2.2首词分析结果

被试在四字组合首词上各眼动指标的平均数和标准误见表4。经统计分析发现,年龄主效应在所有指标上显著,|b|s≥0.09,|t|s≥1.99,ps<0.05,老年人的注视时间显著长于青年被试。词组类型主效应分析中,读者在加工单词组合时的注视时间显著短于双词组合,|b|s≥0.07,|t|s≥2.15,ps<0.05,凝视时间和总注视时间显著短于模糊词组合,|b|s≥0.11,|t|s≥3.36,ps<0.01,首次注视时间也更短但差异边缘显著,b=0.04,t=1.78,p=0.08。模糊词组合和双词组合的差异在各个指标上均不显著,|b|s≤0.03,|t|s≤1.24,ps>0.05。年龄与词组类型的交互作用在注视时间上均不显著,|b|s≤0.06,|t|s≤1.32,ps>0.05。以上结果表明,作为多词组合的第一个成分词,相比于出现在模糊词组合和双词组合中,当其出现在单词组合时更容易加工。

3.2.3尾词分析结果

被试在四字组合尾词上各眼动指标的平均数和标准误见表5。经统计分析发现,年龄主效应在所有指标上显著,|b|s≥0.09,|t/z|s≥2.32,ps<0.05,老年人的注视时间显著长于青年被试,跳读率更低。词组类型主效应分析中,读者在加工单词组合时的注视时间显著短于双词组合和模糊词组合,|b|s≥0.08,|t|s≥3.52,ps<0.001,跳读率高于模糊词组合(b=-0.33, z=-2.14, p<0.05)和双词组(b=-0.15, z=-1.71, p=0.09)。与此同时,读者在双词组合中尾词上的总注视时间显著长于在模糊组合中尾词上的总注视时间,b=0.11,t=3.52,p<0.05。年龄与单词双词组合类型的交互作用在跳读率上边缘显著,b=-0.57,z=-1.88,p=0.06。简单效应分析发现,老年人在双词组合中尾词上的跳读率显著低于单词组合中的尾词,b=-0.55,z=-2.33,p<0.05,而青年人的跳读率不存在显著差异,b=-0.02,z=-0.11,p>0.05。其他主效应和交互作用均不显著,|b|s ≤0.10,|t/z|s ≤1.40,ps>0.05。这一结果表明,四字组合中的尾词的加工也表现出与四字整体加工一致的趋势。

表 4 青年人和老年人在四字组合首词上的各眼动指标的结果

表 5 青年人和老年人在四字组合尾词上的各眼动指标的结果

4 讨论

本研究考察了青年人和老年人多词单元的加工情况并发现,老年人比青年人的注视时间更长,注视次数更多,跳读率更低,向前眼跳长度更短,表现出与以往研究一致的典型的阅读特点(Li et al., 2018)。同时,还发现了多词单元的加工优势,即相比于双词组合和模糊词组合,读者在单词组合上的注视时间更短,注视次数更少,而且这一优势在青年人和老年人之间不存在显著差异。

阅读中眼动控制模型的构建大多基于词是基本加工单元这一假设,而在汉语文本中通常不存在明显的词边界信息,读者的词意识模糊,基本加工单元是构建汉语阅读眼动控制模型首先需要考虑的问题,多词单元概念的提出以及相关研究有利于这一问题的解决。本研究中四字组合的结果显示,汉语读者在加工单词组合时比加工模糊词组合和双词组合时的注视时间更短,第一遍注视次数更少,这表明像单词组合这类两个词经常共同出现而且会被大多数读者看作是一个词的多词组合,很可能已经整体储存在读者的心理词典中,成为一个独立的加工单元,与基于用法的理论和基于样例的理论的假设一致。同时,成分词上的分析发现了与四字整体分析相似的趋势,即单词组合中首字和尾字的注视时间显著短于模糊词和双词组合,跳读率也更高,这进一步证明了多词单元的加工优势。汉语阅读模型(Chinese reading model, CRM)假设,知觉广度内的字同时得到激活,包含激活字的词也会激活,这些词相互之间存在竞争,激活程度越高,越容易赢得竞争,当其中一个词赢得竞争后,这个词也会被切分和识别出来,而这个词的识别也会反过来促进其成分词的加工(Li & Pollatsek, 2020)。根据这一假设,本研究中的目标词组包含的四个字处于读者的知觉广度范围之内,每个字都会同时得到加工,单词组合中首词和尾词的加工也会激活其表达一个完整意义的多词单元,而双词组合和模糊组合中首词和尾词的加工并不能激活上层的整体意义,因此单词组合中的成分词会受到整体意义的积极反馈,相比于双词和模糊词组合中的首词和尾词加工更容易,因此读者的注视时间更短,跳读率更低。不过,尾词上的分析结果发现,双词组合中尾词上总注视时间显著长于模糊词组合中的尾词,这可能是模糊词组合虽然还没有词汇化并作为一个整体储存在读者的心理词典中,但两个成分词的组合能够表达一个完整的意义,读者对模糊词组进行后期整合会比双词组合更加容易,因此表现出后期加工的优势。

以上结果表明,汉语读者会将多词单元作为一个整体进行加工。进一步的数据分析发现,老年人尽管在多词组合整体和成分词的加工均显著慢于青年人,但对于不同类型多词组合的加工方式与青年人不存在显著差异。这一结果支持了本研究的假设3,即与青年人一样,老年人也将多词单元作为一个整体加工,说明汉语老年人的加工单元可能没有变小。老年人自身丰富的语言经验可能使其心理词典中储存了较多的多词单元并将其应用在阅读加工过程中,即便老年人在每次的注视中需要花费更长的时间,甚至需要多次注视,但他们仍然使用相对经济的加工方式。然而,这一结果还可能是预测性作用的影响。由于老年人比青年人更倾向于利用自身的语言经验和背景知识,表现出更大的预测性效应(Paterson et al., 2020; Zhao et al., 2019),同时多词单元的特点之一就是首词对后面尾词的预测性比较高,例如读者看到“固定”后很可能会预测下一个词是“资产”。综合这两点,由于老年人利用了背景知识使得尾词的加工更加容易,进而表现出与青年人相似的多词单元的整体加工优势。然而,本研究中所有目标词组的预测性均为0,单词组合中通过首词能够预测尾词的概率为21.1%,预测概率较低,而且以往研究将预测性作为协变量进行分析后并未发现结果发生显著的改变(He et al., 2021;Zang et al., 2021)。因此,老年人在加工单词组合时表现出的加工优势仍然主要来源于单词组合的整体加工以及独立表征的作用。未来的研究可以采用具有较低词内预测性的多词组合作为目标词组来进一步检验老年人对多词单元的加工。

5 结论

本研究发现,汉语老年读者在加工多词单元时表现出与青年人相似的加工优势,表明老年人同样将多词单元作为一个整体进行加工。

猜你喜欢
首词词组青年人
平凡中的伟大 青年人的楷模
神回复
掉发变胖失眠,现代青年人早衰现状
材料作文“做一个Nice 青年”导写
倚老卖老不可取
宋高宗的眼力
武陵春·风住尘香花已尽
副词和副词词组
《诗词曲五首》(选二)阅读理解