奖励联结的任务无关刺激在注意捕获中的作用

2021-06-22 09:20
心理研究 2021年3期
关键词:测试阶段阶段颜色

刘 丽

(天津商业大学法学院心理系,天津300134)

1 引言

在日常生活中,个体总是面临着包含大量信息的视觉场景,人类的注意系统能够偏向目标相关或者物理突显的客体,从而提高对信息的选择(Serences&Yantis,2007)。但近年来的研究表明,价值也能够使视觉注意指向特定的客体。以前在价值学习中和奖励联结的刺激特征,当在随后的视觉搜索任务中不再预测奖励结果时,仍能无意识地捕获注意(Anderson,Laurent,&Yantis,2011)。例如,在训练阶段将红、绿颜色分别和高、低奖励建立联结,在测试阶段这些颜色作为不突显的分心物出现,并且测试任务不伴随奖励。结果发现,与低奖励联结颜色分心物和无分心物条件相比,高奖励联结的颜色分心物出现时能够使搜索目标的反应时变长(Anderson et al.,2011)。这种刺激-奖励联结对视觉注意的影响被称为价值驱动的注意捕获(Anderson,2013)。它独立于目标驱动和突显驱动,是一种由价值所引发的注意选择机制(Anderson&Halpern,2017)。

虽然价值驱动的注意捕获已被很多研究证实(Anderson,2013;杨海波,赵欣,韦小英,王瑞萌,2017),但与奖励联结的刺激捕获注意的机制还不清楚。大多数研究在训练阶段都是将定义目标的特征与奖励建立联结,即与奖励建立联结的特征是任务相关的。如,被试所获得的奖励依赖颜色搜索任务中的颜色(Anderson et al.,2011;Sali,Anderson&Yantis,2014),形状搜索任务中的形状(Wang,Yu,&Zhou,2013),方向搜索任务中的方向(Laurent,Hall,Anderson,&Yantis,2015),或者为视觉辨别和视觉搜索任务中目标的位置(Chelazzi et al.,2014;白学军,刘丽,宋娟,郭志英,2016;刘丽,李士一,岳俊冰,白学军,2019)。关于注意偏向奖励信号引起注意捕获的一个解释是,奖励与特定的目标“反应”联系在一起,从而引起了注意转移。这种联结持续到了不再伴随奖励的测试阶段。这样,奖励学习后,奖励联结刺激的再次出现会引发已经习得的反应,虽然这些反应不再导致奖励。自动地对奖励联结的刺激进行反应,当刺激恰好与任务要求一致时会促进反应(Failing&Theeuwes,2014),而当刺激和任务要求不一致时会影响成绩(Anderson et al.,2011; Failing&Theeuwes,2014,2015)。照此,可以认为这种联结体现了操作性条件作用的形式。当条件性的刺激再次出现时,对预测奖励的特征的反应也会重新出现(Schultz,2006)。

但是,Le Pelley,Pearson,Griffiths和Beesley(2015)表明奖励对注意的作用不能由操作性条件反应解释。在一个实验中,被试完成附加奇异项任务,搜索一个形状奇异项(例如,一个灰色方形)并报告里面的线段方向。在一些试次中,有一个分心物是颜色奇异项(红色或蓝色的圆),其颜色能够预测奖励水平。例如,红色预测高奖励,而蓝色预测低奖励。结果发现,当颜色奇异项出现时,被试的反应时变慢。重要的是,高奖励联结分心物出现时,相对于低奖励联结分心物,个体对目标的反应时更慢。这表明注意能够偏向任何预测奖励的刺激,并且被捕获,即使它总是干扰任务。在接下来的眼动实验中,被试需要快速地眼跳到目标,如果被试错误地眼跳到预测奖励的分心物,奖励将取消。结果发现,颜色分心物捕获了眼动,预测高奖励的分心物相对于低奖励的分心物捕获得更多。这表明选择偏向价值信号不是因为操作性的反应塑造。单一的奖励预测性能够导致刺激引发注意或眼动捕获(Le Pelley et al.,2016)。

但是,在Le Pelley等(2015)的范式中,预测奖励的刺激总是搜索集中唯一一个颜色刺激,即颜色分心物是物理突显的。可能是突显的刺激“突出(pop out)”,以一种反射性的方式捕获了注意(Yantis&Egeth,1999)。刺激的物理突显性可能是导致捕获的先决条件,而不仅仅是奖励预测性引起的。因此需要考察,当预测奖励的刺激不具有物理突显性时,能否捕获注意。而且,Le Pelley等(2015)的研究缺乏测试阶段。关于任务相关刺激特征的研究所报告的价值驱动注意捕获在刺激作为不突显分心物时出现,并且无奖励的测试阶段也存在(Anderson et al.,2011;Sali,Anderson,&Yantis,2014)。与奖励联结的任务无关刺激对注意的影响能否持续到测试阶段,还需要研究。

本研究采用训练—测试两阶段范式,训练阶段将不具有物理突显性、和任务无关的颜色与奖励建立联结,考察在测试阶段当颜色作为分心物出现时能否捕获注意。训练阶段采用侧抑制任务(Eriksen&Eriksen,1974)。在这个任务中,目标始终处在中心位置(目标由位置确定而不是由颜色确定),周边是分心刺激。将侧面数字的颜色与奖励水平建立联结。中心目标的颜色是唯一的,而所有侧面数字的颜色相同。这样,预测奖励的刺激既是与任务无关的,又不具有物理突显性。

在测试阶段采用经典的附加奇异项范式。被试搜索形状奇异项,但在一些试次中,以前和奖励建立联结的颜色作为分心物出现。本研究想考察,当训练阶段与奖励建立联结的颜色在搜索任务中作为突显分心物出现(实验1)或不突显分心物出现(实验2)时,是否均能够捕获注意。如果价值驱动注意捕获的产生仅仅是奖励预测性信号所引起的,和物理突显性以及目标相关性无关,那么与任务无关的、预测奖励的刺激特征,在测试阶段无论是否作为物理突显的分心物出现均能捕获注意。

2 实验1

2.1 研究方法

2.1.1 被试

24名本科生参加实验(其中女生16名,平均年龄21.04岁,年龄跨度18~22岁)。被试视力正常,无色觉缺陷。在训练阶段累计获得的金钱奖励将作为实验报酬给被试。所有被试均先完成训练任务,休息10分钟后完成测试任务。

2.1.2 实验仪器

采用E-prime2.0编程,材料呈现在分辨率为1024×768的17寸联想台式计算机上,背景为黑色。被试在微亮的室内单独测试,眼睛距离屏幕55cm。

2.1.3 训练阶段

刺激 训练阶段任务为侧抑制任务。每个试次由注视点、搜索屏和反馈屏组成(见图1)。注视点为呈现在屏幕中心的白色“+”(0.63°×0.63°),搜索屏为屏幕中心的白色目标数字和侧面4个相同颜色的分心数字(1.1°×1.4°)。侧面数字颜色为红色(RGB:255,0,0)或绿色(RGB:0,255,0)。数字范围为0~9,目标和侧面数字随机组合,但不能相同。反馈屏呈现本试次所获得的金钱奖励数量和累计的总奖励数量(以“分”为单位)。

实验安排与设计 被试在一定时间内反应正确将会获得金钱奖励。对于一半被试来说,侧面数字是红色时,80%试次中反应正确获得高奖励15分,20%试次中获得低奖励1分;而当分心物是绿色时,80%试次中正确反应获得低奖励1分,20%试次中获得高奖励15分。对于另一半被试来说,奖励与颜色的联结恰恰相反:绿色与高奖励联结,而红色与低奖励联结。告知被试反应正确才能获得奖励,奖励高低是依据一定规则分配的,并且与反应时无关。要求被试在正确的同时尽可能快地反应。训练任务中,当目标数字与侧面数字同为奇数或同为偶数时为一致条件,当目标数字与侧面数字奇偶不同时为不一致条件。

程序 训练阶段包含6个block共360个正式试次和30次练习。每个试次最初呈现400ms~600ms随机变化的注视点;然后呈现1500ms的搜索屏,要求被试对目标数字的奇偶进行判断,奇数按“M”键,偶数按“C”键;1000ms的空屏后呈现1500ms的奖励反馈,随后呈现1000ms的空屏。要求被试将左、右手的食指分别放在“C”键和“M”键上。正确反应获得15分或1分的奖励。反应错误或反应太慢(没有在1500ms之内进行反应)均会得到相应提示。训练阶段持续约40分钟。

2.1.4 测试阶段

刺激 每个试次包含注视点、搜索屏和反馈屏(见图1)。注视点与训练阶段相同。搜索屏为6个灰色(RGB:185,185,185)图形,每个图形内有水平或垂直线段。当图形为5个圆形(直径为2.14mm)和1个方形(对角线为2.62mm)时,目标是唯一的方形图形;当目标为5个方形和一个圆形时,目标为唯一的圆形图形。要求被试对目标内的线段方向进行判断。

实验设计与安排 目标随机呈现在6个位置上。与奖励建立联结的颜色分心物随机出现在6个不同的位置上。50%试次中,其中一个灰色分心物的颜色被训练阶段与奖励建立联结的颜色(红色或绿色)取代,高、低奖励联结颜色分心物各在25%试次中出现。

程序 测试阶段包含30次练习和4个block共240次正式试次。练习时与奖励联结的分心颜色不出现,对被试的反应给予反馈,正式实验不再反馈。每个试次最初呈现400ms~600ms随机变化的注视点;然后呈现1500ms的搜索屏,要求被试对目标图形内的线段方向进行判断,水平按“C”键,垂直按“M”键;随后是1000ms的空屏(实验流程见图1)。在指导语中告知被试测试阶段的任务和训练阶段无关,要求被试忽略颜色。测试阶段持续约15分钟。

图1 实验1流程图

2.1.5 数据统计

删除每个被试正负三个标准差以外的数据(训练阶段删除数据为总数据的1.01%,测试阶段删除数据为总数据的0.95%),对正确反应时和错误率进行分析。

2.2 结果

将训练阶段的反应时进行2(奖励水平:高奖励颜色、低奖励颜色)×2(一致性:一致、不一致)重复测量方差分析。结果表明:一致性的主效应显著,F(1,23)=29.58,p<0.001,ηp2=0.56,不一致条件的反应时比一致条件慢15ms;奖励的主效应不显著,F(1,23)<1;两者的交互作用不显著,F(1,23)=2.29,p>0.1(结果见表1)。错误率的分析结果表明:一致性的主效应显著,F(1,23)=11.00,p<0.01,ηp2=0.32,不一致条件的错误率比一致条件高0.90%;奖励水平的主效应不显著,F(1,23)<1;奖励与一致性的交互作用不显著,F(1,23)=1.13,p>0.1(结果见表1)。错误率的分析表明,不存在反应时与正确率的权衡。

将测试阶段的反应时进行单因素重复测量方差分析(分心物条件:无分心物、低奖励分心物、高奖励分心物)。结果表明,分心物的主效应显著,F(2,46)=11.63,p<0.001,ηp2=0.38。

事后比较表明,高奖励和无分心物条件的反应时差异显著,t(23)=5.17,p<0.001,d=0.61;高奖励和低奖励分心物条件的反应时差异显著,t(23)=3.39,p<0.01,d=0.35;低奖励和无分心物条件的差异也显著,t(23)=3.55,p<0.01,d=0.27(结果见图2)。错误率的分析表明,分心物的主效应显著,F(2,46)=7.97,p<0.05,ηp2=0.26。事后比较表明,高奖励和无分心物条件差异显著,t(23)=4.19,p<0.001,d=0.49;高奖励和低奖励分心物条件差异不显著,t(23)=1.47,p>0.1;低奖励和中性条件差异显著,t(23)=2.30,p<0.05,d=0.33(结果见图2)。错误率的分析表明,不存在反应时与正确率的权衡。

表1 实验1和实验2训练阶段的平均反应时(ms)和错误率(%)

2.3 讨论

实验1训练阶段没有发现奖励对反应时的任何影响,这与以往采用价值驱动注意捕获范式研究的结果一致(Anderson et al.,2011,2012)。他们在训练阶段采用空间搜索任务,将位置不确定的目标颜色与奖励建立联结,也没有发现奖励对反应时的影响。对此,他们的解释是,在训练阶段告知被试反应正确才能获得奖励,导致被试的反应比较保守。但是,Le Pelley等(2015)研究采用的也是空间搜索任务,表明当分心物颜色在训练阶段预测奖励结果时,能够发现奖励的效应,即使预测奖励的刺激干扰对目标的搜索。在本研究实验1中,是将侧抑制任务中的分心物颜色和奖励结果建立联结,分心颜色刺激分布在目标数字的周围(左右各两个数字),不具有空间不确定性,对注意捕获不敏感。所以我们也没有发现奖励对反应时的影响。

在实验1中,当与奖励相联结的颜色特征是与任务无关的并且不具有物理突显性时,我们仍然发现了价值驱动的注意捕获效应。这说明颜色特征不是必须与目标捆绑在一起的,与侧面数字结合也能引发基于价值的捕获。这个结果不支持操作性的反应塑造观点,只要能够预测不同水平的奖励,即使和目标反应无关,也能产生注意捕获(Le Pelley et al.,2016)。实验1的结果也排除了价值驱动的注意捕获是由于刺激的物理突显性所引起的反射性所导致的(Yantis&Egeth,1999)。在我们的实验中,预测奖励的刺激在训练阶段不具有突显性,但是仍然捕获了注意。

在实验1中,我们发现低奖励联结的分心物也能捕获注意。这与以往研究结果一致,物理突显的分心物能够捕获视觉注意(Theeuwes,1992)。所以,实验1测试阶段高奖励联结颜色分心物所产生的注意捕获效应可分为两个部分,一部分是基于价值产生的注意捕获,一部分是基于物理突显性所产生的注意捕获。实验1结果扩展了以往的研究,表明当与奖励联结的刺激特征是与任务无关、不突显的分心刺激时,在空间视觉搜索任务中仍能捕获注意。

图2 实验1测试阶段不同分心物条件下的反应时(A)和错误率(B)

3 实验2

实验1中,虽然发现训练阶段与任务无关、物理不突显的颜色特征与奖励建立联结能够在测试阶段捕获注意。但是,在测试阶段,与奖励相联结的无关刺激特征本身具有物理突显性。以往任务相关特征与奖励建立联结的研究表明,即使在测试阶段,奖励联结分心物不突显时,也能够捕获注意。因此,我们在实验2中考察当与奖励联结的分心物在两个阶段均不具有物理突显性时,能否捕获注意。

3.1 方法

3.1.1 被试

24名本科生参加实验(女生14名,平均年龄为19.9岁,年龄跨度为18~22岁)。所有被试的视力或矫正视力正常,无色盲或色弱。训练阶段获得的奖励作为实验报酬给被试。所有被试先完成训练任务,休息10分钟后完成测试任务。

3.1.2 实验仪器、刺激、设计和程序

实验2与实验1的仪器、刺激、设计和程序大致相同。只有一点不同:测试阶段的搜索屏为6个不同颜色的图形,分别浅蓝色(RGB:0,255,255)、粉色(RGB:255,0,255)、黄 色(RGB:255,255,0)、土黄色(RGB:255,160,0)、蓝色(RGB:0,0,255)、红色(RGB:255,0,0)或绿色(RGB:0,255,0),与奖励联结的颜色作为不突显的分心物出现。在50%试次中,其中一个非目标形状的颜色被训练阶段和奖励建立联结的颜色(红色或绿色)所取代。两种奖励颜色分心物出现的概率各为25%。

3.1.3 数据统计

删除每个被试正负三个标准差以外的极端数据(训练阶段删除的数据为总数据的1.08%,测试阶段删除的数据为总数据的1.04%),对正确反应时和错误率进行分析。

3.2 结果

将训练阶段的反应时进行2(奖励水平:高奖励颜色、低奖励颜色)×2(一致性:一致、不一致)重复测量方差分析。结果表明:一致性的主效应显著,F(1,23)=17.69,p<0.001,ηp2=0.44,不一致条件的反应时比一致条件慢14ms;奖励的主效应不显著,F(1,23)=2.63,p>0.1;两者的交互作用不显著,F(1,23)=2.55,p>0.1(见表1)。错误率的分析表明:一致性的主效应显著,F(1,23)=7.46,p<0.05,ηp2=0.25,不一致条件的错误率比一致条件高0.96%;奖励的主效应不显著,F(1,23)=1.70,p>0.1;两者交互作用不显著,F(1,23)<1(结果见表1)。

为了检验奖励对注意的影响,对测试阶段进行单因素重复测量方差分析(分心物条件:无分心物、低奖励分心物、高奖励分心物)。结果表明分心物的主效应显著F(2,46)=10.79,p<0.001,ηp2=0.32。事后比较表明,高奖励和无分心物条件的反应时差异显著,t(23)=3.89,p<0.01,d=0.24;高奖励和低奖励条件的反应时差异显著,t(23)=3.80,p<0.01,d=0.22;低奖励和中性条件的差异不显著,t(23)<1(结果见图3)。错误率的结果表明,分心物的主效应不显著F(2,46)<1(结果见图3)。

图3 实验2测试阶段不同分心物条件下的反应时(A)和错误率(B)

3.3 讨论

实验2训练阶段的结果与实验1一致,没有发现奖励对反应时有任何影响。在实验2中,训练阶段与奖励建立联结的颜色为任务无关的刺激特征,并且不具物理突显性。而且,在测试阶段,与奖励相联结的颜色也作为物理不突显的分心物出现,我们仍然发现了相对于无奖励联结分心物条件和低奖励联结分心物出现条件,当与高奖励联结的颜色作为分心物出现时捕获了注意。这个结果与以往在训练阶段将目标颜色与奖励建立联结的研究结果一致(Anderson et al.,2011)。这说明训练阶段和测试阶段刺激的物理突显性都不是引起注意捕获的必要条件,与奖励建立联结的刺激是否与任务相关也不是必要条件。结果进一步支持了价值预测性观点,只要刺激能够预测不同水平的奖励,就能够产生价值驱动的注意捕获(Le Pelley et al.,2016)。

4 总讨论

本研究中,我们考察了与奖励联结、和任务无关的分心刺激特征能否引发价值驱动的注意捕获。实验1的训练阶段采用侧抑制任务,将侧面分心数字的颜色与奖励建立联结。在测试阶段的搜索任务中,当和高奖励建立联结的颜色作为突显分心物出现时,高奖励分心物颜色相对于低奖励分心物颜色能够更强地捕获注意。实验2的测试阶段,将与奖励联结的颜色作为不突显分心物出现,和高奖励联结的分心物仍然能够捕获注意,而低奖励联结的分心物不能捕获注意。

本研究结果表明,当分心刺激特征预测奖励时,也能够引发价值驱动的注意捕获,并且不依赖于在测试阶段这个刺激特征是否作为突显分心物出现。以往关于刺激-奖励联结的研究中,与价值相联结的刺激特征总是被定义为目标(Anderson et al.,2011)。虽然Le Pelley等(2015)的结果表明,当没有定义目标的特征能够预测奖励结果时,刺激-奖励的联结影响视觉选择性注意。但是,他们的研究只表明了刺激特征与奖励即时联结在一起时才能捕获注意,这个效应并没有在接下来的测试阶段进行考察。本研究在奖励联结的训练阶段采用了侧抑制任务,当将分心特征与奖励联结时发现了基于价值驱动的注意捕获效应(实验1),而且,当分心物在测试阶段作为不突显刺激出现时,也能够产生捕获效应(实验2)。

本研究结果在很多方面与以往的研究结果一致(Anderson,2013;Chelazzi et al.,2013)。第一,和以往研究相似,分心物特征能够在训练阶段与价值建 立 联 结 (Della Libera,Perlato,& Chelazzi,2011;Le Pelley et al.,2015)。第二,训练阶段的奖励水平导致了在测试阶段是否出现基于价值的注意捕获。当奖励-联结的特征能够预测关于奖励水平的信息时,奖励水平能够影响任务成绩(Anderson et al.,2011,2012)。例如,Anderson等(2011)表明,奖励学习对于视觉搜索任务中注意捕获的影响依赖奖励的水平。高奖励联结的刺激,相对于低奖励联结的刺激来说,能够引起更大的注意捕获效应。本研究也重复了这个结果。第三,当从奖励学习阶段的侧抑制任务转换到测试阶段的视觉搜索任务时,奖励-特征的联结也一直会持续。这支持注意捕获的泛化观点。刺激-奖励联结的学习效应可以从一个任务过度(泛化)到另一个任务(Anderson et al.,2012),颜色-奖励联结所产生的捕获效应能够泛化到相似颜色上(Anderson,2017)。最后,本研究发现,在测试阶段,当和奖励相联结的刺激特征不再能够预测奖励时,这种效应仍然存在。Le Pelley等(2015)研究表明,非目标特征的价值联结的注意捕获效应只在奖励联结的学习任务中表现出来,并没有考察这个效应在本质上和任务相关特征在测试阶段所引发的注意捕获(Anderson et al.,2011)是否相同。本研究表明,在没有奖励的测试阶段,仍然能够发现价值驱动的注意捕获,表明任务无关刺激-奖励联结和任务相关刺激-奖励联结能够获得相似的结果。

本研究结果不支持操作性的条件反应,而是支持经典的巴甫洛夫式的学习规律。当将奖励与某种刺激建立联结,当知道这些刺激信息与被试的反应无关时,注意也能自动地指向这些刺激。注意指向与奖励联结的刺激,而不是指向反应。Bucker和Theeuwes(2017)要求被试完成处于注视点位置的任务,但是在周围任务无关的分心物出现后自动呈现高或低的奖励。通过这种方式,将联结性的奖励学习完全独立于被试的反应,在无奖励反馈的测试阶段仍然发现预测高奖励的颜色作为分心物捕获了注意。Sali等(2014)的研究也表明,当目标刺激不能区分性地预测奖励结果时,目标特征不能产生价值-预测信号,因此不能捕获注意。通过奖励预测机制,刺激和奖励之间的联结性机制能够引起基于价值的注意优先性,巴甫洛夫的刺激-奖励的条件性相倚对于获得价值驱动的注意捕获是充分的。

5 结论

训练阶段和高奖励联结的不突显任务无关刺激特征,在测试阶段无论是否作为突显的分心物出现,均能捕获注意。价值预测性是产生价值驱动注意捕获的充分条件。

猜你喜欢
测试阶段阶段颜色
名师成长的四个阶段
假期之后,你想成为谁?
在学前教育阶段,提前抢跑,只能跑得快一时,却跑不快一生。
浅谈计算机软件工程技术中的逻辑运用
Android应用软件测试研究
不同的阶段 不同的方法
特殊颜色的水
关于改进英语专业高级英语教学过程的分析