两品系大鼠在经典条件反射和操作式条件反射中的行为学表现

2016-04-14 03:05王克柱徐攀卢聪陈怡西谢磊李莹辉曲丽娜刘新民

中国实验动物学报 2016年1期

王克柱，徐攀，卢聪，陈怡西，谢磊，李莹辉，曲丽娜，刘新民*

(1.中国医学科学院北京协和医学院药用植物研究所药理毒理中心，北京　100193； 2.中国航天员科研训练中心，北京　100193)

研究报告

两品系大鼠在经典条件反射和操作式条件反射中的行为学表现

王克柱1，徐攀1，卢聪1，陈怡西1，谢磊1，李莹辉2，曲丽娜2，刘新民1*

(1.中国医学科学院北京协和医学院药用植物研究所药理毒理中心，北京100193； 2.中国航天员科研训练中心，北京100193)

【摘要】目的探讨SD、Wistar两种品系大鼠在经典条件反射和操作式条件反射中行为学表现差异，为研究脑的高级功能建立稳定的条件反射动物模型提供实验动物选择依据。方法选择8周龄的正常SD和Wistar大鼠，分别进行奖赏训练、单次操作训练、连续多次操作训练三种检测模式，研究SD、Wistar大鼠学习记忆能力。结果奖赏训练中，SD大鼠的鼻触次数显著性增多(vs.Wistar,P<0.05)；单次操作训练中，与SD大鼠比较，Wistar大鼠的总踏板次数(LPs)、比率(cLP/LP)显著升高(P<0.05)，总鼻触次数(NPs)于第5天差异有显著性，踏板潜伏期明显降低(P<0.05)，踏板速率则显著性的升高(P<0.05)。连续多次操作训练中，Wistar大鼠鼻触次数显著性升高(P<0.05)，踏板次数、奖赏次数均增多，反应准确率也高于SD大鼠，但组间差异无显著性(P>0.05)。结论经典条件反射阶段SD大鼠对饮水盒的探索能力强，表现出对奖赏物质较强的兴趣；而在奖赏操作条件反射阶段Wistar大鼠的表现优于SD大鼠。

【关键词】经典条件反射；操作式条件反射；SD大鼠；Wistar大鼠；学习记忆

随着分子生物学的迅猛发展，研究脑的高级机能的神经生物学机制已转向微观的分子、细胞水平，而建立一种稳定可靠的实验动物模型同样是必不可少的。利用动物建立不同的条件反射模型已经成为研究脑的高级机能经常采用的一种方法和手段。条件反射是广泛采用的动物行为研究模式，包括经典的条件反射和操作条件反射[1-2]。条件反射需要对不同条件性刺激(conditional stimulus,CS)之间的相互关联与自身行为(response)及其后果(outcome)之间的因果联系的进行学习[3-4]。操作式条件反射又包括奖励性和惩罚性操作条件反射，而奖励性操作式条件反射测试系统是被广泛使用的行为学装置，包括刺激信号、操作机构和奖励物质，而动物在操作测试箱中的行为表现可以从多个方面反映动物的兴趣、注意、决策、反应、选择和目标导向等认知功能[5-9]。奖励性操作条件反射是一种正性增强的条件反射记忆，而基于奖赏效应的学习记忆行为评价技术由于其对动物心理和身体的伤害较小，符合动物伦理的3R原则之一，正被国际医学界所接受[10-11]。

目前随着我国的脑计划的即将实施，利用奖励性操作条件反射进行脑高级功能研究必将成为热门领域，但由于动物行为学受到的影响因素较多，包括噪声、光线、动物的运输时间长短以及实验动物品系、周龄等，并且操作条件反射任务中使用大鼠居多，因此本实验选择国内较常用的SD和Wistar两种品系大鼠，利用灯光(S)、踏板(R)和食物(O)相结合的方法，建立大鼠经典的奖赏条件反射、单次踏板操作条件反射(fixed ratio=1)、连续多次踏板操作条件反射等实验模式，比较两种品系大鼠在上述实验模式中的行为学表现，从而为进一步研究脑的高级功能-学习记忆和运动控制、以及药物筛选等提供实验动物选择的依据。

1材料与方法

1.1实验动物

SPF级雄性SD大鼠及雄性Wistar大鼠各8只，均为8周龄，体重300 g左右，购自北京维通利华实验动物科技有限公司【SCXK(京)2012-0001】。实验室安静，温度恒温保持在(24±3)℃，12 h照明/12 h黑暗环境(8:30-20:30亮灯)，饲养期间给予标准饲料及纯净水。所有动物实验均在中国医学科学院药用植物研究所与中国航天员科研训练中心共建的航天医学国家重点实验室-动物行为学实验室实施【SYXK(京)2008-0019】，并遵守国际实验动物伦理学要求。

1.2实验仪器[12]

奖励性操作式条件反射检测分析处理系统，由中国医学科学院药用植物研究所与中国航天员科研训练中心联合研制。测试系统包括4个测试箱(350 mm ×450 mm ×780 mm(l×w×h))。测试箱分为嵌套的内外两部分，内箱尺寸为 300 mm × 300 mm × 550 mm (l×w×h)，壁中布有红外发光阵列用于消除图像采集时噪声干扰并提高暗环境时图像清晰度。内侧壁安装有2套奖赏装置、踏板装置以及三色信号灯，左右对称。奖赏装置旁各2.5 cm处安装宽度为4 cm的踏板装置，踏板上方各有一个三色信号灯(红、黄、蓝)。内箱的顶部安装有CCD摄像装置和环境光源，可以实时监控动物在测试箱内暗环境下的行为活动。底部为栅间距d=10 mm的不锈钢栅。钢栅可连接12V电源，电流通过时可提供惩罚性的非条件刺激(选配)。内室下方为活动抽屉，用以收集动物的排泄物。

1.3实验方法

1.3.1饮食限制与双瓶喂养

动物在奖赏训练前10 d进行饮食限制，其方法采用双瓶喂养的方法，即给予动物两瓶饮水，其中一瓶为30 mL的8%蔗糖水，另一瓶为30 mL的纯净水，两瓶饮水每天位置对换，以免动物偏爱其中某一方位。饮水控制的同时，每只大鼠每天给予鼠粮14 g，连续饮食限制10 d，目的是使限食后的动物体重达到未限食动物体重的80%～85%[2，6]，此时动物寻找食物的动机最大，同时又没有影响动物正常的营养需求。

1.3.2经典的奖赏条件反射

动物第9天进行为期1 d的适应训练，即动物自由探索测试箱，奖赏装置每(60±10)s自动给予1滴(0.2 mL)20%蔗糖水，实验时间30 min。第10天动物开始进行为期7 d的奖赏训练。奖赏训练过程蓝色信号灯交替出现，每次亮灯10 s，此时动物探索饮水盒时自动促发红外感应装置，发出信号至计算机，并反馈到奖赏装置自动给予一滴奖赏物质，我们将此定义为正确鼻触反应；10 s之后信号灯熄灭，试验进入间隔期(30±5)s，若此时动物进行探索饮水盒，将没有奖赏物质的获得，同样系统也会记录其鼻触反应，我们将其定义为错误鼻触反应。每天训练20 min，连续训练7 d。

1.3.3奖励性操作条件反射实验

自18 d起进行连续10 d的单次操作训练(fixed ratio=1)。打开软件控制单个踏板伸出，训练过程中踏板保持伸出状态。动物完成一次踏板操作后，蓝色信号灯亮灯10 s，然后动物即可获得一次奖赏物质。此阶段是在已形成奖赏条件反射的基础上增加踏板操作，训练动物对踏板(R)-信号灯(S)-奖赏(O)进行关联并形成稳定的奖赏操作条件反射。每天训练时间30 min，训练终止条件为实验时间到或者动物在30 min内连续踏板50次。动物在连续3 d的训练中以踏板操作50次结束实验，被视为动物已习得奖赏操作条件反射。

1.3.4连续多次操作能力测试

动物习得奖赏操作条件反射后进行连续6 d的多次连续踏板操作测试，即获得一次奖赏物质所需要进行的踏板操作为2次或者4次。连续2次或4次踏板操作的时间间隔分别为2 s或4 s，动物在规定时间内连续踏板2次或者4次，蓝色信号灯亮灯10 s，动物即可获得一次奖赏物质，否则重新计次。实验时长为30 min，训练终止条件为实验时间到或动物在30 min内连续踏板50次。实验过程中记录动物获得的奖赏次数、踏板操作次数、鼻触次数等。

1.4数据分析

采用SPSS 19.0统计软件进行统计学分析。试验数据以均值±标准误的形式表示，各组间数据用单因素方差分析判断其统计学意义，以P<0.05表示差异有显著性，P<0.01表示差异有极显著性。

2结果

2.1经典的奖赏条件反射

注：A：正确鼻触次数；B：错误鼻触次数；C：鼻触正确率，与Wistar大鼠比较，*P<0.05差异有显著性。图1　Wistar与SD大鼠经典的奖赏条件反射比较(n=8,mean ±SEM)Note. Correct nose pokes; B: Incorrect nose pokes; C: Accuracy of nose pokes.*P<0.05,compared with the Wistar rats. Fig.1　Comparison of reward conditioning acquisition of the Wistar and SD rats(n=8,mean ±SEM)

在奖赏训练阶段，随着训练周期的延长，SD和Wistar大鼠的正确鼻触次数(correct nose pokes，cNPs)均持续上升；而错误鼻触次数(incorrect nose pokes, iNPs)，SD大鼠在第1天到第3天持续性增加，而在第4天后明显的下降，Wistar大鼠在整个奖赏训练过程中基本保持不变；鼻触正确率也随着训练的增加而逐渐升高，基于上述结果表明两种品系的大鼠(SD和Wistar)均可以将信号灯(stimuli)-奖赏物质(outcome)形成关联，形成稳定的奖赏条件反射。两种品系大鼠比较发现，SD大鼠的cNPs和iNPs均显著性高于Wistar大鼠(P<0.05)。通过公式p=cNPs/(cNPs+iNPs)计算出鼻触正确率，能够反映出大鼠在奖赏训练中的学习效率，从图1看出，在奖赏训练第7天，SD大鼠与Wistar大鼠比较出现显著性差异(P<0.05)。以上结果说明了SD大鼠在经典条件反射学习效率方面优于Wistar大鼠。实验开始后动物首次作出鼻触反应的时间即为鼻触潜伏期(TNPLatency)，反映出动物对S-O关联的记忆程度，同时又可以反映动物运动的敏捷性。从图2看出，随着训练周期的增加，TNPLatency逐渐下降；与Wistar大鼠比较，SD大鼠的TNPLatency明显较低，在第1天表现出显著性差异(P<0.05)。图3是动物在奖赏训练过程中运动轨迹热点图，从图中可以看出，SD和Wistar大鼠的运动路程差异无显著性。

注：与SD大鼠比较，* P <0.05差异有显著性。图2　Wistar与SD大鼠在奖励性条件反射鼻触潜伏期的比较(n=8,mean ±SEM)Note. *P<0.05, compared with the SD rats.Fig.2　Comparison of the nose poke latency in Pavlovian conditioning acquisition of Wistar and SD rats

2.2奖赏操作训练

图3　Wistar与SD大鼠在奖赏训练运动轨迹热点图Fig.3　The hot map of trajectory in Pavlovian conditioning acquisition of Wistar and SD rats

注：A：总踏板次数；B：总鼻触次数；C：踏板次数与鼻触次数的比值；D：踏板速率。与SD 大鼠比较，*P<0.05，**P<0.01差异有显著性。图4　Wistar与SD大鼠在奖赏操作获得能力的比较(n=8, mean ±SEM)Note. A: Total lever presses; B: Total nose pokes; C: The LPs/NPs ratio; D: Lever press rate. *P<0.05, **P<0.01, compared with the SD rats.Fig.4　Comparison of the reward operation conditioning acquisition of Wistar and SD rats (n=8,mean±SEM)

动物习得奖赏条件反射后即可进行奖赏操作训练，由图4看出，随着训练时间的递增，两种品系大鼠的踏板次数(lever presses，LPs)逐渐增加；由于动物逐步习得踏板操作(R)-信号灯、(S)-奖赏物质与(O)三者的关联，无效鼻触减少，因此总鼻触次数(total nose pokes，NPs)呈现下降趋势。Wistar与SD大鼠比较发现，Wistar大鼠的LPs、比率(LPs/NPs, LNP)显著性高于SD大鼠(P<0.05)，而NPs基本与SD大鼠保持一致(除5 d差异有显著性)。图4(d)表示的是动物踏板操作速率，与SD大鼠比较，Wistar大鼠的每分钟踏板次数表现出差异有显著性(P<0.05)。上述结果表明，Wistar大鼠在奖赏操作训练的速率和准确率方面均优于SD大鼠。与TNPLatency相似，踏板操作潜伏期(TLP Latency)通过考察动物对踏板操作(response)-奖赏物质(outcome)的关联程度来反映动物的奖赏操作的学习记忆能力，TLP Latency越短，则说明奖赏操作学习能力越好。图5看出，Wistar大鼠表现出的TLP Latency明显的低于SD大鼠(P<0.05)。图6表示动物在奖赏操作训练中运动轨迹热点图，与SD大鼠比较，Wistar大鼠的运动路程显著性小于SD大鼠。

注：与SD 大鼠比较，*P<0.05 差异有显著性。图5　Wistar与SD大鼠在奖赏操作条件反射中踏板潜伏期的比较(n=8, mean±SEM)Note. *P<0.05, compared with the SD rats.Fig.5　Comparison of the latency of lever pressing in reward operation conditioning of the Wistar and SD rats (n=8, mean±SEM)

2.3连续多次操作能力测试

图7显示在连续多次操作任务中，与SD大鼠比较，Wistar大鼠的总踏板次数(total lever presses, TLPs)较高，但差异无显著性(P>0.05)；总鼻触次数(total nose pokes，TNPs)在4、5、7 d差异有显著性(P<0.05)；而奖赏物质(rewards,Rs)的获得两种品系大鼠则差异无显著性。在比值(R/LP)、NP/LP、R/NP等指标上Wistar大鼠与SD大鼠比较差异均无显著性(P>0.05)。

3讨论

经典条件反射和操作式条件反射广泛应用于研究学习记忆和脑的高级功能(如反应、选择、注意、决策等)的神经机制。操作式条件反射提供了一种目标引导行为(goal-directed behavior)的行为学研究模型。操作式条件反射的学习过程可以分为目标导向性和习惯化学习两种，持续的或特殊强化模式的训练会逐渐形成习惯化行为，不受奖赏物质激励价值贬值(outcome devaluation)和奖赏物质回报率降低(contingency degradation)的影响。研究表明，在较高比率的操作模式中能形成目标导向行为，而较低比率的操作模式中易于形成习惯行为。

动物行为学实验由于受到的影响因素较多，应激、动物品系、周龄、昼夜节律变化等均可以影响行为学结果，使动物实验结果失去重复性。SD和Wistar均属于远交系封闭群白色大鼠，是国际和国内临床前实验研究常用的动物品系。Wistar大鼠由1907年美国Wistar研究所育成，是我国引进最早、使用最广泛，数量最多的品种。性情温顺，对传染病抵抗力强，目前是神经-内分泌实验研究中最常用的动物品系。SD大鼠原产于亚洲中部及原苏联部分的温暖地区，目前已应用于生命科学研究的各个领域，尤其在肿瘤学、药理学、内分泌学、营养学方面应用最为广泛。研究发现，SD大鼠的神经系统与人类相似，广泛应用于高级神经活动的研究，如奖励和惩罚实验、迷宫实验、饮酒实验以及神经官能症、精神发育阻滞的研究。本实验中设置了经典条件反射、单次操作训练和连续多次操作学习模式，对比分析不同品系大鼠在经典条件反射、单次操作反应和复杂操作能力测试的行为表现。

图6　Wistar与SD大鼠在奖赏操作训练运动轨迹热点图(n=8, mean ±SEM)Fig.6　The hot map of trajectory in reward operation conditioning acquisition of Wistar and SD rats

注：与SD大鼠比较，*P<0.05差异有显著性。图7　Wistar与SD大鼠在连续多次操作能力的比较(n=8, mean ±SEM)Note. *P<0.05, compared with SD rats.Fig.7　Comparison of continuous operation ability of the Wistar and SD rats (n=8, mean±SEM)

文献报道，8周龄的Wistar大鼠踏板操作反应灵敏，形成操作条件反射的速度和效率均高于SD大鼠；12周龄的SD和Wistar大鼠均能稳定形成操作条件反射，差异无显著性。石哲[14]研究大鼠信号辨识能力时发现，12周龄的SD和Wistar大鼠在正确操作反应率、正确反应次数等指标并无显著性差异。本实验的经典条件反射实验结果表明，随着训练周期的增加，动物在经典条件反射学习中表现出对饮水盒探索活动(鼻触反应)增加。大鼠的鼻触反应能够反映出动物对奖赏物质的兴趣程度以及对刺激信号的反应能力，而兴趣和反应是动物进行踏板操作的基础。SD大鼠的正确鼻触次数、鼻触正确率显著性高于Wistar大鼠，说明SD大鼠对奖赏物质的兴趣程度较高，同时对灯光刺激信号的反应强烈。在操作反应训练中，增加踏板操作，需要动物主动探索，积累经验，获得强化形成操作条件反射。增加获得奖赏的踏板次数可以降低奖赏物质激励价值和获得奖赏回报率，直接影响动物的正确操作反应。本实验结果发现，单次踏板操作模式中，Wistar大鼠踏板操作次数显著性高于SD大鼠，而鼻触次数则无明显差异，因此正确反应率较高。在连续多次操作能力测试中，要求大鼠在限定的时间内完成设定次数的连续踏板操作以获得奖赏物质。Wistar大鼠的鼻触次数、正确踏板次数、奖赏次数较高，因此正确反应较高。

条件反射方法应用于研究药物对高级神经活动的影响具有几个方面的优点：(1)通过变更刺激信号、操作模式与强化反应，形成在同一动物身上形成不同的条件反射的复合实验，可以观察药物对高级神经活动的选择性作用；(2)通过脑部自身刺激实验还能将药物与作用部位联系起来，研究药物的作用机制[15]；(3)定量比较不同药物对不同实验模式的影响，能够反应出药物药效强度，敏感性好；(4)目前奖励性操作条件反射已实现自动化和智能化，可同时进行4个样本的检测，大大节省了人力，提高了药物筛选的效率[14]。

综上所述，本实验中经典条件反射阶段SD大鼠对饮水盒的探索能力强，表现出对奖赏物质较强的兴趣；而在奖励性操作条件反射阶段，Wistar的操作能力优于SD大鼠，因此Wistar大鼠可能更适合于操作式条件反射的研究。

参考文献

[1]Holland PC. Brain mechanisms for changes in processing of conditioned stimuli in Pavlovian conditioning: Implications for behavior theory[J]. Animal Learn Behav,1997, 25 (4): 373-399.

[2]Shi Z,Sun X,Liu X,et al.Evaluation of an Aβ (1-40)-induced cognitive deficit in rat using a reward-directed instrumental learning task [J].Behav Brain Res,2012,34(2): 323-333.

[3]Winocur G.A comparison of normal old rats and young adult rats with lesions to the hippocampus or prefrontal cortex on a test of matching-to-sample [J].Neuropsychologia,1992,30 (9):769-781.

[4]Luu TT,Pirogovsky E,et al.Age-related changes in contextual associative learning [J].Neurobiol Learn Mem,2008,89 (1):81 -85.

[5]Ostlund SB, Balleine BW. Differential involvement of the basolateral amygdala and mediodorsal thalamus in instrumental action selection [J]. J Neurosci,2008, 28(17):4398-4405.

[6]Ostlund SB, Balleine BW. Lesions of medial prefrontal cortex disrupt the acquisition but not the expression of goal-directed learning [J]. J Neurosci, 2005, 25(34):7763-7770.

[7]Schwabe L, Wolf OT. Stress-induced modulation of instrumental behavior: from goal-directed to habitual control of action [J]. Behav Brain Res,2011,219:321-328.

[8]Steele-Russell I, Russell MI, Castiglioni JA, et al. Selective attention and Pavlovian conditioning[J]. Exp Brain Res,2006, 173:587-602.

[9]Simon NW, Gilbert RJ, Mayse JD,et al. Balancing risk and reward: a rat model of risky decision-making[J]. Neuropsychopharmacology,2009, 34(10):2208-2217.

[10]Berridge KC,Kringelbach ML.Affective neuroscience of pleasure: reward in humans and animals[J].Psychopharmacology,2008,(Berl) 199(3):457-480.

[11]石哲,陈善广,陈玲玲, 等.奖励性操作式条件反射任务在大鼠学习记忆研究中的应用[J].中国实验动物学报,2012,20(4):9-15.

[12]陈铃铃,石哲,陈善广. 奖励性操作条件反射实时测试分析处理系统研制[J].航天医学与医学工程,2013,26(4):278-282.

[13]Oler JA,Markus EJ.Age-related deficits in the ability to encode contextual change: a place cell analysis [J].Hippocampus,2000,10:338-350.

[14]石哲.基于奖励性操作式条件反射的益智复方中药药效评价方法研究[C].北京协和医学院中国医学科学院,北京,中国.2012.

[15]邹罔,金国章,胥彬.操作式条件反射在神经药理学中的应用[J].生理科学进展,1963,5(1):58-66.

Behavioral differences of the Sprague-Dawley and Wistar rats in Pavlovian conditioning and reward operant conditioning

WANG Ke-zhu1, XU Pan1, LU Cong1, CHEN Yi-xi1, XIE Lei1, LI Ying-hui2, QU Li-na2, LIU Xin-min1*

(1.Research Center for Pharmacology & Toxicology,Institute of Medicinal Plant Development ( IMPLAD),Chinese Academy of Medical Sciences and Peking Union Medical College,Beijing 100193,China;2.Astronaut Center of China,Beijing 100193)

【Abstract】ObjectiveTo explore the behavioral differences of Sprague-Dawley (SD) and Wistar rats in Pavlovian conditioning and reward operant conditioning task, and provide a good reference for selection of experimental animals in establishing the animal models of conditional reflex for studying higher brain functions. MethodsHealthy 8-week-old SD and Wistar rats were used in this study. Single operant task and continuous operation training task, and multiple operation training task were used to assess the learning and memory ability of the SD and Wistar rats. ResultsSignificant difference was found in the Pavlovian conditioning. SD rats performed more nose pokes (NPs) (P<0.05) vs. Wistar rats. There were significant differences during a single operation task.Wistar rats preformed significantly more total lever presses (LPs) (P<0.05) and cLP/LP (P<0.05) vs. SD rats, and there was obvious increase in total nose pokes (NPs) (P<0.05) on the fifth day. The two indicators,the lever pressing rate and the latency of the first lever pressing could explain objectively the rat learning and memory abilities. The latency of the first lever pressing in the Wistar rats was significantly shorter than that of SD rats (P<0.05), while the lever pressing rate obviously higher (P<0.05). In the continuous operation training task, the Wistar rats showed significantly higher nose pokes (vs. SD rats, P<0.05); and also had higher lever presses, reward earned, and correct accuracy rate, but with no significant difference between them.Conclusions Wistar rats exhibit excellently in a single operation task and continuous operation training task, while SD rats show better performance in Pavlovian conditioning.

【Key words】Pavlovian conditioning; Operant conditioning; Reward; Sprague-Dawley rats; Wistar rats; Learning and memory ability

[收稿日期]2015-07-21

Corresponding author:LIU Xin-min, E-mail: Liuxinmin@hotmai.com

Doi:10.3969/j.issn.1005-4847.2016.01.012

【中图分类号】Q95-33

【文献标识码】A

【文章编号】1005-4847(2016) 01-0065-07

[作者简介]王克柱(1986-)，男，博士研究生，研究方向：中药神经药理。E-mail： wangkezhu0628@163.com[通讯作者]刘新民，博士生导师，E-mail： Liuxinmin@hotmai.com

[基金项目]中长期航天飞行所致应激损伤评价与防护关键技术研究(BWS11J052)，模拟失重认知功能受损动物模型的建立( SMFA10K01)，科技部重大新药创制(2013ZX09201022)。

中国实验动物学报2016年1期

中国实验动物学报的其它文章: 复合刺激创伤后应激障碍模型大鼠重要脑区的病理变化; 雌性大鼠去卵巢模型中脑神经内分泌信号异常传导的机理; Rapid detection of Shigella and Salmonella in rhesus monkeys by loop-mediated isothermal amplification assay; 人前列腺癌骨转移裸鼠移植模型的建立及其循环肿瘤细胞的特性; 芍药苷对大鼠背根神经元细胞内Ca2+的影响; 一种牵张成骨大鼠实验模型的建立