关于负强化的深入探析

2011-08-15 00:51
中国工作犬业 2011年9期
关键词:口令警犬惩罚

袁 野

关于负强化的深入探析

袁 野

斯金纳认为:人或动物为了达到某种目的,会采取一定的行为作用于环境,当这种行为的后果对他有利时,这种行为就会在以后重复出现;不利时,这种行为就减弱或消失。这种“有利的后果”就是强化。

根据强化的性质和目的,可分为正强化和负强化。人们可以用正强化或负强化的办法来影响行为的后果,从而修正其行为。在管理上,正强化就是奖励那些组织上需要的行为,从而加强这种行为;负强化是积极行为预期增加或者已经增加,为了巩固那些已经增加的积极行为,撤销原来的那些惩罚及与组织不相容的行为带来的痛苦。正强化的方法包括奖金、对成绩的认可、表扬、改善工作条件和人际关系、提升、安排担任挑战性的工作、给予学习和成长的机会等。负强化的方法包括撤销批评、处分、降级等,有时恢复减少的奖金也是一种负强化。

对负强化的理解

负强化,就是对于符合目标的行为,撤消或减弱原来存在的消极刺激或者条件,以使这些行为发生的频率提高。

笔者注意到了容易将负强化混同于惩罚的现象,例如Thyer Laura和L Myers指出:“正强化概念虽然是已经进入我们日常生活的词汇,但即使受过良好训练的临床工作者有时也被正强化与负强化、正惩罚与负惩罚和消退之间的区别所困惑。”事实确实如此。

《警犬训练学》一书认为,“在警犬训练中,根据强化的性质和目的可把强化分为正强化和负强化。凡属纠正和改变犬不符合训练要求的条件反射活动,或制止犬某种不良联系的行为而采取的手段及其效应,称为负强化。”“禁止是训犬员或助训员通过使用威胁音调发出‘非’的口令,同时伴以强有力的机械刺激制止犬的不良行为所采用的负强化手段。‘禁止’对犬来说,实质上是一种抑制性的惩罚。”“在警犬训练中,训犬员不仅要通过正强化加速犬所训作业能力条件反射的形成,而且还要对犬已形成的某些不良联系,采取负强化进行消退。”也就是说,负强化是一种惩罚,可以纠正和制止犬的不良行为或不良联系。

《犬的行为原理》一书认为,“强化是一种进一步增大行为完成的可能性的刺激或活动”“凡是其结果可使行为增加的就称‘强化’,凡是其结果可使其行为减少的称为‘惩罚’”。也就是说,无论正强化和负强化都可以使行为增加,但举例为“通过对行为的正强化或负强化,可以使这种条件反射发生改变,如幼犬向家具上跳而遭到主人反复责备后,可使犬跳的频率减少”,可见前后矛盾。

负强化的含义探析

一、“正、负”的含义

首先要明白概念中“正、负”的含义。在实施强化与惩罚的过程中,如果呈现某事物,就叫做“正”,如果某事物消失,就叫做“负”。因此呈现某事物、导致犬愉快并使犬的特定行为表现频率增加,就叫正强化;如果移去某事物、导致犬愉快并使行动者特定行为增加,就叫负强化;呈现某事物、导致犬痛苦并使犬特定行为表现消失,就叫正惩罚:移去某事物、导致犬痛苦并使犬特定行为表现消失,就叫负惩罚。

Thyer Laura和L Myers认为:“口语上,正强化可以贴上奖励的标签,当一个结果呈现,而自此以后该受到奖励的行为增加了,那么就发生了正强化。负强化可以被解释为解脱,如果一个行为的结果由移走不愉快的事物构成,该行为以后就被增强了,那么这就牵涉到负强化。当一个行为的结果由呈现令人厌恶的东西构成,那么就发生了正惩罚,它以该行为发生的可能性降低为结果。负惩罚包含移走令人愉快的事物,它以未来该行为发生的可能性降低为结果,口语上将负惩罚看做类似于罚款的操作”。负强化是好的,人们向往的,而惩罚是不好的,人们力求回避的。因此不能将负强化等同于惩罚。

二、从行为与结果关系考察

Barry Schwartz将效果律作为操作条件作用的基本问题进行分析,他指出:“效果律研究的焦点是行为和它的结果、反应和结果之间的关系。我们可以确认四类行为——结果关系类型。一是行为能产生积极的结果,这种关系叫正强化;二是行为导致已经呈现的刺激结束或移去,这种关系叫负强化;三是行为产生消极的结果,这种关系叫惩罚;最后一种是行为可能防止消极事件发生,这种关系叫回避。”从行为与结果关系看,正强化、负强化、回避等都将导致行为反应的增加,而惩罚导致行为反应频率降低。

三、依据操作式条件反射原理,强化可以分为四种类型

(一)正强化:给予一种好刺激。为了建立一种适应性的行为模式,运用奖励的方式,使这种行为模式重复出现,并保持下来。例如实验中猴子按下某按钮即可以得到食物,将会培养其主动按下按钮。

(二)负强化:去掉一个坏刺激。为引发所希望的行为的出现而设立。例如实验中猴子按下某按钮即可以停止对其喷水,将会培养其主动按下按钮。

(三)正惩罚:施加一个坏刺激。这是当不适当的行为出现时,给予处罚的一种方法。例如实验中猴子不小心碰到某个按钮会遭到轻微电击,将会使其避免碰到此按钮。

(四)负惩罚:去掉一个好刺激。这种惩罚比之正惩罚更为常用。当不适当的行为出现时,不再给予原有的奖励。例如实验中猴子不小心碰到某个按钮食物会从洞中漏出,将会使其避免碰到此按钮。

负强化的应用

一、在警犬训练中的应用

其实在日常训练中,我们一直在有意或无意地使用负强化方法。例如,在培养犬立科目时,如果“立”的口令下达后犬不立,可用右手向斜上方拉牵引带,同时左手手指向上刺激犬腹部,这时犬会感受到来自脖子和腹部的非条件刺激,对于犬来说这是不舒服的,为了避免这个“坏刺激”再次施加到身上,犬会逐渐主动做出立的动作,训犬员则在犬主动做出动作后立即停止施加刺激。又如扑咬科目中令犬放口,当“放”的口令下达后,犬依然会死死咬住护袖,我们常用向上提拉牵引带、朝耳朵吹气、用木棍按压舌根等方法,这都是在对犬施加一个“坏刺激”,犬为了避免受到刺激会主动形成听到口令后放口的行为,训犬员则立即停止施加刺激。也就是说,训犬员在犬做出正确动作时给予食物等奖励,则属于正强化;而为了防止犬随意扑咬人或随地拣食对其施加的强有力的机械刺激,则属于正惩罚。

二、在训练教学中的应用

在警犬训练教学过程中,也可以参照企业管理方法,对学员实施强化与惩罚,有利于培养学员的训练积极性。让那些训练成绩差的人在队伍前检查自己的不足——这实际是一种正惩罚,那些没有上台的人得到了负强化;让成绩好的人在队伍前带犬示范、谈训练的心得、给予表扬——这是正强化,而那些没有上台的人就受到了负惩罚。这里的负惩罚给学员们提供了努力的方向,且自尊心不会受到影响,因而与正惩罚相比,人们更乐于接受负惩罚。另外,负强化能否发挥激励作用取决于负强化物的性质,如果负强化物具有激励作用,那么负强化就具有激励作用。

使用负强化的注意要点

一、必须与刺激结合起来使用。没有相应的刺激措施,犬逃避刺激的行为就不会出现,行为出现频次更不会逐渐变高,也就不可能形成负强化。

二、必须应用于科目的建立。很显然,负强化和惩罚同样具有积极的教育意义,但要清楚负强化是为了建立某种行为。因此,负强化主要针对犬科目的形成和巩固。

三、负强化如果想收到预期效果,必须建立在客观、一致的情况下。就是无论任何时候,如果犬没做出某行为,对其施加的刺激都是一致的;如果犬做出某行为,则立即撤销对其施加的刺激,这样才能在犬的观念中建立起逃避刺激的反应意识,可以快速帮助犬建立起“行为”与“刺激”之间的因果关系。

(作者单位:公安部警犬技术学校,110034)

(编辑:颜 勤)

猜你喜欢
口令警犬惩罚
警犬是怎样“炼”成的
神的惩罚
高矮胖瘦
Jokes笑话
口 令
惩罚
警犬戈尔吉
警犬集体过生日
好玩的“反口令”游戏
真正的惩罚等