犬的学习方式是多种多样的,其中条件反射是最主要的学习方式。条件反射形成的神经机制是大脑皮层发生暂时神经联系的结果。条件反射建立之前,存在着结构上的联系,但在机能上并未接通,也就是没有神经冲动在这种联系上形成规律性的通过。只有当不同的两种或几种刺激重复而固定地作用于犬,并在大脑皮层的不同部位共同引起相应的兴奋活动时,才会使相关的神经元之间在机能上建立起暂时性的神经联系,即形成条件反射。
兴奋性的条件反射分为经典式条件反射和操作式条件反射两种。
1. 经典式条件反射
经典式条件反射是将已经形成的信号刺激与陌生的信号刺激结合起来,使这种陌生的信号刺激能获得与已经形成的信号刺激相同的作用。
有经验的犬主人会在对小犬进行第一次免疫注射时喂饲其酵母味的药片以分散其注意力。在犬医院里,偶尔能看到一只犬在较短时间内重复地被喂饲维生素片,其结果就是这些犬进来,看到兽医就流口水。毫无疑问,犬在这个过程中已经执行了巴甫洛夫的经典条件反射,流出了口水。
俄国生理学家巴甫洛夫在他的生理研究实验中,以犬为对象,采用一种原来与犬无关的条件刺激(如灯光),与另一种对犬有生物学意义的非条件刺激(如食物)结合作用,引起犬出现食物反应。经过多次重复结合后,只要单独使用灯光刺激而不用再结合食物,同样能引起食物反应,这说明灯光对犬已具有食物信号意义。犬的这种行为的产生,是在一定条件下通过学习获得的经验,所以把它称为条件反射。它的反应程序是刺激在前,行为在后,行为是刺激的结果,犬对刺激的反应是既定的。它的联系表现为:刺激—动作—强化—条件信号活动。
2. 操作式条件反射
一只犬追击一辆跑过的汽车,其结果是“车被赶走”了,在这个过程中完成了行为—反应—强化的过程。这种学习方法是由斯金纳于20世纪30年代后期总结得出的,具体的实验是在特殊设计的实验箱中小鼠被训练动作以得到食物。
动物常以自发的试探性活动与偶然获得正确或错误的行为效果相联系进行学习。例如,关在犬舍内的犬,由于它的活动偶然触及犬舍内的饮水开关而获得了饮水,以后便学会了用扳动开关的行为获得饮水。这样,操作杠杆之类的条件性行为反应,就成了借以获得奖励强化的工具。因此,把它叫做操作式条件反射,也有称之为工具条件反射的。
根据某一训练课目的要求,利用能诱使犬做出相应动作的机会,当犬的适宜行为一出现,就立即给以奖励强化。如为使犬学会按指令吠叫的课目,就应创造能促使犬吠叫的机会和条件,每当犬发声吠叫时,就一边给指令一边给奖励。即使犬叫的声音不大,只要有表示,就应鼓励。如此反复练习,随着学习的进展,强化作用能导致学习的不断进步和动作的熟练,直至犬完全学会按指令吠叫。
这种学习方式较为实用,也有利于调动犬主动学习的积极性。它的反应程序是行为在前,效果在后,行为的后果又能成为以后行为的原因。它的联系表现为:自发动作—强化—冲动—条件性主动活动。
3. 条件反射的建立
建立条件反射需要具有一定的条件,否则,暂时神经联系就不能形成。其基本条件有如下五项:
①建立条件反射时,要将所采用的条件刺激与相应的非条件刺激结合起来作用于犬,而且条件刺激的作用先于非条件刺激的作用,并要重复结合,连续作用,直至条件反射形成。其中,结合的间隔时间不同,会引起不同的反应效果。同时结合所形成的条件反射,叫做同时性条件反射;延时结合所形成的条件反射,叫做延时性条件反射。
②建立条件反射时,要正确掌握所使用的刺激强度。刺激强度在相对比较的情况下,强刺激引起强反应,弱刺激引起弱反应,超强的(阈限上的)或过弱的(阈限下的)刺激都将引起抑制。这在生理学上称为“强度相关法则”。就条件刺激与非条件刺激两者的强度对比而言,在建立条件反射时,应掌握使用非条件刺激的强度大于条件刺激的强度。
③建立条件反射时,犬体要健康,而且大脑皮层应处于觉醒状态。因为犬体的任何病理刺激和大脑的不清醒,都将影响暂时神经联系的接通,阻碍条件反射的形成。
④建立条件反射时,相关的非条件反射中枢应处于相当的兴奋状态。犬如缺乏非条件反射活动的足够兴奋性,就失去了应有的基础,条件反射就难以建立。
⑤建立条件反射时,犬的大脑皮层不应被其他不相干的活动占据。外界环境中作用于犬的各种刺激,都可能干扰犬的学习注意力,抑制条件反射活动。所以在训练初期要选择比较清静的环境,尽量避免和减少不利因素的影响。来自犬体内部的某些偶然活动(如膀胱膨胀、直肠充便、性冲动等),也同样能占据大脑皮层,阻碍条件反射的形成。
4. 强化规律
犬是在持续地使用操作式条件反射的方法学习。当动作受到频繁奖励时它们学习的速度就变快。奖励是多种多样的。当犬在花园栅栏下挖坑并能逃跑到街道上去时,它们就被街道上的新鲜事物所奖励,这是一生中探索和发现的过程,是一种乐趣。它们继续这样做,这种行为得到了加强。
食物奖励、赞扬或抚拍犬是简便的奖励方法。
犬的乐趣并不相同。对于一些犬,练习是一件快乐的事;对另外一些犬,食物更受欢迎。我们知道了这些,就应该在训练中采取较多的奖励犬的办法—食物、赞扬或接触犬。
食物和物理接触被称为主要的强化,这两种都是很有效的奖励,而口头的赞扬就稍差些,可以称为次奖励。在操作式反射中,最好首先使用主强化,在后来的训练中再使用次强化。最好的例子就是教小犬坐,食物对于它来说是最好的奖励,这是主强化。将食物盆置于其头的上方,这样会引导它形成“坐”的姿势。一旦它形成了这种姿势,就将食物给它,它会很快就学会当看到食盆时就坐下,而如果每次下口令“坐”时给它食物,这种行为就是第二强化。很快,只需要说“坐”它就会顺从地坐下,而不需要原来的主强化。
强化的时机、强度与时间间隔都对学习行为有重要影响。强化一定要在动作发生后的第一时间,如果是在训练结束时再统一给强化是没有意义的。对于犬的思维来说,想要强化某一动作其奖励一定要是“即时的”。奖励的强度同样重要。如果奖励是强的,但是犬所感受到的信息混乱(不清晰)也无济于事。在动物诊所里经常会发现这种现象,主人经常使用鼓励的办法来安抚其犬不要乱叫,但效果往往适得其反,这是因为此时对犬的安抚对于犬的神经过程来讲是一种鼓励,他们通过说“好犬”或喂犬美味的食物来平静犬的乱叫行为。在这种情况下,犬因害怕而乱叫,这种“安抚”行为无异于高度地强化犬的这种因为害怕而引起的吠叫。
在犬的成长过程中,对犬的行为强化的节奏运用也很重要。对于某一特定行为持续的和“必然的”强化会使这一行为很快得到巩固。而对于那些时断时续地得到强化的行为来说,形成就比较难,但一旦形成也较难被忘记。多数的被犬牢记的行为,一般都是在形成的初期得到相当频繁的强化,而在后期得到间隔性的强化而形成的。比如一只小犬,可能被允许在它主人的房间睡觉,而且相处得很好。我认为这么做是正确的,当它长大到需要在别的地方自己睡觉时,它以前的行为方式已经被强化过,它已经很乐意如此,现在却需要改变它。如果你是一个心软的人,偶尔会不忍心让它在外面去睡,就允许它在你的房间里睡。这样做你就是间歇性地强化了它的行为,这就会导致你较难使其消退过程完成。同样的道理可以应用于在餐桌边捡食的犬,正如前面提到的,间歇地在桌边得到食物强化的犬是很难停止这种乞食行为的,甚至会比只是正常地在桌边得到食物的犬更难消退。最难消退的行为就是那些偶尔得到的、在不规律的强化中形成的行为。在与你的犬神经活动的较量中,尽管都作出最长时间的坚持,但往往是通过间隔强化而形成某种习惯的犬会获胜。
5. 使用奖励
在犬的思维中,奖励是有条件的。越是有“价值”的奖励就越对其学习速度有正面的影响。这也就是说,只要有条件,特别是在犬的青少年期,我们应该节制使用最为有效的奖励,而当想使其形成某种行为时,再用最为有效的方法比如食物、接触等,以引导其形成我们希望的行为。我们也应该使用尽量多的方法来奖励某种我们希望其出现的行为。
①食物。是最为有效的强化物,要谨慎使用。
②接触。对于一只社会化良好的犬来说,接触是一种有着很好潜力的奖励方法,应该对其进行广泛而谨慎的使用。之所以要谨慎地使用主要是因为不同的接触对于犬来说有着不同的意味。轻轻的抚拍对于犬来说起到平静的作用,但长时间的抚拍,这种抚拍使人得到一种安慰的满足,但对犬来说却意味着“统治”,会使犬形成对人的长期依赖。粗犷或粗野一些的接触会使犬变得易于兴奋,但对于犬的学习却没有直接的奖励作用。
③声音。赞扬是一种非常好的第二强化因素。但必须在开始使用时与一种主要的强化因素相结合,也就是食物或接触。声音的音调(而不是实际的词)是很重要的。一种放松的音调应该被用来做积极的强化,而一种嘶哑或难听的声音用做负面或惩罚刺激。
④玩。身体的活动是一种很好的强化,但因为这种过程会使犬太兴奋而变得不太容易控制。
⑤主人的注意。作为一个群体的领导,至少是一个群体的一员,人对于犬的注意就构成了对犬的强化。对于犬吠的一声大喊构成了对犬吠叫的潜在强化,当犬需要走进走出时,它抓门时你去开门也是对它的一种反馈。如前面所说的,这种间隔的强化会使其消退变得很困难。
咬嚼物品也是某些犬的乐趣
⑥咀嚼。犬口的活动,比如咀嚼玩具(也可能是地毯或家具等)对于犬唤起自己的兴趣等有潜在的作用。排尿和排便也会产生同样的效果。
⑦避免生理或心理上不舒服是一种隐性的奖励,这可以看成是一种训练时使用的野蛮办法。除非在训练中出现了极为特殊的情况,否则不应该使用身体惩罚。电击脖圈及高频率音响是高科技的负强化用品。惩罚并不总是有效的,但对于改变犬的思维还是有一定作用的。
犬睡觉的习惯是居家生活的一个重要方面
人很容易识别出犬害怕时的表情
6. 使用惩罚
很多训练者认为,对犬的身体惩罚是随着犬成长起来的、必要的对其负强化的方式。母犬确实对小犬实施体罚,但正如研究表明的那样,其结果是犬社群能力低下、衔取及社交能力较差。
在群体中随着个体的关系演进,身体惩罚也在持续,但所有的惩罚都与统治有关,而与其他的吠叫、排尿、挖掘、探求和排便无关。在狼群体中自然惩罚是很严酷的,统治依靠形式上的表现存在,狼很少争斗,但一旦有争斗就是致命的。我们对犬繁殖的干预,使其很多仪式或形式上的避免冲突的行为丧失了。尽管我对于犬的争斗这么少感觉奇怪,它们还是比狼群更频繁地产生争斗,并且使用身体惩罚的办法完成统治的过程、领域和性的争夺及解决竞争者之间的争端。
这种严重的惩罚会使其失利者很迅速地放弃它的行为模式,但这个过程是残酷的、你死我活的争斗。同样,对于我们训练犬来说,物理的惩罚应该是很严重而有效的,只是在某些情况下需要如此。对于操作式条件反射来说,中等的惩罚对于修正其行为是足够的了。
身体惩罚有时对于犬的思维是唯一的办法(比如追逐羊群和咬死羊是一种对犬的强有力的强化,要制止这种行为只有严重的身体惩罚可以奏效)。使用极强的身体惩罚对犬有着极大的不利。如果你直接对犬使用这种惩罚,它就会害怕你,或者对你命令的行为有冲突或有敌意。
对于犬的惩罚的意义在于显示出你的权力,而不是使之产生痛苦。这也是在犬的思维中的认识。犬之间可能进行威吓,它们也能彼此惊吓从而导致害怕。母犬可能不理仔犬的乞食而离开,这种负面的惩罚是一种很得当的方法。
在训练中有四种惩罚方法:
①身体的疼痛。电击脖圈、刺钉脖圈都是利用这一原理。猛拉犬的脖圈也是这样。正如我所说的,物理疼痛只应该使用在极端的如追击羊的行为上。
②威吓。提起犬的颈部,摇晃它或者目不转睛地盯着它看,并说“坏犬”是很有效的威吓方式。命令犬坐下并直盯着它也是一种很好的威吓。
③害怕。直视犬是一种威吓,如果在犬做错事时使用就是一种惩罚了,这通常被称为“厌恶疗法”。你做出某种令犬不快的事,以使犬将其与自己的某种行为相结合从而不再出现类似的行为。摇动装着硬币等的金属罐、打响亮的口哨、高频率的声音等都是害怕惩罚的方法。在与犬相处中要记住,不论我们是不是在教,犬总是在学习。所以不管我们是不是在场,这些刺激的出现都会使其行为改变。当犬偶然走过时,街道上店铺遮阳板的突然关闭都会使犬受到惊吓,并因此不再想走这段路。
④禁闭。这是一种很好的惩罚,基于犬对于社交行为及与其他个体交往的需要。当犬产生错误的行为时,立即让它独处;当犬有不当的行为时,主人离开房间使之孤独,这种惩罚应该持续几分钟。这种惩罚不是报复而是使之明白。这种做法正如母犬为避免仔犬吮乳而离开。这种排斥的方法如果使用得当其效果相当不错。
所有的惩罚一定要使之与其行为相联系。所以应该在犬产生错误行为的同时或随后立即实施。事后的惩罚不仅无益还可能有相反的效果。你可能得到犬“悔过的目光”,而实际上它是害怕你,而不是对错误行为的悔过。惩罚最为有效的使用时间是在错误行为的开始阶段。当犬意欲跳上餐桌前对它瞟一眼就能起到很好的惩罚制止作用,而在之后是没有用的。同样的错误行为连续地出现并且每次都受到应有的惩罚会使其错误的行为很快得到消退。
有一些形式的惩罚可能在你看来是一种约束,而在犬看来可能是一种奖励。打犬对你来说可能是惩罚它的办法,但对于一种耐受性好的犬来说这种接触可能是一种奖励。所以在日常管理犬或训练犬时要确认自己的这些方法是否对该犬有效。
犬对于惩罚的反应也会因为它的思维状态而变化,例如它处于容忍、焦虑、兴奋等不同状态,会有不同的反应。它先前的经验、惩罚的力度和时机、犬与人的统治关系也是影响因素。
惩罚有很严重的副作用,它能导致内脏的反应。一些犬会排尿、排便或排出肛门腺液,哪怕是很轻的惩罚也会导致这种情况。这些都会干扰正在形成或已经形成的学习行为,也会使犬产生挫折感或焦虑感,从而使之产生过度的害怕以及产生攻击反应等。不规律的惩罚会使犬的思维产生一种“学习无助”的情况。犬会表现出无所适从的神经状态,这种情况的产生比想象中来得还容易。比如叫犬的名字并赞扬它,再叫它的名字并惩罚它就会让它产生这种无所适从感。
犬通过观察、经典条件反射和操作条件反射、印记等方法来学习,奖励能强化其行为的形成。不管我们是不是在参与,犬均在学习。在犬的脑中总是有得与失的标准,这种得与失的标准可能受前述诸多因素的影响。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。