劉 凡
江蘇省泰州市公安局刑偵支隊,江蘇 泰州 225300
論強化在警犬訓練中的作用
劉 凡
江蘇省泰州市公安局刑偵支隊,江蘇 泰州 225300
在警犬訓練過程中,強化既可以作為警犬日復一日的與自然環境和社會環境相互作用的結果自然發生,也可以作為改變警犬行為的矯正訓練的一部分,通過人為的計劃而發生。強化的塑造和保持作用將會使警犬的個體優勢更加鞏固和突出。同時在適當的時機利用強化的方法,使警犬訓練的效果明顯提高。本文主要通過四個方面闡述強化在警犬訓練中的作用。
強化;警犬訓練;作用
許多科學家都對強化進行過論述,如蘇爾譯——阿薩羅夫和邁耶等,他們對強化對人類行為構成的自然影響和對多種人類行為影響所起的決定作用都有深刻、系統、全面的研究。但是,強化原理最初的建立是利用動物實驗的結果,這就決定了它對警犬訓練的適應性。就警犬訓練而言,強化的定義應該是:緊隨著警犬的某一具體行為的發生,并會對這個行為將來在類似的環境中再次出現可能性加強的一個直接刺激結果。例如:在撲咬訓練中,警犬吠叫使助訓員逃跑,助訓員逃跑是對犬的直接刺激,而助訓員逃跑這一結果又直接強化了犬,會激發犬的兇猛性和對人的仇視性。
強化可分為負強化和正強化,它們都是經警犬的行為結果出現的,都有增強警犬行為再次出現的可能性。二者之間的區別是:正強化是隨著警犬這個行為出現了刺激的增加或刺激強度的增加,而負強化是隨著警犬的這個行為出現了刺激的轉移或刺激強度的降低,其結果都是導致警犬的這個行為的增加。例如,當警犬做出某一正確行為時,訓導員給犬銜取物品的強化,就是對警犬這種行為的正強化;而在訓練警犬搜索物品時,訓導員將警犬急于獲得的物品假拋出去,就是對警犬迫切獲得物品的負強化。
無論是正強化還是負強化對警犬行為的形成和改變都起著至關重要的作用。對任何一種刺激,在我們還沒有觀察到它的效果之前,我們都不能對它起是正強化還是負強化給予簡單的判斷。同時,也不能以日常生活中狹隘的意思去理解強化的“正”和“負”,關鍵是依據強化的效果而言。對強化的正確把握與理解,利于警犬訓導員在警犬訓練中正確運用強化的方法和手段,提高警犬訓練的效率。
強化有兩種基本功能,一是使犬的某些良好行為長久保持;二是使犬的某些不良行為得以消除(即負強化),負強化強度不夠,犬的不良行為不但不會消除,反而還會發展成痼癖。例如當犬咬牽引帶時,訓導員敲擊犬嘴,想制止它咬牽引帶的行為,但由于敲擊力量小,不能使犬停止撕咬,這時犬可能認為訓導員是在鼓勵它,此時訓導員對犬的負強化強度不夠,反而鼓勵了犬這種不良行為的發生。
從強化的兩個基本功能可以看出,強化在訓練中的重要性。在我們訓練過程中經常對犬的不規范動作進行糾正,過多的糾正時間上對犬是一種負強化,當犬在訓導員糾正后對犬不作任何獎勵,或者反復實施同一種刺激而絲毫沒有強化的意思,犬的反應會消失,甚至變得被動,例如:我在訓練犬隨行時,隨行過程中令犬“坐”,犬坐姿不正確,頭部靠里,此時,我對犬的不規范動作進行糾正,方法是當發出“靠”口令同時將犬臀部向左下側敲擊,這樣重復了幾次,當隨行中再令犬“坐”時,犬馬上逃離我,那正是因為過多的糾正對犬實際上實施了負強化,而沒有對犬進行獎勵強化。但這種犬的反應的消失不會是持久的,犬產生了抑制,訓導員可以更換訓練地點、訓練物品等,目的是使犬產生的抑制在較為緩和的環境中將抑制消退,前面所說的隨行訓練中,訓練實際上是給了犬的間接性負強化,我們可以通過在同一地點的長時間反復訓練就能使原來的抑制消退。由此可見,訓導員應正確認識和理解強化的重要性,并積極投入到實際訓練中有效運用。
警犬的行為發生與強化結果之間的時間間隔直接決定強化的最終效果,一個結果要成為有效的強化刺激,應該在行為發生之后立即發生,如果反應和結果之間間隔過長,那么強化也就不會產生效果。本人曾經在訓練犬鑒別時,由于訓導員和助訓員的原因,連續三次使犬在正確反應后相隔3-5分鐘才獎勵,而獎勵時犬正在啃咬拖布,當下一次帶犬進入鑒別室時,犬對鑒別罐沒有興趣,只是亂興奮,當本人令犬嗅嗅源后,犬不進入形式,直接找拖布撕咬。由此可見,獎勵強化的時機對犬強化效果有著直接的影響。
強化的強度大小對警犬影響很大,當犬進行了大強度訓練后,我們要選擇強化強度大的方法來進行獎勵強化。例如在追蹤訓練中,犬追蹤了很長距離,在大強度訓練后,我們可以在終點放上犬最喜歡的物品,讓犬自己找到銜取,進行直接獎勵,隨后扶拍犬或令犬吠叫,使其興奮再拋球,同時訓導員發出“好”的口令,使犬在聽覺、皮膚感覺、視覺等方面得到滿足,那么犬在下一次追蹤訓練中會保持積極性。例如,在犬按訓導員口令指揮做出相應的行為,而這一行為的條件反射十分鞏固了,我們就不必大強度的強化獎勵,只需用口令或面部表情等,使犬“明白”這一行為令主人滿意,是正確的就足夠了,同樣達到了強化的效果。
強化的方式沒有固定的模式,在不同的訓練中視條件我們可以選擇不同的強化方式,例如在追蹤訓練中,我們可以在跡線上布設犬喜歡的物品,讓犬在追蹤過程中聯系氣味直接找到物品,讓其自然直接地銜取,滿足犬的銜取占有欲,對犬是一種自然強化,這種強化很及時,能提高犬的工作積極性,又減少了犬的一些不良聯系。比如我們在追蹤過程中,適時時候拋球給犬,久而久之,犬會形成經常抬頭看訓導員,企盼訓導員拋球這種不良聯系。又例如在隨行訓練中,訓導員不能經常往前拋球進行獎勵強化,這樣會使犬形成隨行超前的毛病,我們可以在保持隨行狀態情況下給犬食物獎勵,也可以突然帶犬跑動,進行這種“爆發”式獎勵。總之訓導員應該在不同的訓練中視情況而定,采取最有效的方式進行獎勵強化,這一點尤為重要。
當犬的反應產生出結果,那么反應與結果之間就存在著一致性。作為警犬訓練,不僅要單純地形成反應與結果的一致性,還要形成警犬的行為反應與訓導員的要求的一致性。例如在鑒別訓練中,犬嗅嗅源進入大形式,但犬由于某些因素沒有對氣味成功地分化,但是犬按訓導員要求嗅嗅源,逐個嗅認,整個鑒別形式很好,此時我們也應該給犬以獎勵強化,只是強化的強度可適當把握。
犬與犬之間有著差異,我們的強化應因犬而異,在訓練中確定某一頭警犬用某種方式進行獎勵強化也很重要。比如,犬食欲不強而銜取欲強,在訓練中我們選擇拋物品讓犬銜取的方法比給犬食物更有效。扶拍對許多犬是一種強化刺激,但對有些皮膚敏感的犬撫拍就會起到相反的作用,由于警犬存在個體差異,也就導致了警犬訓練的復雜性,警犬訓練在遵循普遍規律的同時,還要針對每頭犬的情況制定具體的訓練計劃,包括強化手段,采取有效的刺激,不斷強化警犬做出的目標行為,這時的強化帶有明顯的個體特征。
在警犬訓練中,訓導員應靈活運用強化手段,不拘于一種形式。應根據條件刺激的強度來掌握強化刺激的強度,還要根據犬的反應行為結果來運用不同形式的強化手段,過度使用同一種強化方式,沒有新異刺激,會使犬產生超限抑制。
總之,強化是確保警犬的能力在訓練中不斷提高并長久保持的一種有效訓練手段,在警犬訓練中起著極其重要的作用,大量的實踐和事實證明,訓導員只要正確理解強化的概念,根據個體差異通過人為的計劃靈活運用強化手段,同時在適當的時機利用強化的方法,將會使警犬訓練的效果明顯提高。
[1]單軍.全國工作犬學術研討會論文集[M].北京:北京群眾出版社2001:67-77.
[2]南會林.犬行為原理[M].沈陽:東北大學出版社,2011:220-221.
D631.1
A
2095-4379-(2017)36-0246-02
劉凡(1981-),男,內蒙古赤峰人,本科,畢業于中國刑事警察學院警犬技術系,江蘇省泰州市公安局刑偵支隊,助理工程師,研究方向:從事于警犬的訓練與使用的研究以及警犬技術在國內的發展。