于 毅

條件反射理論是警犬訓練基本理論,警犬作業能力培養過程就是若干個條件反射建立和組合過程。加深對條件反射理論的理解將有助于我們提高警犬訓練技術。
巴甫洛夫反射理論主要觀點是:具有生命的個體和它所處的外部條件是相互聯系的。高等生物個體和他們所處的外部世界的所有聯結實質上就是通過神經體系來聯結的。神經體系與外部世界聯結的形式就是反射。反射就是當外部世界和機體內部對生命體產生刺激后,生命個體通過大腦和神經系統產生的應答性反應。其核心思想就是條件反射理論,這一理論亦稱為經典性條件反射理論。
巴甫洛夫條件反射理論的形成來源于研究消化生理的實驗,也稱“搖鈴實驗”。在實驗中,他選擇食物作為非條件刺激,犬吃到食物時會自然地分泌唾液。他又選擇鈴聲作為中性刺激。在實驗中,巴甫洛夫首先讓犬聽到鈴聲,然后立即給它喂食,這時,犬會分泌大量的唾液。反復多次訓練之后,聽到鈴聲后犬就像已經吃到食物一樣,自然地分泌唾液。此時說明條件反射已經形成,原本的中性刺激鈴聲已經成為引起唾液分泌的條件刺激。巴甫洛夫的實驗印證了條件反射的存在,說明它可以替代非條件反射引起個體相同的反應。巴甫洛夫的經典性條件反射實驗以科學實驗的方式給我們揭示了動物行為的學習途徑。一是食物可以使犬流唾液,流唾液是自然的、無法控制的反應,食物是一種非條件刺激;二是鈴聲不會使犬流唾液,鈴聲是一種條件刺激;三是把食物和鈴聲配合起來,使犬學會把這兩者聯系起來;四是即使沒有食物,鈴聲也可以引起犬流唾液。這種將兩個本沒有關聯的事物聯系在一起,就是條件反射的建立過程。
斯金納是操作性條件反射理論的奠基者,斯金納箱實驗最能說明操作性條件反射原理。這一實驗把貓放到一個“問題箱”里,此時貓在本能驅使下就會想方設法逃出去,它會到處沖撞試圖找到出口。最后它可能因某一個偶然性動作而踩踏了1 塊木板,門便通過機關自動打開或者實驗人員按下開關把門打開,于是貓便逃出箱外獲得了自由,即得到了獎勵。如果把逃出的貓再關入“問題箱”,使這一過程不斷重復,貓就能越來越快地從“問題箱”中逃出來,最后貓便能學會把踩踏木板和開門這兩件事聯系起來。此時如果再把貓放入箱中,它就會為了開門而直接去踩踏木板。操作性條件反射就是這樣建立起來的。在此基礎上,我們將動物的這種學習行為進一步延伸,在其中加入某種信號,使動物根據人為發出的信號執行某種行為。例如,訓練動物在聽到蜂鳴器發出聲響的時候去壓桿,起初1 只饑餓的動物是隨機運動的,也許當蜂鳴器發出聲響時它偶然壓了1 次桿,此時食物立刻出現使之得到獎勵。以后,食物的每次都是在這一特定的情況下出現,經過反復練習,動物就建立了對蜂鳴器聲響的條件反射,聽從其指令去壓桿。操作性條件反射建立過程的邏輯關系是:將動物放在某種我們設計的特定的場景中,其在本能驅使下產生自發行為,某種自發行為自動獲得或者人為施與的獎勵,使這種自發行為反復得到強化,這樣,當某種特定的場景再次出現,動物就“學會”了采取其不斷得到強化的那種行為去“解決問題”,條件反射就此建立。
在經典性條件反射中,條件刺激與非條件刺激(強化物)幾乎同時出現,經過反復練習,使這兩個刺激暫時建立神經聯系,當第一個刺激出現時就能引發與第二個刺激一樣的反應。例如,將鈴聲(條件刺激)與食物(非條件刺激)反復結合共同作用于犬,反復練習,鈴聲就能引發犬產生流唾液的反應。
在操作性條件反射中,當動物的某一個反應發生后,緊接著對其施加特定形式的刺激,這種刺激分為獎勵和懲罰兩種性質,即正、負強化。如果動物得到的是獎勵性質的刺激(正強化),這種反應將趨向于再次發生;如果動物得到的是懲罰性質的刺激(負強化),反應將逐漸弱化,直至不再發生。獎勵或懲罰是伴隨條件反應的發生而出現的,反應決定強化,無反應就無強化。
操作性條件反射同經典性條件反射的區別在于,前者沒有所謂的條件刺激,也不是靠條件刺激與非條件刺激相結合而形成條件反射,它的形成是動物的一種隨意活動,而且是本能行為的結果。動物在本能驅使下不斷去嘗試,因此是一種“試錯式”學習。在操作性條件反射建立過程中,動物具有“主動學習”的特點。
犬體不健康時,建立經典性條件反射時,當非條件刺激施加于犬體,可能影響犬做出相應的應答性行為。建立操作性條件反射時,當某種情境出現時,犬可能不出現我們預期的行為,強化手段無法實施,條件反射將無法建立。因此,我們應加強對犬的飼養管理,當犬患有疾病時應及時治療,消除犬的病痛才能進行訓練。
如果犬因疲倦、睡眠不足等原因,導致頭腦不清醒,將影響條件刺激與非條件刺激、犬主動行為與強化之間結合的效果,導致犬學習效率低下。因此,我們應避免過度、長時間的訓練。每天分多次、短時間地開展訓練,是避免過度訓練的有效方法。
安靜的環境是訓練必要的條件。訓練中干擾因素太多將導致犬無法集中精力,甚至對干擾刺激產生反應,亦稱產生“外抑制”,將嚴重影響訓練效果。一方面我們應堅持對犬進行環境鍛煉,以消除犬對訓練、使用環境中常見刺激的過激反應,以至不再反應;另一方面,要避免在過于復雜的環境中進行訓練,尤其是在條件反射建立初期。
與警犬訓練密切相關,應重點利用的非條件反射主要有:食物反射、防御反射、探求反射、獵取反射、姿勢反射、自由反射、性反射。條件反射建立過程中,犬相應的非條件反射神經活動應處于興奮狀態,警犬訓練才能取得預期效果。例如,利用食物反射誘導犬做出某種作業行為,或者用食物獎勵犬的某種作業行為,將食物作為正強化的手段,以建立某種條件反射時,如果剛給犬喂食,其處于飽腹狀態,或者犬患病導致食欲不振,食物反射的神經活動處于抑制狀態,利用食物來建立條件反射就失去了原有的基礎,條件反射將難以建立。
在經典性條件反射建立過程中,要注意非條件刺激和條件刺激的強度。強刺激引起強反應,弱刺激引起弱反應,但超過犬生理承受范圍的強刺激將引起超限抑制。例如,長時間單調重復訓練將使犬處于抑制狀態,服從科目訓練中對犬施加的機械刺激過強也將導致犬處于抑制狀態等。值得注意的是,在建立條件反射時,非條件刺激強度要大于條件刺激。在操作性條件反射建立過程中,對犬施加的正、負強化刺激也要注意強度,刺激強度的大小要因“犬”制宜,尤其是正強化刺激不應太弱,負強化刺激不能過強,否則將影響訓練效果。
巴普洛夫在研究條件反射建立過程中發現,條件刺激先于非條件刺激出現的效果最佳,同時出現的效果次之,而其他結合方式則很難建立條件反射。在警犬訓練中,我們應先對犬發出條件刺激——口令、手勢等,再對犬施加非條件刺激。例如,“坐”科目訓練,先對犬下達“坐”的口令、手勢,再按壓犬的腰角、提拉脖圈等,使犬做出“坐”的動作,兩個刺激之間一般間隔幾秒鐘,但口令、手勢一定要在前。
條件反射的建立過程就是學習的過程,學習就離不開反復練習。經典性條件反射要將條件刺激與非條件刺激反復結合,操作性條件反射要將犬的某種自發行為與訓導員施加的正負強化刺激反復結合。結合的次數因科目難度和犬的個體差異有所不同,從數十次到成百上千次不等。值得注意的是,條件反射建立后也不是一勞永逸的,如果條件刺激頻頻出現而其后沒有非條件刺激出現,那么這兩種刺激之間的聯系就會逐漸消失。例如,拿犬看到燈光就分泌唾液這一條件反射來說,如果不是不斷地同時給予犬食物刺激,條件反射就會慢慢衰退,這種現象就叫消退。因此,犬的條件反射形成后,還要經常性地進行復習鞏固,這也就是我們要堅持開展日常訓練,定期進行復訓的原因。