張 松
響片訓練在警犬訓練中存在很多誤區(qū),不時可以聽到各種關于響片及響片訓練的表述,諸如“響片一響就表示‘好’的意思!”“響片響一聲意思是坐下,響兩聲意思是臥……”,給人的感覺響片訓練簡單但又神秘。近20多年來,不難發(fā)現(xiàn)國內外民間的競技犬訓練中響片訓練已逐漸成為一個通用的手段,某種程度上該體系推動著訓練技術和水平的發(fā)展,美國犬業(yè)公司Leerburg放言“八九十年代的競技犬優(yōu)勝者如果放到現(xiàn)在的頂尖比賽中無法立足,原因在于現(xiàn)在的頂尖賽犬都使用了標記訓練(是以響片訓練為代表對特定行為進行標記的訓練體系)”。每年公安部警犬技術訪問團到歐洲考察時,也發(fā)現(xiàn)巴伐利亞、斯圖加特等警犬學校都在嘗試使用響片用于血跡搜索、搜毒搜爆等科目訓練。

圖1 訓練理論及響片訓練發(fā)展圖
本文通過筆者近3年的使用經歷,結合多方研究、梳理和思考,旨在從響片訓練發(fā)展的背景、原理、方法與技巧進行一個系統(tǒng)闡述和解讀,與警犬訓練人員和犬競技運動訓練者分享,期待這項有效的訓練能引入到日常訓練中,提高警犬訓練的效率和質量。
1901年,通過響鈴唾液分泌試驗,俄國巴普洛夫創(chuàng)立了經典條件反射理論,奠定了以被動應答為訓練基礎的訓練體系;1936年,美國斯金納建立操作性條件反射學說,在桑代克的試錯學習理論的基礎上,完善了通過強化行為結果而促進行為發(fā)生頻率的學習方式;在20世紀40年代中期,響片成為實驗商業(yè)化的產物,但并未得到廣泛推廣;六七十年代在海洋動物的訓練中,響片類標記訓練得到巨大成功;90年代,海豚訓練師凱倫·普瑞爾(Karen Pryor)出版了《不要斃了你的犬》(Don’t Shoot Your Dog)一書,在美國開始興起了響片在犬訓練領域的各種嘗試,并得到廣泛運用;近年來,在歐洲工作犬訓練比賽、警(軍)犬訓練中,響片訓練也體現(xiàn)出其獨特的效果。
(一)操作性條件反射原理,即得到強化的行為發(fā)生的幾率會增加。響片作為一種中性信號起到人犬之間的交流橋梁的作用,它建立了一個溝通渠道,通過及時標記需要的行為,給犬一個承諾“這是我喜歡的行為,一會兒我會給予獎勵”,這種標記可以不受人犬位置、獎勵時機的限制,做到及時捕捉、延后獎勵。由于犬對于不能及時得到獎勵的行為無法聯(lián)系獎勵與行為之間的關系,即所謂的“1/2秒原理”,響片的使用無疑是最好的溝通方式,便捷、準確、易操作。
(二)強化理論:強化就是通過強化物增強某種行為的過程,而強化物就是增加反應可能性的任何刺激。斯金納把強化分成積極強化和消極強化兩種(見圖2)。積極強化(正強化)是獲得強化物以加強某個反應;消極強化(負強化)是去掉可厭的刺激物,是由于刺激的退出而加強了那個行為。強化理論的實質就是“追求快樂,逃避痛苦!”其中,正強化的代表為響片訓練,負強化的代表為電脖圈、刺釘脖圈等訓練(見圖3),比較形象的描述是“正強化在前面引導、負強化在后面推動”。在訓練中,完全依靠正強化,犬會缺乏速度和精準度,而過度使用負強化,則會使犬由于頻繁或長時間處于壓力狀態(tài),影響其信心和情緒,通常要根據(jù)訓練科目、訓練進度、犬的個體素質和能力進行針對性地科學運用。

圖2 正負強化類別

圖3 訓練中的正負強化,在使用中不可濫用,要根據(jù)犬的實際系統(tǒng)性地引入訓練系統(tǒng)。
響片訓練就是一種標示訓練,除了使用響片,還可以使用一些特定的信號,比如語言信號、光線信號、其它聲音信號(如笛哨等特定響聲)等,只要這些信號每次出現(xiàn)都是一致的,并且不會與平常犬碰到的信號混淆,便可以取到一樣的標記行為的效果。可以說,標示訓練是50多年來最有效率的訓練系統(tǒng),它是一套黑白分明的居于正向強化的交流方法。這套訓練系統(tǒng)提供訓練者一個主動告訴犬喜歡“此刻”所為的手段,并提供非懲罰方法讓犬知道“此刻”所為不喜歡。這種訓練可以用于8周的幼犬,也可對付8歲頑固老犬,對完全沒訓練過的犬可以,需要重新訓練亦可,對貓、兔子、馬、鸚鵡等并且多數(shù)動物和鳥類都可以。下面以響片為例介紹一下具體的操作方法。
1、充電。這個訓練過程主要是讓犬建立對響片“咔嗒”聲的條件反射。具體做法是每次按響片時就給犬強化物(食物、玩具、撫拍、游戲等),這個階段,要先讓犬注意到主人,而且每按一次便立即給予強化。當犬聽到咔嗒聲出現(xiàn)停頓,看主人,找強化物,充電便基本完成,可以進入下一階段。
2、行為標記。對于需要的行為要用響片進行及時、準確的標記,犬的行為可以通過誘導、捕捉、引導桿、目標物等方式促成,比如使用食物在犬頭上慢慢升高誘導犬坐下,或者讓犬由于探求去碰撞目標物(勺子、卡片等),或者耐心等待犬做出某個行為時及時按響片進行標記。
3、塑形。通過擬定訓練分步驟訓練計劃,將訓練進行細化,逐漸提高標記訓練的標準,使犬逐漸趨近要達成的目標(見圖4)。例如:讓犬坐下,可以分解為身體后肢下傾、后肢著地、雙后肢正確著地、規(guī)范坐下幾個步驟耐心進行,響片標記逐漸提高行為要求標準,使犬最終完成標準、規(guī)范的坐下行為。在響片訓練中,口令在犬的特定行為形成以后才加入,通過幾次便可形成口令和行為的條件反射。
4、行為鏈接。訓練中往往需要犬做出較為復雜的行為動作,比如在追蹤中,嗅嗅源、找線、上線、把線、示警,是由一系列行為組成的,響片訓練中可以將各個行為進行細化分解,分別訓練,最后再將這些行為鏈接在一起。在敏捷性運動和藝術人犬舞表演中,更需要將最終要達成的非常復雜的綜合行為進行分解細化,分別標記訓練,最后再進行行為鏈接。

圖4 在訓練中將訓練內容進行細化分解,并按照進度對正確行為進行標記。圖中為筆者在日常訓練和教學中使用響片進行行為標志。
1、食物獎勵。食物在訓練中利于犬安靜地完成任務。使用中,食物必須要足夠大,這樣可以激發(fā)犬需要更多,但也不能過大,使犬花太多的時間進食。食物要軟,不能是易碎的,碎食物會掉到地面上(見圖5)。在訓練中使用不同等級的食物,表現(xiàn)好得到高質量食物,表現(xiàn)一般得到低質量食物(見圖6)。常用獎食種類有:硬奶酪、牛肉塊、熟豬肝塊、雞肉干、香腸、犬飼料等。在犬每日食物攝取量中要扣除獎食的量。
2、物品獎勵。在響片訓練中,可以使用犬喜歡的物品(玩具)進行獎勵,但需要首先能滿足以下條件,否則要謹慎使用:(1)犬不是獨自玩耍,而是跟主人一起玩耍才有趣;(2)每次主人下口令“放”,犬必須能做到立即吐出物品;(3)如果物品拋出,犬必須能夠將其銜回送給主人,邀請繼續(xù)游戲。常用的玩具包括:膠球、Kong(空心膠制玩具)、布條、布帶、塑料棒、麻棒、其他犬玩具等,在獎勵中,也可根據(jù)犬的喜好程度分等級使用。
1、響片發(fā)出咔嗒聲的時機至關緊要,要在所需行為發(fā)生的瞬間。

圖5 食物的大小要合適,不要使用碎食物。

圖6 在日常和犬接觸過程中,測試犬的食物喜好等級,有助于訓練中針對性的使用。
2、每次對特定行為進行標記時只能按一次響片,避免犬出現(xiàn)混淆。
3、在使用響片之前一定要先想好自己的位置和動作,才能準確做好眼手配合。
4、在訓練初期,每次按響片都要及時給犬獎勵,可以逐漸延時給予獎勵,在完成復雜動作時,可以標記幾個行為后,一起給予獎勵。
5、標記時機一定要準確,因此在使用響片之前最好做一些眼手配合的練習,比如將眨眼、手掌開合、網(wǎng)球彈擊等與響片按壓時機結合,這些都是容易操作,便于提高眼手配合的練習。
6、要合理安排獎勵,根據(jù)犬的喜好程度,將獎勵分等級,做到完成難度越高,質量越高,獎勵等級也越高。
7、不能將響片作為獎勵信號來使用,也不能將響片作為口令信號來使用,響片起到的是一個客觀的、無情緒的標記信號,隨意使用響片只會造成犬訓練的混亂。
8、如果使用目標桿等引導定位輔助,要逐漸消除引導,使犬根據(jù)訓導員的手勢或口令做出相應行為。響片的使用也是如此,當犬完成某一行為的塑造,響片就可以不再使用或者間接使用。
9、對于犬出現(xiàn)的其他非需要行為,采用非糾正式的消退,即忽視或者說“NO”(不對)。如在訓練搜爆中,犬出現(xiàn)吠叫、抓扒等示警行為時不要強化,忽略其行為發(fā)生,等到犬出現(xiàn)坐、臥、注視等安靜的示警反應時,立即使用響片標記,進行獎勵。這樣,犬的其他被忽略行為就會逐漸消退,而安靜示警反應就會得到強化。