狗狗不聽話?來看看科學家是怎麼訓練實驗動物的(上)

人人都希望家裡的狗狗乖巧懂事,能聽得懂人話。讓它站起來,嗖一聲它就站起來。讓它蹲下,它夾著尾巴立刻就蹲下。

想想就倍有面子。

然而,大多數時候,你在發號施令,狗狗卻一臉無辜地看著你,不知所以然,狗狗當然聽不懂人話。

但你可知道,實驗室裡的老鼠遠不比狗狗聰明,但老鼠卻能乖乖地服從科學家的命令,做一些普通人聽起來就頭暈腦脹的行為學實驗。

狗狗不聽話?來看看科學家是怎麼訓練實驗動物的(上)

大鼠在做壓桿實驗

其實,早在上一世紀,科學家就發展出了一套關於訓練動物行為理論——操作性條件學習。

什麼是操作性條件學習?

操作性條件學習是一種通過獎勵來強化動物行為,懲罰來弱化動物行為的學習模式。這裡的獎勵稱為強化刺激,而懲罰稱為懲罰刺激。

例如,如果大鼠每次踩到感應杆會有食物獎勵,那麼,大鼠的壓桿行為就會得到強化,小鼠會增加壓桿行為。如果大鼠每次踩到感應杆都會遭到電擊,那麼,大鼠肯定會躲著感應杆走。


狗狗不聽話?來看看科學家是怎麼訓練實驗動物的(上)

訓練狗狗做一個動作,對狗狗來說,也是一種操作性條件性學習,需要通過獎勵來強化。

對於操作性條件學習,最常見的行為強化策略為連續強化策略。

連續強化策略

例如大鼠,如果它每一次正確的壓桿都會得到獎勵,那麼,這種強化策略稱為連續強化(Continuous reinforcement)。當實驗動物剛開始學習某一行為時,連續性強化是最快的訓練方法。連續強化會讓動物很快在行為和獎勵之間建立因果關係。

怎麼將連續強化策略運用到你的訓狗大業中呢?其實,狗狗是很希望配合主人的,但在語言不通的情況下,你和它之間缺少一種有效的溝通方式。而給正確的行為以獎勵,是讓狗狗理解你複雜意圖的最高效、最準確的方式,很可能是唯一的方式。

假如,你想訓練狗狗握你的手。

狗狗不聽話?來看看科學家是怎麼訓練實驗動物的(上)

首先要準備好狗狗最愛吃的牛肉。伸出你的右手,用另一隻手將狗狗的前爪放到你的左手裡,然後搖晃握手。之後迅速獎勵狗狗一塊牛肉,越快越好。間隔時間越短,狗狗越能將握手和獎勵聯繫起來。經過一段時間的訓練後,你就會發現,每當你伸出手掌時,狗狗會主動把爪子放進你的手心。因為狗狗知道這樣做會得到最愛吃的牛肉。

狗狗不聽話?來看看科學家是怎麼訓練實驗動物的(上)

需要注意的是,訓練期間,牛肉只能在握手時給狗狗,其他任何時間都不能給。只有這樣,才能讓狗狗在握手和牛肉獎勵之間建立一條清晰的因果鏈。如果在不握手的時間也給狗狗牛肉,狗狗就會迷惑,誤以為其他動作也能獲得牛肉獎勵,這會削弱握手和牛肉之間的因果關係。


狗狗不聽話?來看看科學家是怎麼訓練實驗動物的(上)

但你也不可能每次握手都給狗狗塊肉,太敗家,也失去了訓練狗狗的本意。你的本意是讓狗狗跟你握手,不是餵狗狗吃肉。因此,我們需要在狗狗學會握手後,減少甚至停止獎勵,但仍能讓狗狗保留和你握手的習慣。

幸運的是,科學家早就發展出一系列的間歇強化策略,來穩定和堅固實驗動物的操作性條件反應。

連續強化後,如果正確的行為不再有獎勵,實驗動物的動作就會消退。通常,不到50次的空手套白狼,實驗動物就不再理你。

而採用了間歇強化策略的動物,在獎勵消失後,還會心甘情願地做上千次、甚至上萬次的行為。

什麼樣的強化策略擁有如此強大的魔力呢?下篇文章,我們一起來揭開它神秘的面紗。


分享到:


相關文章: