
管理學所研究的問題歸納起來,不外是如何調控人的行為。然而,人的行為到底是怎樣產生的?行為的機制是什么?弄清這些,對于管理學具有重要意義。但恰恰在這些問題上,學者們爭論得一塌糊涂。針對這些問題,斯金納從科學立場出發,強調人的行為不是由人的內在心理活動來決定的,而是源于外部環境,行為是在環境中各種刺激因素綜合作用下所引起的反應。他指出,從導致人的行為發生的影響變量上來講,人的行為在很大程度上是由環境決定的。在一定意義上,人的行為就是環境的產物。行為與環境之間有著很強的相倚聯系。環境的改變在很大程度上也能改變人的行為,而人的行為又在不斷改變著環境。由此出發,他提出了一種新的理論—操作性條件反射理論。
應答性行為和操作性行為
現代對人類行為的研究,源于俄國著名學者巴甫洛夫的“條件反射”理論。巴甫洛夫在20世紀初,通過對狗的實驗,發現“無條件刺激”和“條件刺激”的銜接會產生出反應的相關性。狗看見肉就會分泌唾液,這是無條件刺激產生的反應。而當肉的出現同另一個新的刺激(如搖鈴)同時發生時,會引起條件反應。經過多次重復,即使沒有肉,一搖鈴也會引起狗的唾液分泌,這就是條件反射。這說明,有機體的行為是外部各種刺激相互作用引起的反應,與心理活動無關。由此,巴甫洛夫奠定了學習機制和強化機制的科學基礎。
之后,美國心理學家華生于1913年發表了《行為主義者眼中的心理學》一文,學界通常認為,這篇文章是行為主義心理學誕生的標志。華生推廣了巴甫洛夫的“刺激-反應”原理,提出人的學習行為具有兩條主要的規律:頻因律與近因律。在華生眼里,心理學必須是嚴格的自然科學式的,不能關注那些不可測量、不可驗證的“內心”,而只能研究可測量、可驗證的行為。
斯金納繼承和發展了巴甫洛夫與華生的研究成果,而且走得更遠。他堅信,人類行為同其他動物的行為沒有本質區別,基于動物的行為研究,所發現的可實驗、可重復的規律同樣可以用到人身上。經過對有機體行為的研究,斯金納認為華生所堅守的“沒有刺激,就沒有反應”的信條是不全面、不準確的,進而提出了“引發反應”與“自發反應”兩個概念。如果是因為某種刺激的出現才發生的行為,就是“引發反應”;如果沒有明顯的外在刺激而自主發生的行為,就是“自發反應”。引發反應是先有刺激后有行為,而自發反應是先有行為后有刺激。之所以要區分這兩種行為反應模式,是因為引發反應不具有可操作性,而自發反應具有可操作性。在這里,“可操作性”是一個十分重要的概念,其準確含義是自控而不是他控。
依據對行為的兩種反應的區別,斯金納提出了人的兩種行為模式:應答性行為和操作性行為。應答性行為是指由特定的、可觀察到的刺激所引起的行為,如巴甫洛夫的狗。操作性行為是指在沒有可觀察到的外部刺激的情境下發生的行為,它是自發的,如斯金納箱中的白鼠和鴿子(見后)。
應答性行為實際上屬于被動行為。它由刺激所控制,刺激的強弱和頻率直接制約著行為的發生概率及其效果。在這個過程中,行為受制于環境,做出行為是為了獲得刺激,這就是工具性條件反射。操作性行為實際上屬于主動行為,它能對環境做出主動適應,是由行為的后果反過來控制下一步行為的。如果行為的后果能產生積極效應,使行為者獲得較大的滿足,那么這種行為就能得到正強化,使得該行為在以后發生的概率增大;如果行為的結果未能使行為者感到滿足或滿足程度不夠,包括使行為者失望,這種行為就得到負強化,行為主體就會自動調節自己的行為,使這種行為在以后發生的可能性降低。
斯金納的這一區分,在激勵理論的發展上具有重要意義。可以說,從他開始,奠定了后來管理理論中X理論和Y理論區分的心理學基礎。
斯金納箱和操作性條件反射
斯金納的操作性反射是針對人的行為的控制而提出的。他認為,人類的行為總有它產生的原因,通過發現和分析這些原因,就可以在一定程度上預測和控制人的行為。因此,只有了解和掌握影響行為的所有變量和原因,才能形成對行為的有效控制。他認為,任何行為的因果鏈都包括三個環節:①從外部對有機體進行的操作,如剝奪飲食;②內部狀態,如饑餓;③行為,如覓食。斯金納認為,當時的心理學試圖從內部狀態即心理感受上尋找行為原因,但是,這種內部狀態是無法用科學加以測量和驗證的,而內部狀態依賴于外部操作,所以,科學的心理學應該避開無法測度的第二環節,直接建立起第一環節和第三環節之間的函數關系。從這種科學思維出發,斯金納強調人的行為是環境的產物,人的行為取決于環境所給予的強化,人們完全可以通過改變環境和運用各種強化手段來改造和控制人的行為。正是在這種科學信念上,斯金納繼承了華生的觀點。華生曾經提出,心理學要徹底摒棄意識、意志之類詞匯,放棄一切對內在心理的猜測,而只對可測量的外顯行為進行研究。盡管華生由于“不愛江山愛美人”,因婚變而離開了學界。但斯金納繼承了他的衣缽,并用“斯金納箱”進行的白鼠實驗,證實了行為可以由外界因素加以塑造。
所謂“斯金納箱”,是一個高約1尺的長方形箱子。它一面是單向玻璃,用來觀察動物而不驚擾它。箱內有照明小燈,并有一根連接著食物臺的杠桿或踏板,當動物按壓杠桿時,它可以得到食物。里面的記錄裝置可以把動物的按壓反應記錄下來。在實驗中,要求排除一切外來刺激,讓動物自由活動。
斯金納箱的實驗,與巴甫洛夫有著明顯不同,它可以全面顯示出動物的學習行為(斯金納自己很少使用“學習”這一詞匯,因為他反感這一詞匯含有的內在性,通常他只用“強化”來表達人們常說的“學習”)。白鼠在箱子內自由活動,會偶然發現按壓杠桿能得到食物,于是,白鼠就可能調正或改變自己的行為。它會再次按壓杠桿,試圖獲得更多的食物。有意思的是,如果調整強化物的提供方式,白鼠的行為也會產生“聰明”的變化。比如,如果按壓杠桿后必須間隔1分鐘才再次供給食物,那么,白鼠在多次重復后,會把自己的行為調整為間隔1分鐘左右才再次按壓杠桿。如果每按壓10次才掉下來一次食物,那么,白鼠也會逐步摸索,形成10次按壓后停下來去取食物的行為慣性。由此可以說明,學習的本質不是刺激的替代或內心的追求,而是反應的改變。顯然,斯金納已經超越了巴甫洛夫的應答式條件反射,進而提出了操作性條件反射。所謂操作性條件反射,不是由外界刺激引起的,而是由主體行為觸發的。只要出現相應的條件,即強化物和行為之間形成了明顯的相倚關系,那么,相應的行為就會出現。斯金納認為,某人之所以產生某一行為,是由于想得到過去同類行為所產生的某種結果,而不能說是由于想得到該行為將要產生的結果。這話聽著拗口,但不這樣說就弄不清兩種條件反射的差別。歸根到底,操作性行為最明顯的特征是自發的,而不是誘發的。
那么,這種操作性行為能否得到維持,維持的時間長短,就成為激勵重要內容。斯金納認為,這取決于行為結果。想要一種行為長久維持下去,就必須給這個行為予以強化。換句話說,就是要使行為者感覺到這個行為是與一定的強化物相聯系的。如果自己想要得到這種強化物,或者通過這種強化物來獲得別的東西,從而使自己的需求得到滿足,就必須做出這種行為。反之,則要避免這種行為。可見,只有把行為與一定的強化聯系起來,才能達到預定的目的。這種聯系就是強化與反應之間的相倚性聯系。
對行為的強化是通過強化物來起作用的,要選擇適當的強化物就需要辨明哪種事物能對行為產生有效的作用。如果某種東西在使用前和使用后能夠觀察到反應頻率的變化,這種東西就具有強化作用。人的行為是一個“習得”的過程。在這個過程中,如果沒有一定的強化激勵來暗示或明示這種行為是否正確,那么行為者就沒有評判標準。當某種強化物在行為者行為發生后給予相應的激勵刺激,那么行為者就會認識到自己行為能帶來什么樣的后果,進而決定是否需要維持下去。偶然一次的激勵,不能形成相倚性聯系。只有行為結果出現后能得到持續(或遞增或遞減或隨機或間隔,隨機和間隔也是持續的表現方式)的強化,如此反復,行為就會與強化物形成緊密的相倚性聯系。這種聯系的強弱會影響以后行為維持的程度和時間的長短。相倚性聯系越強,則行為維持的程度越強,時間越長;相倚性聯系越弱,則行為維持的程度越弱,時間越短。
反射的強化
人類的行為,多數是經過強化而形成的操作性行為。也就是說,行為是可塑的。斯金納把行為的可塑性作為他研究的依據,行為既然有可塑性,也就是說可以促使某種行為發生,或者抵制某種行為出現,這種愿望的實現恰恰是通過強化作用來實現的。與以往的理論不同處在于,斯金納強調,強化作用不是取決于強化物的有無或大小,而是取決于強化物和行為的聯系。相倚性聯系的建立是強化不斷延續的結果。當一種行為發生后帶來了強化物,最初的強化刺激就形成了。只要這種行為和強化多次重復,就能形成分辨性刺激,行為主體會自行區分相倚性聯系。例如,微笑意味著贊許,而皺眉意味著異議,這種判斷就是來自于經驗歸納的分辨性刺激。一旦行為主體認知到了相倚性聯系,那么這種行為的可操作性就已經建立了。隨后,可以通過控制強化的強度和頻率來調節行為。假如這種行為是強化實施者所期望的行為,那么通過運用恰當的強化物,這種行為就會得到強化,從而導致這種行為出現的概率增大;反之,假如這種行為不是強化實施者所期望的行為,那么通過不同的強化物,這種行為會受到負強化,從而導致這種行為發生的概率降低,甚至為零。
依據這個原理,斯金納認為人的行為是可以塑造的,而其塑造手段是通過強化來進行的。強化的效果,要受強化物種類的選擇、強化方式的選擇、強化程序的安排等因素影響。要使行為發生的概率增加,可以通過正強化物,使行為者得到這種行為的相應收益,使自己需求得以滿足;反之,要使行為發生的概率減少,則可通過相應的負強化物來實現。
斯金納還指出,如果一個已經通過條件化而增強的操作性活動發生之后,卻沒有后續強化物出現,那么這種操作性活動就會削弱。當強化不再伴隨時,反應發生的頻率會逐步降低,這就是“操作的消退”。操作的消退比操作性條件反射的形成慢得多。它表現為一個過程,即一個已經習得的行為并不是隨著強化的停止而馬上終止,而是繼續反應一段時間,最終趨于消失。消退的時間長短和強度大小,則與形成這一反應本身力量的強弱成正比。如果原來反應非常牢固,那么消退的時間較長,強度較大;反之時間較短,強度較小。從這一意義上說,消退狀態是對強化作用的反向測量方式。此外,要使消退的行為重新恢復原來的反應概率,可以通過強化來降低消退,恢復甚至提高反應行為。這一看起來枯燥甚至有點簡單的實驗研究,恰恰構成了激勵理論最基礎的理論平臺。