摘要:強化理論是當代學習心理學最重要的理論之一,廣義上的強化理論包括桑代克的效果律、斯金納的操作強化理論和班杜拉的認知強化理論。發展的強化理論已從S-R條件作用理論轉向為認知交互作用理論,強化因此而被賦予了特殊的涵義。
關鍵詞:效果律;操作強化;認知強化
中圖分類號:G40 文獻標志碼:A 文章編號:1673-9094(2011)05-0015-03
強化理論是當代學習心理學最重要的理論之一,實驗和實踐一致證明:效果律—強化原理確是對人類學習可靠的和有力的概括。需要注意的事實是:學習理論在整個20世紀一直處于發展過程之中,如今的強化理論較之聯結主義的“快樂—痛苦原理”已具有重要的擴充、修正乃至顛覆的含義,其實質已從S—R條件作用理論轉向為認知交互作用理論。然而,當今的教育領域仍存在著把桑代克的效果律和斯金納的操作強化在一個“有效”的基礎上作為手段而簡單、直接運用于實踐中的現象。為此,有必要梳理強化理論的發展脈絡,把握當代強化理論的要義。
一、桑代克的效果律
桑代克的聯結主義心理學依據機能主義的觀點,以刺激與反應之間的聯結替代了赫爾巴特主義的觀念的聯結,并將聯結分為先天(本能)和習得(習慣)兩大類。桑代克認為,學習是聯結的形成與鞏固[1]。從嘗試與錯誤的動物學習實驗中,桑代克得出了著名的快樂—痛苦原理即效果律:一種反應如果伴隨著快樂的體驗,那么它就會被增加;如果伴隨著痛苦,就會被減弱[2]。
桑代克自稱是機能主義者,但他的聯結主義仍是S—R條件作用理論,因而“聯結主義”這個術語在更廣泛的意義上也是“行為主義的”。桑代克動物實驗中的學習情境與后來斯金納的白鼠壓桿情境在基本特征上并無不同,在桑代克的嘗試與錯誤學習中,當動物通過活動達到一“滿意事態”,便設想學習受到了積極影響,即“滿意事態”促使之前活動逐漸增強。斯金納用強化這個概念鑒別出被桑代克稱作效果律的事件,因而,可以把桑代克嘗試錯誤學習中最重要的發現更好地描述為強化理論。
二、斯金納的操作強化理論
斯金納是激進行為主義者,其基本立場為心理學是研究外部行為而且只研究外部行為的一門科學。斯金納認為人的行為主要由操作條件反射構成,塑造行為的過程就是學習的過程,強化是其學習理論中的核心概念。“如果一個操作發生后,接著給予一個強化刺激,那么其強度就增加。”斯金納通過實驗發現:操作行為存在消退現象,消退的行為主要緣于以往操作條件作用的結果。與桑代克的效果律作對比,斯金納的強化理論與效果律的前半段同質,而用“消退”這個概念替換了效果律的后半段,且回避掉桑代克效果律中“快樂”與“痛苦”等字眼。
操作強化理論中,斯金納區分出兩種強化物:積極強化物和消極強化物。當一種刺激的呈現會增強某一行為的發生概率時,這種刺激物就是積極強化物;反之,當一種刺激的消除會增強某一行為的發生概率時,這種刺激物就是消極強化物。從此定義中我們看到,這兩類強化物導致的結果相同,都是某一行為發生概率增強,斯金納強調兩類強化物的差異在于刺激條件不同。但是進一步分析刺激條件,刺激呈現或刺激消除實際上具有同一種性質——獎勵,那么斯金納區分兩種強化物的依據到底是什么?從兩類強化物的具體化羅列中很容易發現,積極強化物多是某種令人愉悅的事物,而消極強化物則多是令人討厭的事物。但斯金納卻否認下列說法:積極強化物產生令人愉悅的情感,消極強化物產生讓人討厭的結果,也就是說斯金納寧肯將兩類強化物的區分依據只分析至刺激條件(行為)層面,盡管這種區別性質上并無差異,也不愿意作進一步的分析和解釋,不愿承認刺激物性質實質上是其區分依據。聯想到上文談及的操作強化理論與效果律的對比分析,可以推斷:斯金納是在刻意回避“快樂”、“痛苦”、“愉悅”、“討厭”等詞匯。對此,斯金納有過一個解釋:強化物不具備“高興”、“不高興”此類物理特征。誠然,刺激作為事物本身被分析時,確實不具備“高興”或“不高興”等物理特征。但刺激成為強化物時,就不僅僅作為事物本身,而是必將與反應著的個體聯系在一起被分析。因此,斯金納的這個解釋實在太多勉強。刺激本身具有的物理特征和強化物所具有的特征是兩個不同的概念,這是其一;其二,如果強化物不具備“高興”、“不高興”此類特征,將無法解釋強化物與反應變化之間的因果關系。事實上,斯金納解釋中的另一句話才是他回避的真正理由:物理學上沒有“高興”、“不高興”之類的術語。對斯金納來說,要描述強化物的性質,必然要涉及“愉悅”、“討厭”此類術語,而一但涉及此類術語,必將研究精神世界,也就必然要使用和行為主義所認為的唯一科學的研究方法——實驗分析相抵觸的方式。在斯金納看來,一個行為不管如何不完全,也比心靈主義的解釋更有價值。
同樣,斯金納對“懲罰不是強化”之論斷的解釋亦存在同樣的問題。當把強化界定成結果為反應增強的過程時,懲罰已自然地被排除在外。界定強化時,斯金納恪守著激進行為主義的準則:直接研究刺激與反應之間的相互關系,不要在它們中間加入任何形式的生理或心理假設。而在解釋論斷時,斯金納實際上是考慮了情感、動機此類個體心理特征,卻囿于激進行為主義的基本假設,刻意回避并拒絕進一步解釋。斯金納強化理論中的自相矛盾和解釋的缺乏,已顯露出行為主義基本假設及其研究準則存在著嚴重的問題。
三、班杜拉的認知強化理論
班杜拉因為主張心理學應主要研究外顯行為,強調行為的結果對行為的影響及強化的重要作用,常被歸為新行為主義者行列。但,班杜拉與行為主義者對人的本質的假定存在著根本的不同。行為主義者認為人本質上是一臺設計精良的機器,而班杜拉認為人是有思想的有機體,具有給自己提供某種自我指導力量的潛能”[3]。班杜拉重視觀察學習、認知過程以及自我調節過程的作用,其社會學習理論亦應從屬于認知交互作用理論范疇。
班杜拉的社會學習理論主要是一個認知強化理論。“結果決定行為”是被行為主義者廣泛接受的信條,班杜拉亦同意一個人先前行為的結果在很大程度上決定這個人的將來行為。但傳統的行為主義者認為,結果強化行為是一個自動機械的過程,班杜拉反對這一論斷。他認為結果之所以能夠強化行為,是因為這些結果具有信息和動機價值,即過去行為使得我們產生了預期,希望在將來的相似情境中也能夠得到相似的結果。“除非人們意識到事件之間的相關,否則個體就不從重復的配對經驗中學到任何東西”[4]。在這一強化過程中,人是有著預見性期望的信息加工者和解釋者。人們對于學習意義的認知,在他將來行為的習得和保持中都將發揮重要的作用。在班杜拉這里,強化因此而被賦予了特殊的含義。強化過程既不是環境中心的過程,也不是個體中心的過程,而是個體利用直接經驗結果和觀察到的經驗結果,以認知期望為中介,人們自我激發的過程。
班杜拉認為存在三種形式的強化,這三種強化都具有認知交互的特征。第一種是直接外部強化,斯金納理論中分析的均是此類強化。與斯金納不同之處在于,班杜拉強調帶來強化效果的獎賞具有信息和動機兩種功能。第二種是替代強化,即個體以他人在相似情境中的行為結果為基礎來調控和改變自己的行為,眾多操作強化理論無法解釋的學習現象可以用替代強化來解釋。替代強化是通過榜樣模仿形成的,認知因素在此過程中起著重要的作用。它在很大程度上決定個體觀察什么、賦予它們何種意義,以及它們所預示的信息應該如何被組織以備將來利用。第三種是自我強化,即個體以自己創設的結果標準為基礎來調控自己的行為。班杜拉認為,個體的行為并不只是迎合他人的喜好,許多行為變化用刺激—反應理論無法解釋;且在并不存在外在獎勵或懲罰的情況下,個體依然會有行為的保持或改變,這種保持或改變緣自個體的自我獎勵或懲罰。個體通過規范和觀察,自己給自己設定了行為標準,依據這些內心準則對自己的行為作出評價,進而調節行為。當外部強化與內部準則發生沖突時,個體如何行動取決于外部力量與內部力量的對比結果。“忽視這種隱蔽的自我強化所具有的作用就等同于忽視人類的獨特能力”[5]。
參考文獻:
[1]車文博.西方心理學史[M].浙江:浙江教育出版社,1998.343.
[2][4][5]【美】Morris L. Bigge, Samuel S. Shermis. 寫給教師的學習心理學[M].徐蘊,張軍華等譯.北京:中國輕工業出版社.2005.35.112.113.
[3]施良方.學習論——學習心理學的理論與原理[M].北京:人民教育出版社,1994.397.
S-R Conditioning Theory and Cognitive Interaction Theory
XU Hong
(School of Education Nanjing Xiaozhuang Institute, Nanjing 211171, China)
Abstract: Reinforcement theory is one of the most important learning theories, broadly including law of effect by Thorndike, Skinner's operating reinforcement theory, and Bandura's cognitive reinforcement theory. Advanced reinforcement theory has developed from S-R conditioning theory to cognitive interaction theory, so reinforcement has its special connotation.
Key words: law of effect; operating reinforcement; cognitive reinforcement