摘要:行為經濟學在當代的發展已經突破了正統經濟學的基本框架,開始對情感、策略互動行為、社會效用、決策者在未知世界中的選擇行為進行系統研究,并在最近幾年綜合形成了多種由理性系統和非理性系統組成的雙系統模型。這些雙系統模型與2 000多年前的柏拉圖馬車模型同構。經濟學研究對柏拉圖的回歸,表明經濟學仍然處于單極化本質主義的結構化陷阱之中。研究分析表明,經濟學發展目前面臨的困境,正是經濟學轉向關系論,走上希望之路的起點。
關鍵詞:雙系統模型;結構化陷阱;單極化本質主義
中圖分類號:F014文獻標識碼:A
文章編號:1000-176X(2007)01-0003-10
從20世紀50年代以來,行為經濟學在心理現實化和描述性轉向上取得了令人矚目的成就。懷著規范性理想,正統經濟學家以預先得到完備界定的心理偏好為其邏輯前提和根本依據,建構了以完全理性的自我為中心的、封閉的、單極化本質主義的選擇理論范式[18]。面對正統經濟學選擇行為理論與行為現實的系統偏差,行為經濟學致力于正統經濟學心理基礎的現實化,有限理性的自我逐漸取代完全理性的自我成為選擇理論的微觀心理基礎[9]。在心理現實化的過程中,行為經濟學逐漸放棄了建立封閉的、絕對的規范性理論體系的努力,轉向了更加富于彈性的描述性。行為經濟學在心理現實化和描述性轉向上取得的豐碩成果,迫使經濟學家不得不更多地關注行為的背景、社會現實等因素,偏好的學習機制、演化機制和隨機過程已經逐漸被納入行為研究的中心領域,正統經濟學的理論前提——預先得到完備界定的偏好關系在行為過程中被顯現——遭到致命的質疑和系統的解構[10]。在完成描述性轉向后,在最近10多年里,行為經濟學大大拓展了經濟學的研究領域,開始系統研究決策者在參與者多邊互動過程中的選擇行為,情感因素、社會效用等被正統經濟學忽略的領域得到越來越多的重視,行為經濟學與博弈論正在綜合形成的行為博弈論加速了決策者融入關系世界的進度,對決策行為的研究也逐漸深入到了未知世界。在最近幾年,綜合各個領域研究成果的新的理論框架已經開始形成。而在行為經濟學的拓展和綜合過程中,經濟學更深層次的問題——單極化本質主義[8]的結構化陷阱——逐漸浮現出來。正是在單極化本質主義的框架之下,經濟學在經過300多年的發展后,重新回歸近2 500年前的柏拉圖。這是經濟學發展面臨的巨大困境。但是,希望總是與困境相隨。在困境之中,經濟學加快擺脫先入為主的、封閉的單極化本質主義框架,更加光明的前途正在向未來和現實展開。
一、行為博弈論
在正統經濟學中,博弈論為描述參與者之間的策略互動行為提供了數學工具,并將參與者之間相互影響的選擇行為形式化。正統經濟學的博弈分析對參與者的策略理性做了以下假設: (1) 策略思維假設。參與者基于對其他人的行為的分析形成判斷。(2) 最優化假設。參與者基于這些判斷選擇最佳的行為策略。(3) 博弈均衡假設。參與者持續調整他們的判斷和行為策略,直到達到相互一致[4]。在互動的策略行為過程中,策略理性被形式化為迭代式的策略思維過程:甲通過算計乙會如何算計甲的選擇來算計乙的選擇,并決定自己的行為策略;乙同樣如此。作為迭代思維的自然結果,博弈者達到相互一致的行為策略——博弈均衡。
策略理性的結果與現實行為的差異很快隨著行為經濟學家對該領域的關注而被發現。下述選美博弈(quoted from Camerer,2003)選美博弈來自于John Maynard Keynes的隱喻,他把股票市場比作選美競賽。在選美競賽中,人們關注的是其他人會認為哪個競爭者漂亮,而不是誰真正最漂亮。在股票市場當中,投機者關心的并非股票的真實價值,而是市場認為股票有什么價值(Camerer,2003).打破了博弈論的理論預測:在博弈過程中,參與者僅僅算計有限的步數,并不是算計無限步直到博弈均衡。
選美博弈的游戲規則為:參與者同時在[0,100]選擇一個數。誰的數最接近所有參與者的平均數的2/3,誰將贏得某一固定數額的獎金。根據博弈論,該博弈的那什均衡為零,在游戲參與者經過無限次的思維算計以后可以得到。但是實驗表明,被選擇的平均數通常在25—40,標準差20左右。大部分參與者似乎僅僅使用了一步或兩步的迭代推理:相信其他人隨機選數的參與者(1步迭代思維)選擇了33,相信其他人都算計一步的參與者(2步迭代思維)選擇了22。
對上述一次性博弈的參與者行為,行為經濟學家建構了思維的認知層次模型[4]。在該模型中,根據思維步驟,將參與者分成不同的認知層次在該模型中,思維步驟為零的參與者隨機選取行為策略;思維步驟為一步的參與者,被假定過份自信地相信其他人都是零步思維者;……;K步思維者則自信地相信其他人都是K-1步思維者。。基于該模型的統計分析表明,參與者的策略思維步驟是有限的,大致服從泊松分布,思維步驟一般為1—2步左右(泊松分布的均值約為1.5)。認知層次模型研究表明,參與者的策略理性是有限的,不可能進行無限的迭代思維。從心理學上看,博弈參與者具有有限的思維步驟是更加現實的。在迭代思維中,“如果她認為他預料她會做什么,那么她應該做什么呢?”是一個“遞歸嵌套”的問題,即使忽略對別人理性程度的判斷總是受到限制的因素,對這種問題的思考,也會使大腦疲于應付。
在具有信息反饋、多次重復的選美博弈中,當重復10次時,大多數被試選擇的數接近均衡值0[4]。行為策略隨著時間發生變化,這促使行為經濟學家轉向對學習機制的研究。他們引入多種學習機制來解釋有限策略思維情況下,行為策略如何隨著時間而調整,最終達到博弈均衡。比如信仰學習(Cheung and Friedman,1997),人們基于他人行為歷史形成關于他人如何行為的判斷,并以此來決定自己的行為策略;再如強化學習(Erev,Roth,1998),人們從實際選擇的行為策略的結果當中學習,不斷強化形成行為策略。Camerer and Ho (1998,1999),Camerer,Ho and Chong[4]則在信仰學習和強化學習基礎上,增加了想象學習機制,建構了EWA學習機制——經驗加權吸引子學習模型:人們不僅看中他人和自己的行為歷史,還通過想象被放棄的選擇學習。EWA學習機制具有與Kahneman[15]綜合形成的雙系統模型(見后文)相似的特點:強化學習具有快、自動、有時候是潛意識的(類似于我們的感覺系統)特點,行為策略迅速地、本能似地形成;而在信仰學習機制中,參與者在想象中學習,從別人的經驗、放棄的選擇的審慎考慮中形成行為策略,比較慢,需要有意識地深思熟慮,通常要借助抽象的規則。在Camerer,Ho and Chong[4]對EWA學習模型的實驗研究表明,隨著時間、地點不同,強化學習機制、信仰學習機制對行為策略選擇的影響程度發生變化。這樣,學習機制并不存在行為經濟學家所希望看到的一致性,它本身也是在一定的背景下,特定的過程中被塑造,隨著時間和空間背景變化而變化。
當參與者意識到博弈對手也在學習時,學習機制將變得更加復雜。前面提到的學習機制都是適應性的、回顧式的,而復雜的參與者則是前瞻性的,他們具有戰略遠見,他們知道博弈對手在學習,能夠預料對手的行為策略如何變化。因此,他們將采取策略引導(Camerer et al.,2002):選擇當前的行為策略,引導其對手學習,使其在將來采取對他們有利的行為策略。這種復雜的博弈過程,在商業銀行貸款業務中可以經常見到,借款人知道銀行評估客戶信用對客戶借款歷史數據的依賴,因此,通過小借小還建立信用記錄,引導銀行對其做出積極的信用評價,從而建立信用,為大借不還創造條件。
總的來看,在考慮學習機制后,在復雜參與者之間的策略互動過程中,參與者相互引導,局中有局,博弈過程異常復雜,對博弈論的現實基礎則提出了更深刻的挑戰:在參與者的相互引導和學習過程中,弈局本身進入了持續演進的過程,并不存在標準經濟分析中的重復博弈,當然也不存在標準經濟分析中的博弈均衡。在持續演進、非重復性的博弈過程中,參與者之間的互動關系逐漸取代了任何單一參與者的理性計算,成為行為分析的基礎和目的。
二、社會效用
在正統經濟學中,經濟人追求主觀效用最大化,被認為是利己主義的典范。但行為經濟學家在決策者的利己動機之外,更加關注決策者在決定自己的行為時,如何考慮他人的行為對自己的影響和自己的行為對他人的影響——社會效用。
在下述囚徒困境的博弈中,參與者如果合作將達到整體最優,但從自利角度都會選擇不合作,博弈均衡是(背叛,背叛)。
許多試驗表明,在一次性的囚徒困境博弈中,在大約一半的博弈中,參與者采取了合作策略。合作的參與者通常說,他們期望其他人也會合作,這與合作是互惠的說法是一致的,而不僅僅是利他或某些道德準則使然。這種合作行為承載的不僅是期望,而且是一種信任。Coleman(1990; quoted from Zinn,2004)引進了理性信任的概念,信任被作為理性計算的結果而引入。“在知識無能的地方,信任便開始了”(Lewis/Weigert,1985; quoted from Zinn,2004)。由于信息不完全、有限理性、時間有限等限制,決策者無法進行充分的學習或交流,信任成為決策者解決現實問題的重要行為策略。在決策者和其交易對手之間,必然有某種默契或潛在的交易規則,破壞潛規則的行為將削弱直至廢除這種信任關系。在囚徒困境中,研究表明,只要參與者擁有對不合作的參與者懲罰的機會,或者參與者之間有溝通的機會,合作就會增加。在合作與沖突并存的現實環境中,信任關系的選擇性(選擇可信任者)和懲罰性(懲罰違背潛規則的不可信任者)發揮的作用至關重要,人類的合作行為高度依賴于彼此間的信任關系,盡管這種信任關系總在持續地發生變動。
而在下述終極交易[3]中,我們看到了決策者對交易公平性的關注。
甲乙兩個被試被告知,甲被授權就某一筆財富在兩者之間進行分配,甲向乙提議一個一次性的分配比例;乙如果接受,甲乙就按分配比例各自獲得相應財產,如果拒絕兩人都一無所有。
如果甲乙都是自利的理性決策者,甲將把分配比例控制得盡可能小,而乙將接受只要不是零的分配方案。但實驗表明,平均的分配比例是30%—50%,分配比例低于20%的提議有一半被拒絕了。乙拒絕甲的提議顯示了對不公平分配行為的報復動機。
當在終極交易中引入競爭時,交易對手之間的互動關系則進一步發生顯著變化。設想有兩個提議者向乙提出分配方案,乙接收分配比例最高的提議。由于競爭的引入,提議者把所有財富都分配給乙是博弈均衡。實驗表明,競爭導致非常不公平的分配——提議者幾乎一無所獲[3]。
在上述參與者之間的互動行為過程中,涉及了利他主義、公平、信任、報復、仇恨、互惠和敵意等社會動機。這些偏離自利假設的經濟現實受到行為經濟學家越來越多的注意。他們著手建立了多種社會偏好的模型。比如差距厭惡模型 (Bolton and Ockenfels,2000;Fehr and Schmidt,1999),假設人們有減少他們與其他人的回報差距以求公平的動機;社會福利模型(Andreoni and Miller,1998),假設人們喜歡增加社會剩余,幫助低收入階層,這通常會導致帕累托改進;互易模型 (Rabin,1993;Dufwenberg and Kichsteiger,1998),假設決策者根據交易對手行為的公平性,決定是提高還是降低其他人的回報,這經常導致破壞帕累托效率的行為。Gary and Rabin[16]的實驗證明,相對差距厭惡而言,人們更加關心增加社會福利——做出犧牲以提高所有人的回報,特別是低收入者的回報;人們通常也會表現出互易性:如果其他人不愿意做出犧牲,他們也會不愿犧牲以追求公平的結果,甚至懲罰不公平的行為。
我們借用終極交易的案例來總結一下正統經濟學家和行為經濟學家在人性假設上的分歧。當甲被試意識到乙被試可以將$100在他們二人之間按照($50,$50)進行分配時,他將拒絕($92,$8)的提議,盡管這將意味著他們均將因此一無所獲,即都得到($0,$0)。在行為經濟學家看來,這種行為表明決策者的選擇并不總是遵循自利的原則,否則他們就會接受盡管不公平,但卻比一無所獲要好的分配。人在這種現實問題中表現出對公平的偏好,當公平性遭到破壞時,他將采取非自利的報復行為,對對方進行懲罰。這種非自利的報復行為無法被自利原則所涵蓋。但同樣的問題,正統經濟學家卻可以給出不同的解釋,決策者在這種博弈中犧牲$8得到$0的行為并不是犧牲行為,而是比較復雜的、自利的名譽建立行為,如果沒有這種局部犧牲,他將被認為是軟弱可欺的,由此在后續的其他博弈中蒙受更大的損失。這樣,在正統經濟學家看來,報復行為才是實現效用最大化的自利行為。由此,正統經濟學和行為經濟學在社會效用問題上產生了分歧。在正統經濟分析中,裁縫為了給自己帶來更多的財富而縫制衣服;而在行為經濟分析中,裁縫為了讓人們生活得更好而縫制衣服。但是他們的分歧并不是實質性的,在兩種情況下,裁縫都是出于自己的某種偏好,在兩種行為背后都有一顆評價、估計行為的心,而社會效用和個人效用就好像這顆心的不同側面李子奈,馮燮剛(2005)以及博蘭(1997)的分析表明,“效用最大化”是不可反駁的。在終極交易情形中,在正統經濟學家看來,行為經濟學家沒有找到使之最大化的效用。。只要我們的分析要以這顆心為前提,正統經濟學和行為經濟學在行為動機方面的分歧就不會消除,一如正統經濟學在這個問題上至今無解的爭論。
三、未知世界中的決策理論
從決策理論的發展來看,正統經濟學最先提出并系統建構的效用理論適用于決定性世界(特定行為指向惟一的特定結果);其后,正統經濟學放松了對行為結果的決定性要求,建立了適用于確定隨機世界(結果集和概率分布都確定)的預期效用理論;隨后進一步放松了對概率分布確定性的要求,建立了適用于模糊隨機世界(結果集已知,但概率分布不確定)的主觀預期效用理論[9]。但在無法確定結果集的未知世界,正統經濟學尚未形成系統的決策理論。在20世紀后半葉的大部分時間里,行為經濟學主要局限于正統經濟學的框架之內,追求心理現實化的目標,對相應世界決策理論進行修正和完善在確定隨機世界的這類理論數不勝數。而在模糊隨機世界當中,也有相當多的理論,比如Craig and Tversky(1998)給出了基于信仰的兩階段模型,用于解決概率分布不確定條件下的決策問題。(1)在模糊隨機世界中進行概率判斷的支持理論:主觀概率被賦予事件的描述,而不是事件本身。而主觀概率的大小,決定于支持事件描述的證據強弱。證據支持信仰 (概率具有次可加性);(2)在確定隨機世界中進行決策的局部選擇理論。。但隨著行為經濟學逐漸完成描述性轉向,行為經濟學家對決策理論的研究逐漸深入到未知世界。
Gilboa and Schmeidler[13]指出,在大多數情況下,與選擇對應的事件的結果很難通過直覺的方式予以界定,世界狀態空間也很難予以界定。如果結果集無法確定,就無從談起結果是否按照決定性的方式被決定,或是按何種概率分布了。因此,在未知世界,預期效用理論或者主觀預期效用理論無法對選擇主體的決策行為予以說明。為解決未知世界的選擇問題,Gilboa and Schmeidler[13]假設,選擇主體基于他們過去處理相似問題的經驗,將當前情形與過去的相似情形進行類比,從而做出選擇。他們建立了下述相似效用函數:
U(a)= UP,M(a)=∑(q,a,r)∈MS(p,q)u(r)
其中,(q,a,r)用問題q、行動a、結果r三個維度來表示記憶M中的情形,當選擇主體遇到新問題p時,上式用以描述基于案例的決策過程:選擇主體將各種可能的行動a放入記憶中與之相應的情形集M,并得到各種情況下相應的結果r,這些結果按照當前情形與記憶情形集的相似程度S(p,q)進行加權,被選擇的行動乃是實現相似加權效用UP,M(a)最大化的選擇。
Gilboa and Schmeidler[13]指出,盡管相似加權效用函數與預期效用函數有相似之處,但二者在選擇機制上是完全不同的:
(1) 作為決策權重的S(p,q)沒有相加起來等于1或某個固定值限制,而預期效用函數則限定為1。
(2) 評價行動a的標準不同。在相似效用理論中,不同的行動,將對應不同的情形集。而在預期效用理論中,所有的行動都會在同一個狀態空間當中進行評價。
(3) 評價過程不同。在相似效用理論中,基于已經發生過的情形進行評價,無需假設。而在預期效用理論中,基于所有可能的結果集的完整集合進行評價,需要假設各個行動在各種狀態下的結果才能完成評價。
(4) 信息結構不同。在相似效用理論中,除了歷史情形,選擇主體別無所知,他不需要區分確定性與不確定性,他只是基于特殊情形中的特殊行動進行評價。而在預期效用理論中,選擇主體必須被假設面對的是完全確定的世界,必須對可能的狀態空間有完全的知識,且必須引入每一個狀態的先驗概率,并被假定進行概率加權效用評價。
(5) 動態結構不同。預期效用理論按照貝葉斯法則來結構化新信息,新信息被視為某個狀態子集上的事件,選擇主體根據新發生事件來修正主觀概率。而對于相似效用理論而言,新信息被視作歷史情形不斷納入記憶中的情形集。遵循預期效用理論的主體基于沒有發生的狀態空間而學習,而遵循相似效用理論則基于發生的事件觀察而學習。
Gilboa and Schmeidler[13]進一步指出,相似效用理論既不是比預期效用理論更好的理論,也不是其替代理論,而是互補理論。在未知世界中,僅僅依靠類比法則進行推理的相似效用理論,可以比預期效用理論少用更多的假設推理,因為后者不僅需要假設各種情形,而且需要假設各種情形的概率分布,以及基于概率法則的數學演繹。
注意,對相似效用理論,一個非常難于回答的問題是初始化問題,即在決策者具備相似性的歷史情形集為空時,如何進行選擇?人們總會面臨全新的問題,與新問題對應的歷史情形集為空的情況并不少見。對這個問題的回答,只能在行為經濟學家建構的啟發機制(見后文)尋找答案根據Kahneman(2003)建構的可達性啟發判斷理論,當記憶中一片空白,或者具有相似性的情形集合為空時,人類的判斷與選擇不會受制于類比的邏輯法則,而會按照啟發性原則,發生思維的跳躍,很難說待決事件會如何地和記憶中和現實中的哪些情形發生關聯。。
事實上,在高度未知、高度不確定性的世界里,在向未來世界、現實世界展開的過程中,我們要面對的,永遠是我們沒有處理過的,過去的都已經成為歷史,未來的任何變數都有可能。比如一個紅綠白三色球箱,里面一共300個球,每色100個,隨機抽取一個,在數學上,抽到紅綠白的概率都是33.3%。這是不是不確定性?這不是!至少不是人類在現實世界中必須面對的不確定性。在現實中,我們面對的是向未來和現實展開的未知世界,就像黑洞,不知道黑洞里有多少種顏色的球,也不知道黑洞里有多少球,甚至不知道是不是都是球,盡管過去我們拿出了很多球,而且紅綠白各1/3,但這僅僅是歷史事件的發生頻率。下一個球是什么?我們不知道!這才是真正的不確定性。
在這樣的世界中,人類行為更大程度上是序貫的、一次性的。一次性或者非重復性意味著概率法則或類比法則不可能是主導我們行為規律的法則。而序貫性則表明在向未來和現實展開的過程中,人類在各個時點上的行為必然有關聯性,我們必須在歷史的基礎上走向未來。面對這樣的世界和行為現實,無視現實世界中決策者之間、決策者和環境之間持續互動的動力學過程,卻試圖依靠以主體為中心的選擇和判斷心理法則得到一致的說明,無論是規范性,還是描述性,都是不可能完成的任務。
四、情感分析
在有記錄的關于人類知識的研究歷史中,學者們對情感的研究討論一直非常活躍。將激情當作理性試圖駕馭,但卻常常沖破理性約束的消極力量,一直是主流觀點直到近現代,經過叔本華、尼采和弗洛伊德等人的努力,學者們才開始系統地研究非理性力量。但追求自然科學理想的主流學者們仍然對非理性力量的研究望而卻步。。從古希臘以來,學者們一直持有這樣的見解,思想、理性、遠見和決策等是人類智慧的高級形式,會被情感的肆虐所破壞。因此,幾千年以來,不能依靠自身理性駕馭情感的行為都被認為是野蠻或者愚昧。在主流學者的觀點里,非理性的情感從來不會遵循一致的理性法則,在作為理性成就的人類知識的基本框架下,人類不會也不能對情感因素進行系統研究后文的分析表明,情感因素只是不能見容于單極化本質主義的知識框架,但卻完全可以納入關系論的知識框架。。因此,在關于人類理性行為的研究中,情感因素不得不被排除在外。但在最近10年里,決策研究者對情感因素的研究興趣明顯加強。情感因素得到了越來越多的積極評價,將情感視作積極力量的觀點,已經成為與傳統觀點并存的一個重要觀點[20]。
在經濟學的發展歷程中,對情感因素的處理經歷了幾起幾落。亞當·斯密(1776)建構了利己心驅動的經濟人,將對美好主觀感受的追求作為理性行為的基本目標和動力。而邊沁(1789)則明確界定了以快樂和痛苦兩相對立的情感為核心的效用概念,并雄心勃勃地嘗試建立快樂和痛苦的客觀度量,并將痛苦和快樂作為指引和決定人類所作所為的主人。但隨著度量快樂和痛苦嘗試的失敗,經濟學家放棄了基數效用理論,轉向了序數效用理論。在古典經濟學、新古典經濟學的綜合中,雖然序數效用保留了主觀感受的基本內涵,但選擇集上主觀效用的序數性質,將經濟學家對主觀感受的關注,轉向了對選擇集中各種選擇的偏好排序。懷著把經濟學建構為物理學似的科學體系的經驗主義理想,經濟學家把各種選擇引起的客觀結果作為選擇偏好排序的主要依據,而忽略了決定偏好順序的情感因素。在新古典經濟學綜合形成的理性決策模型中,決策乃是基于完備的選擇集,確定最優選擇的理性計算過程。行為經濟學對新古典經濟學范式進行了長達半個多世紀的系統反動,作為其心理現實化努力[5]的結果,正統經濟學的完全理性被弱化為有限理性。在行為經濟學的有限理性決策模型中,決策乃是對行為選擇產生的結果進行評估的認知過程。由于受到有限理性的制約,決策者的認知是可錯的。在兩種理論中,決策者都被假定為不動感情、冷靜地計算或認知。這樣,正統經濟學以及行為經濟學的主要研究,都采用了認識論的基本范式,決策者的情感被忽略掉了[21]。
行為經濟學和心理學在過去10多年里,對情感的研究,揭示了情感反應更為豐富的特性,那種認為情感是理性思維和適應性行為的破壞性力量的見解已經被證明是過于簡單化了(Bertson,Boysen,Cacioppo,1993; quoted from Cacioppo,Gardner,1999)。人們越來越深刻地認識到,情感遠遠不僅僅是原始反射,情感在人類的實踐活動中發揮了建設性作用(Cacioppo,Gardner,1999)。越來越多的研究集中揭示了情感反應的相對性。Kahneman,Fredrickson,etc.(1993)在有關研究中發現,人們將更加偏好持續時間延長而強度衰減的痛苦情形。在進一步的研究中,Kahneman(1998)提出了一種假設:一個復雜事件的情感表示是該事件峰值體驗和終值體驗的函數。Schwarz and Strack(1998)發現,客觀生活環境僅僅能夠解釋不超過10%的主觀福利變化,同樣一件事是提高還是降低主觀福利判斷,取決于是將該事件作為標準還是僅僅是生活中的一個普通的故事。比如,Medvec,Madey,Gilovich(1995)發現,由于奧運會銅牌獲得者一般沒有贏得金牌的期望,反而比銀牌獲得者(通常是沖金的熱門人選)更加快樂,盡管以客觀標準來看,奧運會銀牌比銅牌更有價值。Carver,Scheier,(1990),Hsee,Salovey,etc.(1994)則發現,趨向或遠離最終狀態的速度是相應情感的重要決定因素。行為經濟學家在心理現實化過程中,將價值載體從財富的絕對水平修正為財富變化量(Markowitz,1952; Kahneman and Tversky,1979),損失和收益獲得了相對性,與之對應的痛苦和快樂喪失了絕對性。總的來看,就情感反應而言,特定事件所處的背景與特定事件本身同等重要。
這樣,痛苦和快樂獲得了相對性。人處于多維的行為空間中,哪個維度的狀態發生變化,就會引起行為、情感、思維等在相應維度上的變化。行為經濟學家對情感因素的研究,是在描述性轉向上的一個拓展。盡管這種研究還剛剛開始,但已經比較系統地解釋了情感反應的相對性。痛苦和快樂本身不是絕對的,它不過是特定背景、特定過程結構化的產物。正如柏拉圖(《理想國》)指出的那樣,“快樂和痛苦在心靈中的產生都是一種運動……快樂就是痛苦的停止,痛苦就是快樂的停止”。既不存在絕對的主觀感受,比如我們長期以來一直試圖絕對化的痛苦和快樂;也不存在可以被絕對化的、中立的客觀刺激。我們只能在特定主體和特定對象之間,在特定歷史背景和空間背景之下,給出多個維度的關系刻畫。
行為經濟學對情感反應相對性的研究,揭示了情感的背景依賴和指向對象的基本特點。比如某某對鄰居可能當選總統的嫉妒,導致對其鄰居的惡言中傷,惡言中傷是在其鄰居可能當選總統的背景下指向其鄰居的行為。在單極化的本質主義框架下,觀察、判斷、選擇著的心靈是人類行為的終極依據。而對情感等所謂非理性力量(嫉妒)引發的行為(對鄰居的惡言中傷)而言,行為的背景和行為對象的屬性(鄰居當選總統的可能)成為這種行為(惡言中傷)不可忽略的重要原因,但卻很難歸于決策者的心理屬性。因此,在以選擇主體為中心的單極化本質主義框架下,具有強烈的對象指向和背景依賴性的情感,無法單極化地被選擇主體的屬性決定,由其導致的行為也無法在單極化本質主義框架下獲得一致性,而被歸于所謂的非理性力量,被排除在追求自然科學理想的經濟學研究范疇之外。但是一旦從關系論[18-8-11]的視角看,嫉妒以及嫉妒之下的惡言中傷,乃是由鄰居當選總統的可能和嫉妒者的屬性共同決定,這種情緒及行為獲得了在單極化本質主義框架下所不具備的一致性,但卻可以融于關系論的框架。
對經濟學者而言,另一個值得深思的問題是,雖然我們無法否認情感因素對人類行為的影響,但是由于情感變化的內在性、私人性,我們究竟應該關心引起情感變化的事件,還是事件引發的情感,還是情感對行為的影響?從關系論的角度來看,情感在特定背景下,在相互關聯的參與者之間被決定,是特定初始背景和參與者行為之間的中間變量,經驗地確定特定初始背景和參與者行為的關系并不依賴于情感的確定。實際上往往是反過來,我們觀察到參與者的行為,將其歸類于某種情感;我們看到某種特定背景,由其與特定行為的關聯關系和特定行為的情感歸類,預期參與者的情感反應。特定情感承載的不過是主體對外界的某種反應機制。因此,在可以按照公度性原則[18]界定的情感因素之外,在經濟分析中引入對不可觀察的主觀情感的直接分析,既無確實的可能,也非行為分析所必要。
五、行為經濟學在當代的綜合——描述性選擇理論框架
隨著偏好內涵不變性假設、外延無關性假設和經濟資源的完全可替代性假設被行為經濟學家揭示的行為現實所否定,正統經濟學基本前提和分析起點——存在預先得到完備界定的選擇集和基于其上的偏好關系——遭到系統解構,偏好在特定的背景中形成,在特定行為過程中被塑造,并動態、隨機演進的觀點逐漸成為行為經濟學家的主流看法[9-10-11]。正統經濟學理性選擇模型是以理性經濟人為中心的、封閉的選擇模型,屬于單極化本質主義范式[18-7-8]。在心理現實化和描述性轉向研究方向上前行的行為經濟學,逐漸放棄了建立封閉的、絕對的規范性理論體系的努力,轉向了更加富于彈性的描述性。行為經濟學在心理現實化和描述性轉向上取得的豐碩成果,迫使研究者們不得不更多地關注行為的背景、社會現實等因素,偏好的學習機制、演化機制和隨機過程已經逐漸被納入研究的中心領域。在行為經濟學家看來,舊的框架已經被打破,而新的框架尚未確立。他們面臨的任務,已經不再是揭示正統經濟學與行為現實的系統偏差,而是如何重構選擇理論的新的心理基礎,整合形成新的分析框架——描述性的選擇理論。
在最近幾年里,為完成對豐富多變的心理現實的綜合,行為經濟學家在不同角度建立了多種由理性和非理性構成的雙系統模型,給出了兩個心靈的心理圖案[15-14-20-19-4]。下面我們以Kahneman 等人建構的直覺系統、推理系統構成的雙系統模型為例,來分析行為經濟學家正在建構的描述性選擇理論框架。
(一)直覺和推理雙系統模型的基本結構
Kahneman等人建構的雙系統思維模型由直覺系統和推理系統組成。直覺系統具有以下與感知系統類似的屬性:迅速、自動、聯想、無需費力、不易被控制或調整。推理系統具有以下屬性:緩慢、連續、費力、被審慎控制、相對靈活、有潛規則須遵循。當然直覺系統并不像感知系統那樣,局限于處理各種當前的刺激,直覺判斷可以處理知覺、概念,并可以被語言喚醒。而推理系統不僅通過審慎的推理形成判斷,還具有監督思維過程和外顯行為的功能(Gilbert,2002,quoted from Kahneman,2003; Stanovich and West,2002),特別是監督直覺系統的運作。但推理系統的監督非常松散,許多直覺判斷得以自由表達,而許多錯誤也由此而生[15]。感知系統和直覺系統產生印象,這是所有判斷的本源。直覺系統和推理系統則在經驗過程中形成有效判斷積累——知識——和印象基礎上形成判斷。
(二)可達性啟發與判斷偏差
與推理系統經過慎密的推理形成判斷不同,直覺系統依靠啟發過程形成判斷。可達性指特定思想內容進入思維的容易程度(Higgins,1996,queted from Kahneman,2003;Tversky and Kahneman,1974)。是直覺判斷分析的核心概念。可達性評價是決策者自然進行的評估過程,是對感知和記憶中認知流利性的自然評估[14]。比如就高度或體積判斷而言,疊加在一起的方塊比一堆散放的方塊的思維可達性要強得多。可達性是一個連續區間,在一端具有感知系統和直覺系統的特點:快速、自動、毫不費力;而在另一端具有推理系統的特點:緩慢,連續處理、費力。由于可達性具有感知的顯著性、注意的自發性和隨意性、反應觸發的臨時性與聯想激活等含義[14],決策者的直覺判斷不僅要受到與物理背景相關的物理顯著性的影響,也會受到與歷史背景相關的選擇性注意影響,還要面對反應觸發和聯想激活的隨機擾動的影響。因此,在行為經濟學家看來,外在的刺激與決策者的行為之間的因果關系具有內在的不可預見性。
當選擇問題目標屬性(比如正統經濟學效用最大化理論中效用就是選擇問題的目標屬性)可達性較弱時,決策者如何進行判斷和選擇呢?Kahneman and Frederick[15]建構了屬性替代的啟發式判斷模型:決策者將判斷對象之可達性較弱的目標屬性替換為與之相關的、思維可達性較強的啟發屬性,并通過對啟發屬性的評價來間接形成關于目標屬性的判斷。簡言之,啟發式判斷就是按照易于想象的原則,對待決策事件具體化,以進行判斷與選擇。實驗表明,屬性替代的實質是:屬性替代使得判斷對象發生了變化,反應者答非所問,對他們沒有被問及的問題給出了一個合理的解答[14]。比如,當被問及兩支足球隊誰更可能獲得比賽的勝利時,我們馬上將可能性(目標屬性)替換成足球隊的實力(啟發屬性)的比較(比如各個球員的技能、身體素質,球隊的戰績等),我們最后回答的并不是哪支球隊贏的可能性大,而是哪支球隊的實力最強。決策者判斷中的很多偏差,比如代表性、小樣本、錨定效應產生的偏差等,都可以用判斷啟發過程中的屬性替代來解釋。
情感因素也作為一種啟發屬性,被整合進了Kahneman的雙系統模型。有很充分的證據說明每種刺激都激起有意識或無意識的情感評價(Zajonc,1980; Bargh,1997,quoted from Kahneman,2003)。Kahneman,Ritov,and Schkade(1999)指出,自動的情感評價——態度的情感核心——是許多判斷和行為的主要決定因素。在Kahneman等人的雙系統模型中,把情感反應當作啟發屬性,可以廣泛運用于各種復雜情形。
在Kahneman建立的綜合模型中,推理系統作為思維的監督者,參與了所有的隨意行為。這隱含著直覺判斷錯誤將可能來自于兩個系統的失敗:直覺系統產生錯誤的直覺,且推理系統沒能檢測并予以修正(Kahneman and Tversky,1982a;quoted from Kahneman,2003)。盡管判斷啟發會產生偏差,在推理系統的審慎參與下,人們可以通過在偏差中學習,使在特定環境下直覺判斷所違背的規則足夠早地進入思維,從而駕馭直覺判斷,糾正判斷偏差。比如根據模糊性來判斷距離,在大霧天會出現偏差。對司機進行訓練,讓他們掌握大霧天產生距離判斷偏差的知識,可以削弱判斷偏差的影響。但是由于直覺印象通常首先形成,這將形成后續判斷的起點和基礎——所謂的“錨碇”我們用Ariely,Loewenstein,and Prelec(2003)的實驗來說明錨碇和錨定效應。對被試提出是否愿意接受以他們的社會安全號后兩位作為購買價格的問題后(無論回答是否),在對無線鍵盤的定價中,社會安全號后處于00—20的被試的平均定價為$16.09,而處于80—99的被試的平均定價為$55.64。實驗表明,由于被試對無線鍵盤的價格信息了解不充分,在與無線鍵盤定價不直接相關的陳述中,被試會形成賴以進行判斷或選擇的基準——就像拋錨之錨碇,從而影響了價值判斷。,從錨碇開始的修正很難是充分的。因此,直覺判斷的偏差并不會完全消除。
(三)雙系統選擇理論:反射機制和適應機制
我們看到,在Kahneman[18]提供的選擇理論框架中,可達性和直覺與感知之間的類比發揮著核心作用。局部選擇理論(Kahneman and Tverksy,1979)的核心思想就是變化與差距比絕對水平的刺激的可達性要強得多。在結構化效應[16]中,雖然專業訓練可以減少結構化效應中問題的不同描述或展現方式所帶來的選擇不一致,但是理性選擇模型永遠必須面對一個具有有限智力的主體,而這個主體將不得不面對缺乏客觀陳述的現實[10]。
由于直覺和感覺將根據可達性啟發原則形成高度可達的印象,為直覺系統和推理系統形成判斷提供基礎和起點。因此,直覺決策將被特定情形下的可達性啟發所塑造,可達性較強的特征將影響決策,而可達性較弱的特征將基本被忽略。由啟發式判斷提供的可達性較強的判斷或選擇,將變成潛在的錨碇,成為后續選擇和判斷的基礎和起點。即使推理系統深思熟慮地予以規范與駕馭,在錨定效應見注10。的作用下,推理系統也只能對直覺判斷進行逐步的調整。這樣,可達性啟發與錨定效應將在判斷和選擇中發揮關鍵作用。因此,在判斷和選擇行為中,從很大程度上講,直覺系統提供了對外界刺激的反射機制,而推理系統則提供了對外界環境的適應機制。在決策者和外部環境的隨機互動過程中,直覺系統和推理系統構成的選擇系統,決定了決策者高度隨機的判斷和偏好。
(四)描述性轉向:從完全理性到有限理性
懷著對自然科學理想的追求,正統經濟學一直按照理性原則建構經濟學體系。但是邏輯上完備、一致的理性原則無法面對不遵循邏輯原則、高度可變的情緒性、本能似的非理性因素,情感等非理性因素長期被正統經濟學拒之門外。因此,正統經濟學建構了完全理性的自我作為其選擇理論的心理基礎,完全理性成為選擇行為的根本依據。
在雙系統模型中,我們看到的兩個心靈的心理圖畫對我們來說并不陌生。柏拉圖(《理想國》)建構的由理性靈魂、精神靈魂、欲望靈魂組成的馬車模型,弗洛伊德建構的由意識和潛意識或者自我、本我和超我組成的心靈模型,與行為經濟學家正在建構的二系統模型都是同構的。在這些模型中,我們看到,人類行為既有人類深思熟慮的理性因素,也有人類情緒性、本能似的沖動因素,更有完全由物理背景、人文背景和歷史背景激發的因素。
正是由于完全理性的自我僅僅考慮了深思熟慮的理性因素,而沒有考慮人類情緒性、本能似的沖動因素和由物理背景、人文背景與歷史背景激發的因素,正統經濟學選擇理論與行為現實產生了嚴重背離。正統經濟學選擇理論心理基礎的非現實性,成為行為經濟學對正統經濟學的選擇理論進行了系統反動的直接誘因。行為經濟學家為了修正正統經濟學理論與現實的巨大偏離,引入了非理性的直覺,以兼容人類情緒性、本能似的沖動因素和由物理背景、人文背景和歷史背景激發的因素。但是,在傳統的理性框架下,直覺并不遵循邏輯規則,只能理解、描述。由此,行為經濟學放棄了先入為主的規范性理想,轉向了描述性,建構了由理性和非理性系統組成的有限理性。
六、重歸柏拉圖——經濟學的困境與行為經濟學解構
懷著對自然科學理想的追求,正統經濟學一直按照理性原則建構經濟學體系,完全理性的自我成為其選擇理論的心理基礎,并成為選擇行為的根本依據。但是邏輯上完備、一致的理性原則無法面對不遵循傳統理性原則、高度可變的情緒性、本能似的沖動因素和由物理背景、人文背景與歷史背景激發的因素,正統經濟學選擇理論與行為現實產生了嚴重背離。行為經濟學由此對正統經濟學的選擇理論進行了系統反動,并最終系統解構[10]了正統經濟學的完全理性,放棄了規范性理想,轉向了描述性,建構了由理性和非理性系統組成的有限理性。但是,由于仍然試圖在主體的一端尋找主體和其身處的環境之間的互動行為的原因,行為經濟學也沒能跳出單極化本質主義[18-8]的思想框架。
在以選擇主體為中心的單極化本質主義范式下,正統經濟學也好,行為經濟學也罷,決策者自主判斷、自主選擇,正確也好,錯誤也罷,一個判斷和選擇的自我是我們自己行為的主人,是經濟學為豐富多變的行為現實確定的終極依據。在哲學完成本體論到認識論的轉向后,“人是萬物的尺度”同樣的一句話,古希臘時代的普羅泰戈拉和19世紀的康德借以表達的含義則完全不同,前者借以表達感覺的無常性和特殊性,后者則借以表達先驗自我的永恒性和普遍性[7]。,自我理所當然地成為我們所及的世界的中心,所有哲學社會科學知識的建構幾乎無一例外地陷入了以主體為中心的單極化本質主義。不過主體的形象一直在發生變化,從與上帝相通的靈魂[6]到先驗自我[17],從先驗自我到心理自我,而心理自我的建構則更是五花八門。行為經濟學在當代建構的依靠直覺和推理雙系統進行判斷和選擇的有限理性自我,實際上是對約2 500年前柏拉圖馬車模型[2]的回歸。
正象經濟學家目前所完成的大量研究揭示的那樣,在人類行為中,既有人類深思熟慮的理性因素,也有人類情緒性、本能似的沖動因素,更有完全由物理背景、人文背景和歷史背景激發的因素。后兩方面的因素是決策者和環境之間的互動行為,直接被決策者和環境之間的互動過程所決定,無法單一地歸于決策者的心理本質。事實上,只要我們堅持在我們的心靈中尋找行為的所有原因,這兩方面就只能歸于理性所不及的啟發、直覺、潛意識、本我或其他類似的神秘過程。試圖依靠決策者本身的屬性來為決策者與環境之間的互動行為提供一致的說明,這正是以主體為中心的單極化本質主義范式無法解決的一致性困難。
七、小結
行為經濟學對柏拉圖馬車模型的回歸是意味深長的,也是歷史性的。它彰顯了經濟學目前所面臨的困境——深深地陷入單極化本質主義結構化陷阱[11]。正像我們在行為經濟學當代的研究成果中所看到的,在人類行為中,既有人類深思熟慮的理性因素,也有人類情緒性、本能似的沖動因素,更有完全由物理背景、人文背景和歷史背景激發的行為博弈、社會效用、序貫行為等因素。后兩方面的因素直接被決策者和環境之間的互動過程所決定,在傳統的理性自我框架下,不遵循邏輯原則,是非理性的。行為經濟學引入非理性的直覺,建構了有限理性的雙系統模型,試圖為人類行為后兩面的內涵提供描述性框架。但是,作為對完全理性反動的產物,行為經濟學仍然局限于在選擇主體一極尋找選擇行為的終極依據,其建構的有限理性仍然沒有跳出單極化本質主義的結構化陷阱。只要我們還在以選擇為主體中心的單極化本質主義范式下,試圖僅僅依靠決策者本身的屬性來為決策者與環境之間的互動行為提供一致的說明,就是不可能完成的任務。
要擺脫正統經濟學身處的單極化本質主義結構化陷阱,必須邁出更為關鍵的一步,放棄以選擇主體為中心的單極化本質主義,轉向開放的、演進的關系論[11-18],立足關聯互動的現實世界,以“公度性”[18]為基本準則,在決策者和環境之間的互動過程中確定行為依據和對行為的描述框架,建構開放的、演進的經濟學知識體系。因此,行為經濟學對柏拉圖馬車模型的回歸并不是重復性的回歸,而是螺旋上升過程中的回歸,它勾畫出更為豐富、全面、現實的人類行為圖像。在豐富的行為現實中,經濟學深層次的矛盾一覽無余,經濟學的關系論轉向逐漸變得清晰起來,這將成為經濟學走上希望之路的起點。
參考文獻:
[1]Ashraf N.,Camerer C. F.,Loewenstein G. (2004). Adam Smith,behavioral economist. Working paper.
[2]柏拉圖.理想國[M]. 郭斌和、張竹明譯,北京:商務印書館,2002.
[3]Camerer C. F. (2003). Behavioral studies of strategic thinking in games. TRENDS in Cognitive Sciences,Vol.7,No.5,May.
[4]Camerer C.,Ho T. -H.,Chong J. K. (2004). Behavioral game theory: Thinking,learning and teaching. Working paper.
[5]Camerer C. F.,Loewenstein G. (2003). Behavioral economics: Past,present,future. Introduction to Advanced in Behavioral Economics,etited by Camerer,Loewenstein and Rabin,Princeton University Press.
[6]笛卡爾. 第一哲學沉思集[M]. 龐景仁譯,北京:商務印書館,1996.
[7]馮燮剛.向現實世界、未知世界開放的新哲學,清華大學中國經濟研究中心《學術論文》NO.200410.
[8]馮燮剛.知識建構的關系論轉向與開放的知識方法論,清華大學中國經濟研究中心《學術論文》,No.200510.
[9]馮燮剛,李子奈.行為經濟學的心理現實化與正統經濟學的微觀心理基礎[J].經濟學動態,2005,(4).
[10]馮燮剛,李子奈.正統經濟學微觀理論基礎的解構[J].財經問題研究,2006a,(4).
[11]馮燮剛,李子奈.經濟學的關系論轉向[J].經濟學動態,2006b,(7).
[12]Gary C.,Rabin M. (2002). Understanding the social preference. Quarterly Journal of Economics 117(3),August,817-869.
[13]Gilboa I.,Schmeidler D. (1995). Case-based decision theory. The Quarterly Journal of Economics,Vol. 110 No. 3 Aug.,605-639.
[14]Kahneman D. (2003). Maps of bounded rationality: Psychology for behavioral economics. American Economic Review,93,December,1449–75.
[15]Kahneman,D.,and Frederick,S. (2002). Representativeness revisited: Attribution substitution in intuitive judgment. In T. Gilovich,D. Griffin D. Kahneman,Heuristics of intuitive judgment: Extensions and applications (pp. XX-XX). New York: Cambridge University Press.
[16]Kahneman D. and Tversky A. (1984). Choice,Value,and Frames. American Psychologist,1984,39:4,341-50.
[17]康德.純粹理性批判[M]. 藍公武譯,北京:商務印書館,2003.
[18]李子奈、馮燮剛.正統經濟學知識的性質與開放的經濟學方法論[J].經濟學動態,2005,(4).
[19]Loewenstein G.,O’Donoghue T. (2004). Animal spirits: affective and deliberative processes in economic behavior. Working paper.
[20]Loewenstein,G. and Lerner J. S. (2003). The role of affect in decision making,in R. J. Davidson,K. R. Scherer,and H. H. Goldsmith,Handbook of Affective Science,Oxford University.
[21]Loewenstei G.,Weber E. U.,Hsee C. K.,Welch N. (2001). Risk as feeling. Psychology Bulletin,Vol. 127 No. 2,267-286
(責任編輯:劉艷)
<注>:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文