社會規范引導行為協調：日常行為的拇指準則

2019-12-22 14:07:50朱富強

武漢科技大學學報(社會科學版) 2019年6期

關鍵詞：人類

朱富強

(1.河南大學中國經濟學研究中心，河南開封 475004；2.中山大學嶺南學院，廣東廣州 510275)

一、前言

現代主流經濟學對人性及其行為機理的理解根基于西方社會根深蒂固的自然主義思維：一方面，自然主義思維主張將人與自然以及社會割裂開來，把人類個體視為獨立于自然和社會的孤立存在，并把人性視為天賦的和永恒的存在，從而就產生了現代主流經濟學的原子論個體主義思維；另一方面，自然主義思維從人對自然的控制中挖掘出工具理性，工具理性和目的論相結合則塑造出了理性經濟人概念，進而將理性經濟人分析范式拓展到人與人以及人與社會的互動中，由此就形成了現代主流經濟學的博弈思維[1]。不過，基于這種主流博弈思維的個體互動所達致的往往不是社會合作，而是囚徒困境；同時，即使主流博弈論也從基于理性策略的重復互動中尋求合作均衡，但其中也潛含了明顯的邏輯缺陷，這已經為澤爾騰的連鎖店悖論所表明[2]。事實上，按照布坎南和塔洛克的看法，如果兩個以上的個人試圖對某項決定達成一致意見，那么，其中的每一個人都會努力使其自身的可能收益最大化，這必然會帶來討價還價成本，即決策成本[3]。在這種情況下，雖然從“個體”角度來說，對這種談判給予某種可觀的投入可能是相當理性的，但從“社會”角度來看，討價還價所引發的時間和資源卻不是有成效的，因為這是對既定“餡餅”進行分割的零和博弈。

與此同時，囚徒困境在現實生活中卻并不如經濟理論所描述的那樣普遍。在絕大多數情形中，人們都能夠有效地解決他們的沖突，并采取協調一致的行動。因此，主流博弈論所使用的理性概念也就會引起廣泛的質疑。那么，現實世界中人們在行為互動中是如何跳出囚徒困境的呢？這就涉及人類理性的演進以及指導日常行為的拇指規則。事實上，人類理性不是靜態和普遍的，而是在互動中逐漸演化和成熟的；同時，隨著人類理性的逐漸成熟，分立行為間的協調性也得以不斷提升，進而就更容易跳出囚徒困境的陷阱而促進社會分工和合作，這已為很多行為實驗所“證實”[4-6]。因此，要真正理解現實中的人類理性以及不同的社會合作形態，根本上就必須從演化角度來剖析人類心智，要揭示人類心智-生活世界之間的共生互動關系，這也就是何夢筆(Carsten Herrmann-Pillath)強調的“二重實在論”[7]。在很大程度上，現代主流經濟學之所以無法解釋大量存在的以及不同形態的社會合作現象，也難以通過對行為協調的促進來實現社會合作，根本上也就在于，它基于自然主義思維而將豐富多樣又相互聯系的社會人還原為孤立而同質的原子個體，并由此設定了先驗而靜態的理性經濟人分析框架，這不僅忽視了嵌入在人身上的親社會性，而且忽視了親社會性的成長以及由此帶來的理性的發展[8]。有鑒于此，本文對現實行為的特性和理性基礎作一探討，并在此基礎上分析人類行為是如何協調的。

二、習俗是協調行為的基本準則

博弈分析最基本的目的之一是預測，這包括：特定博弈中的博弈方究竟會采取什么行動,最終將會有怎樣的結果，等等。但是，作為主流博弈論發展出的如何進行博弈的一致預測基礎，納什均衡卻并不一定能對所有博弈的結果都作出準確的預測，究其原因有二：①納什均衡的一致預測性質本身就不保證各博弈方的預測是相同的，因為不同博弈方的理性程度并不一致；②許多博弈情境也難以基于納什均衡進行準確預測，因為實際生活中的許多博弈情境都有多個納什均衡。顯然，僅僅是多重均衡的存在，就會產生如下兩大后果：①納什均衡的均衡解并不一定會出現；②即使結果是一個納什均衡，也不能確定是哪一個納什均衡。例如，在性別戰博弈中，盡管預期出現的是(足球、足球)或(歌舞、歌舞)，但實際出現的可能是(足球、歌舞)，麥琪的禮物博弈就凸顯了這一點；進而，我們也不能確定(足球、足球)和(歌舞、歌舞)這兩個納什均衡中究竟哪個將成為現實結果。正因如此，許多學者開始質疑納什均衡能否成為一般博弈的正解概念，這涉及對“合理的”納什均衡和“不合理”的納什均衡之間的區分[9]。

(一)博弈協調的基本路向

迄今為止，主流博弈論探究均衡確定性的基本路徑是：基于數理邏輯來不斷精煉納什均衡，逐步發展出了子博弈精煉納什均衡、貝葉斯納什均衡、精煉貝葉斯均衡、序貫均衡、顫抖手精煉均衡等一系列均衡概念。但是，這些研究并沒有取得根本性突破，因為大量的經驗事實和行為實驗都與這些理論均衡結果相悖。凱莫勒認為：“隨著理論工作者們使用這些博弈來解釋諸如教育投資、保修單、罷工等現象，他們很快發現這些博弈具有多重均衡。一些均衡雖然看起來明顯不現實，但它們在數學意義上卻和已建立的均衡概念一致(甚至如序貫均衡)。回顧一下就很容易發現，諸如納什均衡等概念實在過于數學化也過于脆弱，以致很難用他們挑選出比較可能的均衡來。這就需要對已建立的概念進行精煉以破譯‘不合理’的含義”，“在20世紀80年代，許多理論學者都致力于對精煉的研究。提出這些觀點的論文充滿了對直覺和合理性的討論，但缺乏數據支撐。很奇怪的是，這些頗具數學天賦的理論學者們可以花費數年時間討論在不同博弈中哪些行為是最合理的，卻從沒有試圖將人們置于這些博弈中，將‘合理的’定義為多數人的行為。”[10]

因此，隨著主流博弈思維在解釋和預測上的遇挫，一些經濟學家就開始從社會生活和經驗事實中探尋協調博弈的基本機制。弗登博格和梯若爾就指出，當存在多個納什均衡時，說某個納什均衡一定會被采用，必須有某種能夠導致每個博弈方都預期同一個納什均衡出現的機制或者程序[11]。確實，現實世界中也存在一系列的協調機制來引導博弈均衡，這主要體現在2005年諾貝爾經濟學獎得主托馬斯·謝林(Thomas Schelling)提出的聚點均衡(focal point)和奧曼(Aummann)提出的相關均衡概念(correlated equilibrium)中。

首先，奧曼認為，博弈方通過一個大家都能觀測到的共同信號來選擇行動，從而實現行為的均衡。奧曼還證明，如果每個博弈方根據所收到不同但相關的信號而采取行動，就可以得到更高的預期支付[12]。隨后，梅森(Myerson)作了進一步發展而提出機制設計理論，從而將相關均衡轉化成為一種實現某種有利均衡的制度安排，也即相關均衡是指通過“相關裝置”而使博弈方獲得更多的信息，從而協調博弈各方的行動[13]。這種“相關裝置”在現實生活中非常普遍，如交通信號燈就是不同方向車輛行走的“相關裝置”，法律規章就是人們日常行為的“相關裝置”，上課鈴聲就是學生安排作息時間的“相關裝置”，而且“相關裝置”的設置也成為促進行為協調和社會合作的重要機制。例如，企業組織中管理者的指揮就是一種協調活動，他有助于引導團隊生產者之間的行動協調和分工，龍舟比賽中擂鼓也是設立的一種信號，它有助于協調每位隊員的一致行動。同樣，在戰爭中，旌旗金鼓等作為相關裝置而起到統一指揮、統一行動的作用。孫武就指出：“夫金鼓旌旗者，所以一人之耳目也。人既專一，則勇者不得獨進，怯者不得獨退，此用眾之法也”(《孫子兵法·軍政》)。

其次，謝林提出的聚點均衡說明博弈方能夠基于大家長期以來所形成的共識而自發采取行為并由此形成均衡，而這種信息卻被策略式矩陣省略掉了。謝林的這一概念建立在如下一系列的實驗基礎上：①在互不交流的情況下，讓人同時選擇硬幣的正面或反面，如果選擇相同則可贏得一筆獎金，結果36個人要正面，6個人要反面。②讓互不相識的學生選擇在紐約某地相見，結果大多數學生選擇了紐約中央火車站的服務臺。③在上述實驗中要求他們選擇約見時間，結果幾乎所有人都選擇了中午12點。④讓互不溝通的學生將100美元分成兩份，如果相等則獲得這100美元，如果不等則一無所獲，結果42個學生中有36人將之分成兩份50美元。⑤寫一個正數，如果所寫的數字相同則贏得獎品，結果有2/5的人通過選擇數字1而獲得成功。⑥相似地，指定一筆錢，如果指定的錢數量相同則贏得該數量的獎金，結果有12個人選擇1000 000美元，而只有3個人選擇的數字不是10的冪數。顯然，這些實驗表明，人們的日常行為往往有驚人的一致性，而這種一致性無法用數學邏輯加以分析。謝林認為，這個聚點“很大程度上取決于雙方的直覺而非邏輯思維推理，或許依靠來自雙方對相似事物之間的類比經驗、先例、偶然巧遇、對稱性、審美觀或幾何原理、詭辯推理，亦即當事人的自身條件和對彼此情況的了解”[14]52。例如，工人的努力水平和企業主支付的工資之間、夫妻倆周末在足球和芭蕾之間的選擇，等等，都是聚點均衡的典型例子。

顯然，無論是相關均衡還是聚點均衡，很大程度上都體現為一個社會的傳統習俗和慣例，這也就表明，真實世界中的人類行為往往遵循某些既定的社會規范而不是基于算計的功利原則，這是社會合作得以形成和擴展的基礎，并且也已經為越來越多的學者所認識。事實上，正是由于曾長期被現代主流經濟學排除在外的那些不確定性的習慣、心理等因素為越來越多的行為實驗所顯現和證實，現代經濟學也開始轉向對這些因素的關注，甚至已開始成為主流經濟學教材所講授的一個重要內容。為了說明這一點，這里引入一個博弈實驗作一剖析。

(二)“分水嶺”博弈的解說

在“分水嶺”博弈中，參與者從1至14選擇號碼，而其得益依賴于所有人可能選擇的中位數。譬如，參與人選擇2，而中位數是5，則其得益為65；如果中位數為9，那么其得益為-52。這個實驗可以做多輪，而每輪過后，你都知道中位數是幾，然后計算從中的得益并進行下一步選擇。顯然，這一博弈結構具有這樣的屬性：當你認為其他多數人會選擇較小數字時，你也應該選擇較小數字；當你認為其他多數人會選擇較大數字時，你也應該選擇較大數字；而當你認為其他多數人的行為具有不確定性時，可以選擇6或者7規避風險。

同時，這一博弈結構具有這樣的屬性：如果你猜測其中位數略低于7時，你的最佳反應是選擇一個比該中位數略小的號碼。譬如，如果你認為中位數是7，你的最佳選擇是5，這樣對該中位數的反應就會將中位數拉得更低直至到達3，而3成為一個均衡的最優反應點。相應地，如果你猜測其中位數為8或以上時，你的最佳反應是選擇一個比該中位數略大的號碼。譬如，如果你認為中位數是9，你的最佳選擇是10或11。這樣對該中位數的反應就會將中位數拉得更高直至到達12，而12成為另一個均衡的最優反應點。因此，這個博弈是一個協調博弈，它存在兩個納什均衡：其中7以下的中位數是一個收斂于均衡3的“吸引域”；高于8的中位數是一個收斂于均衡12的“吸引域”，從而被稱為“分水嶺”博弈。

Huyck等人將受試者分成10組，每組做了15次實驗，實驗結果證實了兩位分離均衡的存在[5]。問題是，在現實世界中，究竟會出現(3,3)均衡還是(12,12)均衡呢？顯然，純粹的邏輯根本無法預測究竟會發生哪種均衡。但是，該實驗有兩個重要發現：①即使收斂于低收益的參與者只能得到一半的收益，他們也不總是收斂于高收益均衡；②歷史性的趨勢足夠強大，造成了結果對“初始敏感性條件”的依賴。例如，參與者就發現，如果他們當中有兩、三個人認為7是他們的幸運號并在第一輪選擇7時，結果就會卷入到3的均衡；相反，一、兩個中國參與者則往往會給小組帶來更高的收益，因為8是中國人的吉祥數，從而引向了12的均衡。

大量的行為實驗也表明，行為協調以及均衡的出現往往不是基于理性的計算，而是與特定的社會規范和習慣、風俗有關。人們的日常行為首先是基于以往的習慣，只有遇到新的情勢時才會求助推理。即使如此，互動者之間也會努力進行信息溝通，以圖實現更佳的均衡結果。所以，謝林強調了博弈研究的這樣幾個結論：①結果導向的數學結構分析不應成為博弈論的主要研究方法；②研究過程中不應將問題過于抽象化；③當溝通方式具有某種優勢，博弈雙方對彼此價值觀或戰略選擇缺乏了解，特別是博弈結果依賴于博弈雙方的一系列行為和舉動時，經驗因素往往成為混合博弈研究的關鍵因素，也是最適應的方法[14]139。謝林甚至說，用純理論來預測參與者在博弈中如何行為，就像試圖不把笑話講出來就證明它是可笑的一樣[15]。

可見，現實世界中的人類行為往往不是基于理性計算的，而是遵循一定的習慣、習俗和社會規范這個拇指原則。事實上，無論是凡勃倫的“集中意識”(focus awareness)的習慣，還是康芒斯的“習俗”以及諾斯的“規則”，他們都認為，只有通過習慣，邊際效用才能在現實生活中近似成立。而且，正是由于習慣、習俗等提供了指導共同行動的聚點和相關均衡，從而增進了個體行動的協調性，從而有助于達致合作性均衡。例如，休謨在《人類理智研究》一書中就指出，人的理性不能解決因果的推論問題，唯有非理性的習慣原則才是溝通因果兩極的橋梁，因此，“習慣是人生的偉大指南”；而他在《人性論》中則強調，理智是而且只應是感情的奴隸，它除了服務和服從情感之外永遠不能自稱有任何其他功能。再如，約翰·穆勒在《政治經濟學原理》中也強調，市場產品分配是兩個決定性力量——競爭和習俗所造成的，從某種意義上說，習俗的支配力有時比競爭更為重要[16]。同樣，被視為異端經濟學的凡勃倫很早就曾經將歐洲猶太人在知識和科學上的優勢歸因于他們缺乏當代的見識和他們受到的“公元前”文化的洗禮。因此，要對真實世界中的人類行為及其互動結果有更確切的理解，就必須突破主流博弈理論的工具理性和計算理性的分析框架，而應廣泛地剖析心理的、社會的、文化的、制度的諸因素，否則往往會犯削足適履的錯誤。

三、遵守規范的行為是否理性

上述分析指出，真實世界中的人類行為往往遵循一定的社會規范，有些社會規范還上升為宗教的戒律，成為人們行為必須遵守的道德準則。這就引發了對一個重要問題的思考：遵循規范的行為與追求利益最大化的人類理性之間是否沖突？這涉及對理性概念的理解。一般地，現代主流經濟學將一個人所面對的可選項的集合定義為技術或預算可行性集合，一個理性的人就會根據自身偏好以及時空環境而從這些技術或預算可行性集合中進行選擇以最大化自身利益。但是，社會規范或規則往往會進一步限制可行的選擇集合，這種限制超出了技術上和預算上的可行性，從而導致一個可能提高其效用的可選項被放棄掉。因此，按照主流經濟學的理論，理性的經濟人會敏銳地把握信息和時機而靈活地調整策略，而不會固守某種一成不變的規則，否則就是不理性的。相應的問題就是：固守規則果真是非理性的嗎？在很大程度上，這就要看被社會規范所排除的那些選擇項的性質。顯然，如果社會規范所排除的選項本身就是被長期的社會實踐證明沒有效率的，那么，社會規范的引入反而會促成我們的選擇更為理性。究其原因，正如施瓦茨指出的，現實世界的人們本身是有限理性的，當選擇項增多時，他反而無法確定最佳選擇項；同時，過多的選擇也會占據本可以用于其他事情的時間和精力，從而危害我們的自由[17]。

巴蘇就考察了三類規范：①理性限定規范，即阻止行為者選擇某個選項的規范，不管這個選擇會給他帶來多少收益；②偏好變異規范，即隨著時間的推移而成為行為者偏好一部分的規范；③均衡選擇規范，即導向的選擇完全符合行為者利益的規范。在很大程度上，這三種規范往往都會有利于行為者或整個社會的長期利益。譬如，就理性限定規范而言，無論被抓住以及被懲罰的概率多少，人們通常都不會考慮在擁擠的公交上去拿另一個人的錢包，否則，就會造成每個人都要提防自己的錢包被拿，而這又陷入了極不理性的“野蠻叢林”狀態。再如，就偏好變異規范而言，人類效用根本上就是社會性的，因為厭惡說謊或盜竊而在即使沒有任何人知道的情況下也不說謊或盜竊，這顯然符合個人效用最大化，從而也就是理性的。至于均衡選擇規范，這本身就符合現代主流經濟學的理性行為原則[18]。既然如此，又如何認定遵循規范和習俗的行為是非理性的呢？

事實上，在現實世界中，人們在日常生活中的行為大多也是基于習慣和傳統，而不是基于理性的計算。譬如，在現代企業中，經理人員的努力水平是如何決定的，是基于所謂的激勵機制嗎？他們的行為會隨時根據合同狀況或信息狀況而進行調整嗎？事實上，正因為行為規范在經濟生活中的重要性日益凸顯，已經有越來越多的學者開始重新審視真實世界中人與人之間的互動所基于的理性之內涵。例如，萊賓斯坦很早就指出，人的理性具有惰性區域，而高度反應的行為是無理性的，最終將會帶來比非反應行為更大的壓力，為了說明問題，他還發展出了邊際理性和棘輪理性等概念。

一般地，對理性內涵的理解應該把握這樣兩點：①人類理性本身是基于特定的行動目的和偏好而言的，而行為目的和偏好則是內生的，因而理性就不能被視為先驗而客觀的；②人類理性根本上體現為對長遠和全面利益的認知能力和實現能力，而不是局限于每一次行為的功利計算，因而理性不能等同于主流博弈論所界定的理性。事實上，現代主流經濟學的經濟人范式將人類行為所遵循的拇指規則僅僅視為功利最大化，而且這個功利是基于一次性行為計算的行為功利主義，從這個意義上說，主流經濟學所采用的是絕對有限理性，由此導向的往往也就是囚徒困境[8]。與此相反，盡管現代主流經濟學往往將人們基于習慣和習俗的日常行為視為一種非理性的選擇，但如果考慮到理性計算所需要的時間和精力，那么，“作為應付一個人理性之有限的策略”，采取遵守我們已經形成的習慣或是我們這個文化和社會所提供的慣例的這種“非理性將是絕對理性的”[19]。當然，這種理性不是在行為功利主義意義上的工具理性和短視理性，而是基于規則功利主義意義的社會理性和長遠理性。

既然互動理性根本上體現在行為協調上，現實生活中的個體互動又是如何進行為協調的呢？很大程度上，這就需要借助于習慣、習俗等聚點和社會裝置。其實，盡管機會主義的策略行為在短期的或一次性的互動中可以獲利，至少可以避免最壞的結果，但從長期來看，遵循那些經過不斷調適的規范行為反而會帶來更高的效率。其實，正是在互動中獲得了他人的偏好和行為習慣等信息，這些經驗性東西的擴展和提煉就被編碼成了社會規范，從而成為人們的共同信念以及行為的依據。很大程度上，社會合作現象大多是源于共同的信念，源于對規范的遵守而非理性的算計。阿馬蒂亞·森就寫道：“與根據個人自己的目標無休止的最大化相比，只要遵從這種‘習慣性’規則能夠產生更好的結果，那么將有一個有利于那種模式的‘自然選擇’論據，這將導致它們的持續與穩定。這是一定‘漸進的’影響，是在一個完全不同于如弗里德曼所理解的那種利益最大化者的生存方向上起作用的。”[20]正因如此，人們往往樂于遵循公認的社會規范，這往往不是出于被動的強制，而是認識到遵循規范是必要的、有用的和合意的，從而也就是符合理性的行為。

首先，現實社會中的人類行為本身就源自無數次的理性互動：在不斷的近似重復的互動行為中，理性的人們就將過去的經驗轉化為習慣，并且逐漸在一種拇指規則的規范下展開行動。例如，韋森就舉例說：一個人決定購買一輛汽車時，往往會做大量信息收集和理性計算工作，但一旦購買了之后，就會習慣地使用它，而往往不再考慮和理性計算每一次外出的交通成本了[21]。尤其是，在長期的互動中逐漸摸索出了相對有效的合作方式，產生了“為己利他”行為機理，這一行為機理又轉化為習慣、習俗和慣例，從而節約了下回達成合作的摸索成本。正因為傳統習俗文化往往是全社會優化過程的結果，因此，遵循習慣和習俗也是成本節約的理性方式[22]。例如，Chwe就指出，人類社會中的規范已經凝結了人類社會的共同知識，因而根據規范的行為本身就是高度理性的[23]。同樣，H·培頓·楊也寫道：即使在這種低度理性的環境中基于互動而形成的“這些制度常常恰恰就是被那些高度理性的理論所預料的結果——納什討價還價解、子博弈精煉均衡、帕累托效率協調均衡、嚴格劣勢策略的重復消去法，等等。換言之，當適應性過程有足夠長的時間展開的話，演化力量常常替代很高程度的個人理性。”[24]

其次，盡管人類的長遠理性是逐漸通過學習和模仿而形成的，但它并不僅僅源自個體的直接經驗，而更主要是源自他人或社會的間接經驗，具有學習能力的社會人能夠經由模仿而將他人經驗內化在自身行為之中。正因如此，我們說，人類理性是人們長期互動演化的產物，它深植于社會的文化和習俗之中。譬如，馬林諾夫斯基通過對特羅布里恩島上捐獻活動的循環流動就發現，庫拉圈是滲透在整個部落的關系網中并形成了一個相互交織的網狀結構，這種網狀關系把成千上萬的個人連接成一種永久性的伙伴關系，這包含了各種相互的義務和優惠；而且，個人既不能影響交易，甚至即使最聰明的土著人也不能理解他們之間龐大的、有組織的關系。事實上，絕大多數社會學家和人類學家都認為，經濟是被嵌合在社會之中的，這意味著，人類社會的血緣關系、宗教、禮儀等社會習俗所決定的人類行為本身就潛含著財物的生產、分配等經濟功能。例如，粟本慎一郎就認為，“‘經濟活動’或‘經濟行為’并不是一種始于經濟關系的社會行為。‘經濟’行為的意識是由習尚、傳承、傳說、神話所決定的。而對行為的施動者來說，這種行為意識只能在一定的社會聯帶中才能發生作用。”[25]

最后需要指出，主流博弈論基于理性經濟人的分析思路以及分析結論，與探究博弈思維的基本目的也是相悖的。一般地，探究博弈思維主要有兩大目的：①揭示人們在行為互動中策略選擇的相互依賴性；②探究人們在互動中通過行為協調以實現利益增進的機制。顯然，主流博弈論所理解的理性是靜態的，博弈方采用一種“以不變應萬變”的策略，從而無法應對人類行為的多樣性和變動性，無法真正納入行為的共生性和共促性；同時，主流博弈論所理解的理性是孤立的，博弈方只考慮狹隘的個人利益而忽視其他人的利益訴求，從而采用一種相互提防和對抗的策略，以致最終危害了博弈方的自身利益。正是由于主流博弈論基于理性經濟人模式非但沒有促進個人利益和社會福利的增加，反而會引導進一步陷入困境之中，因此，我們就必須對主流博弈思維進行反思，需要重新考察社會規范在博弈協調中的作用。事實上，如果一個社會中的人們互不關心，那么，社會就很難形成良性的大規模合作，就很難有效使用社會資源，從而必然是貧困和落后的。班菲爾德在《落后社會的道德基礎》一書中就充分證實了這一點[26]。所以，阿馬蒂亞·森指出，一個基于個人利益增進而缺乏合作價值觀的社會在文化意義上是沒有吸引力的，而且這樣的社會在經濟上也是缺乏效率的。

四、全面理解人類理性的內涵

現實世界中的人類行為往往不是像主流經濟學所主張的那樣遵守行為功利最大化原則，而往往是遵守既定的社會規范。例如，包括亨利奇等在內的涵蓋心理學、人類學、經濟學等學科的17位重量級學者歷時13年對12個國家中15個小規模社會做了跨文化的實驗研究(包括最后通牒實驗、公共品投資實驗以及獨裁實驗等)和田野研究，得出的基本結論是：①沒有一個社會在實驗中的行為符合經典的經濟人模型；②在團體之間的偏差比早先研究發現的要大很多；③在經濟組織和社會互動結構中的團體水平差異能夠為不同社會的行為偏差提供堅實的部分解釋：市場一體化水平越高和合作對日常生活帶來的收益越高，實驗博弈中展示出來的親社會性水平越大；④經濟學上的和統計學上的個人水平變化并不能解釋團體內或團體間的博弈行為；⑤很多實驗行為都清楚地反映了人們日常生活中能夠的互動模式[27]。

當然，我們并不能由此否定人類行為的理性特性，畢竟理性是人類區別于一般動物的根本性特征。所以，阿馬蒂亞·森認為，重要的并不是對“人們總是以理性的方式行事”這一假設的批判，而是認識到人們并非完全不服從理性的要求[28]165。既然如此，我們又如何理解真實世界中的人類理性呢？一般地，我們可以從三大維度來理解人類理性的內涵。

首先，人類理性根本上體現為在互動中實現長期收益的最大化。一般地，動物的本能驅動體現在對每一次行為的功利最大化，而人類的理性行為則體現在對長期利益的追求。事實上，在現實生活中，任何個體都不僅是關注一次性行為帶來的收益，而且能夠考慮行為對未來收益的影響，從而將長期利益考慮進來。當然，長期利益與短期利益之間往往存在沖突，因而要實現長期利益，就必須抵制短期利益的誘惑。在實際生活中，長期利益的實現程度往往依賴于行為者的認知力和意志力。為此，阿馬蒂亞·森強調，一個選擇只要在經受了批判性思考之后還能成立就可以被視為是理性的。例如，瑪麗在進行了認真和明智的思考之后決定，即使自己需要作出重大犧牲也要去追求自己所向往的社會目標，那么，她的行為就不是“非理性”的；同樣，即使保羅熱衷于個人利益的最大化，只要他的價值、偏好和選擇能夠經得起自己的嚴肅審視，那么也很難將“不理性”以此用在他身上[28]183。當然，森強調的理性審視根本上是指對長遠目標的通盤考慮，而不是為一時的功利誘惑所驅動，那些事后引起后悔的短期行為就是非理性的，如為一時激情所驅使的性交、賭博、吸毒、犯罪等。

其次，實現長期收益最大化的根本途徑在于合作。一般地，如米瑟斯指出的，“人類與動物區別在于，人類可以進行社會合作。”[29]事實上，動物因為缺乏有意識的合作，往往只能維持基本的生存需要；相反，人類通過合作，從而不斷地擴大自身的能力，不斷增進自己的需求。為此，別爾嘉耶夫強調，人是社會的人，人要獲得自由，就得與他人合作，為人著想，擺脫自我中心主義意識。顯然，越是追溯早期社會，人類社會的合作半徑越小，人類個體的能力和需求滿足水平也越低。哈耶克寫道：“野蠻人遠不是自由的，他也不可能征服世界。除非得到他所屬的群體的同意，他幾乎什么事都不能做。”[30]這種認知可以追溯到古希臘時期。例如，亞里士多德所倡導的城邦共同體學說就認為，人之所以自然傾向于過城邦生活是因為任何個人都不是自足的，只有通過城邦生活，人類才能獲得完全的自給自足；城邦是為滿足人類需要的生活在發展中自然長成的，是人類社會團體從家庭、村落歷史發展而來的。顯然，合作根本上具有互惠的特性。鮑曼就強調，“互惠性行為方式無疑是一種具有最重要意義的經驗現象，它們屬于所有我們已知的社會實踐的根本的和理所當然的‘基本配置’。”[31]

其三，人類理性更主要地體現在交往合理性。一般地，人與人的互動之所以不同于人對物的單向處理，根本點就在于，人處理物時只需要考慮工具合理性，而在與人打交道時則需要考慮交往合理性。事實上，人類正是在社會互動中才衍生出親社會性，親社會性使得人類個體不僅追求物質利益最大化，而且也產生某些社會性需求，這主要體現為同情、關懷、尊重、信任等，這也意味著，社會性需求更主要出現在特定社會共同體內部，并依賴于特定的社會文化倫理。亞里士多德就強調，人們之所以加入城邦，不只是因為城邦是滿足人類需要的生活共同體，還因為城邦是實現人類本性的道德共同體，而且，人只有參加城邦生活才能成其為人，良善的人生僅在城邦生活中才有可能。為此，亞里士多德提出的影響深遠的名言是：人是一個政治動物，人是成為公民而生的。同時，社會性需求本質上又是相互依賴的，從而增大了互動者之間的共同利益，更需要也更容易產生合作。很大程度上，正是在“為己利他”行為機理之上形成了互惠合作關系，并逐漸沉淀和編碼而產生了社會規范，它反過來又指導和協調人們的互動行為，從而形成持久和擴展的社會合作。因此，Sunstein等指出，人們通常不會自發地根據最優化決定理論思考，也確實不情愿基于最優化理論來制定法律[32]。

因此，要實現社會廣泛存在的互利形態，就要夯實人與人之間的合作關系，這就需要確立為大家共同遵守的社會規范，而不是采取機會主義的策略行為。事實上，就企業的產品生產和銷售而言，只有那些提供真正有用的產品的廠商才可能獲得持久的發展，究其原因，就像雇主不希望自己的雇員偷竊公司財務以及希望自己的合作伙伴都能夠遵守協議一樣，消費者把產品買回家打開包裝的時候也希望看到商品與廣告中所宣傳的一致，因而當公司發現自己的產品存在問題時，就應該及時告知消費者，甚至必須回收所有可能有問題的產品。舉一個例子：1992年6月，美國的零售業巨人西爾斯·諾布克公司的汽車中心被指控為誤導顧客和銷售給顧客不必要的汽車維修服務，受來自加利福尼亞、佛羅里達及新澤西州消費者事務官員指控的影響，西爾斯公司的股票下跌了9個百分點，全國汽車中心收入下降了15%。顯然，這種現象是西方短視的追逐私利的結果。亨廷頓甚至說：“美國人決策時，沒有歷史，沒有未來，只追逐眼下的利益，所以敵不過東亞的競爭者。”[33]相反，如果能夠勇于承擔責任，對自己的過錯真誠道歉并努力彌補，長期來看就會獲得基于持續信任的發展。這里也可以看另外一個例子：1982年8月，美國約翰遜公司制造的特蘭諾爾(Tylenol)止痛膠囊導致了3人死于氰化物中毒，在政府還沒有要求該公司采取任何針對性措施的情況下，該公司把公眾安全放在首位，毅然決定回收占公司利潤比例17%～18%的所有特蘭諾爾膠囊，并對公眾公開了所有相關信息，結果，盡管公司遭受了超過1億美元的損失，但在18個月內公司重新獲得了危機前所占市場份額的96%[34]。

然而，基于狹隘的工具理性，主流博弈論往往傾向于將行為者視為基于完全理性計算而行動的短期利益最大化者，結果就導向了非合作的納什均衡。盡管如此，主流博弈論卻樂于將非合作均衡視為結果理性，其理據是，這種結果可以在“完全理性”的基礎上通過“內省和推理”而達致。其實，既然這種行為最終導致了囚徒困境的結局，那么，顯然也就是非理性的，究其根本，經濟人本身就不是實質意義上的理性人，而是“絕對”的有限理性，是阿馬蒂亞·森所指的“理性的傻瓜”[35]。相反，如果考慮人類的理性是根基于社會互動的并受歷史文化的影響，那么，通過在長期互動中“外推和學習”所獲得的“過程理性”就顯得更為合理，以此博弈而形成的均衡就更接近于“結果理性”。在某種意義上，這里對人類理性的闡釋也涉及對“應然”和“實然”的理解。

最后，基于上述分析來審視影響深遠的休謨鍘刀原則：不能從“是”中推出“應該是”。事實上，由人們的社會互動所演化而成的習慣本身就凝結了人類在長期實踐中獲得的經驗知識，在很大程度上也就體現了人類理性的凝結。從這個意義上說，人們遵循當下的應然制度或社會慣例也就是理性的，并且具有扎實的實然基礎，也正因如此，基于習慣的“過程理性”行為往往更容易達致“結果理性”結局，盡管習慣也可能滯后于社會情勢的發展。與此形成對比的是，盡管工具理性在每個時點遵循了行為功利主義原則，卻缺乏對整體的把握而陷入路徑鎖定，進而也就潛含了“理性的自負”。事實上，哈耶克也強調：“文明的發展之所以有可能，在很大程度上就是因為人類用那些理性不及的習俗約束了自己所具有的先天性動物本能；而且一如我們所知，也正是那些理性不及的習俗，才使得規模日益擴大的有序之群體的形成具有了可能。”[36]哈耶克這里所指的理性也就是工具理性，或者工具式的有限理性。從社會現實看，正是由于數學工具的過度引入而將人類理性計量化，新古典經濟學的理論和政策就造成了很多的非理性結果。顯然，這已經為越來越多的學者所認識，進而也促進了行為經濟學的蓬勃發展，這種新趨向積極將心理學、人類學、社會學的研究引進經濟學，強調經濟學研究要觀察盒子外的因素，因為我們一直以來關注的盒子里面是空的(we’re looking outside the box because the box we’ve been looking inside is empty)[37]。

五、結語

現代主流經濟學將嚴格遵循成本-收益原則的行為視為理性的，但將之運用到互動行為的博弈分析中卻存在問題：一方面，經濟人中的理性概念源于人對物或自然的單向處理關系，把它拓展到人類互動中就忽視了行為的社會性和演化性，從而導致了工具主義謬誤；另一方面，行為互動本身就意味著每個人的行為選擇都是針對他人行為的反應，同時自身行為也會引起其他人的行為反應，其中的理性也就不可能是單向的。考慮到互動行為的相互反應，社會中行為選擇就不可能基于一個固定不變的規則，而是具有針對性，并在互動中不斷演化。大量的經驗事實和行為實驗也都表明，真實世界中的人類行為與標準理性經濟人模型的理論結論相差甚遠，以致“理性”假設引起越來越多的反思。阿馬蒂亞·森就指出，理性選擇模型“將選擇的理性僅僅描繪成對于自身利益的最大化。這種方法認為，人們如果沒有明智地而只是追求自身的利益，并且不對任何其他事物加以考慮(除非‘其他事物’會直接或間接地推進他們自身的利益)，那就不是理性的。既然人類能夠有充分的理由去注意自身利益之外的其他目標，擁有更加廣泛的價值觀和適當的行為規范，那么理性選擇理論確實反映了一種對理智和理性極為狹隘的認識”[28]166。

同時，人類理性要求在社會互動中實現長期利益的最大化，因此，行為者就不能僅僅關注個人利益，也要關注他人或社會的利益，要訴諸于合作的方式。正因如此，互動中的人們往往遵循“為己利他”行為機理，而“為己利他”行為機理的擴展和凝結又形成了具有合作性的社會規范；進而，這種社會規范反過來協調人們的互動行為，從而有利于社會合作的實現和深化，最終又有利于最大化個人的長期利益。事實上，如果像主流博弈論那樣每個人都隨時基于功利計算而采取策略性行為，那么反而會因功利的短視性而陷入囚徒困境，進而妨礙了長遠利益的實現。從這個角度上說，遵守社會規范的行為并沒有違背理性的要求，而恰恰體現了人類的理性特質，它不但是理性的，而且在結果上比基于功利計算的行為更為理性。哈耶克指出：“個人之思想本身也是他生活于其間的文明的產物，他可能意識不到形成自己思想的許多經驗——這些經驗已經融入了風俗、習慣、語言和道德信仰，成為人們思想得以形成的根基及其特性的一個組成部分。”[38]很大程度上，風俗、習慣、語言和道德信仰等社會規范成為互動者的共同知識，這種共同知識不僅協調人們的行為，而且促進行為的合作。

當然，主流經濟學人會認為，在一個大型社會中，任何東西成為共同知識幾乎都是不可能的。例如，Rubinstein和Binmore等就用電子郵件(email)博弈來證明，理性的博弈者進行協調行動也是難以實現的[39-40]。但實際上，現實世界的交易往往只發生在具有共同知識的人們之間，即使原本沒有聯系，但在交易之前也會努力去了解交易者的信息，并且必然有一些機制保證共同知識的存在。譬如，顧客去某商場買東西，他必然事先知道這個商場出售的東西是可信的，而商場知道顧客使用的貨幣和信用卡也是真的。在絕大多數情況下，不是每次交易都需要對商品的質量以及貨幣的真實性進行驗證，而是存在于我們的習慣、習俗這種共同知識之中，而如果缺少這種共同知識，那么就會明顯地限制交易。正因為人們的交易往往首先局限在一定的范圍之內，這個范圍之內的習俗、慣例往往就成為交易圈的共同知識，而當這個交易圈擴展時，共同知識也就在更大范圍內得到呈現。顯然，共同知識的呈現范圍會隨著習俗慣例和社會倫理的擴展而擴展，從而促使社會合作的擴展。因此，日常生活行為往往會遵從既定的社會規范而不是基于行為功利原則。