汪敏達 李建標 殷西樂
集體行動是由利益共同體發起的行動,集體行動代表了社會群體的意志,可以改變社群乃至社會面貌。我國是一個飛速發展的轉型社會,因此集體行動將越來越成為我國社會生活中的重要議題。集體行動的治理離不開對集體行動動因和機制的理論研究。盡管集體行動的發生可能具有社會結構、政治資源和社會資本等多種宏觀、中觀動因(趙鼎新,2011),但集體行動能否被組織起來以及能取得何種結果,仍一定程度上要歸因于集體行動參與者的微觀動因,只有個體在發起集體行動方面實現了合作,集體行動才能有效開展。
個體參與集體行動的微觀動因包括偏好性因素和策略性因素。在集體行動博弈中,個體的偏好決定其動機和目標,而個體的策略性動因則決定其對博弈均衡結果的認知和選擇。事實上,集體行動研究一直圍繞著偏好與策略動因展開。在勒龐(1895、2004)那里,集體行動中的個體被假定為非自利且非理性的,而 Olson (1965、2011)將集體行動研究引向了自利偏好和策略理性的進路,從而得到搭便車導致集體行動失敗的結論。后續的理論一度致力于從合作策略的占優性、適應性動態以及決策偏差等基于策略動因的角度來解釋自利個體的集體行動。隨后的理論走向了非自利偏好假設,在 Andreoni(1995)的理論中,部分個體的非自利偏好被界定為“利他”和“光熱效應(warm-glow)”兩部分。目前解釋集體行動微觀機理的主流理論基于有條件的合作和強互惠的社會偏好假設,解釋自利個體合作的策略動因則主要聚焦于隨機優化策略。
集體行動合作的個體社會偏好動因理論主要由 Fehr、G?chter、Gintis等人發展。Fehr和 Fischbacher(2002)將社會偏好界定為個體的效用不僅與自身的物質利益相關而且與有關其他個體的物質利益正相關或負相關的一種偏好。Bowles和 Gintis(2005)則提出了涉他性偏好(other regarding preference)的概念,意指個體會考慮其他人的福利,無論這種考慮與其自身福利是正相關還是負相關。社會偏好包含了多種涉及他人利益的非策略性的考慮,主要包括互惠(尤其是強互惠)、公平與不平等厭惡、信任、利他等。Fehr、G?chter、Gintis等認為,人群可以劃分為互惠合作者、完全自利的搭便車者等類型,強互惠偏好的個體在其他人合作的時候也會合作,而在其他人不合作的時候他們也會拒絕合作,并會對不合作的個體進行懲罰,甚至作出有成本的懲罰。強互惠偏好理論通過個體對其他個體偏好及合作行為的信念和反應機制,較好地解釋了公共物品供給型的集體行動中合作行為隨著博弈重復而衰減的趨勢,但它并沒有很好地解釋個體在集體行動一開始的初始合作動機,也未能考慮個體在成本不同的各類框架下的行為選擇問題。
另一部分研究則不依賴非自利偏好,而純粹從個體策略動因視角探索集體行動微觀機理。這些研究主要聚焦于行為博弈中的個體策略選擇,試圖將自利個體的合作行為解釋為博弈初期的策略誤差(error)和適應性動態過程或策略隨機優化過程。例如,Miller和 Andreoni(1991)發展了復制者動態模型,預測線性公共物品博弈類型的集體行動中采取特定策略的人群結構的變化。McKelvey和 Palfrey(1995)的模型則主要關注博弈參與者的策略選擇方式,參與者依據其策略集、其他參與者選擇某一策略的概率以及隨機誤差因素優化其策略選擇,實現效用最大化。但是,這些研究還未充分考慮個體具有策略遠見的可能性。
現有的集體行動的微觀動因仍然需要進一步探討。在偏好理論方面,社會偏好理論本身過于注重互惠、不平等厭惡等驅動的親社會行為,容易對利他等其他類型的社會偏好以及策略驅動的自利合作有所忽視。事實上,個體參加集體行動的動機是多元的,其期望的收益也是分層次的。一般而言,個人收益在先,他人收益在后。因此,集體行動參與者對其他參與者的行為反應,不僅是偏好性反應,也是策略性最適反應。已有實驗研究也發現,個人的親社會行為(如懲罰、出于利他或公平偏好的分配)亦是服從某種“需求定律”的(Anderoni和 Miller,2002;Anderson和 Putterman,2006;范良聰等,2013)。Kaheman和 Tversky(1986)指出,風險決策過程中面對不同的博弈框架,參與者會作出不同的反應,而不同的集體行動框架同樣可能使得個體的偏好發生偏移。因此,研究集體行動偏好的動因需要綜合考慮個體的多重偏好和對框架的依賴性。同時,由于個體偏好存在情境依賴的異質性,在許多時候個體是自利的,合作是基于一種最優化邏輯的理性考量,這些是合作的基本保障,應該得到重視。在策略動因方面,能應用于集體行動研究的新的視角還很缺乏。以 Axelord(1989、2007)為代表的學者認為自利個體在合作問題上的最優策略是“一報還一報”策略,這實際上將個體的合作行為解釋為演化的壓力。然而,盡管個體的最優策略需要長期合作來達到演化穩定,但短期內的合作仍然大量存在。僅僅將自利個體的合作歸因于決策差誤帶來的噪聲也是難以令人滿意的,因為在線性的公共物品實驗中個體確實能理解實驗和占優策略,長期的博弈也并沒有令合作完全消失。學習和策略隨機效應雖然能解釋合作逐漸衰減的特征,但某些集體行動中存在穩定的高水平合作,而另一些集體行動的合作水平又很低,表明在一般化的個體動因模型中可能還需要引入關于個體策略行為特征的更多假設。
針對上述問題,我們認為,偏好和策略動因是解釋各類集體行動過程和結果的核心要素,因此理解集體行動需要更平衡的、框架依賴的偏好結構,需要考慮不同行為成本時的策略理性。同時,關于集體行動的實驗研究潛在地認為自利個體認同搭便車策略為其占優策略。這樣,合作就只能歸因于長期互動的壓力或決策差誤。這一假設并不一定成立,個體是短視與遠見并存的,而合作則可能是個體發揮其遠見能力所帶來的結果。將個體具有遠見的假設引入個體策略動因理論,能細化黃凱南和程臻宇(2008)提出的“認知理性”概念,將具備認知理性個體的具體認知和理性決策模式具象化為個體對未來決策結果的預期和判斷,從而說明個體發起、參與集體行動甚至建構制度的一個重要的認知理性動因。
基于此,本文把自利偏好和不同類型的社會偏好整合在一個框架依賴的效用函數中解析集體行動的微觀偏好動因;在此基礎上通過提出基于遠見假設的集體行動理性合作理論,補充了策略動因視角對合作的解釋,從而更完整地說明集體行動的發生機制。進一步,本文實施了單次博弈的公共物品實驗,對實驗中的遠見動因進行考察,將集體行動中的兩個主要微觀動因——偏好結構與策略動因遠見分離。結果表明存在一定的基于遠見而合作的個體,個體同時具有利他和不平等厭惡等偏好動因,個體的主要合作動因是策略動因與偏好結構的復合動因。這些結果證明,遠見的理性能力并不能與學習、互惠利他(reciprocity altruism)以及聲譽效應混為一談,遠見是個體對未來結果的高階推斷和基于此的合作信念,即使在沒有互動的單期亦能發揮作用。
本文的第二部分闡述基于偏好結構的集體行動合作理論;第三部分提出遠見假設并發展基于遠見假設的集體行動合作理論;第四部分描述實驗設計;第五部分是實驗結果分析;最后是結論。
集體行動參與人具有多樣的偏好,按照偏好的對象來分,參與人不僅具有風險偏好、時間偏好,而且具有關于利益匹配的偏好①雖然許多學者已經將社會偏好與自利偏好、涉己性偏好與涉他性偏好進行對比,但似乎較少有文獻將這些偏好賦予統一的、類似“風險偏好”或“時間偏好”的歸類。有學者將其稱為分配偏好。本文根據這些偏好都關注利益匹配的特征,統稱為“關于利益匹配的偏好”。,即參與人在自身利益與他人利益、物質利益與非物質利益之間的排序。已有的社會偏好理論如 Fehr和 Schmidt(1999)提出的“不平等厭惡”模型、Dufwenberg和 Kirchsteiger(2004)提出的動機模型,雖然都是假設個體既關注自身利益也關注他人利益的偏好結構模型,但他們的理論較為偏重個體對他人利益的關注,而對個體這種關注的動機——自身的物質利益和“精神”或“心理”上的非物質利益——關注不足,對非自利偏好的關注也不足。集體行動中,個體的行為會產生外部性,個體需要充分考慮自身的物質和非物質利益,同時考慮他人的利益。在考慮他人利益時,個體一部分是出于對他人利益的關懷,而一部分則可能是由于自己或他人的利益和行為給自己帶來了非物質利益的損失或增長。因此,要解釋個體參與集體行動的偏好動因,需要全面考慮個體偏好中同時具有的各個維度。
基于此,我們提出偏好結構這一范疇,即個體在自身利益和與其他人有關的利益上分配的權重以及這幾個維度之間的相互關系,同時也包含個體對物質和非物質利益的偏好。具體而言,個體存在追求親社會行為帶來的心理愉悅與平衡的需要,個體非常重視他人行為給自身物質和非物質層面效用造成的影響,但這些被認為是偏好性而非策略性的行為,仍然要受到實施這種行為的成本的約束,本質上可以視為一種特殊的自利。我們將這種受到成本約束并可能客觀上會滿足心理上的愉悅與平衡、產生心理效用和欲望滿足的非自利偏好,稱之為“不純的社會偏好(impure social preference)”。純粹對自身得益的考慮則促發了自利行為和策略性的非自利行為,例如有意識地利用他人的社會偏好的行為。包容純自利維度和不純的社會偏好維度的偏好結構,可以稱之為“廣義的自利偏好(generalized selfish preference)”。個體也存在完全不考慮行為成本的非自利偏好,此時個體完全以他人利益為中心,在很大的程度上忽略行為成本,純粹關心而非關注他人的行為與利益。可以將這樣的偏好定義為“純粹的社會偏好(pure social preference)”。這在某些集體行動中非常關鍵,例如個體可能出于“正義感”或某種意識形態而奮不顧身,也可能為了與自己無關的第三方的遭遇而懲罰他人,或出于同情共感而幫助他人。在下文的分析中,將主要考慮兼容純自利維度和不純的社會偏好維度的偏好結構,并在沒有特別說明的情況下,將不純的社會偏好簡稱為“社會偏好”。
正式地,在個體偏好一致性假設下,構造三個偏好維度耦合的加權效用函數。設有一個兩人博弈,令xi為個體在僅帶來自身利益的純自利偏好“行為”或“事物”上的“得益”,包括物質與非物質部分,bi為個體i的策略,x-i為個體在涉及他人利益的社會偏好“行為”或“事物”上的“得益”,b-i為他人的策略。則αi表示個體在純自利維度上分配的權重,βi= f (αi)為個體在不純的社會偏好維度上分配的權重。存在一個偏好R,xiRx-i表示個體在兩個維度上的偏好序,存在?、?和等價于三種關系。由于我們定義xi和x-i為個體在不同偏好維度上的行為,因此可以推論當時有,即滿足嚴格單調性,同時假設個體在兩維度上的行為的偏好序滿足完備性、傳遞性和連續性,則存在一個實值函數 U(xi, x-i)為該偏好關系的表達式,即效用函數。令cis為個體i在純自利維度上的行為的成本即“價格”,cio為個體i在社會偏好維度上的行為所耗費的成本即“價格”,w為個人稟賦總額,預算約束為:w ≥cisxi+ciox-i。我們定義預算集為,其中x為不同維度上的得益,而c為不同維度上的價格。效用函數為:U (xi, x-i, αi,B)。U1(2)為個體1(2)效用函數。假設該效用函數具有如下性質。第一,假設 U(xi, x-i, αi,B)關于 xi,x-i是嚴格遞增的。第二,U (xi, x-i, αi,B)是連續且擬凹的。第三,αi影響了效用函數的形態。邊際替代率 MRSi=f1(αi),且 ?f1/? αi> 0,即純自利維度權重越高,邊際替代率 MRSi越大,個體越傾向于自利行為。第四,αi與α-i正相關。
個體的行為選擇是在一定偏好結構下產生的,而個體決策都是置身于一定的框架之中的,個體不僅具有多重偏好耦合的偏好結構,且偏好結構中不同權重的分布受到外部框架的影響(Dufwenberg等,2011)。不同的集體行動類型即是不同的框架類型,這些框架對個體的效用函數選擇、權重分配有重大影響:在某些集體行動中,個體可能在自利和社會偏好之間權衡;在另一些集體行動中,個體可能根本不考慮個人利益。因此,需要一般化地考慮框架依賴的個體偏好和決策行為。要發展可驗證的框架依賴的偏好理論,需要明確框架的類型和個體依框架決策的模式。
框架的類型可以由兩個維度來刻畫,即目標和成本。理性的個體在特定框架下要建立自己的目標,目標分為自利目標和慮他目標。不同框架也造成了達到目標的不同成本,這里可以只考慮完成社會偏好行為的成本,純自利行為成本與之對偶。這樣就可以把框架分為四類。第一類框架:目標是自利的,社會偏好行為成本高。在這一框架下個體將采取純自利行為,純自利維度權重賦值將較高。第二類框架:目標是自利的,社會偏好行為成本較低。在這一框架下個體力求最大化自身利益,但當其覺得必要時,也會付出成本來實施基于不純的社會偏好的非自利行為。第三類框架:目標是考慮他人利益的,社會偏好行為成本較高。第四類框架:目標是考慮他人利益的,社會偏好行為成本低。此時個體主要給社會偏好維度權重賦予較高值,并采取親社會行為①現實中的情境均可以歸類于上述四個框架,但情境歸類的標準還有待進一步研究,因為這方面的經驗證據還存在爭議和探索。例如,Smith(1964)的實驗雙向拍賣市場中個體僅表現出經濟人的交易行為,Davis和Holt(1993)也總結了雙向拍賣市場中個體的自利交易行為。但 Fehr和 Fischbacher(2002)認為最后通牒博弈和禮物交換實驗(Fehr等,1993)的證據表明競爭市場中互惠和不平等厭惡使得參與人的行為不那么自利。Schmidt(2011)認為,契約不完全和不確定性會導致社會偏好在市場交易中起更大作用。因此,即使在市場交易中,何種情境屬于何種框架,其一般化的分類標準如何,個體行為如何理解,還需要探討。。
框架影響個體行為選擇可能有三個機制。第一,框架可能影響個體偏好權重的賦值,即個體αi是隨框架變動而變動的,其在純自利行為和不純的親社會行為之間的匹配是隨框架不同而不同的,在某些框架下個體甚至轉入純粹非自利狀態。第二,框架可能影響個體的信念,即影響個體對他人決策的判斷或對概率的判斷。第三,框架可能影響個體的認知與信息。我們首先考慮框架的不同特征對個體偏好結構的影響。不同的框架下的目標不同可以表達為效用函數的不同特性,借鑒Dufwenberg等(2011)提出的可分性偏好模型(即個體的偏好獨立于其他相關個體的消費和預算集),在以自利為主要目標的框架中,效用函數中的純自利得益與其社會偏好得益分離,且整體效用僅隨純自利得益而單調遞增。即:當且僅當在以親社會行為目標為主的框架中,則整體效用僅隨社會偏好維度得益而單調遞增。即:當且僅當
我們稱上述假設為分離假設。同時,不同框架下,不同偏好維度行為成本不同,即cis和cio均不同,使得偏好集B不同。在第一類框架中,對于任意給定相等的xi和x-i,恒有cis≤cio,在第四類框架中,恒有cis≥cio。在第三類和第二類框架中,cis和cio的大小關系不確定。
根據上述假定,依據新古典微觀經濟學個體效用優化的一階條件存在的充分性(如 Jehle和 Reny,2001),可以得出定理 1。
定理1:當個體的多偏好維度效用函數 U(xi, x-i,αi,B)具有連續且擬凹的性質時,存在一個x?滿足Kuhn-Tucker條件,使得U在該處實現效用最大化。
因此,在一定的假設下,具有多重偏好維度的偏好結構的個體決策仍然滿足經典的消費者最優化,個體在不同的偏好維度上的得益亦即其對純自利和社會偏好行為的選擇,是其依據其預算集而作出的效用最大化決策。在給定稟賦w的情況下,不同框架下的成本和個體效用函數不同的偏好權重αi亦即函數形態決定了個體在純自利或社會偏好行為上的分配。進一步地,由效用最大化可以得出個體在某一個偏好維度上的需求函數為:d(x,αi, B )。
根據我們的定義,個體在某一維度上的得益帶來的效用是隨該維度上的得益遞增的,因此純自利行為或社會偏好行為均為“正常品”。這意味著多偏好維度效用函數也服從斯拉茨基方程,并進而可推導出需求法則。我們由此得出定理2。
定理2:個體在純自利維度和社會偏好維度上的得益需求,在偏好權重和稟賦不變的情況下,均是關于其價格cis和cio嚴格遞減的。
與集體行動的一般實驗框架保持一致,本文采用標準的公共品線性供給問題的效用函數。令ai為個體i的貢獻水平,同時也是實施社會偏好行為所付出的價格,實施純自利行為的價格簡化為0。w為每個個體的財富。為集體總貢獻,λ為個體集體行動中分享的得益,個體貢獻剩余是 w -ai,個體的集體行動得益是,因此個體的純自利效用是
個體在集體行動中的社會偏好可以分為兩方面。第一,個體參加集體行動可能是為了他人的福利或集團的福利。通過個人的貢獻,個體感覺到自身為集團福利的提升做出了貢獻(n -1)λai,因利他行為而得了正效用,這一方面的效用可以用 β1(n -1)λai來表示,其中β1>0為個體利他偏好正效用的系數。第二,個體參加集團福利主導型集體行動,其行為選擇可能帶來個體貢獻與其他個體貢獻的差值。如果個體貢獻遠小于其他個體貢獻的平均水平,可能會產生“負罪感(guilt)”(Battigali和 Dufwenberg,2007)。因此,這種不平等厭惡會給個體行為帶來負效用。本模型用個體捐贈小于其他個體捐贈均值X的差值來衡量不平等厭惡帶來的負效用-β2(X-ai),其中β2為個體貢獻小于他人貢獻時的不平等厭惡偏好效用的系數,且β2>0。具有偏好結構的個體在公共品供給中的效用函數選用可微且擬凹的線性效用函數。個體采用社會偏好行為獲得的效用是β1(n - 1)λai-β2(X -ai)。令β為個體在純自利維度上的權重 ,β+β1+β2≤1。同時,集體行動由于本身試圖增進一個群體的福利,因此可以視作以親社會行為為主要目標,但其社會偏好行為具有較高的成本。集體行動參與者效用函數是:

進一步地,在公共物品博弈中,個體并不知曉其他人的貢獻水平,因此假定其他人的平均貢獻水平X為隨機變量,此時由式(1)可得式(2):

則從關于ai的一階條件中可以推出式(3):

由式(3)可得滿足效用最大化的一階最優條件為式(4):

由式(4)分別對偏好系數β、β1、β2求偏導可得,

命題1:純自利權重越高,個體對集體行動的貢獻就越小。
命題2:利他偏好權重越高,個體對集體行動的貢獻就越大。
上述模型與現有的社會偏好集體行動研究(如 Fehr和 G?chter,2002)得出了類似的結論:個體具有社會偏好,社會偏好促進其合作,特別是有條件的合作。但是,其解釋有不同之處,本文的模型關注了個體從集體行動本身獲得的正心理效用以及個體在不同偏好動因之間的權衡。個體從集體行動本身獲得的正效用 β1(n -1)λai是非常重要的,個體感覺到自己為某一目標而貢獻一份力量,感覺到自己表達了訴求和立場,從集體行動本身就獲得了很大的滿足,他們可能甚至根本沒有產生過是否搭便車的考慮。個體關于其貢獻與其他人貢獻的差距的心理感受,則決定了個體在重復博弈中貢獻的動態變化。
試圖解釋自利個體的合作動因的研究都潛在地認為,自利個體認同搭便車策略為其占優策略,這樣合作就只能是由于長期互動導致的演化壓力、誤差與學習或基于概率判斷的隨機優化決策。然而,這一隱含假設是否一定成立,自利個體是否真正認同搭便車策略為占優策略,其本身就需要驗證。對此,本文提出了基于策略遠見的假設,用以解釋集體行動的合作。在本文的理論中遠見(foresight)是指個體更高階的理性能力,個體能意識到每個個體實施納什均衡策略的結果,并考慮帕累托占優的、更具有集體理性的策略,即使該策略可能是非納什均衡策略。遠見使個體能預見到自利和合作的后果,并在其他個體具有類似想法的信念基礎上選擇合作。這些能力基于個體的推理能力,反映了個體不同的“策略水平”。正是基于遠見,個體選擇在時間維度上具有占優性的均衡行為,在自利的前提下也有可能實現集體行動的合作。
個體基于遠見尋求合作的思想由來已久。Brandt和 Schram(1996)提出 “合作得益尋求者(cooperate gain seeker)”模型,合作得益尋求者會對合作者分布的概率作出估計,根據這一信念他們預測合作收益是否可能實現,當他們預計同類的合作者足夠多、合作得益可以實現時,就會作出合作,他們是有意愿追求合作的共同收益而不僅僅是期待搭便車的人。合作得益尋求者理論初步討論了個體重視合作收益的情況,這一理論提示了一個方向,即個體對合作前景的理性思考與判斷可能也是合作的動因,這一動因與個體偏好相分離。Holt和 Laury(2008)等也從前向推理能力角度討論了集體行動合作。但與個體基于其理性判斷的合作動因的研究更相關的是對紐科姆問題(Newcomb's problem)的討論。Nozick(1969)根據紐科姆問題的博弈模型提出了兩條相互沖突的理性原則,即“期望效用最大化”和“占優”。Nozick認為,個體在囚徒困境中如果意識到實施非合作占優策略的效率低于合作,且認為其他個體以一定概率具有同樣想法,則根據期望效用最大化原則,個體可能理性地選擇合作。一些研究探討了紐科姆問題的經濟學形式(Broome,1989)。部分學者認為,只有超過一個參與者且參與者具有成為背叛者(taker)的利益取向時,紐科姆問題才會成為一個囚徒困境問題(Sobel,1991)。由于紐科姆悖論動搖了博弈論對理性個體均衡策略選擇的基本論斷,因此它引起了一些爭論,如 Binmore(1994、2003)對紐科姆悖論進行了系統的分析,他認為紐科姆悖論實際并不存在,假設其他博弈個體與自己同樣思考和行動的思想是一種謬誤。因此,紐科姆問題的討論并沒有對個體的合作動因理論產生影響,但它和“合作得益尋求者”理論一樣,也提示了一個類似的解釋合作的思路,即自利個體可能由于理性能力而具有合作傾向,這種理性能力來自于一種策略性的遠見。事實上,合作博弈中的遠見穩定(farsighted stability)理論也提出了類似思想,即認為個體可以預見到自己的行動帶來的各方的反應和最終的結果,可以自由地構建聯盟(coalition),進行帕累托有效的理性合作(Suzuki和Muto,2005)。
然而,我們提出的策略遠見假設與上述理論尤其是合作博弈理論有所不同。首先,我們完全在非合作博弈框架下考慮問題,盡管合作博弈框架下的遠見穩定理論給我們提供了思路,但個體可以自由地、獨立地進行策略選擇(而非構建聯盟或在聯盟框架內選擇不同的策略)的特性使得我們有必要從非合作博弈的框架中來重構遠見概念。其次,Suzuki和Muto的理論仍然未能揭示個體在遠見合作和占優策略之間的權衡,紐科姆悖論的研究在非合作博弈框架內揭示了這二者的沖突,但也未能揭示占優策略與合作之間交互反應的循環困境,未能探討個體對相互之間默契行動的信念以及個體對終止循環困境的信念這些更關鍵的決策依據,未能將這一思路上升為對個體策略性合作動因的認識,這就需要我們在非合作博弈中考慮個體的遠見,根據個體的決策信念預測個體合作與非合作的策略選擇。
集體行動的根本難題之一在于自利個體以搭便車為占優策略。搭便車之所以占優,是因為在任何一個其他個體貢獻水平上,個體不貢獻都能得到比貢獻更大的得益。所以,無論其他人是否選擇合作,搭便車都優于合作。然而,考慮到所有個體都具有類似的意識,搭便車理論上可以獲得的超額得益是不會實現的,個體搭便車而其他人貢獻并非均衡狀態,所有人都搭便車才是納什均衡結果,而此時的得益小于所有個體一致合作的得益,合作而不是搭便車才是帕累托最優的結果。因此,如果部分個體具有足夠的“遠見”,比其他僅意識到可以搭便車的個體更進一步認識到如果所有人都選擇搭便車,那么實現的得益會遠低于所有人都合作時的得益,則他會希望選擇合作。當然,這一選擇面臨著兩個難題。首先是個體的合作可能不被其他人配合,而個體在其他人搭便車時選擇搭便車是更優的,因此有遠見的個體也可能退出合作;其次是當個體意識到其他人也有類似的合作傾向時,搭便車成為比合作更優的選擇,個體需要抑制這種沖動。
解決第一個問題的關鍵在于個體對群體中類似的合作傾向的估計,如果這種合作傾向足夠高,則個體選擇合作將面臨更小的風險。同時個體的合作選擇能降低群體合作失敗的風險,有助于合作的成功。集體行動的大部分目標是供給某種公共物品,我們仍以標準的線性公共物品供給問題為主要分析框架來對上述思想進行形式化。公共物品供給博弈類型的集體行動中,個體的物質得益是其中w為個體的稟賦,ai為個體對公共物品的投入,λ為個體從集體行動公共產品中分享的比例。假設每個個體具有遠見的概率為p1,則還有m-1個個體具有遠見的概率為:假設合作就只能貢獻自己所有的稟賦,則在線性公共品供給類型的集體行動中,有遠見的自利個體i選擇合作的期望得益是如果包括有遠見的個體i在內,所有個體均不選擇合作,則i的收益為w。當A1>w時,個體i才選擇合作。注意P與有遠見的個體數量正相關。因此,當個體i認為其他有遠見的個體數量足夠多,或個體在集體行動的得益中分享的比例足夠大(必須高于平均分配時的份額)時,他將有可能持有足夠高的合作信念從而選擇合作,規避所有人全部搭便車造成低效率均衡。群體總規模對合作的作用依賴于概率P與N的具體關系,群體規模越大,有遠見的個體出現的概率就越高,但個體可能分享到的得益也可能越少。
第二個問題在個體遠見的假設下能得到解決。如果具有遠見的個體不能抑制在其他人合作時自己搭便車的沖動,則他們會相互推知其他個體也持類似想法,并預見到合作又會走向崩潰。既然個體已經假設具有遠見,且認為其他個體具有一定概率與其具有同樣想法、選擇同樣行動,則個體理應抑制沖動,選擇合作來終止合作崩潰的循環。這里的理論并沒有假設長期互動的壓力,因此個體即使在單期也可能選擇合作。即,若恰好存在m個有遠見的個體且他們選擇合作時,個體i選擇搭便車的得益是A2= (1+λm)w,有A2>λmw。但是,此時其他有遠見的個體也會持同樣的信念,最終所有個體都選擇搭便車,導致實際的得益仍然是w,具有同樣理性的個體會推斷出這一點并形成默契的共同的信念。因此,在其他個體合作的同時選擇搭便車并不符合更高階的理性以及關于對方理性的高階信念,這一策略在個體遠見假設下被精煉,最終有遠見的個體在期望收益足夠大時會選擇合作,導向非合作的循環會被終結。
從博弈類型轉換的視角看,由于個體的遠見在主觀上已經改變了集體行動的性質,對于有遠見的個體而言,博弈已經由有占優策略的囚徒困境博弈轉變成為具有多重可帕累托排序(Pareto ranking)的納什均衡的協調博弈。令個體的最高得益為A3,A3=(1+λ(N-1))w,所有個體合作的得益為λNw,其他人不貢獻而自己貢獻時的得益為λw,作為囚徒困境的集體行動博弈應有(1+λ(N-1))w>λNw>w>λw。令x=f(P)為個體最高得益的減損變量,代表由于以一定概率P存在有遠見個體而帶來的搭便車得益減少,則當x≥(1-λ)w時,有遠見個體在其他個體全部合作而自己搭便車時的得益是A3-x=(1+λ(N-1))w-f(P)≤λNw,此時,個體在主觀上將囚徒困境博弈轉化為一個協調博弈。該博弈具有兩個納什均衡,即全部合作和全部搭便車。
但是,大部分集團福利主導型集體行動的實驗是多期重復的,存在衰減效應。這要求靜態的遠見模型擴展為考慮時間路徑的合作動態的模型。從博弈結構轉換的角度看,隨著時間的推移,合作趨向穩健,短期內進入低效均衡的可能性降低,誘使部分個體選擇搭便車的得益增大。這使得博弈逐漸從協調博弈轉向囚徒困境博弈,合作隨時間逐步衰減。對于遠見個體而言,如果他(她)總是合作,且總是遭遇不合作者的背叛,搭便車造成的損失可能使得有遠見個體消失。那么,有遠見的個體是如何在演化中生存下來的?長期的合作又是怎樣維系的?這方面的研究已經超出了本研究試圖解決的范圍,但是我們嘗試從演化理論角度進行初步推演。Richerson等(2003)指出,人類的演化過程不能局限于在部落(tribal)層次上的理解,而必須超出部落層次,研究其文化選擇(culture selection)才能明確理解合作規范的演化。他們指出,多層次的演化選擇和基因—文化協同演化才能分析人類的合作制度的產生。Boyd等(2003)認為群體層面選擇可以解釋合作的演化進程。他們指出,通過利他懲罰即對違規者的懲罰,群體內可以形成更多的合作;一旦利他懲罰變得普遍,違規就變得罕見,從而懲罰成本也有效降低。在更多懲罰威脅下內部形成更多合作的群體將遭遇更少滅絕威脅,具有演化適存性,這種群體層面選擇使得懲罰和合作變得普遍,從而越出小群體的合作。Bowles和 Gintis(2003)用仿真方法考察了近 10000期的演化過程,發現當群體中存在“強互惠者”(即遵守合作規范且愿意負擔成本去懲罰違規者的人)時,人群中合作將變得普遍,而且合作者、違規者和強互惠者可以并存,從而解釋了目前社會中合作傾向的分布現狀。從這些早期研究中,我們找到了可能的答案。結合上述文獻,我們認為,在長期演化過程中,至少有兩種力量可以保證遠見個體的基因和遠見文化得以傳承。首先,缺乏遠見個體引導的群體長期陷入低效率的不合作狀態,而有遠見傾向個體和其他合作個體比例足夠高的群體卻長期通過合作生存發展。最終,群體選擇的壓力淘汰了缺乏遠見個體比例高的群體,使得生存下來的群體必然保留了較多具有較高遠見的個體,并從文化上向一代又一代后裔縱向傳遞遠見的重要性(這也是為何我們有“人無遠慮,必有近憂”等諺語的一個可能的原因)。其次,正如 Bowles和 Gintis(2006)指出的,群體中存在強互惠者。強互惠行為能維持長期合作,也符合遠見個體的認知。故而,有遠見的個體和其他強互惠者都可以采取強互惠態度:他們首先遵守長期有利的合作規范,而對于違規的群體,他們也可以進行懲罰。這樣的群體內最終懲罰很少而合作很多,在選擇壓力下獲得了生存。因此,在基因—文化協同演化過程中,有遠見個體較多的群體具有了更高的演化適存性,能對抗可能的威脅。這種遠見帶來的演化優勢不僅使得遠見作為一種基因和文化記憶被選擇和傳承。最終,我們會觀察到長期的合作。
由于社會偏好驅動的合作和遠見驅動的合作在個體行為表現上相同,因此分離社會偏好驅動的合作和策略遠見的合作就必須盡可能減少社會偏好的影響,并找到個體遠見行為的直接證據。在單期博弈中,個體不存在互惠和有條件合作行為,其合作主要是出于利他和考慮到自利行為后果的不平等厭惡,因而我們采用了實驗室內的單期公共物品實驗。單期的公共物品實驗采用標準的線性公共品實驗的支付函數。
根據遠見假設,對遠見的外部強調有可能啟發被試更多地考慮基于遠見的合作策略,這也會加強已有遠見的個體對群體合作的信念,從而有可能激發更多基于遠見的合作。因此,單期公共品實驗中,設計了兩個強調遠見的實驗,其中一個實驗是在實驗說明中通過指導語來外部啟發遠見,另一個設置則同時采用實驗說明指導語和“三個和尚”的剪輯視頻來啟發遠見,第二個實驗的強調程度更高。為了避免不同被試的社會偏好水平、理性能力的差異造成的擾動,實驗采用了組內設計,即同一批被試先后參與了強調遠見的設置和無強調的設置。
實驗是基于局域網的單期博弈,為標準線性公共物品供給的形式,每組4人,每人有10單位稟賦,每人各自獨立地作出公共品投資,本組投資的總和乘以不變的系數為每人從公共品投資中分享的得益,而這個得益加上稟賦剩余則為本時段得益。MPCR始終為0.4,收益計算公式如下:

其中,第i個人的初始稟賦為10 G$,πi(i=1,2,3,4)是第i個人的在本時段的收益(需四舍五入為整數),gi是第i個人的投資量是本組所有人投資量的和。
同時,為將被試的社會偏好動因和基于遠見的策略動因直接揭示出來并進行對比,我們還試圖通過問卷調查進一步探尋合作動因。被試在實驗后填寫調查問卷,回答其策略選擇動機。問卷在描述動機時沒有采用里克特量表方式,而是直接將有待考察的動因寫成選項供被試選擇,但預留了“其他原因”的選項供可能具有特別動因的被試選擇。通過對被試動機選擇的統計,可以考察具有遠見的被試在人群中所占的比重,分離具有社會偏好而無遠見、自利偏好而無遠見、社會偏好而有遠見和自利偏好而有遠見四類人群,分析其決策與偏好、遠見的關系。通過問卷調查分析偏好動因的研究已有范例,例如,在社會偏好研究方面,Perugini等(2003)開發了測度互惠的問卷量表,Dohmen等(2009)利用基于該量表的 SOEP調查證實了互惠的存在,并探討了互惠個體的經濟生活方面的特征。我們結合實驗室實驗的問卷調查設計借鑒了上述研究。
實驗共有四個設置。指導語強調的實驗中,在實驗說明中加入了一段強調遠見的指導語:“根據上述決策過程,如果同組所有四人都把初始稟賦全部投資,則每人將能獲得16;當同組其他三人將初始稟賦10全部投資而你不投資時,你的收益為22,其他三人的收益都是 12;如果其他三人也和你有一樣的想法,則你們組的所有人都不投資,你們每個人將只能獲得初始稟賦 10。當然,每組人很可能將初始稟賦的一部分用來投資而不是全部。”為避免實驗設置的順序效應,指導語強調的實驗分為兩個設置,一局為一個設置,其中一局為先強調設置,即第一次單期博弈前閱讀指導語,然后進行第一次單期博弈,再停頓四分鐘后進行第二次單期博弈;一局為后強調設置,即先進行第一次單期博弈,隨后閱讀指導語并停頓四分鐘后進行第二次單期博弈。博弈之間的停頓是為了避免上一次博弈的經驗和感受對下一次博弈產生過強的影響。
指導語加視頻實驗的設計與指導語實驗相同,唯一的差別在于指導語和視頻。為進一步突出遠見的作用,調整了指導語的表達,更明確地提示基于遠見合作可能更優,指導語為:“根據上述決策過程,當同組其他三人將初始稟賦10全部投資而你不投資時,你的收益為 22,其他三人的收益都是 12。然而,所有人都是同樣理性的,很可能他們也都不投資,如果你們組的所有人都不投資,你們每個人將只能獲得初始稟賦 10,反而不如同組所有四人都把初始稟賦全部投資,這樣每人將能獲得 16。當然,每個人也可能將初始稟賦的一部分用來投資而不是全部。”在閱讀指導語之后,被試還將觀看“三個和尚”的剪輯視頻,視頻展示了三個和尚由于搭便車而無水可用、由于合作而水量充足的故事,對被試作出了更強的基于遠見的合作啟發。該設置也進行兩局,即先強調的設置和后強調的設置。
為分離個體在集體行動中的合作動機,我們設計了測度單期博弈中被試的合作行為動機的問卷。問卷首先區分了個體的“合作”的程度,將合作具體表達為個體是否進行了公共物品上的投資,特別測度了是否將稟賦的半數以上投資于公共物品。問卷在指導語實驗中測度了個體針對兩次博弈的共同的決策準則,而在視頻加指導語設置中進一步細分了兩次博弈的決策。
問卷的每一個題項的選項涵蓋了被試可能具有的主要單期合作動機,即利他、不平等厭惡、遠見、光熱效應和其他原因。對于利他動機的表述為其貢獻“有利于其他人”。不平等厭惡動因的實質是有意避免因自己的不合作而使其他人遭受損失,故不平等厭惡選項表述為“我不希望因為我不合作導致其他人受損失”。遠見的實質在于個體的預期,即預見到我和其他人均不合作后,出現的得益要低于所有人合作的情況。因此,對遠見的選項描述為“我知道如果我不投資,大家也不投資,那么情況會比投資更差”。此外,問卷還準備了其他原因選項和開放性表述供其他動因的被試表述。
具有遠見的個體需要形成同組組員與其共同合作的信念才能作出合作決策,因此測度其對于其他同組成員具有同樣意識且默契合作的預期就非常必要,如果遠見個體預期存在默契合作的概率足夠高,則其更有可能合作。因此,題項中特別詢問了被試預期其他個體具有類似的遠見并與其合作的概率。
最后,問卷還測度被試是否理解了收益公式所隱含的納什均衡,即搭便車策略是個人利益最大化的占優策略。
問卷的表述如下。
1. 在剛才的第一次投資決策中如果你選擇投資,你是如何考慮的?(可多選)
(1) 我希望我的投資有利于其他人
(2) 我不希望因為我不合作導致其他人受損失
(3) 我知道如果我不投資,大家也不投資,那么情況會比投資更差
(4) 我認為我作出的投資本身就給我帶來快樂
(5) 其他理由:請注明
(6) 如果你有選擇 3,你認為同組其他人持有類似想法并與你默契地合作的概率是多少?(以百分比表示)
2. 在剛才的第一次投資決策中如果你選擇投資多于5,你是如何考慮的?(可多選)
(1) 我希望我的投資有利于其他人
(2) 我不希望因為我不合作導致其他人受損失
(3) 我知道如果我不投資,大家也不投資,那么情況會比投資更差
(4) 我認為我作出的投資本身就給我帶來快樂
(5) 其他理由:請注明
(6) 如果你有選擇3,你認為同組其他人持有類似想法并與你默契地合作的概率是多少?(以百分比表示)
3. 在剛才的第二次投資決策中如果你選擇投資,你是如何考慮的?(可多選)
(1) 我希望我的投資有利于其他人
(2) 我不希望因為我不合作導致其他人受損失
(3) 我知道如果我不投資,大家也不投資,那么情況會比投資更差
(4) 我認為我作出的投資本身就給我帶來快樂
(5) 其他理由:請注明
(6) 如果你有選擇3,你認為同組其他人持有類似想法并與你默契地合作的概率是多少?(以百分比表示)
4. 在剛才的第二次投資決策中如果你選擇投資多于5,你是如何考慮的?(可多選)
(1) 我希望我的投資有利于其他人
(2) 我不希望因為我不合作導致其他人受損失
(3) 我知道如果我不投資,大家也不投資,那么情況會比投資更差
(4) 我認為我作出的投資本身就給我帶來快樂
(5) 其他理由:請注明
(6) 如果你有選擇3,你認為同組其他人持有類似想法并與你默契地合作的概率是多少?(以百分比表示)
5. 你是否理解對于剛才的投資決策,你投資0是最優的?
(1)是 (2)否
實驗是在國內某大學的標準的經濟學/管理學實驗室進行的,共有 72名被試參加,其中指導語實驗下先強調設置有被試20人,后強調設置有被試16人;指導語加視頻實驗中先強調設置被試 16人,后強調設置被試 20人。被試主要來自隨機招募的高年級本科生和低年級研究生。已有關于公共物品實驗的文獻基本都采用學生被試,盡管學生群體在一些實驗中表現出與非學生群體的差異(Henrich等,2010),但在測度基礎性的行為問題方面,大部分研究表明學生被試與非學生被試不存在顯著差異(Croson 和 Wu,2017)。在保障實驗結果的效度方面,更關鍵的問題在于被試在設置間分配的隨機性和同質性。我們在不同設置下做到了被試隨機招募和分配,不同設置間男女性別比、專業比基本平衡。所招募被試并未接受過專門的博弈論訓練。因此,在可觀察的變量方面,我們做到了對被試特質的控制。實驗程序使用 Z-tree軟件(Fischbacher,2007)編寫。
根據遠見假設,在單期公共物品博弈實驗中,由于采用組內設置,被試的偏好結構可視為外生給定,在外部的遠見啟發下形成的更強的合作,可視為由遠見造成的合作增強。因此,實驗結果分析要檢驗的首要假設是假設1:有強調的設置下公共品貢獻的水平高于無強調設置。
僅指導語強調的實驗結果表明,先強調的設置下,第一次公共物品博弈的貢獻均值為 4.5,而第二次博弈的貢獻均值為 2.9,Wilcoxon檢驗顯示,兩次博弈的有 0.05水平上的顯著差異(z=-2.042,sig=0.041)。后強調的設置下,第一次公共物品博弈的貢獻均值為 3.56,而第二次博弈的貢獻均值為 2.19,Wilcoxon檢驗顯示,兩次博弈的貢獻無顯著差異(z=-1.085,sig=0.278)。
指導語加視頻強調的實驗結果表明,在先強調的設置中,第一次公共物品博弈的貢獻均值為 2.88,第二次博弈的貢獻均值為 1.56,Wilcoxon檢驗顯示,兩次博弈的貢獻水平有 0.05水平上的顯著差異(z=-2.254,sig=0.024)。但在后強調的設置中,第一次公共品博弈的貢獻均值為5.85,而第二次博弈的貢獻均值為3.8,Wilcoxon檢驗顯示,兩次博弈的貢獻水平有0.05水平上的顯著差異(z=-2.167,sig=0.030)。
上述結果表明,先強調設置下的結果驗證了實驗假設1,在強調遠見和合作的指導語或視頻的啟發下,被試作出了更多的合作。后強調設置下的實驗結果與實驗假設 1相反,有啟發的情況下被試反而更少合作。但是,由于實驗進行了兩次單期博弈,實際上可能形成兩期重復博弈的效果,而在重復公共物品博弈中,貢獻隨時段衰減的效應會導致第一期的合作高于第二期,這意味著,先強調設置下第一次博弈比第二次博弈更高的合作水平可能并不來自于遠見的啟動,但后強調設置下第二次博弈合作的下降也可能并不是由于遠見缺乏,它們都可能歸因于衰減效應。
在后強調設置中,由于第一次博弈是未作任何特殊設置的單期公共物品實驗,故其合作水平可與先強調設置(不區分是何種強調)的合作水平比較,考察第一次博弈較高的合作是否主要來自遠見的啟動。在先強調設置中,經過停頓,第二次博弈可以被視為遠見啟動造成的合作增強效應減退以后的博弈,其合作僅受衰減效應的影響。通過先強調設置和后強調設置的第二次博弈的對比,可以剝離衰減效應造成的擾動。因此,需要檢驗兩個假設,即假設2:先強調設置的第一次博弈合作水平高于后強調設置的第一次博弈合作水平;假設3:先強調設置的第二次博弈合作水平低于后強調設置的第二次博弈合作水平。
由于第一次博弈數據經單樣本 KS檢驗均符合正態分布,故采用兩獨立樣本 T檢驗,結果表明,第一次博弈數據之間無顯著差異(t=-1.309,sig=0.195)。第二次博弈數據均不符合正態分布,故采用兩獨立樣本的非參數檢驗,Mann-Whitney U檢驗結果表明,后強調設置下第二次合作水平與先強調設置下有 0.05水平上的顯著差異(z=-2.014,sig=0.044),且均值為3.08,高于后者的均值即2.31。對于第一次博弈而言,無論是否強調遠見,合作水平無顯著差異,但第二次博弈中,遠見的啟動明顯對沖了衰減效應的影響,顯著提升了合作水平。假設 2未得到支持,假設 3得到支持。
進一步地,若遠見發揮了作用,使得第一次博弈的合作水平在先強調設置下升高,第二次博弈的合作水平在后強調設置下升高,則應有先強調設置下兩次博弈合作水平之差高于后強調設置下兩次博弈合作水平之差。實驗結果是,在指導語實驗的先強調設置中,第一次博弈和第二次博弈的貢獻值差為 32,后強調設置中第一次博弈和第二次博弈的貢獻值差為22,遠見的啟動帶來了10的貢獻增長。在視頻加指導語實驗中,后強調設置的第一次博弈和第二次博弈的貢獻值差為41,先強調設置中第一次博弈和第二次博弈的貢獻值差為 21,遠見的啟動反而造成了貢獻的減少。但是,視頻加指導語實驗中后強調設置的被試貢獻占稟賦比例顯著高于其他設置,這表明被試的合作水平動因存在異質性,需要對被試的合作動因進行更直接和深入的分析。
單期博弈被試合作動因分析主要依賴調查問卷的分析。在問卷中,所有題項的選項1測度被試的利他偏好,選項2測度被試的不平等厭惡偏好,選項 3測度被試基于遠見的理性能力,選項4測度被試的光熱效應(warm-glow)偏好,選項5作為開放性問題,收集被試其他的合作動因。根據遠見假設以及偏好和遠見動因的差異,提出假設4:存在選擇題項 3的被試,且此類被試認為其他個體合作的概率大于 0,貢獻高于平均貢獻。在下面的數據處理中,如強調“僅選擇”,則指該被試僅選擇了某一個或幾個同類的(都與社會偏好有關的)選擇。如不強調“僅選擇”,則指被試可能選擇了這類動因,也可能同時選擇了其他動因。例如,如被試僅選擇了選項3,則該被試除了3未選其他任何選項。如被試選擇3,則其可能選擇了3,也可能同時選了3和4。對上述兩種單選和多選結果的情況,我們作出了分別的統計。
在回收的 72份被試選擇問卷中,在至少一個題項中選擇選項 3的被試共有 48人,占全體被試的66.67%。將在問卷的所有題項里都僅選擇了3的被試定義為僅有遠見的被試,這樣的有9人,占全體被試的12.5%。在至少一個題項中有選擇選項1的被試共有27人,占全部被試的37.5%,僅選擇選項1的被試只有1位。在至少一個題項中有選擇選項 2的被試有 37人,占全體被試的 51.39%,其中僅選擇 2的被試只有 3人,占全部被試的 4.17%。在至少一個題項中有選擇選項 4的被試共有 20人,占全部被試的 27.78%,其中僅選擇 4的被試為 4人。此外,有 16人選擇了 5,即“其他原因”,但有 6人是由于自己未作任何貢獻,有 1人完全未回答其動因。因此,遠見與社會偏好的復合動因是最為主要的合作動因。在單選的合作動因中,遠見動因是較為主要的動因,“光熱效應”動因為第二大動因,“不希望因為我不合作導致其他人受損失”的不平等厭惡動因和利他動因為第三和第四大動因。
在至少有一個題項中選擇了 3的被試中,有 23位同時在至少一個題項中選擇了1,有26位同時在至少一個題項中選擇了2,分別占48名被試的47.92%和54.17%,在至少一個題項中同時選擇1、2、3的被試有11人,占48位被試的22.92%;有11位選3的被試同時至少在一個題項中選擇了4,只有2人選擇了1、3、4。因此,選擇了3的被試在策略動因維度上具有遠見激發的合作動因,同時在偏好維度上具有多種社會偏好,一部分被試會同時受利他、不平等厭惡或光熱效應的驅動。在不認為自己具有遠見的被試中,合作更多受不平等厭惡和光熱效應的單一偏好驅動,或受利他和不平等厭惡的復合偏好驅動。表1列示了選擇各類動因的被試在全部樣本中所占比例。

表1 選擇各類動因的被試在全部樣本中數量及其所占比例
在指導語實驗中,問卷未區分兩次博弈,而是就整體情況進行了詢問,事后訪談得知,被試基本上回答第一次博弈的決策動因。表2 列示了回答其考慮各類動因的個體比例,n代表指導語設置下所有被試的數量。其中問題 1詢問被試作出非零貢獻的動因,其中半數被試選擇了 3,即表達了遠見考慮,其中僅選擇 3的被試有 6人,占16.67%。問題 2詢問的是被試作出大于 5的貢獻的動因,此時選擇 3的被試有所減少,但其中僅選擇3的被試有7人,占19.44%。此外,有10位被試僅選擇了1、2或1和 2,占 27.78%。因此,具有多種復合動機的被試總體占比最高,但具有遠見的被試,即使是僅具有遠見的被試,占有15%~20%的比例。

表2 指導語設置下選擇各類動因被試的人數及其比例(n=36)
在視頻加指導語實驗中,問卷細分了兩次博弈,分別詢問了第一次博弈中被試作出非零貢獻(問題1)和高于5的貢獻(問題2)以及第二次博弈中被試作出非零貢獻(問題3)和高于5的貢獻(問題4)的動因。在先強調設置中,問題1中選擇了3的被試共有8人,占16位被試的50%,其中僅選擇3的被試有5人。此外,有4人僅選擇了利他、不平等厭惡或光熱效應等親社會偏好動因,另有3人選擇了其他原因。問題2中選擇了3的被試共有4人,占16位被試的25%,其中僅選擇3的被試有2人。此外,有6人僅選擇了利他、不平等厭惡或光熱效應等親社會偏好動因。在后強調設置中,問題1中選擇了3的被試共有11人,占20位被試的55%,其中僅選擇3的被試有4人。此外,有 8人僅選擇了不平等厭惡或光熱效應等親社會偏好動因,另有 1人僅選擇了其他原因。問題2中選擇了3的被試共有6人,占20位被試的30%,其中僅選擇3的被試有3人。此外,有9人僅選擇了利他、不平等厭惡或光熱效應等親社會偏好動因。
表3列示了在視頻加指導語實驗中選擇各類動因被試的人數及其比例。在其中的先強調設置中,問題3中選擇了3的被試共有7人,占16位被試的43.75%,其中僅選擇3的被試有6人。此外,有7人僅選擇了利他、不平等厭惡或光熱效應等親社會偏好動因,另有1人僅選擇了其他原因。問題4中選擇了3的被試共有2人,占16位被試的12.5%,其中僅選擇3的被試有2人。此外,有7人僅選擇了利他、不平等厭惡或光熱效應等親社會偏好動因,只有一人選擇了2、4的復合偏好動因,另有6人選擇了其他原因或不填。在指導語加視頻后強調設置中,問題 3中選擇了3的被試共有 10人,占20位被試的 50%,其中僅選擇3的被試有7人。此外,有6人僅選擇了不平等厭惡或光熱效應等親社會偏好動因,另有 2人選擇了其他原因。問題4中選擇了3的被試共有4人,占20位被試的20%,其中僅選擇3的被試有3人。此外,有7人僅選擇了利他和不平等厭惡等親社會偏好動因,另有9人選擇了其他原因或不填。

表3 視頻+指導語設置下選擇各類動因被試的人數及其比例(n=36)
從上述結果看,在第一次博弈中,先強調設置下并未有更多個體具有遠見,但在第二次博弈中,后強調設置下卻有更多的被試基于遠見選擇合作,再次表明遠見的啟動在后強調設置中發揮了明顯作用,但在先強調設置中可能因為被試的較強親社會偏好以及偏好的異質性而被削弱。在第二次博弈中,由于衰減效應,個體更難合作,尤其是作出高于稟賦中位數的合作,但如果個體在第二次博弈中仍然合作,則其更可能是出于遠見,若其選擇高于中位數的合作,更可能完全出于遠見而合作。
僅有遠見仍不足以進行合作,有遠見的個體是在其他人具有類似想法并進行合作的信念基礎上選擇合作的。在問卷中,被試要報告其對其他人具有遠見并合作的概率判斷。在視頻加指導語實驗的問卷中,被試要針對兩次博弈分別報告概率,僅選取較低的概率作為其判斷。在指導語實驗的先強調設置中,有遠見的被試報告的平均概率為62%,后強調設置中,有遠見的被試報告的平均概率為42%。在視頻加指導語實驗的先強調設置中,有遠見的被試報告的平均概率為 62%,后強調設置中,有遠見的被試報告的平均概率為49%。因此,選擇了選項3的被試的確報告了一定的概率,表明其對其他個體的合作具有穩定的信念和預期。
進一步看,可從貢獻水平中識別出合作個體的類型。48位有選擇 3的被試中,有42位至少在一次決策中作出了非零貢獻,占比87.5%,有33位被試在兩次決策中均作出了非零貢獻,占比 68.75%。這高于僅選擇各類社會偏好動因的被試。在純粹選擇社會偏好動因的個體中,12人至少在一次決策中作出了非零貢獻,占比 80%。只有 6人兩次決策均作出非零貢獻,占比 40%。如果將作出了大于等于 5的貢獻且選擇了 3的被試定義為“遠見高合作個體”,則第一次博弈中這樣的個體共有25人,占全部72位被試的34.72%。在第二次博弈中這樣的個體則有 17人,占全部72人的23.61%。如果將至少一次決策中作出了大于等于5的貢獻且選擇了1、2、4的被試定義為“社會偏好高合作個體”,則第一次博弈中這樣的個體有 28人,占全部被試的 38.89%。在第二次博弈中這樣的個體有 17人,占 23.61%。但是,上述人群中主要是復合動因個體。遠見高合作個體中存在4位僅選擇了3的被試,即“純遠見高合作個體”。將至少一次決策中作出了大于等于 5的貢獻且僅選擇了 1、2、4的被試定義為“純偏好高合作個體”,這樣的個體共有6位,在偏好合作個體中剔除純偏好合作個體后有22位被試,可定義為“復合動因高合作個體”。從實際的貢獻水平看,純遠見高合作個體在第一次博弈中人均貢獻為 8.67,第二次博弈中貢獻均值為 2.75;純偏好高合作個體在第一次博弈中貢獻均值為6,第二次博弈中貢獻均值為2;同時有選擇3和1、2、4的復合動因高合作個體在第一次博弈中貢獻均值為 7.73,第二次博弈中貢獻均值為 7.93。所有僅有遠見的被試的第一次貢獻均值為 3.9,第二次貢獻均值為 1.8。僅有利他、不平等厭惡或“光熱效應”等偏好的被試的第一次貢獻均值為3.26,第二次貢獻均值為1.47。同時有選擇3和1、2、4的復合動因被試的第一次貢獻和第二次貢獻分別是5.24和3.76。因此,在剔除實際并未作出足夠高合作的“心口不一”的被試后,基于遠見而進行合作的被試仍然在高合作被試中占據了一定比例,且純粹出于遠見而合作的被試的合作水平均值相對純粹出于社會偏好的被試更高,但復合動因的被試是高水平合作群體的主流,也作出了最高的平均貢獻。因此,總體上看,假設4得到了部分支持。
總之,通過對單期公共物品博弈實驗的決策結果和問卷調查的分析,可認為,基于遠見的策略動因和基于利他、不平等厭惡以及“光熱效應”的親社會偏好(可能主要是不純的社會偏好),構成了集團福利主導型集體行動參與者在單期仍選擇合作的主要動因。這與第二部分模型得出的命題以及第三部分關于遠見的存在及其影響的命題是相互印證的。遠見的強調和啟動僅在促進單次博弈的合作和削弱衰減效應方面起到了較顯著的作用。雖然單一的遠見并不總是能將合作提升到足夠高的水平,也并不是個體最主要的合作傾向,但偏好結構與策略動因的結合就可以構成維系合作的主要力量。
本文首先對偏好和策略動因范疇作了擴展。我們認為,個體的偏好是多維度偏好耦合的,個體既具有純自利偏好,又具有“不純的”社會偏好,還具有純粹的社會偏好,三個偏好維度的差異不僅在于其是否“考慮”和“關心”其他人的策略與福利,而且還在于其偏好序的調整是否受到滿足該種偏好的成本的影響。將框架的特征分為兩個維度,分析了四類框架下個體偏好結構參數和決策行為的調整。我們聚焦于遠見這一特別的策略動因。本文認為,集體行動中的部分個體可以預見到博弈的各種均衡結果,他們能意識到,不合作不僅不會給個體實現最大化的得益,而且可能帶來無效率的結果,合作反而可以提高集體和自身的實際得益。如果他們認為群體中持有類似認知的個體足夠多,合作的概率較高,則他們有可能選擇合作而不是搭便車。
將偏好結構和遠見綜合在一起,本文對線性公共物品自愿供給類型的集體行動進行了理論分析,模型的結果是,具有自利和社會偏好耦合的偏好結構的個體更有可能作出貢獻,其貢獻取決于公共物品的價值、社會偏好維度權重、不平等厭惡強度系數等。無論個體偏好如何,遠見可以導致個體理性地作出貢獻,即使搭便車才是占優均衡策略。從遠見的角度看,具有囚徒困境形式的公共物品博弈可以退化為協調博弈。我們進行了分離社會偏好和遠見在推動集體行動合作方面作用的實驗。結果表明,存在一定比例的表達遠見考慮且真實地作出了較高貢獻的被試。總體上看,在單期公共物品博弈中,具有自利和社會偏好且具有一定程度的遠見的個體,是提供較高貢獻的主體。
總體上看,本文為集體行動合作提出了新的假說和解釋,也考察了新的動因解釋變量。將個體同時具有多樣偏好且其偏好序根據不同的框架而改變的情況作為基礎假設,這意味著個體將根據不同框架下的目標和滿足某一特定偏好的成本(即偏好的價格)作出理性的選擇。這一研究不僅可以運用于集體行動、公共物品私人供給的相關問題,而且可以一般化地擴展到許多行為經濟學發現的“偏差”或“異象”的解釋上。行為經濟學關于社會偏好的研究,實際上并沒有全面修改和擴展微觀經濟學對于個體偏好的假設,而是提供了一個重要的分析問題的視角。事實上,傳統的微觀經濟學并未假設個體完全自利,而是假設個體理性,即具有偏好的一致性。但是,標準微觀經濟學和博弈論分析都相對忽視個體多樣的親社會偏好,而簡單假設個體僅關注自身得益。這種過于狹隘的視角阻礙了對多種經濟社會行為的解釋。涉他偏好的提出,表明了個體關注甚至關心他人的得益、行為與意圖(即慮他)。但無論是實驗證據(Anderoni和Miller,2002)還是現實經濟行為,都表明個體是在自慮與慮他(other-regarding)之間進行復雜權衡。雖然已有社會偏好模型捕捉到了這種權衡(Fehr和 Schmit,1999),但我們進一步認為這種權衡也應符合需求定律,將傳統微觀經濟理論與行為經濟學更有機地統一起來,并可解釋人們面臨自慮和慮他決策困境時的許多行為。如 Gneezy 和Rustichini(2000)等發現,增加罰款并不能有效提高人們對規則的遵守,反而由于人們將罰款視為一種付費而愈加不守規則。相關研究進一步討論了忽視社會偏好以后導致的激勵擠出及其糾正(Kurz等,2014)。根據我們的理論,人們并非不對負激勵(如懲罰)作出合理的反應,而是因為負激勵造成的成本、遵守規則造成的成本等“價格因素”。如果違規的成本真的足夠高,或者懲罰命中了當事人真正的“痛點”,那么負激勵仍然會產生作用。擠出效應也可以看作一種框架的改變,遵守既定社會規范為目標的框架和市場行為框架的沖突,是擠出效應的一個本質內容。提高懲罰的道德導向而不是物質結構導向,也可能糾正被懲罰所扭曲的框架,使人們仍然以遵守規則為目標,則懲罰就能產生作用。社會排斥、公開的譴責等都是這樣思路的懲罰措施。另外,在市場競爭中,人們比較接受不平等,而在日常生活中人們更多希望平等,這也是一種目標不同的框架造成的決策差異。因此,我們的偏好結構理論具有一定的經濟學意義。
我們提出遠見假設,回應了經典博弈論對紐科姆問題的質疑,肯定了被試選擇非占優策略的合理性,這些結果為集體行動的微觀動因提供了一個可能的說明。自Olson(1965、2011)以來,行為和實驗經濟學對于集體行動的研究大多聚焦于解答個體為何不搭便車。如果我們把公共物品的私人供給以及為保障公共品供給而采取的措施(即二階集體行動)視為制度建構的主要內容,我們的遠見假設也就可用于對于制度變遷的解釋。事實上,搭便車等囚徒困境問題沒有從根本上斷絕人們建立合理制度、實現適度合作的可能性,一個原因就是少數具有遠見的個體的領導、勸說與示范作用。這種遠見也可能會擴展到人群之中,形成一種規范和文化,得以固化和遵守。更進一步地,具備策略遠見的群體更能擺脫囚徒困境和Hobbes叢林狀態,從而建立高效而有序的社會,積累更多的財富與人口,從而具有適存優勢。葉航(2012)認為,通過演化博弈模型的多期仿真后可發現,強互惠者的懲罰會使社會演化出實施集體行動的規則,從而克服二階集體行動難題,避免無法懲罰搭便車的情況。事實上,這種演化結果也可以解釋我們對遠見在長期動態過程中的看法:有遠見的個體出于長遠合作的考慮,而勇于懲罰其他人,甚至說服其他人建立規則,避免搭便車行為。遠見導致的群體選擇優勢,可能使遠見成為一種文化甚至基因痕跡。文化與基因共同演化的結果,是遠見意識存在于人們的社會認知和潛意識中,在面對困境時能得到表達。重大歷史轉折,也往往是有遠見的個體和群體領導的結果。我們的研究也突破了當前行為經濟學多關注“短視”和“偏差”的現狀,有望為聚焦于人們表現出較高理性能力的條件提供一個先導性研究。
當然,本文仍然存在相當的后續拓展空間。偏好結構假設是集體行動理論的關鍵基礎假設。本文的偏好結構理論中個體的偏好仍然是基于博弈結果,而非基于對方動機,雖然強調偏好結構依賴框架而調整,但也未能對具體的框架特征下集體行動的特征與社會規范的演化做深入探討。這意味著偏好結構需要與心理博弈結合,不僅包含其他人的福利和策略,而且包含從對方的策略選擇中讀取的動機,并具體化分析各種框架下個體行為和社會規范的差異,與偏好性行為相區分。同時,要擴展顯示偏好原理、斯勒茨基方程、福利經濟學定理甚至一般均衡理論,使這些理論可以容納多重偏好,并使偏好結構可以運用于沖突等集體行動問題。另外,需要進一步推進個體遠見理論,將個體的遠見與短視結合起來考慮,分析個體在何種條件下具有遠見,何種條件下短視,何種條件下遠見或短視主導集體行動。