合作與信任是人類社會得以存在和發展的基礎,但它們總會被自私所侵蝕?;舨妓拐J為,無論人與人還是國與國的關系,隨著資源稀缺的加劇,都會變得更接近狼與狼的關系。但是,現代社會終究沒有淪為原始叢林,有合作善意的人群還沒有滅絕,人與人之間的溫情和信任也沒有消失——自私和克制自私,似乎同樣屬于人類本能。
由此,美國密歇根大學政治學家羅伯特阿克塞爾羅德(Robert Axelrod)開始思考:在現代復雜社會中,何種行為規則才是個人收益最大化的最優競爭策略?
上世紀80年代,他寫信給不同學科的學者,讓他們提供自以為最佳的行為規則,然后編成電腦程序,相互競賽。第一場錦標賽,他共收到14個程序,在捉對廝殺中,程序運轉了十多萬次,最后按照總得分排出名次。勝出的程序,竟是其中最簡單明了的“一報還一報”(Tit for Tat)。
“一報還一報”是人類最古老的行為規則之一。它要求我們最初總以善意待人,在沒有被欺騙之前,永遠不要主動欺騙他人;但一旦發現他人的欺騙,下次交往時要毫不猶豫地報復、懲罰;懲罰過后,又回到起點,繼續善意待人。這種行為規則中,永遠只需記憶最近一次的對方行為,寬容看待對方的過往行為,除了上一次背叛。
很快,阿克塞爾羅德又組織了第二場錦標賽。這次他收到了62個程序,其中還有不少程序針對“一報還一報”做了專門改進。一場混戰的結果是,“一報還一報”再次排名第一。
這兩次錦標賽充分證明了“一報還一報”策略的威力。阿克塞爾羅德后來曾公開征集可能打敗它的策略程序,但20多年過去,還沒有程序能做到這一點。阿氏把“一報還一報”所體現的精神歸納為“KISS”(Keep It Simple,Stupid)原則,即盡可能簡單、愚蠢。簡單到可以用一句話概括,又愚蠢到不記憶對手的歷史行為,正應了“大智若愚”的中國老話。
阿克塞爾羅德繼續發展這套工具,開始研究不同策略行動在大規模、長時段、更復雜的社會演化過程中的表現。他發現,一旦在電腦錦標賽中加入博弈者之間的誤解、合謀、壟斷等更貼近現實社會的要素,就會出現新問題。以“一報還一報”策略為例,單純的“一報還一報”不大可能成為“壞策略”,因為它不會總被人利用;但它也不見得永遠都是“好策略”,因為有時它不夠寬容。
真實的社會交往中,我們只能通過他人行動來推測其動機,這樣很容易產生誤解,既會誤解別人,也被別人誤解。當兩個都采用“一報還一報”策略的人相遇,其中一方偶爾誤解對方,實行報復,雙方就可能陷入報復循環,不能自拔。此時,附加一些寬容條件,如容許對方偶爾犯錯,容許對方自我悔悟等,這樣的策略會取得更好的結果。
這表明,社會秩序和規范并非由簡單利誘或威懾壓力造成,必須考慮總體環境與各種文化、制度的影響。個人行動策略必須置于總體社會的演化過程之中,意義才可能凸現。行動者在選擇行動策略時,真正要面對的不僅是單個競爭對手,還有各自所處的小團體和大團體,各式各樣的顯規則和潛規則。這時,威懾、法律、聲譽、社會認同、成員身份等非經濟約束都可能起到很大作用。
尤其值得一提的是,阿克塞爾羅德發現了“元規范”的作用。所謂“元規范”,就是行動者不僅自身遵循社會規范,而且也不惜付出代價,主動懲罰不遵守規范的人。從短視的經濟人角度看,個人付出代價來維護集體利益并不理性,但“元規范”在穩定的人類社會中卻廣泛存在,對社會進步起到極大作用。阿氏的大型計算機仿真實驗,有力地證明了這一點——雖然個人在短期內看不到收益,但在足夠長的時間內,良好的社會秩序總會逐步回饋個人。
阿克塞爾羅德指出,設定行動者的策略,利用大型計算機仿真程序來研究人類社會演化過程,已經成為現代社會科學中的一種基礎研究方法。它不僅適用于生物進化、歷史發展研究,還被廣泛運用到國際關系、商業聯盟、文化傳播等領域,取得許多重要成果,并為現實數據所驗證。因此,為當代社會科學研究引介一套利用計算機仿真的研究方法,恐怕才是阿氏此書的真正目的。
不過,如康德所言,應然世界與實然世界之間存在不可逾越的鴻溝。完全信賴計算機對真實世界的仿真和引導是荒謬的。在并不清楚為什么要合作的時候,人類已經廣泛開展合作。
從這個意義上說,阿克塞爾羅德的研究只是再次證明了人類的合作本能。但畢竟,他揭示出了社會合作互動中的一些關鍵環節,因而極大增進了人類對自身的理解。■
《合作的復雜性:基于參與者競爭與合作的模型》,(美)羅伯特阿克塞爾羅德著,梁捷、高笑梅等譯,上海人民出版社2008年4月第一版。參見本刊2008年第12期“本刊6月薦書”
本文作者為復旦大學經濟學院博士研究生