“一報還一報”

2008-12-31 00:00:00梁捷

財經 2008年13期

合作與信任是人類社會得以存在和發展的基礎，但它們總會被自私所侵蝕?；舨妓拐J為，無論人與人還是國與國的關系，隨著資源稀缺的加劇，都會變得更接近狼與狼的關系。但是，現代社會終究沒有淪為原始叢林，有合作善意的人群還沒有滅絕，人與人之間的溫情和信任也沒有消失——自私和克制自私，似乎同樣屬于人類本能。

由此，美國密歇根大學政治學家羅伯特阿克塞爾羅德（Robert Axelrod）開始思考：在現代復雜社會中，何種行為規則才是個人收益最大化的最優競爭策略？

上世紀80年代，他寫信給不同學科的學者，讓他們提供自以為最佳的行為規則，然后編成電腦程序，相互競賽。第一場錦標賽，他共收到14個程序，在捉對廝殺中，程序運轉了十多萬次，最后按照總得分排出名次。勝出的程序，竟是其中最簡單明了的“一報還一報”（Tit for Tat）。

“一報還一報”是人類最古老的行為規則之一。它要求我們最初總以善意待人，在沒有被欺騙之前，永遠不要主動欺騙他人；但一旦發現他人的欺騙，下次交往時要毫不猶豫地報復、懲罰；懲罰過后，又回到起點，繼續善意待人。這種行為規則中，永遠只需記憶最近一次的對方行為，寬容看待對方的過往行為，除了上一次背叛。

很快，阿克塞爾羅德又組織了第二場錦標賽。這次他收到了62個程序，其中還有不少程序針對“一報還一報”做了專門改進。一場混戰的結果是，“一報還一報”再次排名第一。

這兩次錦標賽充分證明了“一報還一報”策略的威力。阿克塞爾羅德后來曾公開征集可能打敗它的策略程序，但20多年過去，還沒有程序能做到這一點。阿氏把“一報還一報”所體現的精神歸納為“KISS”（Keep It Simple，Stupid）原則，即盡可能簡單、愚蠢。簡單到可以用一句話概括，又愚蠢到不記憶對手的歷史行為，正應了“大智若愚”的中國老話。

阿克塞爾羅德繼續發展這套工具，開始研究不同策略行動在大規模、長時段、更復雜的社會演化過程中的表現。他發現，一旦在電腦錦標賽中加入博弈者之間的誤解、合謀、壟斷等更貼近現實社會的要素，就會出現新問題。以“一報還一報”策略為例，單純的“一報還一報”不大可能成為“壞策略”，因為它不會總被人利用；但它也不見得永遠都是“好策略”，因為有時它不夠寬容。

真實的社會交往中，我們只能通過他人行動來推測其動機，這樣很容易產生誤解，既會誤解別人，也被別人誤解。當兩個都采用“一報還一報”策略的人相遇，其中一方偶爾誤解對方，實行報復，雙方就可能陷入報復循環，不能自拔。此時，附加一些寬容條件，如容許對方偶爾犯錯，容許對方自我悔悟等，這樣的策略會取得更好的結果。

這表明，社會秩序和規范并非由簡單利誘或威懾壓力造成，必須考慮總體環境與各種文化、制度的影響。個人行動策略必須置于總體社會的演化過程之中，意義才可能凸現。行動者在選擇行動策略時，真正要面對的不僅是單個競爭對手，還有各自所處的小團體和大團體，各式各樣的顯規則和潛規則。這時，威懾、法律、聲譽、社會認同、成員身份等非經濟約束都可能起到很大作用。

尤其值得一提的是，阿克塞爾羅德發現了“元規范”的作用。所謂“元規范”，就是行動者不僅自身遵循社會規范，而且也不惜付出代價，主動懲罰不遵守規范的人。從短視的經濟人角度看，個人付出代價來維護集體利益并不理性，但“元規范”在穩定的人類社會中卻廣泛存在，對社會進步起到極大作用。阿氏的大型計算機仿真實驗，有力地證明了這一點——雖然個人在短期內看不到收益，但在足夠長的時間內，良好的社會秩序總會逐步回饋個人。

阿克塞爾羅德指出，設定行動者的策略，利用大型計算機仿真程序來研究人類社會演化過程，已經成為現代社會科學中的一種基礎研究方法。它不僅適用于生物進化、歷史發展研究，還被廣泛運用到國際關系、商業聯盟、文化傳播等領域，取得許多重要成果，并為現實數據所驗證。因此，為當代社會科學研究引介一套利用計算機仿真的研究方法，恐怕才是阿氏此書的真正目的。

不過，如康德所言，應然世界與實然世界之間存在不可逾越的鴻溝。完全信賴計算機對真實世界的仿真和引導是荒謬的。在并不清楚為什么要合作的時候，人類已經廣泛開展合作。

從這個意義上說，阿克塞爾羅德的研究只是再次證明了人類的合作本能。但畢竟，他揭示出了社會合作互動中的一些關鍵環節，因而極大增進了人類對自身的理解。■

《合作的復雜性：基于參與者競爭與合作的模型》，（美）羅伯特阿克塞爾羅德著，梁捷、高笑梅等譯，上海人民出版社2008年4月第一版。參見本刊2008年第12期“本刊6月薦書”

本文作者為復旦大學經濟學院博士研究生

財經2008年13期

財經的其它文章: 以師為吏; 不添麻煩不叫“大牌”; 鄉鎮企業異軍突起的秘密; 秦漢后中國非封建社會; 讀者來信; 人物志