葉紅心
摘 要:本文首先論述了合作博弈機制建立的思想基礎,其次,在此基礎上給出合作博弈機制的建構方法,并應用該方法討論了囚徒困境博弈。
關鍵詞:博弈;合作;機制
一、合作博弈機制建立的思想基礎
對于一個作為系統的群體,如何實現其利益最大化及公平合理地履行分配措施至關重要。但由于群體成員追求個人利益最大化,競爭沖突的出現會造成群體利益的損失,這就導致了個人理性與集體理性的沖突問題。為了保證群體的有效運行和目標的實現,必須有某種機制來約束群體成員以使其決策朝著群體利益的方向走,以實現整個系統的Pareto最優,這就需要群體成員的有效合作。
促進合作的各種機制在操作上實際是通過博弈規則而起作用,并且最終成為博弈成員共同遵守的一種共同知識,博弈成員通過遵守它來彌補理性的不足,從而減少背離合作目標的可能。另一方面,由于非完全共同利益群體成員之間存在利益沖突和協調交織的錯綜復雜的關系,而群體成員又無法理解或預期他人的行動,那么群體合作秩序就無法形成。因此,機制化的合作博弈規則起到了使群體成員能正確預期他人行為的作用,在博弈規則的作用下,在博弈過程中群體成員就能正確預期他人可能的戰略選擇,從而減少群體成員互動中的不確定性,降低由戰略沖突引發的各種交易成本。正如劉易斯(Lewis,D)提出:“作為不斷重現的情況,S中的行為者P,其行為的規律性R在有僅在以下情況下成為規則,而且在P中這是一種共識,即在任何一種S的場合下,P的成員:①每個人都遵守R,②每個都希望其他人遵守R,③每個人在其他人都遵守R,也心甘情愿地遵守R,因而只是一個協作問題,對R的一致性遵守是在S中的一個協作性均衡。”因此需要這些促進合作的機制形成的規則在群體成員之間能得到重新理解和交流。
當然,合作后的利益分配問題不容忽視,因為它直接影響群體成員的合作積極性以及以后長期的合作。因此,我們這里將通過機制設置改變博弈的支付結構,使群體的Pareto最優組合成為預期博弈的Nash均衡。
二、合作博弈機制的建立
1、基本概念
假設戰略式博弈是n人博弈,Si是i的戰略空間,Pi是i的支付函數
記,是第i個博弈方的最優戰略,即
Nash均衡若是唯一的,則是一個可自動執行的協議,即其他方沒有積極性偏離均衡,該方也沒有積極性偏離。
戰略組合是Pareto最優組合,即滿足
定義 通過引入機制λ的博弈稱為預期博弈,即
假定原博弈的Si、Pi是公共知識,機制λ也是公共知識,機制化的預期博弈Gλ正是博弈方賴以決策的依據。
機制λ作如是設置:它能保證Pareto最優戰略組合是預期博弈的Nash均衡。這樣就能保證博弈方不會偏離Pareto最優解,達到促進合作的目的。為方便討論,我們假定原博弈G有唯一的Nash均衡,不然可分別討論,進行機制集成。
2、建立方法
構造如下:
這里ΔPi稱為合作附加收益。λ=(αi)稱為機制,或懲罰函數。顯然
所以是i的占優戰略。因此是博弈Gλ的嚴格Nash均衡,即給定其他方不偏離合作結果,沒有博弈方有積極性偏離該均衡。
三、應用示例
為了演示上述方法的實用性,我們應用它分析眾所周知的囚徒困境博弈。
(C,C)是非合作Nash均衡? ? ? ? ? ? 存在合作Nash均衡(N,N)
綜上所述,在博弈結構是群體成員(博弈參與人)的公共知識的前提下,我們建立機制以保證原博弈的Pareto最優組合是機制化后的預期博弈的Nash均衡。由Nash均衡的哲學內涵知,只要其他成員不偏離,系統成員無積極性單獨偏離這一均衡結果。因此,該機制可通過細致的談判以法律或契約的形式實現。
參考文獻
[1]張維迎,博弈論與信息經濟學,上海:三聯書店,1997.
[2]尼爾·瑞克曼,合作競爭大未來,經濟管理出版社,1998.
[3]Lewis,D.,Convention:A Philosophical Study.Oxford:Basil Blackwell,1986.
(作者單位:中共河南省委黨校)