劉國翰
(浙江理工大學法政學院,浙江 杭州 310018)
近年來,博弈論在社會學和政治學領域的應用越來越廣泛。以經濟學和生物學為主要應用對象發展起來的博弈論對于理解社會現象和政治現象提供了新的思路。這種以社會現象和政治現象為主要分析對象的博弈論可以稱為“社會博弈(Social Games)”(Lanzi Diego,2013)。在以經濟問題為主要對象的傳統博弈中,博弈方之間一般沒有特定的關系或者規范,博弈方被假設為追求自身利益最大化的自由人,而在社會博弈中,博弈方的選擇不僅受其利益的影響,而且會受到規范、角色以及社會網絡的影響。可以說,任何一個博弈方都是嵌入在具體的社會關系中,按照一定的社會規范,根據自己的能力和一定的理性,采取合適的或者自認為最優的策略來追求自身的利益。另外,社會博弈一般也是多人博弈和非對稱博弈。
為了處理社會博弈中的復雜性,當前的研究主要集中在以下三方面:
第一方面是合作博弈(Cooperative Game Theory)的發展,合作博弈假定多個博弈方能夠形成有約束力的同盟,用比較簡潔的方式解決了大群體中人與人之間能否形成穩定聯盟的問題(Shapley,1953;Aumann,Dreze,1974)。但是,在合作博弈中,博弈方之間的關系只有“合作”和“非合作”兩種,它很難全面描述社會博弈博弈方之間的多樣化關系。此外,在合作博弈中,博弈方之間一般是對稱關系,非對稱關系下的合作很難用合作博弈的框架進行解釋。
第二方面的研究是網絡博弈(Network Games)和進化圖論(Evoutinary Graph Theory,EGT)。網絡博弈用網格來模擬眾多博弈方之間的社會關系,不同的網絡形狀、結構、網絡聯接的密度以及在網絡中的位置等因素會影響網絡博弈的結果(桑吉夫·戈伊爾,2010)。進化博弈論通過使用復制動態方程,能夠以個體的選擇作為基礎解釋群體的特征,而進化圖論(EGT)則更進一步,能夠以進化博弈論為基礎描述群體內部結構之 間 的 關 系 和 變 化 (Lieberman,Hauert,Nowak,2005;Gy?rgy Szab ó,G áborF át h,2007;Albert Xin Jiang,Kevin Leyton-Brown,Navin A.R.Bhat,2011)。不過,無論是網絡博弈還是進化圖論,都是以博弈方之間的微觀互動為基礎來解釋宏觀群體特征和現象,難以做到就微觀的互動關系來解釋微觀的互動結果。
第三方面的研究是計算博弈論(Computational Game Theory)。計算博弈論仍然以多人非合作博弈作為基礎,通過尋找合適的算法,在眾多的策略組合中確定最有可能出現的策略組合,主要的算法有最小最大法(Minimax),Maxn算法(Davi DMUtchler,1991),UTC算法(Nathan R.Sturtevant,2008)等。計算博弈論試圖通過計算機程序在多人動態博弈中尋找最佳策略,主要用于多人對戰的棋牌、游戲等場合,但是在社會博弈的場合,一個有限理性的博弈方幾乎不能進行如此復雜的運算。
結構化博弈(Jean-Jacques Herings,etc,2007)的思路和以上三個方面的研究既很大的相關性,又有一定的區別。結構化博弈主要考察多個不同的博弈方在具有各自社會角色的情況下,如何根據他們之間不同的博弈關系來選擇最佳策略。在結構化博弈中,博弈方之間的互動關系除了“合作”與“不合作”之外還有多種可能的選擇,任何一個博弈方在選擇自己的最佳對策時,不僅要考慮和自己有直接互動關系的博弈方的對策,還要考慮和自己沒有直接互動關系的博弈方之間的博弈狀態,結構化博弈以博弈方之間的微觀互動關系為基礎,在微觀層面探討博弈的均衡解和穩定的結果。現實生活中結構化博弈的例子非常多,例如戰國時代齊國“圍魏救趙”的故事就是齊、魏、趙三國之間的結構化博弈,寡頭廠商和行業管理部門之間的博弈,婆、媳、兒子(丈夫)之間的關系也都是結構化博弈的具體例子。
結構化博弈采取的是從具體問題到具體結論的分析路徑,即針對具體的問題建立相應的結構化博弈模型,然后求具體的均衡解。結構化博弈的解對于博弈的結構非常敏感,不同的結構會產生完全不同的均衡解。但是對于同一類結構的問題,結構化博弈的均衡解可以給出一致的規律。3人博弈是多人博弈的基礎,通過對3人結構化博弈的分析,可以獲得一般的多人結構化博弈的分析框架。因此,下面以一個3人博弈為基礎來分析結構化博弈的求解方法。

圖1 三人結構博弈示意圖
圖1是一個一般的三人結構博弈的示意圖,在這個圖中,每一個博弈方都和另外兩個博弈方進行博弈。博弈方分別用節點①、②、③來表示,用G12,G13,G23分別表示博弈方1和2,博弈方1和3,博弈方2和3之間的博弈,記為:

G12,G13,G23表示博弈方①、②、③之間的邊博弈,其中,Si(i=1,2,3)表示博弈方i在相應的兩兩博弈中的策略空間,ui(i=1,2,3)表示博弈方i在相應的兩兩博弈中的收益。在兩兩博弈的基礎上,可以給出三人結構博弈的定義:

在博弈G123中,博弈方i在策略空間等于其在相應的兩兩博弈中策略空間的乘積,即:

博弈G123的結果取決于三個博弈方在每個兩兩博弈中的策略選擇,因此,結果空間可以表示為:

各博弈方的得益取決于博弈的結果,得益函數可以表示為:

由此可見,三人結構化博弈可以轉化成一般的三人非合作博弈,不同的地方是每個博弈方的策略空間的維數增加,而且得益函數也發生了變化。把結構化博弈轉化成一般的非合作博弈之后納什均衡的概念仍然適用,因此,可以通過求解這個一般的非合作博弈的納什均衡獲得結構化博弈的均衡策略組合。
聯盟博弈的經典例子是三人分300元的博弈,假定按照少數服從多數的原則進行分配,即只需要兩人同意某個分配方案即可。聯盟博弈的傳統求解方法是給出各種可能聯盟的特征函數,在特征函數的基礎上定義“優超”和“核”的概念。對于n人聯盟博弈,可行分配集中不被任何分配優超的分配的全體,稱為該博弈的“核”。事實上,上述博弈的“核”是空集(謝識予,2006),這意味著合作博弈的解對于“三人分300元”這樣的博弈的結果沒有很好的指導意義。但是在現實生活中,如果三人的地位完全對稱,那么出現每人獲得100元這樣的結局的可能性非常高。我們可以運用結構化博弈的框架來證明這一點。
聯盟博弈可以看成三個博弈方之間的兩兩博弈,以博弈方1和2之間的博弈為例,他們之間的博弈可以描述為:

其中,C代表策略“合作”,D代表策略“背叛”。同理,博弈方1和3之間的博弈可以表示為:

博弈方2和3之間的博弈可以表示為:

在博弈G123中,博弈方1的策略空間可以表示為:

同理,博弈方2和3的策略空間可以分別表示為:

因為每個博弈方有4個純策略,所以可能的策略組合就是43=64個,博弈的結局也就有64種。不過,由于三個博弈方在地位上的對稱性,64種結局可以歸納為8種。表1列出了這8種結果的詳細信息,在示意圖中,連線表示相應的博弈方之間存在合作關系,能夠結成聯盟,合作關系需要雙方都采取“合作”的策略才能達成,如果有一方采取“背叛”的策略,合作關系就不成立,各博弈方的位置和圖1中的位置相同。

表1 聯盟博弈的八種結果
在多人博弈中,由于改變結果往往需要幾個博弈方同時改變自己的策略,因此單純從納什均衡的角度來看,會存在很多納什均衡。以結果Ⅰ為例,策略組合{(D/G12,D/G13),(D/G12,D/G23),(D/G13,D/G23)}就是一個納什均衡,因為如果給定其他人采取“背叛”的策略,任何一個博弈方采取“合作”和“背叛”的策略所得到的收益都是0。同理,另外7種結果都有相應的策略組合是納什均衡。但是,這8個純策略納什均衡的穩定程度是不一樣的。以策略組合{(D/G12,D/G13),(D/G12,D/G23),(D/G13,D/G23)}為例,盡管在該策略組合中,每個博弈方的策略都是其他博弈方策略的最佳對策,但是根據“顫抖手原理”,如果其他博弈方的策略發生微小的變動,即以很小的概率采取“合作”的策略,那么自己采取“合作”的策略就會提高自己的收益。因此,結果Ⅰ并不是一個穩定的均衡局面。結果Ⅱ對應的納什均衡是{(C/G12,D/G13),(C/G12,D/G23),(D/G13,D/G23)},結果Ⅴ對應的納什均衡是{(C/G12,C/G13),(C/G12,D/G23),(C/G13,D/G23)},其中結果Ⅲ和Ⅳ與結果Ⅱ具有相同的結構,結果Ⅵ和Ⅶ與結果Ⅴ具有相同的結構,可以證明,它們所對應的納什均衡都非顫抖手均衡。每一個博弈方所期望的最佳結果都是自己和另外兩個博弈方達成合作,同時這兩個博弈方彼此不能形成合作,因為每個博弈方都如此考慮,所以從結果Ⅱ到結果Ⅶ都不是穩定的均衡局面。結果Ⅷ意味著三個博弈方之間都同時采取合作的策略,其對應的納什均衡是{(C/G12,C/G13),(C/G12,C/G23),(C/G13,C/G23)},這個策略組合是一個顫抖手均衡,因為對其中任何一個博弈方而言,即使有另外一個博弈方以較小的概率采取“背叛”的策略,自己放棄“合作”的策略只會得到更低的收益,所以每個人都會保持“合作”的策略不變。
根據以上的分析可以看出,對于三人分300元的經典聯盟博弈,結構化博弈的分析框架能夠給出更多有意義的結果。按照傳統的合作博弈的分析框架,由于上述博弈的“核”是空集,因此很難預測其穩定的結果。而根據結構化博弈的分析,可以得出結果Ⅷ(即每個博弈方在所有的兩兩博弈中采取“合作”的策略)是一個穩定的均衡,因此每個人將獲得100元的收益,這個結果更加符合社會的直覺。
在三人分300元的聯盟博弈中,各博弈方的地位是對稱的,結構化博弈也可以用來分析地位不對稱的多人博弈。假設有三個國家,他們之間存在戰爭的可能性,其中國家1是超級大國,國家2是地區性強國,國家3是小國。國家1和3之間可能形成聯盟,國家2和3之間可能發生沖突,國家1和2之間沒有直接的沖突或者同盟的可能性。如果國家1和3不結成同盟,在國家2和3的沖突中,國家2勝,如果國家1和3結成同盟,在國家2和3的沖突中,國家3勝。由于地緣政治的原因,如果國家2在沖突中獲勝,國家1也會受到損失,如果國家3在沖突中獲勝,國家1會獲得正的收益。國家2和3也可以懸著保持和平,這樣三個國家都會獲益。向鋼華和王永縣(2006)用不完美信息的三方動態博弈模型分析了一個包含挑戰者、防御者和干預者三個不同角色的博弈,根據初始條件的不同,博弈可能分別出現威懾均衡、挑戰均衡、分離均衡的不同結果。同樣,我們也可以用結構化博弈模型對這個問題進行分析。

圖2 戰爭同盟博弈示意圖
圖2是一個戰爭同盟博弈的示意圖,國家2和3之間是一個戰爭-和平博弈,兩者都可以選擇“戰爭(W)”或者“和平(P)”。國家1和3之間是一個協調博弈,兩者都可以選擇“合作(C)”或者“背叛(D)”,只有當兩者都選擇“合作”的情況下同盟才成立。
由于國家1和2之間沒有直接的博弈關系,因此在整個結構博弈中,國家1和2的策略空間并沒有發生變化:

國家3的策略空間可以表示為:

該博弈共有16(2×2×4)種不同的策略組合,但是由于只有國家1和3同時采取合作的情況下才能夠形成同盟,因此博弈的結果共有8種,如表2所示,結果Ⅰ到Ⅵ每一種對應三個不同的策略組合,結果Ⅴ到Ⅷ每一種對應一個策略組合。為了分析的方便,每種結果下博弈方的得益給出了具體的數字。

表2 戰爭同盟博弈的八種結果
該博弈有四個純策略納什均衡,第一個是結果Ⅰ所對應的策略組合{(D/G13),(W/G23),(D/G13,W/G23)},在這個策略組合中,任何一個博弈方單方面改變自己的策略都不會增加自己的得益。第二個純策略納什均衡是結果Ⅲ所對應的的策略組合{(D/G13),(W/G23),(D/G13,P/G23)},第三個純策略納什均衡是結果Ⅴ所對應的策略組合{(C/G13),(W/G23),(C/G13,W/G23)},第四個純策略納什均衡是結果Ⅷ所對應的的策略組合{(C/G13),(P/G23),(C/G13,W/G23)}。表2中的箭頭代表了不同博弈結果之間的狀態遷移方向。可以看出,結果Ⅰ和Ⅲ所對應的純策略納什均衡并不是一個穩定的均衡,而結果Ⅴ和Ⅷ所對應的純策略納什均衡是穩定的均衡。在這兩個穩定的結果中,國家1和3都選擇了相互“合作”,結成同盟,而且國家3都選擇了“戰爭”。
結構化博弈是一種多人非對稱博弈,在這種博弈中,參與方兩兩之間會形成特定的博弈關系,整個結構化博弈的均衡解必須建立在博弈方之間兩兩博弈的結果之上。與合作博弈(Cooperative Game Theory)、網絡博弈(Network Games)、進化圖論(Evolutionary Graph Theory,EGT)、計算博弈論(Comptational Game Theory)相比,結構化博弈既有和它們相似的地方,也有非常重要的差別。結構化博弈更適合用來分析政治問題和社會現象中的多人博弈局面。
結構化博弈的均衡結果對于博弈的結構非常敏感。最簡單的結構化博弈是三人結構化博弈,通過對每個博弈方的策略集進行擴展,可以非常方便地對該結構化博弈進行一般性的描述。按照同樣的方法,我們也可以對四人、五人結構化博弈進行一般化描述。當然,隨著博弈方數量的增加,兩兩博弈的結果更加難以預測,而且每一個博弈方的策略數量也會大幅增加,這會給均衡分析帶來一定的困難。
分析框架的生命力在于其分析過程是否更合乎邏輯,能否給出更加符合實際的結論。首先,我們把結構化博弈用來分析經典的聯盟博弈(三人分300元博弈),我們發現,相對于合作博弈的空集解,結構化博弈能夠發現更多的均衡結果,并且能夠證明三人均分是一個穩定的均衡解,這個解更加符合人們的行為特征。其次,我們還運用結構化博弈的框架來分析三個國家之間的戰爭與結盟問題。對這個問題的傳統分析是運用動態非完美信息博弈的框架,能夠得出威懾均衡、挑戰均衡、分離均衡等三種不同的可能性,而我們根據結構化博弈則能給出更加具體的均衡結果,即存在兩個穩定的均衡狀態,其中一個穩定均衡狀態是:國家1(超級大國)和國家3(小國)結盟,國家2(地區大國)和國家3選擇戰爭,另一個穩定均衡狀態是國家1(超級大國)和國家3(小國)結盟,國家2(地區大國)選擇和平,國家3選擇戰爭。在這兩個穩定的均衡解中,國家1(超級大國)和國家3(小國)總是選擇結盟,國家3(小國)總是選擇和國家2(地區大國)戰爭。這個結論也比較符合國際關系中的實際。
以上只是結構化博弈分析框架在比較簡單的問題中的應用。實際上,我們在政治、經濟、社會領域中碰到的大量問題都符合結構化博弈的特征,可以預期,如果通過結構化博弈對這些復雜的問題進行分析,將會大大加深我們對于人類行為和社會的理解。
[1]Lanzi Diego.Frames and Social Games[J].The Journal of So-cio-Economics,2013(45):227-233.
[2]Shapley LS.A Value for n-person games[J].Annals of Mat-hematics Studies,1953,28:307-318.
[3]Aumann R,Dreze J.Cooperative games with coalition structures [J].Game Theory,1974,3:217-237.
[4]桑吉夫·戈伊爾.社會關系:網絡經濟學導論 [M].北京大學出版社,2010.
[5]Lieberman,E.,Hauert,C.,Nowak,M.A..Evolutionary dynamics ongraphs[J].Nature,2005,433:312-316.
[6]Gy?rgy Szabó,Gábor Fáth.Evolutionary Games on Graphs[J].Physics Repots,2007(446):97-216.
[7]Albert Xin Jiang,Kevin Leyton-Brown,Navin A.R.Bhat.ActionGraph Games[J].Games and Economic Behavior,2011(7):141-173.
[8]David Mutchler.The Multi-player Version of Minimax Displ-ays Game-tree Pathology,Methodologies for Intelligent Systems,1991(542):62-71.
[9]Peterson G.Decision Algorithms for Multiplayer Noncoopera-tive Games of Incomplete Information[J].An International Jo-urnal Computers Mathematics with Applications,2002(43):179-206.
[10]Nathan R.Sturtevant.An Analysis of UCT in Multi-PlayerGames[J].ICGA Journal,2008,31(4):195-208.
[11]Jean-Jacques Herings,Gerard Van Der Laan,Dolf Talman.Socially Structured Games[J].Theory and Decision,2007,62:1-29.
[12]謝識予.經濟博弈論 [M].復旦大學出版社,2006:363-366.
[13]向鋼華,王永縣.一種三方不完全信息延伸威懾動態博弈模型 [J].系統工程,2006(4):40-43.
[14]Lu Zhoulai.The distribution of corporate internal power wi-thin the framework of the cooperative game[J].Economic Re-search Journal,2009(12).
[15]ZHAO Hong.The cooperative game between the enterprisestakeholders and balance[J].The Theory and Practice of Fi-nance and Economics,2007(04).
[16]Liu Songxian.Enterprise strategic alliance research based oncooperative game[J].Statistics and Decision,2005(14).
[17]鄭士源.合作博弈理論的研究進展——聯盟的形成機制及穩定性研究綜述 [J].上海海事大學學報,2011(04).
[18]黃武軍,劉天虎,許維勝等.N人合作博弈的Nash及演化均衡穩定策略分析 [J].計算機工程與應用,2010(17).
[19]Chen Zhao,Liu Ming.Cooperative game enterprise transfor-mation and its implications for the system and the growththeory[J].World Economic Forum,2005(Z1).
[20]趙志泉.戰略聯盟的存在機理及其生命周期管理 [J].技術經濟與管理研究,2012(07).
[21]Liu xia,Zhang Xiaojin.Try to talk about in the public cri-sis management system of multiple participation main bodyof the game and choice[J].Academic Forum,2005(03).
[22]Wang Lei,Zhang Qingpu,Zhang Binnan.Based on coopera-tive game point of view of the scientific research of profitdistribution between the team members[J].Library and Info-rmation Service,2011(16).