知識、信念與均衡
——一個關于博弈均衡解理性支持系統的討論*

2017-01-05 03:25:13李軍林王麒植姚東旻

教學與研究 2016年12期

李軍林，王麒植，姚東旻

李軍林，王麒植，姚東旻

均衡解；高階信念；共同先驗；不完全信息博弈

博弈理論的發展過程可以看成是對其均衡解的概念不斷完善和精煉的過程，而解的概念反映的是行為和信念的一致性。在不完全信息條件下，在決策時決策者不但要考慮自己的信息，還要考慮別人的信息，別人對自己信息的信息等等高階信念，此時如何定義信念一致性的問題長期困擾著學者。海薩尼的貢獻在于通過構造“海薩尼轉換”將不完全信息博弈轉換為完全但不完美信息博弈，并基于此提出了貝葉斯納什均衡的概念，為經濟學建立了分析信息問題的博弈框架，并奠定了整個信息經濟學的基礎。本文認為，海薩尼意義上的貝葉斯納什均衡的一致性需要以共同先驗假設為前提，但是此假設在現實中很難滿足。因此，在使用海薩尼博弈分析實際經濟問題時，必須首先檢驗共同先驗假設是否可以被滿足。

從某種意義上講，博弈理論的發展過程，可以看成是對其均衡解的概念(solution concept)不斷完善和精煉的過程。對均衡的定義，或者說對博弈解的定義，直接反映了研究者對“理性決策”的理解。而對均衡的求解過程無非是在多人交互決策情境下，參與人根據自己已有知識并形成的信念，對理性原則的貫徹和堅持。

事實上，最初人們提到博弈論時也會很自然地將其與納什均衡聯系起來，然而，納什均衡所要求的理性與信息約束實際上并不能很好地刻畫許多常見的經濟情形(例如競標，二手車買賣，保險銷售等諸多問題)，因此，需要針對此類情形構造新的解的概念以及相關的信息設定，來完善與改進博弈理論。但在放松了假設之后，如何提出合理的解的概念在博弈論發展中困擾了理論學者很長時間。其中，對于不完全信息的處理尤其棘手：由于博弈的交互性導致參與人的推理過程經常需要高階信念(直至無窮階信念)的支持，而如何合理、簡潔地處理這些高階信念便是建模者無法回避的問題。本文即從高階信念和高階知識的視角出發，分析并介紹海薩尼(Harsanyi)提出的“貝葉斯納什均衡”(Bayesian Nash Equilibrium，后稱BNE)在博弈論發展中的重大意義。[1][2][3]

在海薩尼之前，經濟學沒有統一的框架來分析信息問題，因此經濟學分析中參與人的信息往往都是相同的。[4]海薩尼博弈對高階信念簡潔且精妙的處理，為后來的研究掃清了障礙，是方法論上的巨大突破。正是由于海薩尼的杰出貢獻，使得經濟學進入了前人認為“不可分析”的領域，沒有他的貢獻，信息經濟學便永遠不會產生*海薩尼的論文(參見參考文獻[1][2][3])對于現代信息經濟學的產生與構建是具有里程碑意義的。盡管其他一些學者關于非完全信息問題也有過奠基性的研究成果，比如，威克瑞關于拍賣競標的論文[Vickrey,W.,“Counterspeculation, auctions, and competitive sealed tenders”,The Journal of Finance,1961 16(1)]；阿克洛夫關于二手車市場問題的論文[Akerlof, G., “The market for ‘lemons’,quality uncertainty and the market mechanism.”，Quarterly Journal of Economics, 1970,84(3),pp.488-500]；斯本斯關于勞動力市場信號傳遞問題的論文[Spence, M. “Job market signaling”,Quarterly Journal of Economics,1973,87(3),pp.355-374]；羅斯柴爾德和斯蒂格利茨關于保險市場銷售的論文[Rothschild,M.,&Stiglitz,J.“Equilibrium in Competitive Insurance Markets:An Essay on the Economics of Imperfect Information.”,The Quarterly Journal of Economics.1976,90(4),pp.629-649]等等。盡管他們也都由于對信息經濟學的杰出貢獻而先后獲得了諾貝爾經濟學獎，但是，從研究的方法論上看，他們的工作都針對的是某個市場的特殊商品的分析而得出的結論，而海薩尼的工作是給出了非完全信息競爭市場(有不同信息行為人)一般分析框架。。

此外，他的工作在經濟學說史上也是一項了不起的成就。在完全信息和非完全信息博弈分析框架建立起來之后，組織經濟學、信息經濟學等學科得到了極大的推動，豐富和拓展了經濟學分析的視野和深度。因此，他們的貢獻在學說史上也是濃墨重彩的一筆。

對博弈理論發展歷程的回顧和整理對研究者正確地理解和使用相關工具具有重要意義：一方面，從現在理論發展的視角回看這些工作可以使學者更清晰完整地認識該理論根基；另一方面，對理論先驅工作的充分理解也是向其致敬的最好方式。隨著澤爾騰的去世，第一批博弈論做出奠基性貢獻的諾貝爾經濟學獎獲得者全部離我們而去。這或許意味著一個時代的結束，而本文也體現了作者對這批學者的追思。

基于此，本文介紹了博弈論圍繞博弈核心問題“高階信念和推理”進行處理的發展脈絡，進而也展示知識和信念如何結合形成并支撐著具有說服力和解釋力的解的概念。從這個角度將可以更好地理解、把握博弈論與經濟現實的關系，以及如何進一步推動博弈論向前發展。

早期關于處理的經典博弈模型分析方法具有求解的簡便性。雖然這種簡便性大大提升了分析效率，從而使博弈分析工具流行起來，但同時，簡便性也弱化了博弈模型背后復雜的推理過程以及假設條件，尤其可能會忽視了博弈的合理均衡解存在的理性支持系統，進而增大了模型被誤用的可能。

筆者將進一步分析博弈所隱含的假設以及這些假設所對應的情形。因此，本文重點使用決策分析視角對博弈理論分析法背后的機理和假設進行闡述和分析，進而給出不同納什均衡的理性支持系統。

一、納什均衡與共同知識

著名的納什均衡(Nash Equilibrium，后稱NE，)是一個全部參與人的策略組合，其中每個參與人策略是在給定其他人策略不變的前提之下對自己最有利的策略。換句話說，沒有一個參與人能夠通過改變自己策略來改善福利水平。[5]

納什均衡的定義中實際上隱含地引入了共同知識的假設*研究發現，博弈中的共同知識(Common Knowledge)假設在博弈均衡的定義中起到了基礎性作用，但是卻在現實中難以滿足。因此，正確識別對被研究情形中的共同知識是選擇合適博弈模型的關鍵。。共同知識(common knowledge)是指具有如下性質的事件：當其發生時，所有人都知道它發生了，所有人都知道其他人也知道它發生了，所有人都知道其他人都知道所有人都知道它發生了，并且此推理鏈條可以推到無窮階均成立。

在完全信息條件下，勃蘭登伯格對NE所要求的推理過程所蘊含的信息要求進行了總結。[6]一般來說，兩類信息假設是必須的*需要注意的是，這并不意味著其他條件均無法保證納什均衡。例如，如果要求參與人的策略是共有知識，則可以放松部分共同知識約束且仍保證納什均衡的出現(參見參考文獻[6]和[7])。：

首先，博弈的結構必須是共同知識，其中包括博弈規則、參與人數、參與人的收益等等。與單人決策過程不同，博弈過程中的決策具有交互性，即決策者的決策過程互相嵌套*例如，在兩個廠商的古諾競爭中，廠商1的產量取決于自己的邊際成本和廠商2的產量，而廠商2的產量又取決于自己的邊際成本和廠商1的產量，形成一個嵌套循環。。博弈決策中的相互嵌套循環要求每個參與人的信念或知識也必須在無窮階成立*參考文獻[8]提供了一個清晰的例子，展示了高階信念在博弈決策中的必要性。。很明顯，完全信息假設對決策者信息的要求遠不止“所有參與人都知道”特定信息，而需要參與人達成高度的一致，因而在實際生活中并不非常容易得到滿足。但是遺憾的是，尋找一種合理且簡便的方式放松此假設卻是一項困難的任務。關于這個問題的理論發展過程將在第三部分進行討論。

其次，所有決策者的理性方式必須是共同知識*并非在所有情形下都需要“理性”作為共同知識如此嚴格的條件來保證NE的出現——作為有限知識的理性即足夠，參見參考文獻[6]。但是為了結論不失一般性，此處仍然要求“理性”成為共同知識。。對每個決策者而言，博弈決策的交互性決定了其他決策者的決策方式也必然是影響自身決策的重要因素。下例修改自沃朗[9]的思想實驗，用以說明在即使客觀條件完全相同的博弈中，決策者也會根據對方參與人的不同而改變自身策略。設想你要參加一個用現金作為回報的二人博弈，并被告知將分別和兩個人進行博弈，其中一位是你的朋友，另一位是陌生人。你和朋友相識多年并且智力水平相同；而那位陌生人是剛剛從喜馬拉雅山上請下來的，他僅僅大概知道一塊錢能買什么東西。你的可選策略有兩個：唯一的納什均衡策略和保險策略。當雙方都采用納什均衡策略時，你的收益是1 000塊；但是此時如果對方偏離，你將會至少損失1 000塊。如果你采用保險策略，那無論對方選擇什么，你的收益都是900塊。那么很明顯，你面對朋友時更有可能采用納什均衡策略。

為了保證納什均衡的實現，在全部決策者的所有高階信念中都必須排除出現“喜馬拉雅人”的情況。換句話說，每個參與人的決策規則也必須是共同知識，也即是要求所有決策者的理性必須是共同知識。此時，“理性”實際上指的是參與人如何處理信息、作出決策的規則。

那么在實際情形下這兩個條件是否容易得到滿足？共同知識對參與人施加的約束十分苛刻——它要求信息不僅僅是公開的，而且必須在多個參與人中達成共識。很顯然如果模型中存在重要的私人信息，那么前述推理過程必然無法成立。但是需要注意的是，并不是所有的公開信息都滿足共同知識假設。例如國家宏觀統計數據，雖然它是公開的，但是并不是每個人都會去看，也不是每個人都確定別人會去看，更不是每個人都確定別人知不知道自己看不看，等等。因此，若假設此類數據是參與人的共同知識，便會面臨參與人行為偏離預測的風險。

此外，作為共同知識的理性也常常被忽略。例如在最后通牒博弈(Ultimatum Game)中，兩個參與人(匿名)嘗試就一定數量金錢達成分成比例。首先一個出價者給出他的分成計劃，然后回應者決定是否接受出價者的計劃。如果計劃被接受，那么每個參與人獲得相應的報酬；如果計劃被拒絕則分成失敗，兩人的收益都為0。對于回應者來說，面對一個非負的計劃，接受總是不差于拒絕的，因此出價者應該預測理性的回應者在此種情況下總是選擇接受。然而金提思[10]通過實驗研究發現低于30%的分成比經常被拒絕。這表明參與人所使用的理性原則并非總是與理論相符，對其進行預測也并不是簡單的任務*另一種解釋是雖然博弈規則給定了支付金額，但是卻沒有唯一確定每個人的效用。例如參與人可以因為分配不公平而產生副效用，從而導致拒絕成為了理性選擇。如果遵從這種解釋，那么實際上是各個參與人的支付而不是理性方式沒有成為共同知識。這種解釋是有道理的，不過卻與本文提供的解釋從分析邏輯上完全等價，原因在于新古典經濟學以來“理性”的內含實際上是包括了“效用”和“最大化方法”兩個元素的，并且二者都需要借助對方來定義自己，并不存在清晰的界限。參見[Vriend,N.J.“Rational behavior and economic theory,”Journal of Economic Behavior & Organization, 1996,29(2),pp.263-285;Binmore.K.“Chapter l-rationality,”Handbook of Game Theory with Economic Applications,2015,pp.1-26]。

總的來說，NE概念從認識論和方法論上為交互決策情形提供了有力工具，但是對于具體的情形的研究經常需要對其做更進一步的限制或擴展。接下來將介紹的貝葉斯納什均衡用一種精妙的模型設置將NE概念的內含延伸到不完全信息情況下，而這些工作為信息經濟學取得的突破性進展，在關鍵問題的處理上掃清了障礙。

二、共同知識與不完全信息博弈模型

(一) 不完全信息博弈與高階信念

納什均衡的實現所需要的大量共同知識在實際經濟生活中很難滿足——經濟參與者往往不能對客觀現實產生如此一致且正確的認識。因此在20世紀五六十年代左右，博弈論學者便提出了“不完全信息”的概念。

以如下兩個簡單的博弈為例，參與人1在(a)和(b)中的支付相同而參與人2的支付不同。如果參與人1不能知道參與人2的實際支付的話，他便不知道參與人2將會選L還是R，進而不知道自己的最優策略是U還是D。

表1 不完全信息

參與人2LR參與人1U1,00,1D0,01,1

(a) (b)

如果博弈中部分模型設置不是共同知識，例如上例中的支付矩陣，那么此博弈便被稱為不完全信息博弈。在博弈論的發展過程中，博弈論學者對“什么是不完全信息博弈”的定義實際上發生過變化。[4]馮·諾依曼和摩根斯坦最初對“不完全信息”的定義是“部分結構沒有被清晰定義的博弈” ，[11]而且從理論上講，沒有定義清楚的模型是不能被分析的，因此，他們認為沒有必要研究此類博弈。顯然，這個回答無法使學者們滿意，許多學者此后依然在不斷嘗試建立新的分析方法以處理這類情形，其中最成功的嘗試來自海薩尼。[1][2][3]在海薩尼的模型中，無法被精確定義的變量以概率分布的形式描述并且此分布被假設為全部參與人的共同知識。在后文的討論中可以發現，在這些假設的幫助下，不完全信息博弈模型便是可分析的。因此，從這種意義上講，這些變量的取值雖然不是被精確地知道，但是其取值范圍以及分布是知道的，即決策者知道他們“知道自己不知道的具體是什么”和“多大程度上不知道”，因此也并不是完全不知道。換句話說，海薩尼模型所刻畫的“不完全信息”已經與其最初的定義有所不同：馮·諾依曼和摩根斯坦定義的不完全信息是“不知道”，而海薩尼定義的不完全信息是“不確知”，即前者比后者包含更大的范圍，如下圖所示。

圖1 兩種不完全信息對比

用概率對不確定性進行刻畫之后更重要的問題是高階信念如何處理。一個直接的辦法是將所有高階信念逐階給出，分析每種情況下的最優策略。魯斯和拉法亞[12]曾經沿著這條思路進行了探索。為了避免完全信息的嚴格假設，他們為一個n人博弈構建了n2個支付函數以刻畫每個參與人i對參與人j支付的推測。然而很顯然，僅僅對二階信念進行刻畫是遠遠不足以支撐均衡的。例如，考慮表1所描述的博弈。如果在完全信息條件下，當真實支付矩陣是(a)時，參與人1將采取其納什均衡策略D。然而，如果參與人1認為參與人2“錯誤地”相信真實矩陣是(b)，進而選擇L的話，他也會將自己的策略修改為U。如果參與人1認為參與人2認為參與人1“錯誤地”相信真實矩陣是(b)，則參與人1會期待參與人2選擇R，進而自己選擇D。此類考慮可以無限延展下去。

因此，在不完全信息下，如何設置全部的高階信念是一個無法回避的問題。同時也可以發現，直接給出全部信念并不是一個理想的方式，因為它十分復雜凌亂并且難以處理。海薩尼[1][2][3]介紹了一種數學上更為簡便的建模方法，極大地提升了分析的可操作性。

(二)海薩尼轉換與貝葉斯納什均衡

海薩尼構造了一個由自然先行動的博弈模型，在此模型中借助貝葉斯規則便可以簡便地將全部高階信念給出，于是便解決了高階信念的問題。海薩尼的等價構造將馮·諾依曼和摩根斯坦意義上的不完全信息博弈轉換為完全信息但不完美博弈，進而避免了馮·諾依曼和摩根斯坦質疑的這種情形不可分析、相關模型不可解的問題，使分析討論可以繼續。此過程即是著名的“海薩尼轉換(Harsanyi’s Transformation)”，它使不完全信息條件下的博弈分析成為可能，使經濟學第一次可以使用統一規范的框架對信息問題進行分析，也為現代信息經濟學的繁榮發展做出了奠基性貢獻。

海薩尼首先令人信服地論證，所有對于模型的不確定性可以分為三類：對事件的不確定、對支付的不確定和對參與人策略的不確定。其次，他進一步論證這三種不確定性完全可以轉化為對參與人支付的不確定性。然后，根據參與人支付的不同將參與人分為不同的“類型”，并且在正式博弈開始之前，由“自然”按照先驗的概率(是共同知識)對參與人的類型進行選擇，并且所有參與人僅僅可以觀測到自己的類型，而不知道別人的類型。因此，雖然參與人并不確切地知道其他參與人的類型，但是可以根據先驗概率和自己的類型對他們的類型進行推測(貝葉斯推斷)。最后，在余下的博弈中，參與人依照自己的條件期望收益選擇最優反應。以上過程被稱為“海薩尼轉換”，而轉換后的博弈被稱為海薩尼博弈。

對“海薩尼轉換”過程更加準確的介紹需要引入一些概念*本文僅介紹簡略定義，嚴格的數學定義可見[Zamir,S.,“Bayesian Games:Games with Incomplete Information,”Encyclopedia of Complexity and Systems Science,Robert A.Meyers (ed.),Springer，New York,2009,pp.426-441;Dekel,E.,& Gul,F.“Rationality and knowledge in game theory”,David M.Kreps and Kenneth F. Wallis,(eds.),Advances in Economics & Econometrics Theory & Applications Seventh World congress， Volume 1,Econometric Society Monographs,no.26,Cambridge,New York and Melbourne:Cambridge University Press,1997,pp.87-172]。。

● 自然狀態(state of nature)，包含關于博弈的全部客觀信息，如支付函數、博弈規則、模型中隨機數的可能實現值等等。例如，表1中(a)和(b)兩個博弈情形就代表了兩個不同的自然狀態。

● 類型(type)，包含關于博弈參與人主觀信念的全部信息，因此也被稱為意識狀態(state of mind)。例如，參與人對真實狀態是表1中哪個的信念以及全部高階信念。

● 世界狀態(state of world)，由特定的一個自然狀態和特定一組參與人類型構成，描述了某個特定的博弈模型以及其中參與人的信念。

在海薩尼構造的博弈中，對“解的概念”(solution concept)的定義沿承以最優反應為核心的納什均衡思路，又因為其對貝葉斯理性的使用，也被稱為貝葉斯納什均衡(Bayesian Nash Equilibrium, 后稱BNE)。在BNE中，每個參與人都在給定其他參與人策略的條件下，選擇最大化自己條件期望收益的策略。根據澤邁爾的總結，海薩尼博弈以如下順序進行：

式中，Pr為激光回波功率，常數k為4ln2，tr為回波時刻，T0為激光脈沖寬度，Nn為噪聲，包括背景噪聲、電路噪聲等非理想因素.其中激光回波功率可以由激光朗伯體反射傳輸模型得到[14]，即

1.自然選擇世界狀態，包括一種自然狀態和全部參與人的類型；

2.參與人被告知自己的類型，但不知道自然狀態和其他參與人的類型；

3.參與人選擇策略并獲得支付。

通過海薩尼轉換，不完全信息博弈被轉換成為完全但不完美信息博弈，因而模型便可以求解了。

例如，參與人1的信念為“如果自己是高能力的，那么參與人2是高能力的概率是3/7，低能力的概率是4/7；如果自己是低能力的，那么參與人2是高能力的概率為2/3，低能力的概率是1/3”*為了簡潔起見，僅給出二階信念。實際上，每一階信念均需要滿足一致性要求。；參與人2的信念為“如果我是高能力的，那么參與人1是高能力的概率是3/5，低能力的概率是2/5；如果我是低能力的，那么參與人1是高能力的概率為4/5，參與人2是低能力的概率是1/5”*雙方的信念都是共同知識。。那么便可以找到一個聯合分布(見表2)來描述自然的選擇。在這種情況下，便稱參與人的信念是一致的(consistent)。

表2 一致的信念

參與人2高低參與人1高0.30.4低0.20.1

可以看出，根據條件概率公式，所有的高階信念均可以通過此聯合分布得到。為了看清這一點，記高類型和低類型的參與人1為H1，L1。類似的，參與人2的類型為H2，L2。為了符號上的簡便，分別記世界狀態(H1，H2)，(H1，L2)，(L1，H2)和(L1，L2)為a，b，c和d。以高類型的參與人H1為例，其一階信念可以通過計算各個世界狀態條件于H1的概率得到，即真實世界狀態是a的概率是3/7，是b的概率是4/7。

類似的，其二階信念是有3/7的概率參與人2相信“世界狀態是a的概率為3/5，c的概率為2/5”，有4/7的概率參與人2相信“世界狀態是b的概率為4/5，d的概率為1/5”。

如果信念是一致的，或者說，存在共同先驗，那么在貝葉斯理性(利用條件概率進行推斷)的幫助下，所有的高階信念均是共同知識。也就是說，此時，博弈模型以一種簡潔的方式重新成為了“完全的”(complete)，并且可以通過條件概率公式計算出每一階信念，避免了直接考慮高階信念時所面對的復雜又難以處理的數學運算。在“共同先驗假設”的保證下，BNE便可以被清晰地定義*此定義非常基礎，可在任意博弈論教材中找到，因此本文略去介紹。。

由于海薩尼的工作，后繼的研究可以輕易地對信息問題進行分析而不用涉及復雜的高階信念問題。這一貢獻是奠基性的，它在不增加過多的數學復雜性的前提下，直接拓展了經濟學研究的范圍，為理解更加復雜的博弈互動行為提供了有力的分析工具。

此外，了解海薩尼轉換的前提也同樣重要。通過上例可以看到，海薩尼轉換要求信念的一致性。如果信念不是一致的，便無法找到一個作為共同知識的聯合分布，因此分析過程就會變得更加復雜。需要注意的是，海薩尼轉換并非適用于為所有的不確定性和關于不確定性的信念情形建模，作為對海薩尼工作的補充，下一節將考察不一致信念的問題。

(三) 信念的一致性問題

如果將上述參與人2的信念前半部分修改為“如果我是高能力的，那么參與人1是高能力的概率為1/2，參與人2是低能力的概率是1/2”，此時，便不存在可以支撐1和2信念的聯合分布*此例修改自Zamir,S.,“Bayesian Games: Games with Incomplete Information”,Encyclopedia of complexity and Systems Science,Robert A.Meyers(ed.),Springer，New York,2009,pp.426-441.。那么，便不存在一個公認的自然選擇過程作為起點，海薩尼轉換無法適用。在這種情況下，便稱參與人的信念是不一致的。

顯然，海薩尼轉換所需要的重要假設是全部參與人的信念是“一致的”，即可以從共同的先驗概率中推得，并且此先驗概率分布是共同知識。此假設被稱為共同先驗假設(Common Prior Assumption，后稱CPA假設)，滿足此假設的博弈被稱為海薩尼博弈。顯然，并不是所有的博弈都是海薩尼博弈。也就是說，為了分析更廣泛的博弈情形，需要一個比海薩尼博弈中定義的BNE更加一般的解的概念。

實際上，BNE的定義并不一定要以海薩尼轉換(或一致性信念)為基礎。如上例中的不一致的信念可表示如下：

高低高3/74/7低2/31/3

(a)參與人1的信念

高低高1/24/5低1/21/5

(b)參與人2的信念

假設四種情形下參與人的支付矩陣為：

參與人2LR參與人1U2,00,1D0,01,0

GHH：參與人都是高能力時的支付矩陣

參與人2LR參與人1U0,00,0D1,11,0

GHL：參與人1是高能力且參與人2是低能力時的支付矩陣

參與人2LR參與人1U0,00,0D1,10,0

GLH：參與人1是高能力且參與人2是低能力時的支付矩陣

參與人2LR參與人1U0,02,1D0,00,2

GLL：參與人都是高能力時的支付矩陣

由于信念的不一致性，無法使用海薩尼轉換，但是此博弈仍然有混合策略均衡。將參與人1的策略記為(x,y)，表示：

● 當參與人1是高能力時，使用混合策略[x(U), (1-x)(D)]；

● 當參與人1是低能力時，使用混合策略[y(U), (1-y)(D)]；

類似的，將參與人2的策略記為(z,t)。在混合策略均衡下，每個參與人的每個類型必須對自己的兩個純策略無差異。因此解得：

可以看出，CPA所要求的前提實際上十分嚴格，它不僅要求參與人對“不知道”的事件形成概率層面的認識，更要求這種概率層面的認識是一致的且是共同知識。換句話說，它要求參與人對不知道的事情達成一致。一致性信念的要求很重要，因為即使參與人的信念是共同知識，但是如果他們不一致，海薩尼意義下的BNE依然不適用。而在現實生活中，我們往往很難說清CP是從哪來的。CP所刻畫的情形中參與人都必須十分熟悉且達成了思想層面的高度一致。所以，實際上海薩尼意義下的BNE的適用范圍十分局限，并不是任意的情形都可以適用。若要適用海薩尼博弈作為分析框架，必須首先驗證是否所要模型化的情境之中存在CP的基礎*參考文獻[14]證明了在所有可能的信念系統集合(belief system)中一致性信念系統集合的勒貝格測度為0。也就是說，海薩尼轉換所依賴的一致性信念系統并非是一個容易滿足的條件。。

為了解決信念不一致的問題，默滕斯和澤邁爾[15]提出了信念空間(BeliefSpace)的模型，并將在信念空間上重新定義BNE。在信念空間中，并不要求信念是一致的，進而大大拓展了分析范圍。然而，這種方法所使用的數學技術較為復雜，在實際研究中，研究者總是希望能利用共同知識來簡化模型。總的來說，CPA的合理性在經濟學界仍然是一個有爭議的話題*對這個問題的討論可參見[Dekel,E.,& Gul,F.Rationality and knowledge in game theory，Advances in Economics & Econometrics Theory & Applications Seventh world Congress， Volume 1, Econometric Society Monographs,no.26,David M. Kreps and Kenneth F. Wallis,(eds.)，Cambridge, New York and Melbourne:Cambridge University Press,1997,pp.87-172;Morris,S.，“The common prior assumption in economic theory，” Economics & Philosophy, 1995,11(2),pp.227-253;Gul,F.,“A Comment on Aumann’s Bayesian View, ”Econometrica,1998,Vol. 66, No.4,pp.923-927],對CPA假設的質疑，以及奧曼(Aumann,R.J.“Common Priors: A Reply to Gul,”Econometrica,1998,Vol.66,No.4,pp.929-938)為CPA的辯護。。

三、總結性評述

海薩尼貢獻的直接產物之一便是現代信息經濟學。從以上對海薩尼模型的簡單梳理過程便可以很清晰地發現，現代信息經濟學分析必須遵從海薩尼模型的前提假設。研究者若要用不完全信息博弈模型對現實進行刻畫分析，則必須先驗證這些假設是否能被滿足。一旦不滿足，則必須對標準模型進行修改或建立新模型。一個嚴重的建模誤區是將部分假設看成“建模慣例”而不對其深究。CPA便是一個很好的例子：雖然現實生活中能滿足CPA的情形十分有限，但是在分析中對其的使用則顯得有些任意。正如賓莫爾[16]所強調的：海薩尼僅僅告訴我們滿足CPA的模型該如何處理，但沒有告訴我們哪些情況滿足它。對模型假設的詳細驗證不僅保證模型對現實的準確刻畫，而且還幫助研究者正確地解釋結論并排除那些由不合理假設帶來的“有趣”結論。

一個值得注意的問題是，雖然不完全信息最初被引入是為了放松“共同知識”對博弈參與人過于苛刻的要求，但是在海薩尼模型中對CPA的依賴實際上完全背離了這一初衷：共同知識的假設完全沒有被放松，甚至可以說是更加嚴格了。在不完全信息博弈中，CPA假設要求參與人對不知道的事情也要達成一致，即確切地知道別人是如何不知道的、以什么概率認為是什么情況等等信息。這種一致明顯更難以達成。此外，由于貝葉斯推斷的復雜性遠遠高于一般選擇理論對決策者的理性要求，所以，奧曼認為不完全信息博弈并非體現了決策者的有限理性，而是一個要求超級無限理性的模型。這也導致不完全信息博弈的理論預測結果可能與現實情況產生偏差。

總結來說，納什均衡的思路在非合作博弈中得到了很好的繼承和延續。同時，納什均衡所要求的嚴苛前提條件在后續的博弈研究中也并沒有得到緩解，反而，以海薩尼博弈為例，甚至被限定得更加苛刻了。因此，研究者在利用博弈論對現實問題進行考察的過程中，必須仔細驗證這些條件是否得到了滿足，從而保證分析的合理性。

[1]Harsanyi,J.C.Gameswithincompleteinformationplayedby“Bayesian”players, Ⅰ-Ⅲ.PartI.Thebasicmodel[J].ManagementScience,1967,(14).

[2]Harsanyi,J.C.Gameswithincompleteinformationplayedby“Bayesian”players,Ⅰ-ⅢPartII.Bayesianequilibriumpoints[J].ManagementScience,1968a,(14).

[3]Harsanyi,J.C.Gameswithincompleteinformationplayedby“Bayesian”players,Ⅰ-ⅢPartⅢ.Thebasicprobabilitydistributionofthegame[J].ManagementScience，1968b,(14).

[4]Myerson,R.B.Commentson“GameswithIncompleteInformationPlayedby‘Bayesian’Players,I-IIIHarsanyi’sGameswithIncompleteInformation”[J].ManagementScience,Vol. 50,No. 12Supplement,December2004.

[5]Nash,J.Non-cooperativegames[J].AnnalsofMathematics, 1951,(54).

[6]Brandenburger,A.Knowledgeandequili-briumingames[J].TheJournalofEconomicPerspectives,Vol.6,No.4,1992.

[7]Aumann,R., &Brandenburger,A.EpistemicConditionsforNashEquilibrium[J].Econometrica,1995，63(5).

[8]Binmore,K.Playingforreal[M].Oxford:OxfordUniversityPress,2007.

[9]Werlang,S.R.D.C.Commonknowledgeandgametheory[Z].PhDDissertation,PrincetonUniversity，1986.

[10]Gentis,H.GameTheoryEvolving[M].Princeton,NJ:PrincetonUniversityPress,2000.

[11]VonNeumann,J.,Morgenstern,O.TheoryofGamesandEconomicBehavior[M].Princeton,NJ:PrincetonUniversityPress,1944.

[12]Luce,R.D.andRaiffa,H.GamesandDecisions[M].Wiley,NewYork,1957.

[13]Zamir,S.BayesianGames:GameswithIncom-pleteInformation[A].RobertA.Meyers(ed.).EncyclopediaofComplexityandSystemsScience[C].Springer;NewYork,2009

[14]Nyarko.Mostgamesviolatethecommonpriorsdoctrine[J].InternationalJournalofEconomicTheory,2010,6(1).

[15]Mertens,J.F., &Zamir,S.FormulationofBayesiananalysisforgameswithincompleteinformation[J].InternationalJournalofGameTheory, 1985,14(1).

[16]Binmore.K.Chapter1-rationality[Z].HandbookofGameTheorywithEconomicApplications, 2015.

[責任編輯陳翔云]

Knowledge, Belief and Equilibrium——A Discussion on the Belief System of Solution Concept

Li Junlin1, Wang Qizhi2, Yao Dongmin3

(1,2. School of Economics, Renmin University of China, Beijing 100872; 3. Center for China Fiscal Development， Central University of Finance and Economics, Beijing 100081)

equilibrium solution; high-order belief; common prior; incomplete information game

The development of game theory can be regarded as a process of continuous improvement and refinement of the solution concept, which imposes consistency requirements on behaviors and beliefs. Harsanyi’s contribution is converting a game of incomplete information to a complete but imperfect information game by “Harsanyi transformation”, and proposing the concept of Bayesian Nash equilibrium, which provided an unified analytical framework to cope with information problem and laid the foundation for the economics of information. This paper argues that the Bayesian Nash Equilibrium defined on the Harsanyi game needs to take the common prior assumption as the premise, which is rather demanding. Therefore, any analysis based on the Harsanyi game must make sure the common prior assumptions are satisfied.

李軍林，中國人民大學經濟學院教授，中國特色社會主義經濟建設協同創新中心研究員；王麒植，中國人民大學經濟學院博士生(北京 100872)；姚東旻(通訊作者)，中央財經大學中國財政發展協同創新中心講師(北京100081)。

* 作者李軍林感謝近年來在博弈論專題課堂上積極參與討論的各位博士生、碩士生同學。

知識、信念與均衡——一個關于博弈均衡解理性支持系統的討論*

一、納什均衡與共同知識

二、共同知識與不完全信息博弈模型

三、總結性評述

知識、信念與均衡
——一個關于博弈均衡解理性支持系統的討論*