999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

知識(shí)、信念與均衡
——一個(gè)關(guān)于博弈均衡解理性支持系統(tǒng)的討論*

2017-01-05 03:25:13李軍林王麒植姚東旻
教學(xué)與研究 2016年12期
關(guān)鍵詞:分析信息模型

李軍林,王麒植,姚東旻

?

知識(shí)、信念與均衡
——一個(gè)關(guān)于博弈均衡解理性支持系統(tǒng)的討論*

李軍林,王麒植,姚東旻

均衡解;高階信念;共同先驗(yàn);不完全信息博弈

博弈理論的發(fā)展過(guò)程可以看成是對(duì)其均衡解的概念不斷完善和精煉的過(guò)程,而解的概念反映的是行為和信念的一致性。在不完全信息條件下,在決策時(shí)決策者不但要考慮自己的信息,還要考慮別人的信息,別人對(duì)自己信息的信息等等高階信念,此時(shí)如何定義信念一致性的問(wèn)題長(zhǎng)期困擾著學(xué)者。海薩尼的貢獻(xiàn)在于通過(guò)構(gòu)造“海薩尼轉(zhuǎn)換”將不完全信息博弈轉(zhuǎn)換為完全但不完美信息博弈,并基于此提出了貝葉斯納什均衡的概念,為經(jīng)濟(jì)學(xué)建立了分析信息問(wèn)題的博弈框架,并奠定了整個(gè)信息經(jīng)濟(jì)學(xué)的基礎(chǔ)。本文認(rèn)為,海薩尼意義上的貝葉斯納什均衡的一致性需要以共同先驗(yàn)假設(shè)為前提,但是此假設(shè)在現(xiàn)實(shí)中很難滿足。因此,在使用海薩尼博弈分析實(shí)際經(jīng)濟(jì)問(wèn)題時(shí),必須首先檢驗(yàn)共同先驗(yàn)假設(shè)是否可以被滿足。

從某種意義上講,博弈理論的發(fā)展過(guò)程,可以看成是對(duì)其均衡解的概念(solution concept)不斷完善和精煉的過(guò)程。對(duì)均衡的定義,或者說(shuō)對(duì)博弈解的定義,直接反映了研究者對(duì)“理性決策”的理解。而對(duì)均衡的求解過(guò)程無(wú)非是在多人交互決策情境下,參與人根據(jù)自己已有知識(shí)并形成的信念,對(duì)理性原則的貫徹和堅(jiān)持。

事實(shí)上,最初人們提到博弈論時(shí)也會(huì)很自然地將其與納什均衡聯(lián)系起來(lái),然而,納什均衡所要求的理性與信息約束實(shí)際上并不能很好地刻畫(huà)許多常見(jiàn)的經(jīng)濟(jì)情形(例如競(jìng)標(biāo),二手車買賣,保險(xiǎn)銷售等諸多問(wèn)題),因此,需要針對(duì)此類情形構(gòu)造新的解的概念以及相關(guān)的信息設(shè)定,來(lái)完善與改進(jìn)博弈理論。但在放松了假設(shè)之后,如何提出合理的解的概念在博弈論發(fā)展中困擾了理論學(xué)者很長(zhǎng)時(shí)間。其中,對(duì)于不完全信息的處理尤其棘手:由于博弈的交互性導(dǎo)致參與人的推理過(guò)程經(jīng)常需要高階信念(直至無(wú)窮階信念)的支持,而如何合理、簡(jiǎn)潔地處理這些高階信念便是建模者無(wú)法回避的問(wèn)題。本文即從高階信念和高階知識(shí)的視角出發(fā),分析并介紹海薩尼(Harsanyi)提出的“貝葉斯納什均衡”(Bayesian Nash Equilibrium,后稱BNE)在博弈論發(fā)展中的重大意義。[1][2][3]

在海薩尼之前,經(jīng)濟(jì)學(xué)沒(méi)有統(tǒng)一的框架來(lái)分析信息問(wèn)題,因此經(jīng)濟(jì)學(xué)分析中參與人的信息往往都是相同的。[4]海薩尼博弈對(duì)高階信念簡(jiǎn)潔且精妙的處理,為后來(lái)的研究掃清了障礙,是方法論上的巨大突破。正是由于海薩尼的杰出貢獻(xiàn),使得經(jīng)濟(jì)學(xué)進(jìn)入了前人認(rèn)為“不可分析”的領(lǐng)域,沒(méi)有他的貢獻(xiàn),信息經(jīng)濟(jì)學(xué)便永遠(yuǎn)不會(huì)產(chǎn)生*海薩尼的論文(參見(jiàn)參考文獻(xiàn)[1][2][3])對(duì)于現(xiàn)代信息經(jīng)濟(jì)學(xué)的產(chǎn)生與構(gòu)建是具有里程碑意義的。盡管其他一些學(xué)者關(guān)于非完全信息問(wèn)題也有過(guò)奠基性的研究成果,比如,威克瑞關(guān)于拍賣競(jìng)標(biāo)的論文[Vickrey,W.,“Counterspeculation, auctions, and competitive sealed tenders”,The Journal of Finance,1961 16(1)];阿克洛夫關(guān)于二手車市場(chǎng)問(wèn)題的論文[Akerlof, G., “The market for ‘lemons’,quality uncertainty and the market mechanism.”,Quarterly Journal of Economics, 1970,84(3),pp.488-500];斯本斯關(guān)于勞動(dòng)力市場(chǎng)信號(hào)傳遞問(wèn)題的論文[Spence, M. “Job market signaling”,Quarterly Journal of Economics,1973,87(3),pp.355-374];羅斯柴爾德和斯蒂格利茨關(guān)于保險(xiǎn)市場(chǎng)銷售的論文[Rothschild,M.,&Stiglitz,J.“Equilibrium in Competitive Insurance Markets:An Essay on the Economics of Imperfect Information.”,The Quarterly Journal of Economics.1976,90(4),pp.629-649]等等。盡管他們也都由于對(duì)信息經(jīng)濟(jì)學(xué)的杰出貢獻(xiàn)而先后獲得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),但是,從研究的方法論上看,他們的工作都針對(duì)的是某個(gè)市場(chǎng)的特殊商品的分析而得出的結(jié)論,而海薩尼的工作是給出了非完全信息競(jìng)爭(zhēng)市場(chǎng)(有不同信息行為人)一般分析框架。。

此外,他的工作在經(jīng)濟(jì)學(xué)說(shuō)史上也是一項(xiàng)了不起的成就。在完全信息和非完全信息博弈分析框架建立起來(lái)之后,組織經(jīng)濟(jì)學(xué)、信息經(jīng)濟(jì)學(xué)等學(xué)科得到了極大的推動(dòng),豐富和拓展了經(jīng)濟(jì)學(xué)分析的視野和深度。因此,他們的貢獻(xiàn)在學(xué)說(shuō)史上也是濃墨重彩的一筆。

對(duì)博弈理論發(fā)展歷程的回顧和整理對(duì)研究者正確地理解和使用相關(guān)工具具有重要意義:一方面,從現(xiàn)在理論發(fā)展的視角回看這些工作可以使學(xué)者更清晰完整地認(rèn)識(shí)該理論根基;另一方面,對(duì)理論先驅(qū)工作的充分理解也是向其致敬的最好方式。隨著澤爾騰的去世,第一批博弈論做出奠基性貢獻(xiàn)的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者全部離我們而去。這或許意味著一個(gè)時(shí)代的結(jié)束,而本文也體現(xiàn)了作者對(duì)這批學(xué)者的追思。

基于此,本文介紹了博弈論圍繞博弈核心問(wèn)題“高階信念和推理”進(jìn)行處理的發(fā)展脈絡(luò),進(jìn)而也展示知識(shí)和信念如何結(jié)合形成并支撐著具有說(shuō)服力和解釋力的解的概念。從這個(gè)角度將可以更好地理解、把握博弈論與經(jīng)濟(jì)現(xiàn)實(shí)的關(guān)系,以及如何進(jìn)一步推動(dòng)博弈論向前發(fā)展。

早期關(guān)于處理的經(jīng)典博弈模型分析方法具有求解的簡(jiǎn)便性。雖然這種簡(jiǎn)便性大大提升了分析效率,從而使博弈分析工具流行起來(lái),但同時(shí),簡(jiǎn)便性也弱化了博弈模型背后復(fù)雜的推理過(guò)程以及假設(shè)條件,尤其可能會(huì)忽視了博弈的合理均衡解存在的理性支持系統(tǒng),進(jìn)而增大了模型被誤用的可能。

筆者將進(jìn)一步分析博弈所隱含的假設(shè)以及這些假設(shè)所對(duì)應(yīng)的情形。因此,本文重點(diǎn)使用決策分析視角對(duì)博弈理論分析法背后的機(jī)理和假設(shè)進(jìn)行闡述和分析,進(jìn)而給出不同納什均衡的理性支持系統(tǒng)。

一、納什均衡與共同知識(shí)

著名的納什均衡(Nash Equilibrium,后稱NE,)是一個(gè)全部參與人的策略組合,其中每個(gè)參與人策略是在給定其他人策略不變的前提之下對(duì)自己最有利的策略。換句話說(shuō),沒(méi)有一個(gè)參與人能夠通過(guò)改變自己策略來(lái)改善福利水平。[5]

納什均衡的定義中實(shí)際上隱含地引入了共同知識(shí)的假設(shè)*研究發(fā)現(xiàn),博弈中的共同知識(shí)(Common Knowledge)假設(shè)在博弈均衡的定義中起到了基礎(chǔ)性作用,但是卻在現(xiàn)實(shí)中難以滿足。因此,正確識(shí)別對(duì)被研究情形中的共同知識(shí)是選擇合適博弈模型的關(guān)鍵。。共同知識(shí)(common knowledge)是指具有如下性質(zhì)的事件:當(dāng)其發(fā)生時(shí),所有人都知道它發(fā)生了,所有人都知道其他人也知道它發(fā)生了,所有人都知道其他人都知道所有人都知道它發(fā)生了,并且此推理鏈條可以推到無(wú)窮階均成立。

在完全信息條件下,勃蘭登伯格對(duì)NE所要求的推理過(guò)程所蘊(yùn)含的信息要求進(jìn)行了總結(jié)。[6]一般來(lái)說(shuō),兩類信息假設(shè)是必須的*需要注意的是,這并不意味著其他條件均無(wú)法保證納什均衡。例如,如果要求參與人的策略是共有知識(shí),則可以放松部分共同知識(shí)約束且仍保證納什均衡的出現(xiàn)(參見(jiàn)參考文獻(xiàn)[6]和[7])。:

首先,博弈的結(jié)構(gòu)必須是共同知識(shí),其中包括博弈規(guī)則、參與人數(shù)、參與人的收益等等。與單人決策過(guò)程不同,博弈過(guò)程中的決策具有交互性,即決策者的決策過(guò)程互相嵌套*例如,在兩個(gè)廠商的古諾競(jìng)爭(zhēng)中,廠商1的產(chǎn)量取決于自己的邊際成本和廠商2的產(chǎn)量,而廠商2的產(chǎn)量又取決于自己的邊際成本和廠商1的產(chǎn)量,形成一個(gè)嵌套循環(huán)。。博弈決策中的相互嵌套循環(huán)要求每個(gè)參與人的信念或知識(shí)也必須在無(wú)窮階成立*參考文獻(xiàn)[8]提供了一個(gè)清晰的例子,展示了高階信念在博弈決策中的必要性。。很明顯,完全信息假設(shè)對(duì)決策者信息的要求遠(yuǎn)不止“所有參與人都知道”特定信息,而需要參與人達(dá)成高度的一致,因而在實(shí)際生活中并不非常容易得到滿足。但是遺憾的是,尋找一種合理且簡(jiǎn)便的方式放松此假設(shè)卻是一項(xiàng)困難的任務(wù)。關(guān)于這個(gè)問(wèn)題的理論發(fā)展過(guò)程將在第三部分進(jìn)行討論。

其次,所有決策者的理性方式必須是共同知識(shí)*并非在所有情形下都需要“理性”作為共同知識(shí)如此嚴(yán)格的條件來(lái)保證NE的出現(xiàn)——作為有限知識(shí)的理性即足夠,參見(jiàn)參考文獻(xiàn)[6]。但是為了結(jié)論不失一般性,此處仍然要求“理性”成為共同知識(shí)。。對(duì)每個(gè)決策者而言,博弈決策的交互性決定了其他決策者的決策方式也必然是影響自身決策的重要因素。下例修改自沃朗[9]的思想實(shí)驗(yàn),用以說(shuō)明在即使客觀條件完全相同的博弈中,決策者也會(huì)根據(jù)對(duì)方參與人的不同而改變自身策略。設(shè)想你要參加一個(gè)用現(xiàn)金作為回報(bào)的二人博弈,并被告知將分別和兩個(gè)人進(jìn)行博弈,其中一位是你的朋友,另一位是陌生人。你和朋友相識(shí)多年并且智力水平相同;而那位陌生人是剛剛從喜馬拉雅山上請(qǐng)下來(lái)的,他僅僅大概知道一塊錢能買什么東西。你的可選策略有兩個(gè):唯一的納什均衡策略和保險(xiǎn)策略。當(dāng)雙方都采用納什均衡策略時(shí),你的收益是1 000塊;但是此時(shí)如果對(duì)方偏離,你將會(huì)至少損失1 000塊。如果你采用保險(xiǎn)策略,那無(wú)論對(duì)方選擇什么,你的收益都是900塊。那么很明顯,你面對(duì)朋友時(shí)更有可能采用納什均衡策略。

為了保證納什均衡的實(shí)現(xiàn),在全部決策者的所有高階信念中都必須排除出現(xiàn)“喜馬拉雅人”的情況。換句話說(shuō),每個(gè)參與人的決策規(guī)則也必須是共同知識(shí),也即是要求所有決策者的理性必須是共同知識(shí)。此時(shí),“理性”實(shí)際上指的是參與人如何處理信息、作出決策的規(guī)則。

那么在實(shí)際情形下這兩個(gè)條件是否容易得到滿足?共同知識(shí)對(duì)參與人施加的約束十分苛刻——它要求信息不僅僅是公開(kāi)的,而且必須在多個(gè)參與人中達(dá)成共識(shí)。很顯然如果模型中存在重要的私人信息,那么前述推理過(guò)程必然無(wú)法成立。但是需要注意的是,并不是所有的公開(kāi)信息都滿足共同知識(shí)假設(shè)。例如國(guó)家宏觀統(tǒng)計(jì)數(shù)據(jù),雖然它是公開(kāi)的,但是并不是每個(gè)人都會(huì)去看,也不是每個(gè)人都確定別人會(huì)去看,更不是每個(gè)人都確定別人知不知道自己看不看,等等。因此,若假設(shè)此類數(shù)據(jù)是參與人的共同知識(shí),便會(huì)面臨參與人行為偏離預(yù)測(cè)的風(fēng)險(xiǎn)。

此外,作為共同知識(shí)的理性也常常被忽略。例如在最后通牒博弈(Ultimatum Game)中,兩個(gè)參與人(匿名)嘗試就一定數(shù)量金錢達(dá)成分成比例。首先一個(gè)出價(jià)者給出他的分成計(jì)劃,然后回應(yīng)者決定是否接受出價(jià)者的計(jì)劃。如果計(jì)劃被接受,那么每個(gè)參與人獲得相應(yīng)的報(bào)酬;如果計(jì)劃被拒絕則分成失敗,兩人的收益都為0。對(duì)于回應(yīng)者來(lái)說(shuō),面對(duì)一個(gè)非負(fù)的計(jì)劃,接受總是不差于拒絕的,因此出價(jià)者應(yīng)該預(yù)測(cè)理性的回應(yīng)者在此種情況下總是選擇接受。然而金提思[10]通過(guò)實(shí)驗(yàn)研究發(fā)現(xiàn)低于30%的分成比經(jīng)常被拒絕。這表明參與人所使用的理性原則并非總是與理論相符,對(duì)其進(jìn)行預(yù)測(cè)也并不是簡(jiǎn)單的任務(wù)*另一種解釋是雖然博弈規(guī)則給定了支付金額,但是卻沒(méi)有唯一確定每個(gè)人的效用。例如參與人可以因?yàn)榉峙洳还蕉a(chǎn)生副效用,從而導(dǎo)致拒絕成為了理性選擇。如果遵從這種解釋,那么實(shí)際上是各個(gè)參與人的支付而不是理性方式?jīng)]有成為共同知識(shí)。這種解釋是有道理的,不過(guò)卻與本文提供的解釋從分析邏輯上完全等價(jià),原因在于新古典經(jīng)濟(jì)學(xué)以來(lái)“理性”的內(nèi)含實(shí)際上是包括了“效用”和“最大化方法”兩個(gè)元素的,并且二者都需要借助對(duì)方來(lái)定義自己,并不存在清晰的界限。參見(jiàn)[Vriend,N.J.“Rational behavior and economic theory,”Journal of Economic Behavior & Organization, 1996,29(2),pp.263-285;Binmore.K.“Chapter l-rationality,”Handbook of Game Theory with Economic Applications,2015,pp.1-26]。

總的來(lái)說(shuō),NE概念從認(rèn)識(shí)論和方法論上為交互決策情形提供了有力工具,但是對(duì)于具體的情形的研究經(jīng)常需要對(duì)其做更進(jìn)一步的限制或擴(kuò)展。接下來(lái)將介紹的貝葉斯納什均衡用一種精妙的模型設(shè)置將NE概念的內(nèi)含延伸到不完全信息情況下,而這些工作為信息經(jīng)濟(jì)學(xué)取得的突破性進(jìn)展,在關(guān)鍵問(wèn)題的處理上掃清了障礙。

二、共同知識(shí)與不完全信息博弈模型

(一) 不完全信息博弈與高階信念

納什均衡的實(shí)現(xiàn)所需要的大量共同知識(shí)在實(shí)際經(jīng)濟(jì)生活中很難滿足——經(jīng)濟(jì)參與者往往不能對(duì)客觀現(xiàn)實(shí)產(chǎn)生如此一致且正確的認(rèn)識(shí)。因此在20世紀(jì)五六十年代左右,博弈論學(xué)者便提出了“不完全信息”的概念。

以如下兩個(gè)簡(jiǎn)單的博弈為例,參與人1在(a)和(b)中的支付相同而參與人2的支付不同。如果參與人1不能知道參與人2的實(shí)際支付的話,他便不知道參與人2將會(huì)選L還是R,進(jìn)而不知道自己的最優(yōu)策略是U還是D。

表1 不完全信息

參與人2LR參與人1U1,00,1D0,01,1

(a) (b)

如果博弈中部分模型設(shè)置不是共同知識(shí),例如上例中的支付矩陣,那么此博弈便被稱為不完全信息博弈。在博弈論的發(fā)展過(guò)程中,博弈論學(xué)者對(duì)“什么是不完全信息博弈”的定義實(shí)際上發(fā)生過(guò)變化。[4]馮·諾依曼和摩根斯坦最初對(duì)“不完全信息”的定義是“部分結(jié)構(gòu)沒(méi)有被清晰定義的博弈” ,[11]而且從理論上講,沒(méi)有定義清楚的模型是不能被分析的,因此,他們認(rèn)為沒(méi)有必要研究此類博弈。顯然,這個(gè)回答無(wú)法使學(xué)者們滿意,許多學(xué)者此后依然在不斷嘗試建立新的分析方法以處理這類情形,其中最成功的嘗試來(lái)自海薩尼。[1][2][3]在海薩尼的模型中,無(wú)法被精確定義的變量以概率分布的形式描述并且此分布被假設(shè)為全部參與人的共同知識(shí)。在后文的討論中可以發(fā)現(xiàn),在這些假設(shè)的幫助下,不完全信息博弈模型便是可分析的。因此,從這種意義上講,這些變量的取值雖然不是被精確地知道,但是其取值范圍以及分布是知道的,即決策者知道他們“知道自己不知道的具體是什么”和“多大程度上不知道”,因此也并不是完全不知道。換句話說(shuō),海薩尼模型所刻畫(huà)的“不完全信息”已經(jīng)與其最初的定義有所不同:馮·諾依曼和摩根斯坦定義的不完全信息是“不知道”,而海薩尼定義的不完全信息是“不確知”,即前者比后者包含更大的范圍,如下圖所示。

圖1 兩種不完全信息對(duì)比

用概率對(duì)不確定性進(jìn)行刻畫(huà)之后更重要的問(wèn)題是高階信念如何處理。一個(gè)直接的辦法是將所有高階信念逐階給出,分析每種情況下的最優(yōu)策略。魯斯和拉法亞[12]曾經(jīng)沿著這條思路進(jìn)行了探索。為了避免完全信息的嚴(yán)格假設(shè),他們?yōu)橐粋€(gè)n人博弈構(gòu)建了n2個(gè)支付函數(shù)以刻畫(huà)每個(gè)參與人i對(duì)參與人j支付的推測(cè)。然而很顯然,僅僅對(duì)二階信念進(jìn)行刻畫(huà)是遠(yuǎn)遠(yuǎn)不足以支撐均衡的。例如,考慮表1所描述的博弈。如果在完全信息條件下,當(dāng)真實(shí)支付矩陣是(a)時(shí),參與人1將采取其納什均衡策略D。然而,如果參與人1認(rèn)為參與人2“錯(cuò)誤地”相信真實(shí)矩陣是(b),進(jìn)而選擇L的話,他也會(huì)將自己的策略修改為U。如果參與人1認(rèn)為參與人2認(rèn)為參與人1“錯(cuò)誤地”相信真實(shí)矩陣是(b),則參與人1會(huì)期待參與人2選擇R,進(jìn)而自己選擇D。此類考慮可以無(wú)限延展下去。

因此,在不完全信息下,如何設(shè)置全部的高階信念是一個(gè)無(wú)法回避的問(wèn)題。同時(shí)也可以發(fā)現(xiàn),直接給出全部信念并不是一個(gè)理想的方式,因?yàn)樗謴?fù)雜凌亂并且難以處理。海薩尼[1][2][3]介紹了一種數(shù)學(xué)上更為簡(jiǎn)便的建模方法,極大地提升了分析的可操作性。

(二)海薩尼轉(zhuǎn)換與貝葉斯納什均衡

海薩尼構(gòu)造了一個(gè)由自然先行動(dòng)的博弈模型,在此模型中借助貝葉斯規(guī)則便可以簡(jiǎn)便地將全部高階信念給出,于是便解決了高階信念的問(wèn)題。海薩尼的等價(jià)構(gòu)造將馮·諾依曼和摩根斯坦意義上的不完全信息博弈轉(zhuǎn)換為完全信息但不完美博弈,進(jìn)而避免了馮·諾依曼和摩根斯坦質(zhì)疑的這種情形不可分析、相關(guān)模型不可解的問(wèn)題,使分析討論可以繼續(xù)。此過(guò)程即是著名的“海薩尼轉(zhuǎn)換(Harsanyi’s Transformation)”,它使不完全信息條件下的博弈分析成為可能,使經(jīng)濟(jì)學(xué)第一次可以使用統(tǒng)一規(guī)范的框架對(duì)信息問(wèn)題進(jìn)行分析,也為現(xiàn)代信息經(jīng)濟(jì)學(xué)的繁榮發(fā)展做出了奠基性貢獻(xiàn)。

海薩尼首先令人信服地論證,所有對(duì)于模型的不確定性可以分為三類:對(duì)事件的不確定、對(duì)支付的不確定和對(duì)參與人策略的不確定。其次,他進(jìn)一步論證這三種不確定性完全可以轉(zhuǎn)化為對(duì)參與人支付的不確定性。然后,根據(jù)參與人支付的不同將參與人分為不同的“類型”,并且在正式博弈開(kāi)始之前,由“自然”按照先驗(yàn)的概率(是共同知識(shí))對(duì)參與人的類型進(jìn)行選擇,并且所有參與人僅僅可以觀測(cè)到自己的類型,而不知道別人的類型。因此,雖然參與人并不確切地知道其他參與人的類型,但是可以根據(jù)先驗(yàn)概率和自己的類型對(duì)他們的類型進(jìn)行推測(cè)(貝葉斯推斷)。最后,在余下的博弈中,參與人依照自己的條件期望收益選擇最優(yōu)反應(yīng)。以上過(guò)程被稱為“海薩尼轉(zhuǎn)換”,而轉(zhuǎn)換后的博弈被稱為海薩尼博弈。

對(duì)“海薩尼轉(zhuǎn)換”過(guò)程更加準(zhǔn)確的介紹需要引入一些概念*本文僅介紹簡(jiǎn)略定義,嚴(yán)格的數(shù)學(xué)定義可見(jiàn)[Zamir,S.,“Bayesian Games:Games with Incomplete Information,”Encyclopedia of Complexity and Systems Science,Robert A.Meyers (ed.),Springer,New York,2009,pp.426-441;Dekel,E.,& Gul,F.“Rationality and knowledge in game theory”,David M.Kreps and Kenneth F. Wallis,(eds.),Advances in Economics & Econometrics Theory & Applications Seventh World congress, Volume 1,Econometric Society Monographs,no.26,Cambridge,New York and Melbourne:Cambridge University Press,1997,pp.87-172]。。

● 自然狀態(tài)(state of nature),包含關(guān)于博弈的全部客觀信息,如支付函數(shù)、博弈規(guī)則、模型中隨機(jī)數(shù)的可能實(shí)現(xiàn)值等等。例如,表1中(a)和(b)兩個(gè)博弈情形就代表了兩個(gè)不同的自然狀態(tài)。

● 類型(type),包含關(guān)于博弈參與人主觀信念的全部信息,因此也被稱為意識(shí)狀態(tài)(state of mind)。例如,參與人對(duì)真實(shí)狀態(tài)是表1中哪個(gè)的信念以及全部高階信念。

● 世界狀態(tài)(state of world),由特定的一個(gè)自然狀態(tài)和特定一組參與人類型構(gòu)成,描述了某個(gè)特定的博弈模型以及其中參與人的信念。

在海薩尼構(gòu)造的博弈中,對(duì)“解的概念”(solution concept)的定義沿承以最優(yōu)反應(yīng)為核心的納什均衡思路,又因?yàn)槠鋵?duì)貝葉斯理性的使用,也被稱為貝葉斯納什均衡(Bayesian Nash Equilibrium, 后稱BNE)。在BNE中,每個(gè)參與人都在給定其他參與人策略的條件下,選擇最大化自己條件期望收益的策略。根據(jù)澤邁爾的總結(jié),海薩尼博弈以如下順序進(jìn)行:

式中,Pr為激光回波功率,常數(shù)k為4ln2,tr為回波時(shí)刻,T0為激光脈沖寬度,Nn為噪聲,包括背景噪聲、電路噪聲等非理想因素.其中激光回波功率可以由激光朗伯體反射傳輸模型得到[14],即

1.自然選擇世界狀態(tài),包括一種自然狀態(tài)和全部參與人的類型;

2.參與人被告知自己的類型,但不知道自然狀態(tài)和其他參與人的類型;

3.參與人選擇策略并獲得支付。

通過(guò)海薩尼轉(zhuǎn)換,不完全信息博弈被轉(zhuǎn)換成為完全但不完美信息博弈,因而模型便可以求解了。

例如,參與人1的信念為“如果自己是高能力的,那么參與人2是高能力的概率是3/7,低能力的概率是4/7;如果自己是低能力的,那么參與人2是高能力的概率為2/3,低能力的概率是1/3”*為了簡(jiǎn)潔起見(jiàn),僅給出二階信念。實(shí)際上,每一階信念均需要滿足一致性要求。;參與人2的信念為“如果我是高能力的,那么參與人1是高能力的概率是3/5,低能力的概率是2/5;如果我是低能力的,那么參與人1是高能力的概率為4/5,參與人2是低能力的概率是1/5”*雙方的信念都是共同知識(shí)。。那么便可以找到一個(gè)聯(lián)合分布(見(jiàn)表2)來(lái)描述自然的選擇。在這種情況下,便稱參與人的信念是一致的(consistent)。

表2 一致的信念

參與人2高低參與人1高0.30.4低0.20.1

可以看出,根據(jù)條件概率公式,所有的高階信念均可以通過(guò)此聯(lián)合分布得到。為了看清這一點(diǎn),記高類型和低類型的參與人1為H1,L1。類似的,參與人2的類型為H2,L2。為了符號(hào)上的簡(jiǎn)便,分別記世界狀態(tài)(H1,H2),(H1,L2),(L1,H2)和(L1,L2)為a,b,c和d。以高類型的參與人H1為例,其一階信念可以通過(guò)計(jì)算各個(gè)世界狀態(tài)條件于H1的概率得到,即真實(shí)世界狀態(tài)是a的概率是3/7,是b的概率是4/7。

類似的,其二階信念是有3/7的概率參與人2相信“世界狀態(tài)是a的概率為3/5,c的概率為2/5”,有4/7的概率參與人2相信“世界狀態(tài)是b的概率為4/5,d的概率為1/5”。

如果信念是一致的,或者說(shuō),存在共同先驗(yàn),那么在貝葉斯理性(利用條件概率進(jìn)行推斷)的幫助下,所有的高階信念均是共同知識(shí)。也就是說(shuō),此時(shí),博弈模型以一種簡(jiǎn)潔的方式重新成為了“完全的”(complete),并且可以通過(guò)條件概率公式計(jì)算出每一階信念,避免了直接考慮高階信念時(shí)所面對(duì)的復(fù)雜又難以處理的數(shù)學(xué)運(yùn)算。在“共同先驗(yàn)假設(shè)”的保證下,BNE便可以被清晰地定義*此定義非常基礎(chǔ),可在任意博弈論教材中找到,因此本文略去介紹。。

由于海薩尼的工作,后繼的研究可以輕易地對(duì)信息問(wèn)題進(jìn)行分析而不用涉及復(fù)雜的高階信念問(wèn)題。這一貢獻(xiàn)是奠基性的,它在不增加過(guò)多的數(shù)學(xué)復(fù)雜性的前提下,直接拓展了經(jīng)濟(jì)學(xué)研究的范圍,為理解更加復(fù)雜的博弈互動(dòng)行為提供了有力的分析工具。

此外,了解海薩尼轉(zhuǎn)換的前提也同樣重要。通過(guò)上例可以看到,海薩尼轉(zhuǎn)換要求信念的一致性。如果信念不是一致的,便無(wú)法找到一個(gè)作為共同知識(shí)的聯(lián)合分布,因此分析過(guò)程就會(huì)變得更加復(fù)雜。需要注意的是,海薩尼轉(zhuǎn)換并非適用于為所有的不確定性和關(guān)于不確定性的信念情形建模,作為對(duì)海薩尼工作的補(bǔ)充,下一節(jié)將考察不一致信念的問(wèn)題。

(三) 信念的一致性問(wèn)題

如果將上述參與人2的信念前半部分修改為“如果我是高能力的,那么參與人1是高能力的概率為1/2,參與人2是低能力的概率是1/2”,此時(shí),便不存在可以支撐1和2信念的聯(lián)合分布*此例修改自Zamir,S.,“Bayesian Games: Games with Incomplete Information”,Encyclopedia of complexity and Systems Science,Robert A.Meyers(ed.),Springer,New York,2009,pp.426-441.。那么,便不存在一個(gè)公認(rèn)的自然選擇過(guò)程作為起點(diǎn),海薩尼轉(zhuǎn)換無(wú)法適用。在這種情況下,便稱參與人的信念是不一致的。

顯然,海薩尼轉(zhuǎn)換所需要的重要假設(shè)是全部參與人的信念是“一致的”,即可以從共同的先驗(yàn)概率中推得,并且此先驗(yàn)概率分布是共同知識(shí)。此假設(shè)被稱為共同先驗(yàn)假設(shè)(Common Prior Assumption,后稱CPA假設(shè)),滿足此假設(shè)的博弈被稱為海薩尼博弈。顯然,并不是所有的博弈都是海薩尼博弈。也就是說(shuō),為了分析更廣泛的博弈情形,需要一個(gè)比海薩尼博弈中定義的BNE更加一般的解的概念。

實(shí)際上,BNE的定義并不一定要以海薩尼轉(zhuǎn)換(或一致性信念)為基礎(chǔ)。如上例中的不一致的信念可表示如下:

高低高3/74/7低2/31/3

(a)參與人1的信念

高低高1/24/5低1/21/5

(b)參與人2的信念

假設(shè)四種情形下參與人的支付矩陣為:

參與人2LR參與人1U2,00,1D0,01,0

GHH:參與人都是高能力時(shí)的支付矩陣

參與人2LR參與人1U0,00,0D1,11,0

GHL:參與人1是高能力且參與人2是低能力時(shí)的支付矩陣

參與人2LR參與人1U0,00,0D1,10,0

GLH:參與人1是高能力且參與人2是低能力時(shí)的支付矩陣

參與人2LR參與人1U0,02,1D0,00,2

GLL:參與人都是高能力時(shí)的支付矩陣

由于信念的不一致性,無(wú)法使用海薩尼轉(zhuǎn)換,但是此博弈仍然有混合策略均衡。將參與人1的策略記為(x,y),表示:

● 當(dāng)參與人1是高能力時(shí),使用混合策略[x(U), (1-x)(D)];

● 當(dāng)參與人1是低能力時(shí),使用混合策略[y(U), (1-y)(D)];

類似的,將參與人2的策略記為(z,t)。在混合策略均衡下,每個(gè)參與人的每個(gè)類型必須對(duì)自己的兩個(gè)純策略無(wú)差異。因此解得:

可以看出,CPA所要求的前提實(shí)際上十分嚴(yán)格,它不僅要求參與人對(duì)“不知道”的事件形成概率層面的認(rèn)識(shí),更要求這種概率層面的認(rèn)識(shí)是一致的且是共同知識(shí)。換句話說(shuō),它要求參與人對(duì)不知道的事情達(dá)成一致。一致性信念的要求很重要,因?yàn)榧词箙⑴c人的信念是共同知識(shí),但是如果他們不一致,海薩尼意義下的BNE依然不適用。而在現(xiàn)實(shí)生活中,我們往往很難說(shuō)清CP是從哪來(lái)的。CP所刻畫(huà)的情形中參與人都必須十分熟悉且達(dá)成了思想層面的高度一致。所以,實(shí)際上海薩尼意義下的BNE的適用范圍十分局限,并不是任意的情形都可以適用。若要適用海薩尼博弈作為分析框架,必須首先驗(yàn)證是否所要模型化的情境之中存在CP的基礎(chǔ)*參考文獻(xiàn)[14]證明了在所有可能的信念系統(tǒng)集合(belief system)中一致性信念系統(tǒng)集合的勒貝格測(cè)度為0。也就是說(shuō),海薩尼轉(zhuǎn)換所依賴的一致性信念系統(tǒng)并非是一個(gè)容易滿足的條件。。

為了解決信念不一致的問(wèn)題,默滕斯和澤邁爾[15]提出了信念空間(BeliefSpace)的模型,并將在信念空間上重新定義BNE。在信念空間中,并不要求信念是一致的,進(jìn)而大大拓展了分析范圍。然而,這種方法所使用的數(shù)學(xué)技術(shù)較為復(fù)雜,在實(shí)際研究中,研究者總是希望能利用共同知識(shí)來(lái)簡(jiǎn)化模型。總的來(lái)說(shuō),CPA的合理性在經(jīng)濟(jì)學(xué)界仍然是一個(gè)有爭(zhēng)議的話題*對(duì)這個(gè)問(wèn)題的討論可參見(jiàn)[Dekel,E.,& Gul,F.Rationality and knowledge in game theory,Advances in Economics & Econometrics Theory & Applications Seventh world Congress, Volume 1, Econometric Society Monographs,no.26,David M. Kreps and Kenneth F. Wallis,(eds.),Cambridge, New York and Melbourne:Cambridge University Press,1997,pp.87-172;Morris,S.,“The common prior assumption in economic theory,” Economics & Philosophy, 1995,11(2),pp.227-253;Gul,F.,“A Comment on Aumann’s Bayesian View, ”Econometrica,1998,Vol. 66, No.4,pp.923-927],對(duì)CPA假設(shè)的質(zhì)疑,以及奧曼(Aumann,R.J.“Common Priors: A Reply to Gul,”Econometrica,1998,Vol.66,No.4,pp.929-938)為CPA的辯護(hù)。。

三、總結(jié)性評(píng)述

海薩尼貢獻(xiàn)的直接產(chǎn)物之一便是現(xiàn)代信息經(jīng)濟(jì)學(xué)。從以上對(duì)海薩尼模型的簡(jiǎn)單梳理過(guò)程便可以很清晰地發(fā)現(xiàn),現(xiàn)代信息經(jīng)濟(jì)學(xué)分析必須遵從海薩尼模型的前提假設(shè)。研究者若要用不完全信息博弈模型對(duì)現(xiàn)實(shí)進(jìn)行刻畫(huà)分析,則必須先驗(yàn)證這些假設(shè)是否能被滿足。一旦不滿足,則必須對(duì)標(biāo)準(zhǔn)模型進(jìn)行修改或建立新模型。一個(gè)嚴(yán)重的建模誤區(qū)是將部分假設(shè)看成“建模慣例”而不對(duì)其深究。CPA便是一個(gè)很好的例子:雖然現(xiàn)實(shí)生活中能滿足CPA的情形十分有限,但是在分析中對(duì)其的使用則顯得有些任意。正如賓莫爾[16]所強(qiáng)調(diào)的:海薩尼僅僅告訴我們滿足CPA的模型該如何處理,但沒(méi)有告訴我們哪些情況滿足它。對(duì)模型假設(shè)的詳細(xì)驗(yàn)證不僅保證模型對(duì)現(xiàn)實(shí)的準(zhǔn)確刻畫(huà),而且還幫助研究者正確地解釋結(jié)論并排除那些由不合理假設(shè)帶來(lái)的“有趣”結(jié)論。

一個(gè)值得注意的問(wèn)題是,雖然不完全信息最初被引入是為了放松“共同知識(shí)”對(duì)博弈參與人過(guò)于苛刻的要求,但是在海薩尼模型中對(duì)CPA的依賴實(shí)際上完全背離了這一初衷:共同知識(shí)的假設(shè)完全沒(méi)有被放松,甚至可以說(shuō)是更加嚴(yán)格了。在不完全信息博弈中,CPA假設(shè)要求參與人對(duì)不知道的事情也要達(dá)成一致,即確切地知道別人是如何不知道的、以什么概率認(rèn)為是什么情況等等信息。這種一致明顯更難以達(dá)成。此外,由于貝葉斯推斷的復(fù)雜性遠(yuǎn)遠(yuǎn)高于一般選擇理論對(duì)決策者的理性要求,所以,奧曼認(rèn)為不完全信息博弈并非體現(xiàn)了決策者的有限理性,而是一個(gè)要求超級(jí)無(wú)限理性的模型。這也導(dǎo)致不完全信息博弈的理論預(yù)測(cè)結(jié)果可能與現(xiàn)實(shí)情況產(chǎn)生偏差。

總結(jié)來(lái)說(shuō),納什均衡的思路在非合作博弈中得到了很好的繼承和延續(xù)。同時(shí),納什均衡所要求的嚴(yán)苛前提條件在后續(xù)的博弈研究中也并沒(méi)有得到緩解,反而,以海薩尼博弈為例,甚至被限定得更加苛刻了。因此,研究者在利用博弈論對(duì)現(xiàn)實(shí)問(wèn)題進(jìn)行考察的過(guò)程中,必須仔細(xì)驗(yàn)證這些條件是否得到了滿足,從而保證分析的合理性。

[1]Harsanyi,J.C.Gameswithincompleteinformationplayedby“Bayesian”players, Ⅰ-Ⅲ.PartI.Thebasicmodel[J].ManagementScience,1967,(14).

[2]Harsanyi,J.C.Gameswithincompleteinformationplayedby“Bayesian”players,Ⅰ-ⅢPartII.Bayesianequilibriumpoints[J].ManagementScience,1968a,(14).

[3]Harsanyi,J.C.Gameswithincompleteinformationplayedby“Bayesian”players,Ⅰ-ⅢPartⅢ.Thebasicprobabilitydistributionofthegame[J].ManagementScience,1968b,(14).

[4]Myerson,R.B.Commentson“GameswithIncompleteInformationPlayedby‘Bayesian’Players,I-IIIHarsanyi’sGameswithIncompleteInformation”[J].ManagementScience,Vol. 50,No. 12Supplement,December2004.

[5]Nash,J.Non-cooperativegames[J].AnnalsofMathematics, 1951,(54).

[6]Brandenburger,A.Knowledgeandequili-briumingames[J].TheJournalofEconomicPerspectives,Vol.6,No.4,1992.

[7]Aumann,R., &Brandenburger,A.EpistemicConditionsforNashEquilibrium[J].Econometrica,1995,63(5).

[8]Binmore,K.Playingforreal[M].Oxford:OxfordUniversityPress,2007.

[9]Werlang,S.R.D.C.Commonknowledgeandgametheory[Z].PhDDissertation,PrincetonUniversity,1986.

[10]Gentis,H.GameTheoryEvolving[M].Princeton,NJ:PrincetonUniversityPress,2000.

[11]VonNeumann,J.,Morgenstern,O.TheoryofGamesandEconomicBehavior[M].Princeton,NJ:PrincetonUniversityPress,1944.

[12]Luce,R.D.andRaiffa,H.GamesandDecisions[M].Wiley,NewYork,1957.

[13]Zamir,S.BayesianGames:GameswithIncom-pleteInformation[A].RobertA.Meyers(ed.).EncyclopediaofComplexityandSystemsScience[C].Springer;NewYork,2009

[14]Nyarko.Mostgamesviolatethecommonpriorsdoctrine[J].InternationalJournalofEconomicTheory,2010,6(1).

[15]Mertens,J.F., &Zamir,S.FormulationofBayesiananalysisforgameswithincompleteinformation[J].InternationalJournalofGameTheory, 1985,14(1).

[16]Binmore.K.Chapter1-rationality[Z].HandbookofGameTheorywithEconomicApplications, 2015.

[責(zé)任編輯 陳翔云]

Knowledge, Belief and Equilibrium——A Discussion on the Belief System of Solution Concept

Li Junlin1, Wang Qizhi2, Yao Dongmin3

(1,2. School of Economics, Renmin University of China, Beijing 100872; 3. Center for China Fiscal Development, Central University of Finance and Economics, Beijing 100081)

equilibrium solution; high-order belief; common prior; incomplete information game

The development of game theory can be regarded as a process of continuous improvement and refinement of the solution concept, which imposes consistency requirements on behaviors and beliefs. Harsanyi’s contribution is converting a game of incomplete information to a complete but imperfect information game by “Harsanyi transformation”, and proposing the concept of Bayesian Nash equilibrium, which provided an unified analytical framework to cope with information problem and laid the foundation for the economics of information. This paper argues that the Bayesian Nash Equilibrium defined on the Harsanyi game needs to take the common prior assumption as the premise, which is rather demanding. Therefore, any analysis based on the Harsanyi game must make sure the common prior assumptions are satisfied.

李軍林,中國(guó)人民大學(xué)經(jīng)濟(jì)學(xué)院教授,中國(guó)特色社會(huì)主義經(jīng)濟(jì)建設(shè)協(xié)同創(chuàng)新中心研究員;王麒植,中國(guó)人民大學(xué)經(jīng)濟(jì)學(xué)院博士生(北京 100872);姚東旻(通訊作者),中央財(cái)經(jīng)大學(xué)中國(guó)財(cái)政發(fā)展協(xié)同創(chuàng)新中心講師(北京100081)。

* 作者李軍林感謝近年來(lái)在博弈論專題課堂上積極參與討論的各位博士生、碩士生同學(xué)。

猜你喜歡
分析信息模型
一半模型
隱蔽失效適航要求符合性驗(yàn)證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
3D打印中的模型分割與打包
展會(huì)信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 亚洲大尺码专区影院| 日韩高清在线观看不卡一区二区 | 亚洲a级在线观看| 欧美日韩一区二区在线播放| 婷婷色中文网| 欧美精品亚洲精品日韩专| 亚洲国产欧美中日韩成人综合视频| 久久伊伊香蕉综合精品| 狠狠综合久久| 亚洲性视频网站| 亚洲国语自产一区第二页| 亚洲欧洲自拍拍偷午夜色无码| 国产啪在线| 尤物视频一区| 欧美日韩国产在线播放| 亚洲色无码专线精品观看| 欧美日韩导航| 亚洲视频三级| 99精品视频九九精品| 四虎国产永久在线观看| 99ri精品视频在线观看播放| 午夜无码一区二区三区在线app| 国产精品xxx| 91在线播放国产| 国产一级一级毛片永久| 亚洲成年人网| 青草娱乐极品免费视频| 人妻丰满熟妇AV无码区| 久久公开视频| 曰AV在线无码| 成人福利在线免费观看| 日韩国产亚洲一区二区在线观看| 欧美无专区| 亚洲精品国产精品乱码不卞| AV不卡在线永久免费观看| 国产麻豆精品在线观看| 国产精品亚洲一区二区三区z| 国产99视频精品免费观看9e| 天天色天天综合| 少妇露出福利视频| 亚洲欧美综合另类图片小说区| 色丁丁毛片在线观看| 老汉色老汉首页a亚洲| 亚洲国产精品成人久久综合影院| 欧美精品亚洲精品日韩专区| 婷婷亚洲天堂| 国产成人精品视频一区二区电影 | 久久99热这里只有精品免费看| 欧美日一级片| 久久这里只有精品免费| 国模粉嫩小泬视频在线观看 | 97在线视频免费观看| 国产第一页屁屁影院| 亚洲综合第一区| 欧美成人手机在线观看网址| 国产自无码视频在线观看| 囯产av无码片毛片一级| 午夜a视频| 精品视频第一页| 成人国产精品一级毛片天堂| 色香蕉网站| 亚洲综合片| 91久久偷偷做嫩草影院电| 国产一二三区视频| 欧美一级大片在线观看| 97国产成人无码精品久久久| 粉嫩国产白浆在线观看| 欲色天天综合网| 色久综合在线| 亚洲无码熟妇人妻AV在线| 日韩毛片免费观看| 亚洲精品视频网| 99视频精品全国免费品| 午夜欧美理论2019理论| 性喷潮久久久久久久久| 无码AV动漫| 久久精品国产亚洲麻豆| 亚洲福利视频一区二区| 永久毛片在线播| 毛片卡一卡二| 露脸一二三区国语对白| 欧美色香蕉|