不完備偏好擴(kuò)展式博弈的序貫均衡

2012-01-01 00:00:00時(shí)奇,諶貽慶

經(jīng)濟(jì)數(shù)學(xué) 2012年1期

摘要將Kreps和Wilson提出的序貫均衡解概念推廣到了存在不完備偏好的情形. 首先給出了一個(gè)修正的顫抖手完美均衡的概念，然后應(yīng)用它去證明不完備偏好擴(kuò)展式博弈序貫均衡的存在性.

關(guān)鍵詞博弈；不完備偏好；序貫均衡；納什均衡；顫抖手完美均衡

中圖分類號(hào) F016 文獻(xiàn)標(biāo)識(shí)碼 A

Sequential Equilibrium in Extensive Games with Incomplete Preferences

SHI Qi 1，2， CHEN Yiqing 1

(1.School of Economics and Management， Nanchang University， Nanchang， Jiangxi 330031，China;

2.School of Economics， Shanghai University of Finance and Economics， Shanghai 200433，China)

Abstract The Kreps and Wilson’s solution concept of sequential equilibrium was generalized to the extensive games with incomplete preferences.First a revised concept of trembling hand perfect equilibrium was given， and then was applied to verify the existence of sequential equilibrium in extensive games with incomplete preferences.

Key words game；Incomplete preference；Sequential equilibrium；Nash equilibrium；Trembling hand perfect equilibrium

1 引言

上個(gè)十年不完備偏好理論得到了復(fù)興［1-3］. Bade［4］把它應(yīng)用到博弈論中，廣泛地探討了在參與者具有不完備偏好時(shí)的納什均衡概念. Bade將經(jīng)典納什均衡概念擴(kuò)展到不完備偏好的環(huán)境下，發(fā)現(xiàn)一個(gè)博弈的納什均衡恰好就是該博弈的所有完備化博弈的納什均衡集的并集. 而且，如果不完備偏好可以被一個(gè)多效用函數(shù)［1］所表示，那么在一定假設(shè)下，納什均衡集恰好就是該博弈所有線性完備化博弈的納什均衡集的并集.

納什均衡是博弈論中最重要的解概念，但是，它可能會(huì)給出了太多均衡; 當(dāng)博弈存在不完美信息的時(shí)候，它甚至可能造成誤導(dǎo). Kreps和Wilson提出的序貫均衡［5］是納什均衡的精練，其基本思想在于均衡不僅應(yīng)該描述參與者的策略，還要描述參與者在每個(gè)信息集上關(guān)于究竟是哪個(gè)歷史發(fā)生了的信念. 一個(gè)很自然的問(wèn)題是: 當(dāng)去掉完備偏好的假設(shè)，是否仍然能夠定義一個(gè)序貫均衡的概念，使得它在每個(gè)有限擴(kuò)展式博弈都存在呢?與Kreps和Wilson類似，想使用原擴(kuò)展式博弈的代理人標(biāo)準(zhǔn)式表示的顫抖手完美均衡來(lái)證明序貫均衡的存在性. 然而，對(duì)于不完備偏好，顫抖手完美均衡可能不是一個(gè)納什均衡. 幸運(yùn)的是，任意有限博弈都有一個(gè)顫抖手完美納什均衡(THPNE)，這樣就能得到與Kreps和Wilson類似的結(jié)論.

2 基本概念

在本文中， Γ:={N∪{c}，H，P，fc，(Ii)i∈N，(≥i)i∈N}表示一個(gè)完美記憶有限擴(kuò)展式博弈. 其中， N為有限的參與人集合， c為自然， H為歷史集合， P 為參與人函數(shù)，fc為每個(gè)P(h)=c 的歷史h指定一個(gè)A(h)上的概率測(cè)度f(wàn)c(·|h))，而且，集合Ιi∈Ii為參與人i的一個(gè)信息集.

終結(jié)歷史集合標(biāo)記為Z. 每個(gè)參與人i∈N擁有一個(gè)定義在Z上的(可能為不完備的)偏好關(guān)系≥i.假設(shè)每個(gè)偏好關(guān)系≥i都是傳遞的，反身的，但是，與經(jīng)典理論不同，不一定是完備的. 參與人 i 在 x和y之間無(wú)差異，標(biāo)記為x～iy，當(dāng)且僅當(dāng)x≥iy 且y≥ix. 參與人 i 嚴(yán)格偏好x甚于y，標(biāo)記為x＞iy，當(dāng)且僅當(dāng)x≥iy但不是y≥ix.

與不完備偏好表示理論的最近文獻(xiàn)［2］相似，考慮偏好關(guān)系≥i 是可以被函數(shù)表示的，也即，存在一個(gè)函數(shù)u:Z→Rn使得x≥y當(dāng)且僅當(dāng)u(x)≥u(y). 在下文中，將用Γα:={N∪{c}，H，P，fc，(Ii)i∈N，(ui)i∈N}表示博弈

Γα:={N∪{c}，H，P，fc，(Ii)i∈N，(≥i)i∈N}，其中函數(shù)ui:Z→Rmi表示偏好≥i. 更具體而言，對(duì)于任意向量α={α1，…，αI}，αi∈Rmi，定義一個(gè)博弈

Γα:=N∪{c}，H，P，fc，(Ii)i∈N，uii∈I，

其中， αiui:Z→R定義為αi和ui的點(diǎn)積，或αiui=∑mij=1αijuij. 進(jìn)一步的，定義

Δ:={α={α1，…，αI}，αi∈Δmi，i}，

經(jīng) 濟(jì) 數(shù) 學(xué)第 29卷第1期時(shí) 奇等：不完備偏好擴(kuò)展式博弈的序貫均衡

且

Δ+:=Δ∩R∑mi+ +，

其中，Δmi表示mi－1維單純形.

如果≥′和≥都是定義在Z上的偏好關(guān)系，≥≥′且＞＞′，那么稱≥′是≥的完備化. 說(shuō)一個(gè)擴(kuò)展式博弈Γ′:={N∪{c}，H，P，fc，(Ii)i∈N，(≥′i)i∈N}是另一個(gè)擴(kuò)展式博弈Γ:={N∪{c}，H，P，fc，(Ii)i∈N，(≥i)i∈N}的完備化，如果對(duì)于每個(gè)參與人i， ≥′i都是≥i的完備化. 那么，對(duì)于任意αi>>0，函數(shù)αiui代表了由ui所代表的偏好關(guān)系的完備化. 因此，對(duì)于任意α∈Δ+，博弈Γα是原博弈Γ的線性完備化.

仿照Kreps和Wilson的證明方法，考慮博弈Γα的代理人標(biāo)準(zhǔn)表示(ANFR)［6］. 但在此之前，給出一些術(shù)語(yǔ). 用Ii標(biāo)記參與人i應(yīng)該行動(dòng)的那些信息集的集合，用 s 標(biāo)記任意信息集，用 i.s 標(biāo)記應(yīng)該在信息集s∈Ii行動(dòng)的那個(gè)代理人. 而且，用Ds標(biāo)記信息集s可以采取的行動(dòng); 更具體的說(shuō)，如果知道在信息集s采取行動(dòng)的應(yīng)該是參與人i，那么稱他可以采取的行動(dòng)集為Di.s. 那么，博弈Γα的ANFR可以表示為

Γaα:={I∪{c}，(Di.s)i.s∈I，(ui)i∈N}，

其中， I表示所有代理人的集合.

3 納什均衡和顫抖手完美均衡

給定博弈Γα，定義代理人 i.s 的最優(yōu)反應(yīng)映射BRui，使得

BRui(σ－i.s):=arg max di.s∈Di.sui(di.s，σ－i.s)，

其中，-i.s表示除i.s之外的其他代理人. 那么，對(duì)于任意y(σ－i.s)∈BRui.s(σ－i.s)，給定其他代理人的行為策略σ－i.s，不存在y′(σ－i.s)使得(σ－i.s，y′(σ－i.s))＞i(σ－i.s，y(σ－i.s)).

對(duì)于博弈Γa的完備化Γaα，也可以定義參與人i.s的最優(yōu)反應(yīng)映射BRαiui使得

BRαiui(σ－i.s):=arg max di.s∈Di.sαiui(di.s，σ－i.s).

定理1 對(duì)于所有代理人i.s，以及所有αi∈Δmi+，有

BRαiui(σ－i.s)BRui(σ－i.s).

證明用反證法. 假設(shè)定理1不成立，那么必存在σ－i.s和di.s使得 di.s∈BRαiuiσ－i.s但di.s∈BRuiσ－i.s成立. 這樣必存在d′i，s使得di，s. 因?yàn)棣联琲∈Δmi+，那么αid′i，s＞αidi，s，這與di.s∈BRαiuiσ－i.s相矛盾.

定理2 對(duì)于所有代理人i.s和所有σ－i.s，BRuiσ－i.s是上半連續(xù)的.

證明因?yàn)椴┺氖怯邢薜模?BRuiσ－i.s總是緊值的. 根據(jù)最大值定理［7］，有，對(duì)于所有代理人i.s，所有αi∈Δmi+，以及所有是上半連續(xù)的. 那么，對(duì)于任意序列(σk－i.s)→σ－i.s和yk∈BRuiσk－i.s，存在yk的一個(gè)子序列收斂于BRuiσ－i.s中的一點(diǎn). 但是，根據(jù)定理1，有BRαiuiσ－i.sBRuiσ－i.s. 那么BRuiσ－i.s也是上半連續(xù)的.

一個(gè)隨機(jī)策略組合σ:=(σ1，σ2，…，σI)是博弈Γaα的納什均衡，如果不存在一個(gè)代理人i.s有策略σ′i，s∈Δ(Di，s)使得(σ′i，s，σ-i，s)＞(σi，s，σ-i，s). 將一個(gè)擴(kuò)展式博弈的所有納什均衡集合標(biāo)記為NEΓ.

一個(gè)隨機(jī)策略組合σ:=(σ1，σ2，…，σI)是博弈Γaα的一個(gè)顫抖手完美均衡，如果存在一個(gè)序列σk∞k=0使得

σk∈×i.s∈IΔ+Di.s，k∈1，2，3，…，

lim k→∞σki.sdi.s=σi.sdi.s，i.s∈I，di.s∈Di.s，

σi.s∈arg max uiσk－i.s，τi.s，i.s∈N，

但是，如果允許不完備偏好，一個(gè)顫抖手完美均衡可能不是納什均衡，這與完備偏好情形時(shí)是不同的. Bade ［4］給出了一個(gè)簡(jiǎn)單的反例，并且建議應(yīng)該把目光集中在那些也是納什均衡的顫抖手完美均衡上，這就產(chǎn)生了一個(gè)新概念，即顫抖手完美納什均衡(trembling hand perfect Nash equilibrium， THPNE). 幸運(yùn)的是，在一個(gè)有限擴(kuò)展式博弈的代理人戰(zhàn)略式中，總是可以找到一個(gè)THPNE，這一點(diǎn)由Bade［4］的推論1所保證.

定理3 (Bade)任意有限博弈Γaα都有一個(gè)顫抖手完美納什均衡.

4 序貫均衡

現(xiàn)在進(jìn)入到本文的核心部分，原博弈Γ的序貫均衡的存在性. 先考慮這樣一個(gè)評(píng)估σ，μ［8］，其中σ為行為策略組合， μ為一個(gè)這樣的信念函數(shù)：為每個(gè)信息集的歷史指定一個(gè)概率測(cè)度.

定義，結(jié)果Oσ，μs為給定信息集s已達(dá)到由行為策略σ決定的終結(jié)歷史的概率分布. 一個(gè)評(píng)估σ，μ是序貫理性的，如果對(duì)于每個(gè)參與人i∈N和每個(gè)信息集s∈Ii不存在一個(gè)σ′i，s使得

O((σ′i，s，σ-i，s)，μ)＞iO((σi，s，σ-i，s)，μ).

注意到對(duì)序貫理性的定義不同于經(jīng)典定義，這是因?yàn)樵诮Y(jié)果空間引入了不完備偏好.

說(shuō)一個(gè)評(píng)估σ，μ是一個(gè)擴(kuò)展式博弈Γα:=N∪{c}，H，P，fc，(Ii)i∈N，uii∈I的序貫均衡，如果σ，μ是序貫理性的且具有一致性. 一致性的定義是標(biāo)準(zhǔn)的［5］.

定理4 假設(shè)Γα:{N∪{c}，H，P，fc，(Ii)i∈N，(ui)i∈I}為一個(gè)完美記憶擴(kuò)展式博弈，且σ為Γα的代理人標(biāo)準(zhǔn)式表示的一個(gè)顫抖手完美納什均衡. 那么必存在一個(gè)信念向量μ使得σ，μ為Γα的一個(gè)序貫均衡.

證明對(duì)于博弈Γα中的任意參與人i，用s表示Ii中任意信息集. 那么s中的歷史集合被表示為Hs. 以Xs表示不被Hs中所有節(jié)點(diǎn)所達(dá)到的終結(jié)歷史集合；以σ∞k=1表示在×r∈IΔ+Dr中的行為策略組合序列. 對(duì)于Γα的代理人標(biāo)準(zhǔn)式表示而言，它們既是顫抖手完美均衡又是納什均衡. 對(duì)于任意k和Hs中的任意h，令

μksh=Phσk∑g∈HsPgσk，

其中， Phσk代表如果該博弈按照σk進(jìn)行給定信息集s達(dá)到而歷史h達(dá)到的條件概率. 注意到對(duì)于任意h∈Hs有Phσk>0，那么∑g∈HsPgσk＞0. 令

μsh=lim h→

那么μ為一個(gè)與σ一致的信念向量.

令vs(·)表示ANFR中代理人i.s的效用函數(shù). 當(dāng)這個(gè)代理人使用隨機(jī)策略ρi.s∈ΔDs，而其他代理人使用σk規(guī)定的策略 (可能包括了該參與人的其他代理人). 給定歷史h達(dá)到，代理人i.s使用隨機(jī)策略ρi.s，其他代理人使用σk－i.s，令Uiσ－i.s，ρsh代表此時(shí)參與人i的期望多效用函數(shù). 那么，

vsσk－i.s，ρs=∑h∈HsPhσk－i.s，ρsUiσk－i.s，ρsh

+∑x∈XsPxσk－i.s，ρsuix

=∑h∈HsPhσkUiσk－i.s，ρsh

+∑x∈XsPxσkuix

=∑g∈HsPgσk∑h∈HsμkshUiσk－i.s，ρsh

+∑x∈XsPxσkuix.

因?yàn)棣覟橐粋€(gè)顫抖手完美均衡，有σi.s∈arg max ρi.s∈Δsvsσki.s，ρi.s，這意味著

σi.s∈arg max ρi.s∈Δs∑h∈HsμkshUiσk－i.s，ρi.sh.

那么，根據(jù)最優(yōu)反應(yīng)映射的上半連續(xù)性，有

σi.s∈arg max ρi.s∈Δs∑h∈HsμshUiσ－i.s，ρi.sh.

這就是序貫均衡的序貫理性條件，因此σ，μ為博弈Γα的一個(gè)序貫均衡.

證畢

根據(jù)定理3和定理4，下面的定理成立.

定理5 所有完美回憶的有限擴(kuò)展式博弈都有一個(gè)序貫均衡.

5 結(jié) 論

Bade［4］為不完備偏好的標(biāo)準(zhǔn)式博弈定義了納什均衡的概念，本文是其在擴(kuò)展式博弈中的擴(kuò)展。采用 Kreps和Wilson［5］的思路，先給出了一個(gè)修正的顫抖手完美均衡的概念，然后應(yīng)用它去證明不完備偏好擴(kuò)展式博弈的序貫均衡的存在性. 如何將其應(yīng)用到博弈論其他領(lǐng)域（例如產(chǎn)業(yè)組織理論）中去，將是進(jìn)一步研究的方向.參考文獻(xiàn)

［1］時(shí)奇，諶貽慶，陳劍. 不完備偏好理論及其應(yīng)用綜述［J］. 經(jīng)濟(jì)評(píng)論， 2010， (3):116-123.

［2］ E OK. Utility Representation of an incomplete preference relation［J］. Journal of Economic Theory， 2002， 104(2):429-449.

［3］ J DUBRA，F(xiàn) MACCHERONI， E Ok. Expected utility theory without the completeness axiom［J］. Journal of Economic Theory， 2004， 115(1): 118-133.

［4］ S BADE. Nash equilibrium in games with incomplete preferences［J］. Economic Theory， 2005， 26(2):309-332.

［5］ D KREPS， R WILSON. Sequential equilbria［J］. Econometrica， 1982， 50(4): 863-894.

［6］ R SELTON. Reexamination of the perfectness concept for equilibrium points in extensive games［J］. International Journal of Game Theory， 1975，4(1):25-55.

［7］ S BERGE. Topological spaces［M］. New York: Macmillan， 1963.

［8］ R MYERSON. Game theory［M］. Cambridge: Harvard University Press， 1991.

經(jīng)濟(jì)數(shù)學(xué)2012年1期

經(jīng)濟(jì)數(shù)學(xué)的其它文章: 基于盤(pán)整市的RSI投資決策; 具有隨機(jī)利率、隨機(jī)變差的最優(yōu)投資和聯(lián)合比例超額損失再保險(xiǎn); 一種求解分組0-1背包問(wèn)題的動(dòng)態(tài)規(guī)劃法; 投資模型中收益率的極限定理; 基于可替代資源的稀缺資源利用問(wèn)題研究; 索賠次數(shù)為復(fù)合Poisson-Geometric過(guò)程的雙險(xiǎn)種風(fēng)險(xiǎn)模型