摘 要 將Kreps和Wilson提出的序貫均衡解概念推廣到了存在不完備偏好的情形. 首先給出了一個(gè)修正的顫抖手完美均衡的概念, 然后應(yīng)用它去證明不完備偏好擴(kuò)展式博弈序貫均衡的存在性.
關(guān)鍵詞 博弈;不完備偏好;序貫均衡;納什均衡;顫抖手完美均衡
中圖分類號(hào) F016 文獻(xiàn)標(biāo)識(shí)碼 A
Sequential Equilibrium in Extensive Games with Incomplete Preferences
SHI Qi 1,2, CHEN Yiqing 1
(1.School of Economics and Management, Nanchang University, Nanchang, Jiangxi 330031,China;
2.School of Economics, Shanghai University of Finance and Economics, Shanghai 200433,China)
Abstract The Kreps and Wilson’s solution concept of sequential equilibrium was generalized to the extensive games with incomplete preferences.First a revised concept of trembling hand perfect equilibrium was given, and then was applied to verify the existence of sequential equilibrium in extensive games with incomplete preferences.
Key words game;Incomplete preference;Sequential equilibrium;Nash equilibrium;Trembling hand perfect equilibrium
1 引 言
上個(gè)十年不完備偏好理論得到了復(fù)興[1-3]. Bade[4]把它應(yīng)用到博弈論中, 廣泛地探討了在參與者具有不完備偏好時(shí)的納什均衡概念. Bade將經(jīng)典納什均衡概念擴(kuò)展到不完備偏好的環(huán)境下, 發(fā)現(xiàn)一個(gè)博弈的納什均衡恰好就是該博弈的所有完備化博弈的納什均衡集的并集. 而且, 如果不完備偏好可以被一個(gè)多效用函數(shù)[1]所表示, 那么在一定假設(shè)下, 納什均衡集恰好就是該博弈所有線性完備化博弈的納什均衡集的并集.
納什均衡是博弈論中最重要的解概念, 但是, 它可能會(huì)給出了太多均衡; 當(dāng)博弈存在不完美信息的時(shí)候, 它甚至可能造成誤導(dǎo). Kreps和Wilson提出的序貫均衡[5]是納什均衡的精練, 其基本思想在于均衡不僅應(yīng)該描述參與者的策略, 還要描述參與者在每個(gè)信息集上關(guān)于究竟是哪個(gè)歷史發(fā)生了的信念. 一個(gè)很自然的問(wèn)題是: 當(dāng)去掉完備偏好的假設(shè), 是否仍然能夠定義一個(gè)序貫均衡的概念, 使得它在每個(gè)有限擴(kuò)展式博弈都存在呢?與Kreps和Wilson類似, 想使用原擴(kuò)展式博弈的代理人標(biāo)準(zhǔn)式表示的顫抖手完美均衡來(lái)證明序貫均衡的存在性. 然而, 對(duì)于不完備偏好, 顫抖手完美均衡可能不是一個(gè)納什均衡. 幸運(yùn)的是, 任意有限博弈都有一個(gè)顫抖手完美納什均衡(THPNE), 這樣就能得到與Kreps和Wilson類似的結(jié)論.
2 基本概念
在本文中, Γ:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}表示一個(gè)完美記憶有限擴(kuò)展式博弈. 其中, N為有限的參與人集合, c為自然, H為歷史集合, P 為參與人函數(shù),fc為每個(gè)P(h)=c 的歷史h指定一個(gè)A(h)上的概率測(cè)度f(wàn)c(·|h)), 而且, 集合Ιi∈Ii為參與人i的一個(gè)信息集.
終結(jié)歷史集合標(biāo)記為Z. 每個(gè)參與人i∈N擁有一個(gè)定義在Z上的(可能為不完備的)偏好關(guān)系≥i.假設(shè)每個(gè)偏好關(guān)系≥i都是傳遞的, 反身的, 但是, 與經(jīng)典理論不同, 不一定是完備的. 參與人 i 在 x和y之間無(wú)差異, 標(biāo)記為x~iy, 當(dāng)且僅當(dāng)x≥iy 且y≥ix. 參與人 i 嚴(yán)格偏好x甚于y, 標(biāo)記為x>iy, 當(dāng)且僅當(dāng)x≥iy但不是y≥ix.
與不完備偏好表示理論的最近文獻(xiàn)[2]相似, 考慮偏好關(guān)系≥i 是可以被函數(shù)表示的, 也即, 存在一個(gè)函數(shù)u:Z→Rn使得x≥y當(dāng)且僅當(dāng)u(x)≥u(y). 在下文中, 將用Γα:={N∪{c},H,P,fc,(Ii)i∈N,(ui)i∈N}表示博弈
Γα:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}, 其中函數(shù)ui:Z→Rmi表示偏好≥i. 更具體而言, 對(duì)于任意向量α={α1,…,αI},αi∈Rmi, 定義一個(gè)博弈
Γα:=N∪{c},H,P,fc,(Ii)i∈N,uii∈I,
其中, αiui:Z→R定義為αi和ui的點(diǎn)積, 或αiui=∑mij=1αijuij. 進(jìn)一步的, 定義
Δ:={α={α1,…,αI},αi∈Δmi,i},
經(jīng) 濟(jì) 數(shù) 學(xué)第 29卷第1期時(shí) 奇等:不完備偏好擴(kuò)展式博弈的序貫均衡
且
Δ+:=Δ∩R∑mi+ +,
其中,Δmi表示mi-1維單純形.
如果≥′和≥都是定義在Z上的偏好關(guān)系,≥≥′且>>′, 那么稱≥′是≥的完備化. 說(shuō)一個(gè)擴(kuò)展式博弈Γ′:={N∪{c},H,P,fc,(Ii)i∈N,(≥′i)i∈N}是另一個(gè)擴(kuò)展式博弈Γ:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}的完備化, 如果對(duì)于每個(gè)參與人i, ≥′i都是≥i的完備化. 那么, 對(duì)于任意αi>>0, 函數(shù)αiui代表了由ui所代表的偏好關(guān)系的完備化. 因此, 對(duì)于任意α∈Δ+, 博弈Γα是原博弈Γ的線性完備化.
仿照Kreps和Wilson的證明方法, 考慮博弈Γα的代理人標(biāo)準(zhǔn)表示(ANFR)[6]. 但在此之前, 給出一些術(shù)語(yǔ). 用Ii標(biāo)記參與人i應(yīng)該行動(dòng)的那些信息集的集合, 用 s 標(biāo)記任意信息集, 用 i.s 標(biāo)記應(yīng)該在信息集s∈Ii行動(dòng)的那個(gè)代理人. 而且, 用Ds標(biāo)記信息集s可以采取的行動(dòng); 更具體的說(shuō), 如果知道在信息集s采取行動(dòng)的應(yīng)該是參與人i, 那么稱他可以采取的行動(dòng)集為Di.s. 那么, 博弈Γα的ANFR可以表示為
Γaα:={I∪{c},(Di.s)i.s∈I,(ui)i∈N},
其中, I表示所有代理人的集合.
3 納什均衡和顫抖手完美均衡
給定博弈Γα, 定義代理人 i.s 的最優(yōu)反應(yīng)映射BRui,使得
BRui(σ-i.s):=arg max di.s∈Di.sui(di.s,σ-i.s),
其中,-i.s表示除i.s之外的其他代理人. 那么, 對(duì)于任意y(σ-i.s)∈BRui.s(σ-i.s), 給定其他代理人的行為策略σ-i.s, 不存在y′(σ-i.s)使得(σ-i.s,y′(σ-i.s))>i(σ-i.s,y(σ-i.s)).
對(duì)于博弈Γa的完備化Γaα, 也可以定義參與人i.s的最優(yōu)反應(yīng)映射BRαiui使得
BRαiui(σ-i.s):=arg max di.s∈Di.sαiui(di.s,σ-i.s).
定理1 對(duì)于所有代理人i.s, 以及所有αi∈Δmi+,有
BRαiui(σ-i.s)BRui(σ-i.s).
證明 用反證法. 假設(shè)定理1不成立, 那么必存在σ-i.s和di.s使得 di.s∈BRαiuiσ-i.s但di.s∈BRuiσ-i.s成立. 這樣必存在d′i,s使得di,s. 因?yàn)棣联琲∈Δmi+, 那么αid′i,s>αidi,s, 這與di.s∈BRαiuiσ-i.s相矛盾.
定理2 對(duì)于所有代理人i.s和所有σ-i.s,BRuiσ-i.s是上半連續(xù)的.
證明 因?yàn)椴┺氖怯邢薜模?BRuiσ-i.s總是緊值的. 根據(jù)最大值定理[7], 有, 對(duì)于所有代理人i.s, 所有αi∈Δmi+, 以及所有是上半連續(xù)的. 那么, 對(duì)于任意序列(σk-i.s)→σ-i.s和yk∈BRuiσk-i.s, 存在yk的一個(gè)子序列收斂于BRuiσ-i.s中的一點(diǎn). 但是, 根據(jù)定理1, 有BRαiuiσ-i.sBRuiσ-i.s. 那么BRuiσ-i.s也是上半連續(xù)的.
一個(gè)隨機(jī)策略組合σ:=(σ1,σ2,…,σI)是博弈Γaα的納什均衡, 如果不存在一個(gè)代理人i.s有策略σ′i,s∈Δ(Di,s)使得(σ′i,s,σ-i,s)>(σi,s,σ-i,s). 將一個(gè)擴(kuò)展式博弈的所有納什均衡集合標(biāo)記為NEΓ.
一個(gè)隨機(jī)策略組合σ:=(σ1,σ2,…,σI)是博弈Γaα的一個(gè)顫抖手完美均衡, 如果存在一個(gè)序列σk∞k=0使得
σk∈×i.s∈IΔ+Di.s,k∈1,2,3,…,
lim k→∞σki.sdi.s=σi.sdi.s,i.s∈I,di.s∈Di.s,
σi.s∈arg max uiσk-i.s,τi.s,i.s∈N,
但是, 如果允許不完備偏好, 一個(gè)顫抖手完美均衡可能不是納什均衡, 這與完備偏好情形時(shí)是不同的. Bade [4]給出了一個(gè)簡(jiǎn)單的反例,并且建議應(yīng)該把目光集中在那些也是納什均衡的顫抖手完美均衡上, 這就產(chǎn)生了一個(gè)新概念,即顫抖手完美納什均衡(trembling hand perfect Nash equilibrium, THPNE). 幸運(yùn)的是, 在一個(gè)有限擴(kuò)展式博弈的代理人戰(zhàn)略式中, 總是可以找到一個(gè)THPNE, 這一點(diǎn)由Bade[4]的推論1所保證.
定理3 (Bade)任意有限博弈Γaα都有一個(gè)顫抖手完美納什均衡.
4 序貫均衡
現(xiàn)在進(jìn)入到本文的核心部分, 原博弈Γ的序貫均衡的存在性. 先考慮這樣一個(gè)評(píng)估σ,μ[8], 其中σ為行為策略組合, μ為一個(gè)這樣的信念函數(shù):為每個(gè)信息集的歷史指定一個(gè)概率測(cè)度.
定義, 結(jié)果Oσ,μs為給定信息集s已達(dá)到由行為策略σ決定的終結(jié)歷史的概率分布. 一個(gè)評(píng)估σ,μ是序貫理性的, 如果對(duì)于每個(gè)參與人i∈N和每個(gè)信息集s∈Ii不存在一個(gè)σ′i,s使得
O((σ′i,s,σ-i,s),μ)>iO((σi,s,σ-i,s),μ).
注意到對(duì)序貫理性的定義不同于經(jīng)典定義, 這是因?yàn)樵诮Y(jié)果空間引入了不完備偏好.
說(shuō)一個(gè)評(píng)估σ,μ是一個(gè)擴(kuò)展式博弈Γα:=N∪{c},H,P,fc,(Ii)i∈N,uii∈I的序貫均衡, 如果σ,μ是序貫理性的且具有一致性. 一致性的定義是標(biāo)準(zhǔn)的[5].
定理4 假設(shè)Γα:{N∪{c},H,P,fc,(Ii)i∈N,(ui)i∈I}為一個(gè)完美記憶擴(kuò)展式博弈, 且σ為Γα的代理人標(biāo)準(zhǔn)式表示的一個(gè)顫抖手完美納什均衡. 那么必存在一個(gè)信念向量μ使得σ,μ為Γα的一個(gè)序貫均衡.
證明 對(duì)于博弈Γα中的任意參與人i,用s表示Ii中任意信息集. 那么s中的歷史集合被表示為Hs. 以Xs表示不被Hs中所有節(jié)點(diǎn)所達(dá)到的終結(jié)歷史集合;以σ∞k=1表示在×r∈IΔ+Dr中的行為策略組合序列. 對(duì)于Γα的代理人標(biāo)準(zhǔn)式表示而言,它們既是顫抖手完美均衡又是納什均衡. 對(duì)于任意k和Hs中的任意h, 令
μksh=Phσk∑g∈HsPgσk,
其中, Phσk代表如果該博弈按照σk進(jìn)行給定信息集s達(dá)到而歷史h達(dá)到的條件概率. 注意到對(duì)于任意h∈Hs有Phσk>0, 那么∑g∈HsPgσk>0. 令
μsh=lim h→
那么μ為一個(gè)與σ一致的信念向量.
令vs(·)表示ANFR中代理人i.s的效用函數(shù). 當(dāng)這個(gè)代理人使用隨機(jī)策略ρi.s∈ΔDs, 而其他代理人使用σk規(guī)定的策略 (可能包括了該參與人的其他代理人). 給定歷史h達(dá)到, 代理人i.s使用隨機(jī)策略ρi.s, 其他代理人使用σk-i.s, 令Uiσ-i.s,ρsh代表此時(shí)參與人i的期望多效用函數(shù). 那么,
vsσk-i.s,ρs=∑h∈HsPhσk-i.s,ρsUiσk-i.s,ρsh
+∑x∈XsPxσk-i.s,ρsuix
=∑h∈HsPhσkUiσk-i.s,ρsh
+∑x∈XsPxσkuix
=∑g∈HsPgσk∑h∈HsμkshUiσk-i.s,ρsh
+∑x∈XsPxσkuix.
因?yàn)棣覟橐粋€(gè)顫抖手完美均衡, 有σi.s∈arg max ρi.s∈Δsvsσki.s,ρi.s, 這意味著
σi.s∈arg max ρi.s∈Δs∑h∈HsμkshUiσk-i.s,ρi.sh.
那么, 根據(jù)最優(yōu)反應(yīng)映射的上半連續(xù)性,有
σi.s∈arg max ρi.s∈Δs∑h∈HsμshUiσ-i.s,ρi.sh.
這就是序貫均衡的序貫理性條件, 因此σ,μ為博弈Γα的一個(gè)序貫均衡.
證畢
根據(jù)定理3和定理4, 下面的定理成立.
定理5 所有完美回憶的有限擴(kuò)展式博弈都有一個(gè)序貫均衡.
5 結(jié) 論
Bade[4]為不完備偏好的標(biāo)準(zhǔn)式博弈定義了納什均衡的概念,本文是其在擴(kuò)展式博弈中的擴(kuò)展。采用 Kreps和Wilson[5] 的思路, 先給出了一個(gè)修正的顫抖手完美均衡的概念, 然后應(yīng)用它去證明不完備偏好擴(kuò)展式博弈的序貫均衡的存在性. 如何將其應(yīng)用到博弈論其他領(lǐng)域(例如產(chǎn)業(yè)組織理論)中去,將是進(jìn)一步研究的方向.參考文獻(xiàn)
[1] 時(shí)奇, 諶貽慶, 陳劍. 不完備偏好理論及其應(yīng)用綜述[J]. 經(jīng)濟(jì)評(píng)論, 2010, (3):116-123.
[2] E OK. Utility Representation of an incomplete preference relation[J]. Journal of Economic Theory, 2002, 104(2):429-449.
[3] J DUBRA,F(xiàn) MACCHERONI, E Ok. Expected utility theory without the completeness axiom[J]. Journal of Economic Theory, 2004, 115(1): 118-133.
[4] S BADE. Nash equilibrium in games with incomplete preferences[J]. Economic Theory, 2005, 26(2):309-332.
[5] D KREPS, R WILSON. Sequential equilbria[J]. Econometrica, 1982, 50(4): 863-894.
[6] R SELTON. Reexamination of the perfectness concept for equilibrium points in extensive games[J]. International Journal of Game Theory, 1975,4(1):25-55.
[7] S BERGE. Topological spaces[M]. New York: Macmillan, 1963.
[8] R MYERSON. Game theory[M]. Cambridge: Harvard University Press, 1991.