999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

不完備偏好擴(kuò)展式博弈的序貫均衡

2012-01-01 00:00:00時(shí)奇,諶貽慶
經(jīng)濟(jì)數(shù)學(xué) 2012年1期

摘 要 將Kreps和Wilson提出的序貫均衡解概念推廣到了存在不完備偏好的情形. 首先給出了一個(gè)修正的顫抖手完美均衡的概念, 然后應(yīng)用它去證明不完備偏好擴(kuò)展式博弈序貫均衡的存在性.

關(guān)鍵詞 博弈;不完備偏好;序貫均衡;納什均衡;顫抖手完美均衡

中圖分類號(hào) F016 文獻(xiàn)標(biāo)識(shí)碼 A

Sequential Equilibrium in Extensive Games with Incomplete Preferences

SHI Qi 1,2, CHEN Yiqing 1

(1.School of Economics and Management, Nanchang University, Nanchang, Jiangxi 330031,China;

2.School of Economics, Shanghai University of Finance and Economics, Shanghai 200433,China)

Abstract The Kreps and Wilson’s solution concept of sequential equilibrium was generalized to the extensive games with incomplete preferences.First a revised concept of trembling hand perfect equilibrium was given, and then was applied to verify the existence of sequential equilibrium in extensive games with incomplete preferences.

Key words game;Incomplete preference;Sequential equilibrium;Nash equilibrium;Trembling hand perfect equilibrium

1 引 言

上個(gè)十年不完備偏好理論得到了復(fù)興[1-3]. Bade[4]把它應(yīng)用到博弈論中, 廣泛地探討了在參與者具有不完備偏好時(shí)的納什均衡概念. Bade將經(jīng)典納什均衡概念擴(kuò)展到不完備偏好的環(huán)境下, 發(fā)現(xiàn)一個(gè)博弈的納什均衡恰好就是該博弈的所有完備化博弈的納什均衡集的并集. 而且, 如果不完備偏好可以被一個(gè)多效用函數(shù)[1]所表示, 那么在一定假設(shè)下, 納什均衡集恰好就是該博弈所有線性完備化博弈的納什均衡集的并集.

納什均衡是博弈論中最重要的解概念, 但是, 它可能會(huì)給出了太多均衡; 當(dāng)博弈存在不完美信息的時(shí)候, 它甚至可能造成誤導(dǎo). Kreps和Wilson提出的序貫均衡[5]是納什均衡的精練, 其基本思想在于均衡不僅應(yīng)該描述參與者的策略, 還要描述參與者在每個(gè)信息集上關(guān)于究竟是哪個(gè)歷史發(fā)生了的信念. 一個(gè)很自然的問(wèn)題是: 當(dāng)去掉完備偏好的假設(shè), 是否仍然能夠定義一個(gè)序貫均衡的概念, 使得它在每個(gè)有限擴(kuò)展式博弈都存在呢?與Kreps和Wilson類似, 想使用原擴(kuò)展式博弈的代理人標(biāo)準(zhǔn)式表示的顫抖手完美均衡來(lái)證明序貫均衡的存在性. 然而, 對(duì)于不完備偏好, 顫抖手完美均衡可能不是一個(gè)納什均衡. 幸運(yùn)的是, 任意有限博弈都有一個(gè)顫抖手完美納什均衡(THPNE), 這樣就能得到與Kreps和Wilson類似的結(jié)論.

2 基本概念

在本文中, Γ:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}表示一個(gè)完美記憶有限擴(kuò)展式博弈. 其中, N為有限的參與人集合, c為自然, H為歷史集合, P 為參與人函數(shù),fc為每個(gè)P(h)=c 的歷史h指定一個(gè)A(h)上的概率測(cè)度f(wàn)c(·|h)), 而且, 集合Ιi∈Ii為參與人i的一個(gè)信息集.

終結(jié)歷史集合標(biāo)記為Z. 每個(gè)參與人i∈N擁有一個(gè)定義在Z上的(可能為不完備的)偏好關(guān)系≥i.假設(shè)每個(gè)偏好關(guān)系≥i都是傳遞的, 反身的, 但是, 與經(jīng)典理論不同, 不一定是完備的. 參與人 i 在 x和y之間無(wú)差異, 標(biāo)記為x~iy, 當(dāng)且僅當(dāng)x≥iy 且y≥ix. 參與人 i 嚴(yán)格偏好x甚于y, 標(biāo)記為x>iy, 當(dāng)且僅當(dāng)x≥iy但不是y≥ix.

與不完備偏好表示理論的最近文獻(xiàn)[2]相似, 考慮偏好關(guān)系≥i 是可以被函數(shù)表示的, 也即, 存在一個(gè)函數(shù)u:Z→Rn使得x≥y當(dāng)且僅當(dāng)u(x)≥u(y). 在下文中, 將用Γα:={N∪{c},H,P,fc,(Ii)i∈N,(ui)i∈N}表示博弈

Γα:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}, 其中函數(shù)ui:Z→Rmi表示偏好≥i. 更具體而言, 對(duì)于任意向量α={α1,…,αI},αi∈Rmi, 定義一個(gè)博弈

Γα:=N∪{c},H,P,fc,(Ii)i∈N,uii∈I,

其中, αiui:Z→R定義為αi和ui的點(diǎn)積, 或αiui=∑mij=1αijuij. 進(jìn)一步的, 定義

Δ:={α={α1,…,αI},αi∈Δmi,i},

經(jīng) 濟(jì) 數(shù) 學(xué)第 29卷第1期時(shí) 奇等:不完備偏好擴(kuò)展式博弈的序貫均衡

Δ+:=Δ∩R∑mi+ +,

其中,Δmi表示mi-1維單純形.

如果≥′和≥都是定義在Z上的偏好關(guān)系,≥≥′且>>′, 那么稱≥′是≥的完備化. 說(shuō)一個(gè)擴(kuò)展式博弈Γ′:={N∪{c},H,P,fc,(Ii)i∈N,(≥′i)i∈N}是另一個(gè)擴(kuò)展式博弈Γ:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}的完備化, 如果對(duì)于每個(gè)參與人i, ≥′i都是≥i的完備化. 那么, 對(duì)于任意αi>>0, 函數(shù)αiui代表了由ui所代表的偏好關(guān)系的完備化. 因此, 對(duì)于任意α∈Δ+, 博弈Γα是原博弈Γ的線性完備化.

仿照Kreps和Wilson的證明方法, 考慮博弈Γα的代理人標(biāo)準(zhǔn)表示(ANFR)[6]. 但在此之前, 給出一些術(shù)語(yǔ). 用Ii標(biāo)記參與人i應(yīng)該行動(dòng)的那些信息集的集合, 用 s 標(biāo)記任意信息集, 用 i.s 標(biāo)記應(yīng)該在信息集s∈Ii行動(dòng)的那個(gè)代理人. 而且, 用Ds標(biāo)記信息集s可以采取的行動(dòng); 更具體的說(shuō), 如果知道在信息集s采取行動(dòng)的應(yīng)該是參與人i, 那么稱他可以采取的行動(dòng)集為Di.s. 那么, 博弈Γα的ANFR可以表示為

Γaα:={I∪{c},(Di.s)i.s∈I,(ui)i∈N},

其中, I表示所有代理人的集合.

3 納什均衡和顫抖手完美均衡

給定博弈Γα, 定義代理人 i.s 的最優(yōu)反應(yīng)映射BRui,使得

BRui(σ-i.s):=arg max di.s∈Di.sui(di.s,σ-i.s),

其中,-i.s表示除i.s之外的其他代理人. 那么, 對(duì)于任意y(σ-i.s)∈BRui.s(σ-i.s), 給定其他代理人的行為策略σ-i.s, 不存在y′(σ-i.s)使得(σ-i.s,y′(σ-i.s))>i(σ-i.s,y(σ-i.s)).

對(duì)于博弈Γa的完備化Γaα, 也可以定義參與人i.s的最優(yōu)反應(yīng)映射BRαiui使得

BRαiui(σ-i.s):=arg max di.s∈Di.sαiui(di.s,σ-i.s).

定理1 對(duì)于所有代理人i.s, 以及所有αi∈Δmi+,有

BRαiui(σ-i.s)BRui(σ-i.s).

證明 用反證法. 假設(shè)定理1不成立, 那么必存在σ-i.s和di.s使得 di.s∈BRαiuiσ-i.s但di.s∈BRuiσ-i.s成立. 這樣必存在d′i,s使得di,s. 因?yàn)棣联琲∈Δmi+, 那么αid′i,s>αidi,s, 這與di.s∈BRαiuiσ-i.s相矛盾.

定理2 對(duì)于所有代理人i.s和所有σ-i.s,BRuiσ-i.s是上半連續(xù)的.

證明 因?yàn)椴┺氖怯邢薜模?BRuiσ-i.s總是緊值的. 根據(jù)最大值定理[7], 有, 對(duì)于所有代理人i.s, 所有αi∈Δmi+, 以及所有是上半連續(xù)的. 那么, 對(duì)于任意序列(σk-i.s)→σ-i.s和yk∈BRuiσk-i.s, 存在yk的一個(gè)子序列收斂于BRuiσ-i.s中的一點(diǎn). 但是, 根據(jù)定理1, 有BRαiuiσ-i.sBRuiσ-i.s. 那么BRuiσ-i.s也是上半連續(xù)的.

一個(gè)隨機(jī)策略組合σ:=(σ1,σ2,…,σI)是博弈Γaα的納什均衡, 如果不存在一個(gè)代理人i.s有策略σ′i,s∈Δ(Di,s)使得(σ′i,s,σ-i,s)>(σi,s,σ-i,s). 將一個(gè)擴(kuò)展式博弈的所有納什均衡集合標(biāo)記為NEΓ.

一個(gè)隨機(jī)策略組合σ:=(σ1,σ2,…,σI)是博弈Γaα的一個(gè)顫抖手完美均衡, 如果存在一個(gè)序列σk∞k=0使得

σk∈×i.s∈IΔ+Di.s,k∈1,2,3,…,

lim k→∞σki.sdi.s=σi.sdi.s,i.s∈I,di.s∈Di.s,

σi.s∈arg max uiσk-i.s,τi.s,i.s∈N,

但是, 如果允許不完備偏好, 一個(gè)顫抖手完美均衡可能不是納什均衡, 這與完備偏好情形時(shí)是不同的. Bade [4]給出了一個(gè)簡(jiǎn)單的反例,并且建議應(yīng)該把目光集中在那些也是納什均衡的顫抖手完美均衡上, 這就產(chǎn)生了一個(gè)新概念,即顫抖手完美納什均衡(trembling hand perfect Nash equilibrium, THPNE). 幸運(yùn)的是, 在一個(gè)有限擴(kuò)展式博弈的代理人戰(zhàn)略式中, 總是可以找到一個(gè)THPNE, 這一點(diǎn)由Bade[4]的推論1所保證.

定理3 (Bade)任意有限博弈Γaα都有一個(gè)顫抖手完美納什均衡.

4 序貫均衡

現(xiàn)在進(jìn)入到本文的核心部分, 原博弈Γ的序貫均衡的存在性. 先考慮這樣一個(gè)評(píng)估σ,μ[8], 其中σ為行為策略組合, μ為一個(gè)這樣的信念函數(shù):為每個(gè)信息集的歷史指定一個(gè)概率測(cè)度.

定義, 結(jié)果Oσ,μs為給定信息集s已達(dá)到由行為策略σ決定的終結(jié)歷史的概率分布. 一個(gè)評(píng)估σ,μ是序貫理性的, 如果對(duì)于每個(gè)參與人i∈N和每個(gè)信息集s∈Ii不存在一個(gè)σ′i,s使得

O((σ′i,s,σ-i,s),μ)>iO((σi,s,σ-i,s),μ).

注意到對(duì)序貫理性的定義不同于經(jīng)典定義, 這是因?yàn)樵诮Y(jié)果空間引入了不完備偏好.

說(shuō)一個(gè)評(píng)估σ,μ是一個(gè)擴(kuò)展式博弈Γα:=N∪{c},H,P,fc,(Ii)i∈N,uii∈I的序貫均衡, 如果σ,μ是序貫理性的且具有一致性. 一致性的定義是標(biāo)準(zhǔn)的[5].

定理4 假設(shè)Γα:{N∪{c},H,P,fc,(Ii)i∈N,(ui)i∈I}為一個(gè)完美記憶擴(kuò)展式博弈, 且σ為Γα的代理人標(biāo)準(zhǔn)式表示的一個(gè)顫抖手完美納什均衡. 那么必存在一個(gè)信念向量μ使得σ,μ為Γα的一個(gè)序貫均衡.

證明 對(duì)于博弈Γα中的任意參與人i,用s表示Ii中任意信息集. 那么s中的歷史集合被表示為Hs. 以Xs表示不被Hs中所有節(jié)點(diǎn)所達(dá)到的終結(jié)歷史集合;以σ∞k=1表示在×r∈IΔ+Dr中的行為策略組合序列. 對(duì)于Γα的代理人標(biāo)準(zhǔn)式表示而言,它們既是顫抖手完美均衡又是納什均衡. 對(duì)于任意k和Hs中的任意h, 令

μksh=Phσk∑g∈HsPgσk,

其中, Phσk代表如果該博弈按照σk進(jìn)行給定信息集s達(dá)到而歷史h達(dá)到的條件概率. 注意到對(duì)于任意h∈Hs有Phσk>0, 那么∑g∈HsPgσk>0. 令

μsh=lim h→

那么μ為一個(gè)與σ一致的信念向量.

令vs(·)表示ANFR中代理人i.s的效用函數(shù). 當(dāng)這個(gè)代理人使用隨機(jī)策略ρi.s∈ΔDs, 而其他代理人使用σk規(guī)定的策略 (可能包括了該參與人的其他代理人). 給定歷史h達(dá)到, 代理人i.s使用隨機(jī)策略ρi.s, 其他代理人使用σk-i.s, 令Uiσ-i.s,ρsh代表此時(shí)參與人i的期望多效用函數(shù). 那么,

vsσk-i.s,ρs=∑h∈HsPhσk-i.s,ρsUiσk-i.s,ρsh

+∑x∈XsPxσk-i.s,ρsuix

=∑h∈HsPhσkUiσk-i.s,ρsh

+∑x∈XsPxσkuix

=∑g∈HsPgσk∑h∈HsμkshUiσk-i.s,ρsh

+∑x∈XsPxσkuix.

因?yàn)棣覟橐粋€(gè)顫抖手完美均衡, 有σi.s∈arg max ρi.s∈Δsvsσki.s,ρi.s, 這意味著

σi.s∈arg max ρi.s∈Δs∑h∈HsμkshUiσk-i.s,ρi.sh.

那么, 根據(jù)最優(yōu)反應(yīng)映射的上半連續(xù)性,有

σi.s∈arg max ρi.s∈Δs∑h∈HsμshUiσ-i.s,ρi.sh.

這就是序貫均衡的序貫理性條件, 因此σ,μ為博弈Γα的一個(gè)序貫均衡.

證畢

根據(jù)定理3和定理4, 下面的定理成立.

定理5 所有完美回憶的有限擴(kuò)展式博弈都有一個(gè)序貫均衡.

5 結(jié) 論

Bade[4]為不完備偏好的標(biāo)準(zhǔn)式博弈定義了納什均衡的概念,本文是其在擴(kuò)展式博弈中的擴(kuò)展。采用 Kreps和Wilson[5] 的思路, 先給出了一個(gè)修正的顫抖手完美均衡的概念, 然后應(yīng)用它去證明不完備偏好擴(kuò)展式博弈的序貫均衡的存在性. 如何將其應(yīng)用到博弈論其他領(lǐng)域(例如產(chǎn)業(yè)組織理論)中去,將是進(jìn)一步研究的方向.參考文獻(xiàn)

[1] 時(shí)奇, 諶貽慶, 陳劍. 不完備偏好理論及其應(yīng)用綜述[J]. 經(jīng)濟(jì)評(píng)論, 2010, (3):116-123.

[2] E OK. Utility Representation of an incomplete preference relation[J]. Journal of Economic Theory, 2002, 104(2):429-449.

[3] J DUBRA,F(xiàn) MACCHERONI, E Ok. Expected utility theory without the completeness axiom[J]. Journal of Economic Theory, 2004, 115(1): 118-133.

[4] S BADE. Nash equilibrium in games with incomplete preferences[J]. Economic Theory, 2005, 26(2):309-332.

[5] D KREPS, R WILSON. Sequential equilbria[J]. Econometrica, 1982, 50(4): 863-894.

[6] R SELTON. Reexamination of the perfectness concept for equilibrium points in extensive games[J]. International Journal of Game Theory, 1975,4(1):25-55.

[7] S BERGE. Topological spaces[M]. New York: Macmillan, 1963.

[8] R MYERSON. Game theory[M]. Cambridge: Harvard University Press, 1991.

主站蜘蛛池模板: 欧美成人精品一级在线观看| 日本午夜三级| 亚洲香蕉久久| 一级黄色欧美| 一本大道东京热无码av | 亚洲国产综合精品一区| 亚洲精品第一页不卡| 久久中文字幕不卡一二区| 久久人妻xunleige无码| 国产无码网站在线观看| 国产精品成人第一区| 视频二区亚洲精品| 国产精品无码制服丝袜| 91在线精品免费免费播放| 青青草久久伊人| 亚洲人成在线精品| 国产精品片在线观看手机版| 国产成人AV综合久久| 97视频精品全国免费观看| 青青草一区二区免费精品| 国产精品污视频| 亚洲啪啪网| 国产福利一区二区在线观看| 无码人中文字幕| 囯产av无码片毛片一级| 嫩草在线视频| www.91中文字幕| 久久婷婷综合色一区二区| 免费观看成人久久网免费观看| 精品欧美一区二区三区久久久| 东京热一区二区三区无码视频| 亚洲V日韩V无码一区二区| av无码一区二区三区在线| 国产成人无码Av在线播放无广告| 久久人与动人物A级毛片| 国产精品美乳| 国产精品夜夜嗨视频免费视频| 天天综合色网| 国产精品思思热在线| 久久一日本道色综合久久| 日韩高清成人| 成人小视频网| 综合天天色| 91精品啪在线观看国产| 日韩成人免费网站| 中文字幕日韩视频欧美一区| 国产成人亚洲无吗淙合青草| 国产网友愉拍精品视频| 高h视频在线| 欧美午夜在线播放| 特级aaaaaaaaa毛片免费视频| 天堂va亚洲va欧美va国产| 中文字幕亚洲乱码熟女1区2区| 91亚洲免费视频| 人妻丰满熟妇αv无码| 久青草免费视频| 伊人色在线视频| Aⅴ无码专区在线观看| 免费Aⅴ片在线观看蜜芽Tⅴ| 一级毛片在线免费视频| 无码国产伊人| 伊人成人在线视频| 国产区成人精品视频| 99热在线只有精品| 天堂在线亚洲| 色首页AV在线| 亚洲综合色区在线播放2019| 一级黄色欧美| 色老头综合网| 国产精品青青| 亚洲成人手机在线| 中文毛片无遮挡播放免费| 成人一区在线| 亚洲美女一区二区三区| 色噜噜久久| 中日无码在线观看| 无码区日韩专区免费系列| 毛片在线播放网址| 日韩精品专区免费无码aⅴ| 伊人久综合| 毛片在线播放网址| 亚洲美女AV免费一区|