999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于演化視角的“納什均衡”觀察與思考

2013-01-01 00:00:00牟洪仲呂立艷
學(xué)理論·下 2013年3期

摘 要:從演化的視角對(duì)納什均衡所在的策略空間做了一個(gè)觀察,認(rèn)為納什均衡所在的策略空間是不斷變化的,這種變化源于策略空間本身的變化而不是決策,并以“生產(chǎn)力”與“生產(chǎn)關(guān)系”的類比對(duì)此給出了一種解釋。通過(guò)“囚徒困境”中策略空間的演化進(jìn)一步說(shuō)明了演化的必然性,同時(shí)得到?jīng)Q策是基于所處的策略空間演化過(guò)程中的位置的結(jié)論,相應(yīng)的策略空間中的某個(gè)納什均衡并不能成為一種持續(xù)的決策所依賴的均衡。

關(guān)鍵詞:演化;納什均衡;囚徒困境;策略空間;決策

中圖分類號(hào):F08 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1002-2589(2013)09-0127-03

一、納什均衡的定義

在博弈G=(S1,…,Sn:u1,…,un)中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策論組合(s1*,…,sn*)中,任一博弈方i的策論si*,都是對(duì)其余博弈方策略的組合(s1*,…s*i-1,s*i+1,…,sn*)的最佳對(duì)策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)對(duì)任意sij∈Si都成立,則稱(s1*,…,sn*)為G的一個(gè)納什均衡[1]57。很顯然該策論組合(s1*,…,sn*)為策論組合空間S的一個(gè)子集,那么首先需要討論的是S的性質(zhì)。

二、S——有限性還是無(wú)限性

上述納什均衡的定義并未明顯陳述S是有限還是無(wú)限,但納什本人關(guān)于納什均衡的定義中明確提到“有限個(gè)純策略”(anassociated finiteset)[2]287??死灼账挂蔡岬健敖?jīng)濟(jì)學(xué)家用納什均衡分析經(jīng)濟(jì)問(wèn)題,其前提是相應(yīng)形勢(shì)下存在明確的博弈過(guò)程”[3]33。所以經(jīng)典的納什均衡認(rèn)為可供選擇的策略是明確而且有限的。但是如果這個(gè)空間本身只是N維空間的一個(gè)有限空間,那么即使得到了“納什均衡”,也僅能認(rèn)為該“納什均衡”只是這個(gè)有限空間的“納什均衡”而很可能不是“無(wú)限理性空間”[即N維空間]的納什均衡。

可是,如果說(shuō)該S空間即為抽象的無(wú)限理性的,①那么,我們做決策是否還有意義,正如哈耶克所說(shuō)“不知道的也是不能計(jì)劃的”[4]96誰(shuí)能斷定不能預(yù)知的策略組合不是更好的?基于此,作者認(rèn)為所謂的決策是基于現(xiàn)有存在的有限的策略空間而非未來(lái)不確定的無(wú)限的策略空間。而如果說(shuō)決策是基于現(xiàn)有存在的有限的策略空間,甚至是明確清晰的策略空間,那么為什么我們所做的決策常常出現(xiàn)并不是基于這個(gè)有限的策略空間的最優(yōu)呢?西蒙的“有限理性”觀念似乎不能解釋這種矛盾,當(dāng)然,在我們假設(shè)策略方案有限性的時(shí)候的確已經(jīng)包含了“有限理性”,所以作者的一種解釋是決策者的決策是基于現(xiàn)有存在的有限的策略空間,可與此同時(shí),決策者有限理性地清楚自己的有限理性。從上面的討論能看到即使對(duì)于近乎確定的策略空間決策者也并不一定能做出基于該策略空間的最優(yōu)決策。而客觀上策略空間本身不是一成不變的,也就是說(shuō)它本身在演化,這種演化以決策者的決策②為前提,而之所以實(shí)施決策卻源于策略空間的變化。到此得到一個(gè)近乎悖論的結(jié)論:演化的原因與結(jié)果均是策略空間本身的變化。

三、一種解釋

上節(jié)非但沒(méi)能完全回答S空間有限性無(wú)限性的問(wèn)題,反而得到了一個(gè)近乎悖論的結(jié)論:演化的原因與結(jié)果均是策略空間本身的變化。事實(shí)上,這是不矛盾的。策略空間本質(zhì)上是一種“生產(chǎn)力”,而各方所做的選擇是相應(yīng)的“生產(chǎn)關(guān)系”,當(dāng)“生產(chǎn)力”發(fā)展到一定程度,必然有相應(yīng)的“生產(chǎn)關(guān)系”去適應(yīng)這種“生產(chǎn)力”,而“生產(chǎn)力”發(fā)展了必然引起“生產(chǎn)關(guān)系”的改變。這與以生物進(jìn)化學(xué)的觀點(diǎn)類比演化的做法是有差異的,他們認(rèn)為演化以“適應(yīng)性”為核心,也即拉馬克強(qiáng)調(diào)的“變異的主動(dòng)性”[5]86。而以生產(chǎn)力和生產(chǎn)關(guān)系的角度來(lái)講,我們看到的更多是“自發(fā)性”,也即演化的自然發(fā)生。形象一點(diǎn),生物進(jìn)化論的觀念:目的是“生產(chǎn)關(guān)系”,演化的原因是決策;而本文的觀念:目的是“生產(chǎn)力”,也即創(chuàng)造更適宜的策略空間,策略空間本身決定了演化的必然。自然地,我們還會(huì)發(fā)現(xiàn)另外一個(gè)重要的端倪——策對(duì)于路徑的依賴,也即某個(gè)演化的起點(diǎn)的重要,這將決定演化的最終方向和終點(diǎn),這是宏觀層面;而另外更重要的也是我們可能忽略的是參與演化的個(gè)體的演化起點(diǎn),這決定著演化的路徑。但我們要明白的是演化的終點(diǎn)不會(huì)是至少不會(huì)一直是我們?cè)O(shè)定的終點(diǎn),正如弗格森所說(shuō)演化的結(jié)果是“人類行為的結(jié)果卻不是人為設(shè)計(jì)的結(jié)果”[6]58。也即索羅斯所謂“均衡點(diǎn)之不可企及”[7]21。本文同樣認(rèn)為均衡是相對(duì)的,而演化是絕對(duì)的,也就是說(shuō),均衡僅僅是演化動(dòng)態(tài)過(guò)程的某一點(diǎn)(甚至是事實(shí)上未達(dá)到的某一點(diǎn)),作者將以納什均衡中經(jīng)典案例“囚徒困境”做具體的觀察與思考。

四、“囚徒困境”觀察與思考

囚徒困境表述如下:①警方逮捕甲、乙兩名嫌疑犯,但沒(méi)有足夠證據(jù)指控二人有罪。于是警方分開(kāi)囚禁嫌疑犯,分別和二人見(jiàn)面,并向雙方提供以下相同的選擇,見(jiàn)表1.1:

若一人認(rèn)罪并作證檢控對(duì)方(相關(guān)術(shù)語(yǔ)稱“背叛”對(duì)方),而對(duì)方保持沉默,此人將即時(shí)獲釋,沉默者將判監(jiān)10年。

若二人都保持沉默(相關(guān)術(shù)語(yǔ)稱互相“合作”),則二人同樣判監(jiān)半年。

若二人都互相檢舉(互相“背叛”),則二人同樣判監(jiān)2年。

討論該案例的文獻(xiàn)多將重點(diǎn)放在均衡的分析,本文側(cè)重策略空間的性質(zhì)——這個(gè)策略空間的歷史路徑。我們有理由相信:在最初階段,抓到嫌疑犯后警察提供的選擇是“你們(注意是你們)認(rèn)罪還是不認(rèn)罪,如果認(rèn)罪只判刑2年,要是不認(rèn)罪,5年!”②那么,在只有兩種選擇的策略空間中,罪犯當(dāng)然“趕緊”認(rèn)罪,因?yàn)槟鞘莾烧咧凶顑?yōu)化的策略??墒?,兩人在牢里天天受牢頭欺負(fù)的罪犯就開(kāi)始尋思呀:牢里日子可真不好受,我們是不是被警察騙了,假如我們不承認(rèn),警察能判我們5年嗎?是的,我們不承認(rèn)就不等于我們沒(méi)有罪嗎?沒(méi)有罪警察怎么能判我們的刑?在此時(shí),新的方案凸顯了——不承認(rèn),將判無(wú)罪!那么這個(gè)并不是警方想看到的結(jié)果!于是警方陷入了僵局,警方想要的是雙方都認(rèn)罪,而出現(xiàn)的是不認(rèn)罪的對(duì)罪犯有利的方案,因?yàn)槿绻疾徽J(rèn)罪的話他們確實(shí)無(wú)法給罪犯定罪,這個(gè)時(shí)候警方就提出了新的方案——你們認(rèn)罪的話,我們不但不給你們判刑,而且還給你們數(shù)量1的獎(jiǎng)勵(lì),此時(shí),便出現(xiàn)了新的“顯性”的策略空間:③都不認(rèn)罪——都不判刑;都認(rèn)罪——得到1的獎(jiǎng)勵(lì);如果說(shuō)僅是這兩種方案,很顯然他們會(huì)承認(rèn);可是,由于有第一回合的博弈(已有的演化經(jīng)驗(yàn)),其中一個(gè)很可能“回憶”起認(rèn)罪被判2年的經(jīng)歷!也就是說(shuō),在這個(gè)時(shí)候,認(rèn)罪有兩個(gè)可能的結(jié)果:(1)數(shù)量1的獎(jiǎng)勵(lì);(2)判兩年。也即不確定性出現(xiàn)了,于是就出現(xiàn)了最重要的也是首次的分化:一個(gè)認(rèn)罪,一個(gè)未認(rèn)罪;一個(gè)被判1年,一個(gè)被判3年——他們事前并未意識(shí)到的其中一種結(jié)果(自以為聰明的未認(rèn)罪者認(rèn)為他甚至看到了隱藏在警察提供的兩種方案后面的第三個(gè)方案:認(rèn)罪的話要判2年?。?;正是基于群體內(nèi)的首次分化,分開(kāi)審訊的想法便出現(xiàn)了,也就相應(yīng)出現(xiàn)了新的方案:若一人認(rèn)罪,而對(duì)方不認(rèn)罪,認(rèn)罪者判1年,不認(rèn)罪者判3年??梢韵氲剑涸谠摲桨赋鰜?lái)之初,由于其中的不確定性,罪犯會(huì)均傾向于選擇認(rèn)罪(或者一方認(rèn)罪),但隨著相應(yīng)的策略空間的穩(wěn)定,罪犯?jìng)儠?huì)選擇另一個(gè)明顯有利的策略——都不認(rèn)罪!隨著罪犯選擇的穩(wěn)定,策略空間又會(huì)發(fā)生變化,警察會(huì)提供新的“顯性”策略空間:若一人認(rèn)罪,而對(duì)方不認(rèn)罪,認(rèn)罪者無(wú)罪釋放,不認(rèn)罪者判4年。值得注意的是,此時(shí),都不認(rèn)罪與都認(rèn)罪均是該空間的納什均衡。在該方案出來(lái)之初,罪犯會(huì)均傾向于選擇認(rèn)罪(或者一方認(rèn)罪),也就是說(shuō)從其中的一個(gè)均衡逐漸變到了另外一個(gè)均衡,但同樣的,隨著相應(yīng)的策略空間的穩(wěn)定,罪犯?jìng)儠?huì)選擇另一個(gè)明顯有利的策略——都不認(rèn)罪!……直到“顯性”的策略空間演化為文中囚徒困境的案例中警方提供的選擇空間。圖1.1為該演化過(guò)程的一個(gè)簡(jiǎn)圖。

需要說(shuō)明的是,上述演化過(guò)程只是其中一種可能的演化路徑中幾個(gè)可能見(jiàn)到的切面,而真實(shí)的演化過(guò)程是我們無(wú)法事先確定,也是更為復(fù)雜的。但是從上述演化中我們還是能得到一些啟發(fā)性的思考:其一,不論是真實(shí)的策略空間,還是“顯性”的策略空間,它們都是在不斷變化的,其二,真實(shí)的策略空間和“顯性”的策略空間往往是在對(duì)方趨于穩(wěn)定的狀態(tài)下變化的,且呈交替變化的狀態(tài);其三,真實(shí)的策略空間和我們“顯性”的策略空間大多數(shù)時(shí)間是不一致的,也有一致的時(shí)候,但是由于真實(shí)策略空間本身在不斷演化,即使二者一致,作為單個(gè)的決策者(他們往往經(jīng)歷過(guò)“顯性”空間和真實(shí)空間的不一致)做出的決策并不是整體最優(yōu)。換句話說(shuō),博弈并不僅僅是橫向策略空間的識(shí)別與認(rèn)知,更是當(dāng)前策略空間與歷史策略空間的博弈。所以決策是基于經(jīng)驗(yàn)的,基于他所處的策略空間演化過(guò)程中的位置的。這種決策對(duì)于路徑的依賴為多個(gè)納什均衡中如何判斷到底哪個(gè)納什均衡是決策者傾向于選擇的納什均衡提供了思路。那就是決策者往往選擇與他所處的位置最靠近的那個(gè)均衡。其四,如果真實(shí)的策略空間相對(duì)固定[見(jiàn)圖中(3)—(6)],那么“顯性”策略空間也會(huì)相對(duì)固定(見(jiàn)圖中6—7),也就是說(shuō)這個(gè)時(shí)候決策者是能做出整體最優(yōu)的決策的。然而這種均衡狀態(tài)依然不能持久,其原因是隨著“顯性”策略空間的趨于穩(wěn)定,真實(shí)的策略空間改變了。其五,經(jīng)典囚徒困境實(shí)驗(yàn)的結(jié)果是囚徒均認(rèn)罪這個(gè)納什均衡占多數(shù),初看與本文所持觀念有出入(見(jiàn)“其四”),但仔細(xì)探究會(huì)發(fā)現(xiàn),實(shí)驗(yàn)的結(jié)果正是文中強(qiáng)調(diào)的演化過(guò)程的必然結(jié)果,之所以兩個(gè)罪犯都趨向認(rèn)罪,其實(shí)質(zhì)并不是他們受到了納什均衡點(diǎn)的“吸引”,而是在策略空間長(zhǎng)期演化的過(guò)程中,罪犯往往得知的是:兩人都不認(rèn)罪,按真實(shí)的策略空間,他們都不會(huì)被判刑;可是等到他們真的都不認(rèn)罪,警方在后期的調(diào)查中又找到新證據(jù)呢?那么他們會(huì)重判!且這種情況是較普遍的。也即他們知道無(wú)論如何也無(wú)法預(yù)知所謂“理性空間”(見(jiàn)注釋①),僅能基于他所處的策略空間演化過(guò)程中的位置做出判斷。其六,演化過(guò)程中,納什均衡本身的變化相對(duì)緩慢。

五、結(jié)論

本文首先從演化的角度對(duì)納什均衡所在的空間做了一個(gè)觀察,認(rèn)為納什均衡所在的策略空間是不斷變化的,這種變化以決策者的決策為前提,而決策者實(shí)施決策源于策略空間的變化,也即策略空間的變化互為因果,然后以“生產(chǎn)力”與“生產(chǎn)關(guān)系”的類比對(duì)此給出了一種解釋。最后通過(guò)“囚徒困境”中策略空間的演化進(jìn)一步說(shuō)明了演化的必然性并對(duì)演化的規(guī)律做了初步的分析,同時(shí)得到?jīng)Q策是基于所處的策略空間演化過(guò)程中的位置的結(jié)論,相應(yīng)的策略空間中的某個(gè)納什均衡并不能成為一種持續(xù)的決策所依賴的均衡。

參考文獻(xiàn):

[1]王則柯,李杰.博弈論教程[M].北京:中國(guó)人民大學(xué)出版社,2010.

[2]Nash J.Non-cooperative games[J].Annals of Mathematics,1951,

(54):286-295.

[3][美]戴維·M.克雷普斯.博弈論與經(jīng)濟(jì)模型[M].鄧方,譯.北京:商務(wù)印書館,2006.

[4]F.A.哈耶克.致命的自負(fù)[M].馮克利,胡晉華,譯.北京:中國(guó)社會(huì)科學(xué)出版社,2000.

[5]白瑞雪.生物學(xué)類比與演化經(jīng)濟(jì)學(xué)的發(fā)展階段[J].教學(xué)與研究,2011,(3):84-90.

[6]雷國(guó)雄.不確定性、創(chuàng)新不足與經(jīng)濟(jì)演化[M].北京:科學(xué)出版社,2012.

[7][美]索羅斯.金融煉金術(shù)[M].孫忠,侯純,譯.海口:海南出版社,1999.

主站蜘蛛池模板: 亚洲欧洲美色一区二区三区| 欧美午夜网| 91在线国内在线播放老师| 91久久精品国产| 又爽又大又黄a级毛片在线视频| 亚洲欧美日韩色图| 亚洲欧美精品日韩欧美| 国产精品第5页| 欧美精品啪啪一区二区三区| 国产又粗又猛又爽视频| 成年片色大黄全免费网站久久| 九九九精品成人免费视频7| 国产一区免费在线观看| 亚洲无线一二三四区男男| 亚洲精品不卡午夜精品| 欧美亚洲一区二区三区导航| 欧美日韩精品在线播放| 精品一区二区久久久久网站| 亚洲人成网线在线播放va| 欧美日韩亚洲国产主播第一区| 国产乱人免费视频| 国产一区二区色淫影院| 欧美激情视频二区三区| 欧美一区中文字幕| 亚洲日本精品一区二区| 免费激情网站| 国产特级毛片| 无码久看视频| 国产成人无码综合亚洲日韩不卡| 一本大道香蕉中文日本不卡高清二区 | 国产一区在线观看无码| 欧美性精品| 亚洲日韩精品伊甸| 欧美另类视频一区二区三区| 亚洲色中色| 亚洲性影院| 欧美中文字幕一区二区三区| 亚洲天堂精品在线| 在线亚洲小视频| 白丝美女办公室高潮喷水视频| 亚洲一区波多野结衣二区三区| 成人一区在线| 成人午夜视频免费看欧美| 欧美精品v| 亚洲日韩精品综合在线一区二区| 69av在线| 亚洲国产成人精品青青草原| 美女被操黄色视频网站| 国产精品hd在线播放| 亚洲日本中文字幕乱码中文| 亚洲成人黄色在线| 精品少妇人妻一区二区| 人妻丰满熟妇av五码区| 亚洲中文字幕av无码区| 亚洲精品视频免费| 亚洲高清在线天堂精品| 久久婷婷六月| 丝袜高跟美脚国产1区| 亚洲欧美人成人让影院| 国产91小视频在线观看| 91福利片| 国产麻豆aⅴ精品无码| 久久96热在精品国产高清| 91娇喘视频| 亚洲一区二区三区麻豆| 中文字幕av无码不卡免费| 热九九精品| 色综合久久久久8天国| 高潮爽到爆的喷水女主播视频| 国产97视频在线观看| 在线欧美国产| 亚洲毛片一级带毛片基地| 国产成人亚洲无码淙合青草| 亚洲精品中文字幕无乱码| 日韩成人午夜| 国产精品无码一二三视频| 亚洲av无码片一区二区三区| 久久国产香蕉| 国产一级做美女做受视频| 欧美日韩免费在线视频| 久久久受www免费人成| 黄色在线网|