摘 要:通過對斗地主叫分的規(guī)則的研究,分析不完全信息動態(tài)博弈在生活中的作用和意義,從而進一步的思考在模型中共同知識的重要性。通過思考其中的完美貝葉斯均衡來分析我們在國際“游戲”中的策略。
關(guān)鍵詞:不對稱信息貝葉斯均衡
中圖分類號:F406 文獻標(biāo)識碼:A 文章編號:1006-4117(2012)01-0208-01
一、提出問題
在生活中的大家也許都對斗地主不陌生,那么又有多少人對其中的博弈知道多少呢?為什么大家規(guī)則中和格局中總是將不叫這個選項放入最后呢?
二、分析
首先我們先來了解什么是不完全信息動態(tài)博弈。不對稱信息,特別是不完全信息在博弈論是非常重要的。當(dāng)參與人依次采取若干行動時,前面的行動能夠向其他參與人傳遞相關(guān)的私人信息,這就會影響后面的參與人的決策(參與人是理性的)。在本文研究斗地主的游戲中,由于3個人的參與每個人都不知道別人的手中牌,但是每個人知道所有的牌型所以有此可以簡單推出其他牌,但是在規(guī)則中要求最后留有3在底牌,這就增加了牌型的不確定性所以我們在這里為了簡單處理,將最后的勝負決定權(quán)交給底牌,即如果底牌好則贏否則輸。
現(xiàn)在我們進行分析:參與人為:ABC
規(guī)則:1,后一個人的叫分>前一個人的叫分或者后一個選擇不叫
2,如果都不叫則強行第一個人3分拿走
順序:
支付:(A的得分,B的得分,C的得分)
策略:每個人選擇3分或不叫(簡單化處理)
以下為動態(tài)博弈樹:
以上的動態(tài)博弈中我們可以看出來,在A通過手中的牌來判斷自然選擇的時候,好的底牌他一定會選擇3分,在底牌不好的時候值得我們分析,因為在牌不好的時候都不選擇有可能強制分配,必然會得到支付減少,所以A可以給出后面人一個錯誤的信息使得自己的支付不為負。所以B的信息只能判斷并且是根據(jù)A的信息,得出一個他的選擇結(jié)果。根據(jù),支付我們可以看出B的支付需要計算A的給分來確定概率,即p(好牌/A選擇1分)、p(好牌/A選擇2分)、p(好牌/A選擇不叫),也就是B的信息集中只能判斷A的分不能知道底牌的好壞。最后的出一個完美的貝葉斯均衡:A在牌好的情況下選擇3分,不好的情況下
選擇2分。而B在A給出的信息中只能獲得12不叫的信息,所以在選擇上B往往會選擇3分,然而C則沒有選擇的機會而其支付卻取決于AB的決策,C處于“下風(fēng)”位置。
在斗地主情況下,每一輪都會有一次洗牌,而且重新選擇順序,這就打破了這種所謂的“下風(fēng)”定勢。而且在游戲中,我們發(fā)現(xiàn)了其公平的地方就是游戲提供了一個共同的知識或信息,那就是所有的牌是一定的,所有每個人的選擇都是根據(jù)自己手中的牌有自己的預(yù)先估計的,所以在選擇的順序就會起了至關(guān)重要的地位。
三、總結(jié)
以上分析進行推廣我們發(fā)現(xiàn)了一個“游戲”的竅門,那就是選擇的順序是一個游戲勝負的關(guān)鍵,那么在國際社會上呢同樣也有著這一個規(guī)律。比如,WOT這個游戲規(guī)則首先不考慮規(guī)則的制定為何人,就看其執(zhí)行的順序,先進入后由于其選擇的空間首先很大,其先擠占國際舞臺的主導(dǎo)地位后,后進入者就得根據(jù)先進入者的經(jīng)驗來決定自己的策略,所以被動挨打。
完善這種國際游戲規(guī)則斗地主游戲已經(jīng)告訴我們兩種可行的辦法:一是在人員不變動的情況下進行重新洗牌,這就是為什么我們國家和第三世界國家一直都在爭取的原因;二是擴大共同知識,即參與者在一個一定的空間中選擇,都能根據(jù)自己的手中的“牌”去推算出合理輸贏的概率,從而找到均衡。
在回答后面的問題時我們值得思考,為什么將不叫放入最后,因為在B選擇的時候每個選項的概率看上去一定的,其實不是的,因為p(贏/不叫)最小。這告訴我們什么呢?被動卻要站優(yōu)勢地位是概率很小的,所以在一次告訴我們,積極入世是正確之舉。從小的環(huán)境來看看,我們現(xiàn)在的就業(yè),一到畢業(yè)就會有很多同學(xué)抱怨找不到工作,原因何在,就是被動入市,所以在學(xué)校的時候?qū)W校為什么鼓勵在學(xué)校期間接觸社會。
從中思考得出來的結(jié)論便是,身為學(xué)生的我們既然都是為了后期能在社會上找到好的工作而學(xué)習(xí)的,那么我們應(yīng)該在學(xué)習(xí)的過程中積極入市,學(xué)習(xí)切合工作的相關(guān)知識,首先下手?jǐn)D占市場空間。
作者單位:遼寧大學(xué)商學(xué)院