999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

博弈論—囚徒困境模型淺析

2019-04-02 07:31:30
福建質量管理 2019年5期
關鍵詞:困境策略

(黃山學院數學與統計學院 安徽 黃山 245041)

一、囚徒困境模型

警方逮捕兩名嫌疑犯A、B,可以用某電影中的黎叔與小葉代替,警察沒有證據指控二人。他們每一個人都被單獨囚禁,并單獨進行審訊,即雙方無法互通信息。警方向這兩名嫌疑犯交代量刑原則:坦白從寬,抗拒從嚴。具體如下:

1、如果兩人都坦白,則每人各判刑5年;

2、如果一方坦白,一方不坦白,則坦白的一方將被釋放,不坦白的將被判10年;

3、如果兩人都不坦白,警方由于證據不足,只能對二人短期關押,各判1年。

如下圖的支付矩陣:

囚徒A(黎叔)囚徒B(小葉)坦白抵賴坦白(-5,-5)(0,-10)抵賴(-10,0)(-1,-1)

這兩個囚犯的博弈過程如下:先考慮黎叔的選擇。黎叔要決定自己的選擇,他必須要先考慮小葉的選擇,即黎叔是在考慮了小葉的選擇的前提下來決定自己的選擇。那么,黎叔一定是這樣考慮的:

如果小葉選擇坦白,我如果也選擇坦白,被判5年,如果我選擇抵賴,被判10年。于是我選擇坦白。(因為5<10)

如果小葉選擇抵賴,我如果選擇坦白,立馬釋放,如果我選擇抵賴,被判1年。于是我選擇坦白。(因為0<1)

得出結論:無論小葉選擇坦白還是抵賴,我都選擇坦白。

同理,在分析小葉的選擇時,我們也會得到類似結論。但當我們仔細分析,不難發現,如果兩個人都選擇抵賴(即合作),則可以獲得最好的結局(即只判1年)。但是由于他們之間不能互通信息,所以每一方都擔心由于對方坦白而自己抵賴時自己所遭受到的重判(即對方釋放,自己抵賴被判10年)。在這種情況下,每個人都會從自己的利益考慮,最后的選擇都是坦白。

這就是博弈論中的重要的數學模型——完全信息靜態博弈模型。

二、完全信息靜態博弈

完全信息靜態博弈是指各博弈方同時決策,且所有博弈方對各方得益都了解的博弈。屬于非合作博弈最基本的類型。基于以上考慮,黎叔和小葉都會選擇坦白,達到一個穩定解,但是這個解卻不是整體的最優解。

通過對囚徒困境的分析,我們得出這樣一個結論:無論小葉選擇坦白還是抵賴,黎叔都會選擇坦白。于是,我們說坦白策略是他的占優策略,類似的分析對于小葉也是適用的,所以坦白策略也是小葉的占優策略。

因此,我們給出占優策略的定義:無論其他參與者采取什么策略,某參與者的唯一的最優策略就是他的占優策略。在我們的分析例子中,(坦白,坦白)這一對策略組合下的博弈狀態,就是一種均衡狀態。一般地說,由博弈中的參與者的占優策略組合構成的均衡就是占優策略納什均衡。

我們可以在支付矩陣中用劃橫線的方法來尋找占優策略納什均衡。具體做法如下:當小葉選擇坦白時,黎叔會選擇坦白,則在報酬-5下劃一橫線,當小葉選擇抵賴時,黎叔仍會選擇坦白,則在報酬0下劃一橫線。小葉選法同理。最后,矩陣圖中的唯一兩個數字都被劃上橫線的那一格報酬組合(-5,-5)所對應的(坦白,坦白)的策略組合就是該博弈的占優策略納什均衡。

三、公共資源流失

黎叔和小葉都是理性人作出的選擇都是理性對自己收益最大的,最終整體的的結果卻沒有達到最優,這個問題值得我們去思考。

自私自利的人類可能因為自己的聰明而降低包括自身在內的所有人的福利水平,個人的理性導致集體的非理性,非合作的自利行為導致兩敗俱傷。

以生活中實例對這一現象加以說明和理解:

1、父母為什么熱衷于給孩子報暑期班,暑期班廣告鋪天蓋地,只此一句不要讓孩子輸在起跑線上,就讓家長對商家的套路毫無抵抗,這里就蘊含了囚徒困境原理,輔導班廣告正是通過囚徒困境將家長捆綁在一起。

2、每年暑期高考之后各大名校爭搶狀元,納什均衡最大悲劇就在于北大和清華都意識到搶狀元毫無意義,即使他們都認同不搶狀元才是最好的結果但是這樣的結果卻達不到,因為雙方不得不采取對自己最有利的策略:搶狀元。

類似生活中的現象比比皆是:上網購物、夫妻吵架、各大商家企業價格戰、軍備競賽等。

四、如何走出囚徒困境?

(一)增加背叛成本—信任

若在囚徒困境模型中,增加雙方選擇坦白策略的成本:各判5年增加到各判15年,當庭釋放增加到判5年,則支付矩陣如下:

黎叔小葉坦白抵賴坦白(-15,-15)(-5,-10)抵賴(-10,-5)(-1,-1)

如果小葉選擇坦白,黎叔如果也選擇坦白,被判15年,如果選擇抵賴,被判10年。于是黎叔選擇抵賴。(因為10<15)

如果小葉選擇抵賴,黎叔如果選擇坦白,被判5年,如果選擇抵賴,被判1年。于是黎叔選擇抵賴。(因為1<5)

得出結論:無論小葉選擇坦白還是抵賴,黎叔都選擇抵賴。

同理,小葉也會得到相同的結論,這樣小葉和黎叔的最終選擇都變成了抵賴策略,達到了整體最優,避免了公地悲劇的發生。

(二)雙方達成協議—合作

若雙方可以相互溝通達成協議,直接選擇最優策略,那么也會達到共贏。

猜你喜歡
困境策略
基于“選—練—評”一體化的二輪復習策略
求初相φ的常見策略
例談未知角三角函數值的求解策略
困境
文苑(2020年12期)2020-04-13 00:54:08
我說你做講策略
高中數學復習的具體策略
數學大世界(2018年1期)2018-04-12 05:39:14
“鄰避”困境化解之策
我國霧霾治理的困境與出路
環境科技(2016年3期)2016-11-08 12:14:20
論狹義平等理論的三重困境
社會科學(2016年6期)2016-06-15 20:29:08
中國“富二代”家庭教育的困境
人生十六七(2015年2期)2015-02-28 13:08:04
主站蜘蛛池模板: 亚洲精品无码高潮喷水A| 一级做a爰片久久免费| 欧美久久网| 亚洲性网站| 91在线精品麻豆欧美在线| 国产一在线| 亚洲欧美人成人让影院| 国产精品观看视频免费完整版| www.99在线观看| 久久成人免费| 日韩人妻精品一区| 国产精品私拍在线爆乳| 国产微拍精品| 国产一线在线| 国产成人亚洲精品蜜芽影院| 国产一级在线观看www色 | 国产免费久久精品99re丫丫一| 亚洲一区二区约美女探花| 青青久久91| 欧美日韩导航| 亚洲AV一二三区无码AV蜜桃| 国产乱人免费视频| 国产福利不卡视频| 亚洲一级毛片在线播放| 97se亚洲综合在线天天| 中文天堂在线视频| 四虎影视永久在线精品| 99热这里只有精品5| 亚洲精品福利视频| 国产欧美日韩在线在线不卡视频| 欧美黄色网站在线看| 色噜噜中文网| 成年午夜精品久久精品| 国产剧情国内精品原创| 国产精品人人做人人爽人人添| 中文字幕人成乱码熟女免费| 亚洲区第一页| 国产亚洲视频免费播放| 国产一区二区三区免费| 这里只有精品在线播放| 日韩精品一区二区三区免费| 色偷偷综合网| 人妻夜夜爽天天爽| 欧美日韩一区二区三区四区在线观看 | 波多野一区| 性色在线视频精品| 久久精品视频一| 久久视精品| 亚洲最黄视频| 欧美日韩中文字幕二区三区| 国产精品免费福利久久播放 | 国产精品嫩草影院视频| 亚洲人成成无码网WWW| 99热免费在线| 97青青青国产在线播放| 18禁色诱爆乳网站| 福利视频久久| 国产美女精品在线| 国产精品久线在线观看| 亚洲精品国产成人7777| 中文字幕va| 毛片最新网址| a国产精品| 久久不卡国产精品无码| 72种姿势欧美久久久大黄蕉| 丁香婷婷激情网| 国产无遮挡猛进猛出免费软件| 亚洲综合狠狠| 97久久超碰极品视觉盛宴| 国产毛片基地| 国产九九精品视频| 国产一在线观看| 欧美精品在线看| 性色生活片在线观看| 亚洲精品午夜无码电影网| 99re66精品视频在线观看| 国产精品自在线天天看片| 久久久久人妻一区精品| 午夜视频免费试看| 97色伦色在线综合视频| 国产精品无码在线看| 亚洲视频四区|