徐欣

【摘要】在現實生活中,總是需要做大量的決策,而個人的決策收益往往不是孤立的,會受其他決策者的選擇影響。在完全理性的假設下,雖然每個決策者絕對理性地選擇對自己最優的策略,但是最終卻陷入博弈困境,從群體角度看并不是最優決策。本文從博弈論基礎出發,介紹了博弈標準式、嚴格劣策略、納什均衡的概念,推導了納什均衡點求解,最后通過案例進行實際的分析。
【關鍵詞】博弈 ?博弈標準式 ?納什均衡
【中圖分類號】O29 ?【文獻標識碼】A 【文章編號】2095-3089(2019)27-0015-02
一、引言
在現實社會生活中,個體的決策總是受群體決策的影響,或者說給定個體的決策,該決策的收益會隨著其他個體決策的變化而變化。但是在其他個體不可控的情況下,個體理性的選擇往往不是群體最有利的選擇。
比如,有兩個商戶(商戶A、商戶B)銷售類似商品,屬于競爭關系。每個商戶都有兩種可選擇的策略:促銷或者不促銷。當商戶A選擇促銷,若商戶B選擇不促銷,則商戶A收益為10,而商戶B因為沒有任何優惠活動收益為0;若商戶B同樣選擇促銷,則商戶A和商戶B的收益都是2。當商戶A選擇不促銷;若商戶B選擇促銷,則商戶A和商戶B的收益分別是0、10;若商戶B同樣選擇不促銷,則商戶A和商戶B都會收益9。具體博弈矩陣如表1所示,從表中可以看出,商戶A和商戶B都不促銷是群體最優的決策。但是,在現實情況下,在每個商戶都是理性人的情況下,最終的結局一般都是商戶A和商戶B都選擇促銷[1]。
上述例子是一個典型的博弈困境,是博弈論中最經典的博弈模型之一。對決策主體如何做出決策進行建模,研究當其行為在直接相互產生作用的時候,決策主題最終選擇的策略如何達到均衡。博弈論是應用數學的一個分支,也是運籌學的一個重要學科,也是西方經濟學理論的重要組成部分。博弈論通過嚴謹的數學語言,標準化定義博弈的關鍵要素,考慮博弈過程中的個體的預測行為和實際行為,并研究他們的優化策略。下面通過介紹博弈論的基本概念,定義博弈的標準表達式,引入納什均衡的概念來解釋現實生活中的博弈困境。
二、博弈論基礎
1.博弈的標準表達式
一個博弈問題需要明確該問題的參與者、每個參與者可以選擇的策略,以及當確定所有參與者的決策后每個參與者的收益函數。所以,博弈的標準表達式由三個元素構成:參與者、每人的可選擇戰略合集、每人可選擇戰略集合的收益[2]。
若有n個參與者,記每一個參與者為其序號{1,2,…,n},其中參與者i的戰略集合為Si,?襓Si?襓=mi,mi為參與者i的所有可能決策數,收益為ui(S1,S2,…,Sn)。所以,一個完整的博弈表達式可列為:
G={S1,S2,…,Sn;u1,u2,…,un}
以上文商家促銷為例,在該博弈問題中,參與者共2人(商戶A、商戶B);二人的戰略合集S1=S2={促銷,不促銷},收益函數u1,u2可以用雙變量矩陣來表式,表1即為博弈矩陣。
表1 商戶促銷博弈矩陣
博弈標準表達式概括論博弈問題中的三要素,已知博弈標準表達式就已知了博弈問題中的所有信息,博弈標準表達式是我們科學研究博弈問題的第一步。
2.嚴格劣戰略
當我們通過博弈標準表達式明確了我們的決策環境之后,如何合理地在現有條件下做最有利于自己的合理決策呢?
在博弈標準式中,令Si'和Si"為決策者i的兩個可行策略,即Si',Si"∈Si,如果對其他所有參與者的每一個可能的戰略組合,決策者i選擇Si'的收益都小于選擇Si"的收益,
ui(S1,…,Si-1,S'i,Si+1,…,Sn) 那么戰略Si'相對與戰略Si"為嚴格劣策略。 如定義,嚴格劣策略是一個相對的概念,是和另一個可行策略相比是劣的。理性的參與者會主動拋棄嚴格劣策略,因為雖然無法知道其他參與者的決策,但是不管其他參與者選擇什么決策,即不管在任何情況下,嚴格劣策略都不如另一個可行策略,所以理性參與者會提出這個策略。 以此類推,我們可以通過重復刪除不同參與者的嚴格劣策略,找到最終博弈問題的解,即所有參與者的最終決策。 3.納什均衡 在博弈問題中,若所有參與者自發通過理性選擇,最終得到一個唯一的狀態,由于是自動實施的所以也是戰略穩定的,這一狀態成為納什均衡。 由納什均衡的定義可知,我們可以通過重復刪除嚴格劣策略求得博弈問題的納什均衡點。 三、博弈問題求解 仍以上文商家促銷為例,站在商家B的角度考慮,無論商家A促銷還是不促銷,商家B選擇促銷的收益都要高于不促銷,故不促銷是此博弈問題的嚴格劣戰略。排除商家B的不促銷戰略,對于商家A而言,不促銷相對于促銷是嚴格劣策略。所以,通過兩次刪除嚴格劣策略,可以求得戰略組合{促銷,促銷}為該博弈問題的納什均衡點[3]。 四、實例分析 博弈困境模型雖然簡單抽象,但是現實中存在很多的應用,比如最近很活躍的互聯網公司之間的競爭比拼:滴滴和快的兩家公司對打車市場的爭搶;美團和餓了么之間補貼競賽,等等。 在這些博弈問題中,博弈雙方都使用的最簡單粗暴的競爭策略——低價補貼。低價補貼是一個惡性競爭,一旦開始,就會像裝備大戰一樣陷入膠著,也就是所謂的博弈困境。在博弈問題中,任何博弈方一旦停止補貼,而競爭對手如果繼續采取補貼策略,那么用戶就會選擇有補貼優惠的平臺,這就勢必導致提前結束補貼的一方陷入被動局面,甚至被競爭對手給徹底甩開。 所以,博弈中存在競爭關系的雙方不得不選擇低價補貼的策略,進入僵持局面,陷入博弈困境。面對此困境,尋求合并線下商議,博弈參與者通過交流獲取更多信息,是一個比較好的打破僵局的方法。通過資本的撮合和雙方的協商,制定對雙方都有利的規則,從而獲得壟斷優勢,走出困境,取得長遠發展。但是,在不加入外界影響和干擾的情況下,就會自發地陷入博弈困境,無法達到對多方博弈者都有利的點。 五、總結 博弈論把現實問題進行抽象,通過對博弈標準式、嚴格劣策略、納什均衡等概念的介紹,以一個簡單案例為例對其進行求解,最后對實際問題進行分析。通過對博弈困境的分析得出,個人的理性結果并不能導出團體的最優決策,是非合作的競爭[4],只有通過博弈參與者以外的第三方制定規則和限制才能使合作下的良性競爭出現。 參考文獻: [1]李元棟,劉慎軍,陳曉航.基于囚徒困境模型的高校員工幫助計劃實施策略博弈研究[J].黑龍江高教研究, 2017(7). [2]吉本斯,峰.博弈論基礎:A primer in game theory[M].中國社會科學出版社,1999. [3]張峰.論博弈邏輯的分析方法——納什均衡分析法[J].北京理工大學學報(社會科學版),2008(2):95-99. [4]陶鋒,楊積成,劉金紅.“囚徒困境”視角下的企業間信息共享博弈分析[J].技術經濟與管理研究,2013(7):22-26.