牛新宇
完全信息動態多目標博弈優化模型及應用
牛新宇
利用多目標規劃思想,通過子博弈精煉納什均衡原理構建了完全信息動態多目標博弈模型。并針對優化模型進行了實例分析,為進一步深入研究動態多目標博弈問題提供了一種有效的分析方法。
博弈就是一些個人或組織面對一定的條件,在一定規則下從各自允許選擇的行為或策略中加以選擇并取得相應結果的過程。因此,在現實生活中,人們每天都會面臨著博弈。在博弈中,博弈方之間進行的的往往是針對多個目標的博弈,即多目標博弈問題。近年來,很多學者對博弈方同時選擇策略的靜態多目標博弈的研究較多,相繼出現了一些研究成果。但是實際問題中的許多決策活動往往是依次選擇策略,而并不是同時選擇策略。由于后決策者在選擇策略時已經觀察到先決策者的策略,因此這種決策問題構成的博弈與靜態多目標博弈有很大的區別,稱它們為動態多目標博弈。由此可見,研究動態多目標博弈具有更重要的現實意義。
動態博弈指參與人不是同時,而是先后選擇博弈行為,且后行動者能夠觀察到先行動者的選擇行為。如商業活動中的討價還價,拍賣活動中的輪流競價。完全信息動態博弈的常用描述方式是擴展式博弈。從擴展式博弈中不僅可以看到博弈的結果而且可以看到博弈的進程。擴展式博弈的最優策略組合是一個子博弈精煉納什均衡。 “子博弈”是原博弈的一部分,可以作為獨立的博弈進行分析。子博弈精煉納什均衡不僅是原博弈的納什均衡而且是每一個子博弈的納什均衡。
在此,假設動態多目標博弈分為兩個階段,在n個參與人中,M={1,2,…,m}是主動者的集合,Q={m+1,m+2,…,n}是從動者集合。

基于以上理論,建立動態多目標博弈優化模型如下:
求x∈X ,使

某城市有兩個生產商生產相同的某種產品,廠商之間進行的是產量競爭.廠商1首先選擇產量q1,廠商2在選擇產量q2時能夠觀測到q1。假設生產商只關心利潤和風險兩個目標。兩個生產商如何選擇產量才能使彼此獲得預期利潤的同時,盡量減少風險帶來的損失呢?
根據上述假設可知,兩廠商的利潤函數分別為:

廠商1的預期目標:利潤不低于10,風險不高于4;
廠商2的預期目標:利潤不低于7,風險不高于2。
如前述得動態多目標博弈優化模型:

由于考慮到在一般情況下,廠商在利潤和風險兩個目標上,更希望最先滿足的是利潤這個目標值;因此,在模型中將利潤目標的優先等級設定為較高的優先等級,只有在利潤這個目標滿足的基礎上,才能考慮風險所對應的目標。
對上述模型求解:得q1=3,q2=2,于是,取策略組合(3,2)作為該動態多目標博弈問題的最優策略。這個結果也反映了兩個廠商所處的地位不對稱帶來的作用。因為廠商1具有“先動優勢”,從而使廠商1能通過選擇較大的產量得到較多的利益。
本文將多目標規劃思想運用到多目標博弈中,通過子博弈精煉納什均衡原理構建了完全信息動態多目標博弈模型。模型即考慮了博弈方選擇策略行為的順序,又兼顧了各個目標之間的主次輕重。最后,針對具體博弈實例進行分析,進一步說明了模型解的合理性和實用性。
10.3969/j.issn.1001-8972.2015.17.021