(云南財經大學經濟研究院 云南 昆明 650221)
在我們平時遇見的博弈中,純戰略納什均衡和混合策略納什均衡并不能夠很好很高效率的解決所有問題,雖然所有的博弈經過上述兩種方法總能找出相應的最優戰略或是最優解,但是最終的結果卻未必是最好的。所以我們就會引入相關的設置機制,意在找出更好的均衡解或是均衡戰略,改善整體的效率與期望水平,使整體博弈的效益盡量最大化,而相關均衡即是這樣的一種均衡選擇機制。相關均衡的概念是由奧蒙提出,他指出:如果參與人可以根據某個共同觀測到的信號選擇行動,就可能出現“相關均衡”,相關均衡可以使所有人受益。
在本書所給的案例中,其支付矩陣如下:


第一種機制設置:A、B兩個參與人通過猜硬幣的方式決定戰略:如果硬幣是正面,A選擇U,B選擇L;如果硬幣是反面,A選擇D,B選擇R。在該機制的約束下,參與人A、B都會自愿遵守這個規則,因為在該機制的作用下,硬幣出現正面與出現反面的概率各為1/2,此時,當參與人A和B的期望效用都為3(1/2×5+1/2×1),大于上述混合戰略均衡的均衡結果2.5。因此,理性的參與人A和理性的參與人B必定會選擇效用更大的硬幣決策規則,并嚴格遵守這個規則。
第二種機制設置:A、B兩人決定由處于旁觀者的第三人擲骰子的方式來選擇戰略,具體規則如下:如果1、2點出現,A選擇U,3-6點出現,A選擇D;與此同時,如果1-4點出現,B選擇L,如果5、6點出現,B選擇R。假定第三方只是通過觀察到的點數告知每位參與人應該選擇什么行動,而不會告訴骰子出現的點數,在這樣的情況下,當A被告知選擇U時,參與人A知道骰子出現的點數為1點或2點,此時,B被告知的選擇只能是L。而當A被告知選擇D時,參與人A只知道3-6的某一點數出現了,但是具體的點數A并不知道,此時參與人B被告知的選擇就會有兩種,一種是選擇L,即出現的點數為3點或是4點,另一種是選擇R,即出現的點數為5點或6點。通過上述分析,我們可以將投擲骰子出現的點數整體分為三種情況,一種是1、2點出現,參與人A、B的納什均衡為(U,L),一種是3、4點出現,參與人A、B的最終納什均衡為(D,L),又或是5、6點出現,參與人A、B的納什均衡為(D,R),在此機制下,不理想的結果(U,R)永遠不會出現,而且上述每種情況出現的概率均為1/3。最終結果(U,L)、(D,L)、(D,R)均會以1/3的概率被選擇,在新的均衡中,參與人A、B的最終期望效用均為10/3(1/3×5+1/3×4+1/3×1)。
第三種機制設置:假定參與人A、B仍通過投硬幣的方式選擇策略,但與第一種機制設置不同,此次機制的設置選擇兩枚硬幣,其具體規則如下:選擇兩枚質地均勻的硬幣,若兩枚硬幣均出現正面,參與人A選擇U,參與人B選擇L;若兩枚硬幣均出現反面,參與人A選擇U,參與人B選擇R;若兩枚硬幣一枚出現正面,一枚出現反面,則參與人A選擇D,參與人B選擇L。其最終的納什均衡也只有三種結果(U,L)、(D,L)和(D,R),也同時規避掉了“壞”結果(U,R)。而一枚硬幣出現正面與反面的概率均為1/2,兩枚硬幣均出現正面或是均出現反面的概率為1/4(1/2×1/2),兩枚硬幣出現一枚正面一枚反面的概率為1/2(1/2×1/2+1/2×1/2)。
以此類推,假設有n枚硬幣,均出現正面的概率為1/2n,均出現反面的概率為1/2n,其他情況的概率為(1-1/2n-1),而且同樣假設均出現正面時,參與人A選擇U,參與人B選擇L;均出現反面時,參與人A選擇D,參與人B選擇R;否則,其他的情況下,參與人A選擇D,參與人B選擇L,在此納什均衡(U,L)、(D,L)、(D,R)的情況下,參與人的期望效用為6/2n+4×(1-1/2n-1),整理得(4-1/2n-1),不難發現,隨著n的增多,硬幣的數量的增加,參與人A與B的期望效用會不斷增加,當n趨于無窮時,兩位參與人的期望效用將趨于4,將不斷大于上述幾種機制的期望效用10/3、3.5、3.75。參與者的期望效用在不斷得以改善,境況變得越來越好。
在信號博弈中,博弈雙方可以設置不同的機制,并嚴格依據和遵守所選擇的機制與規則采取相應的行動和選擇,參與人的期望效用可以不斷的得到提高,其收益水平會遠遠高于混合戰略的納什均衡,參與人的境況得到進一步改善,博弈雙方的收益會進一步不斷的增大,作為理性的參與人,這將是博弈雙方的福利,也將是博弈雙方更愿意看到的局面和獲得的收益。當然這種機制的設立,需要博弈雙方或是旁觀者又或是政府國家進行不斷的探索與尋找,或許一般情況下的納什均衡并不會是博弈者的最優選擇和最好狀況,在相關均衡的共同信號的約束與規范下,博弈雙方或許可以得到更好更優更完美的決策結果與新的更優的納什均衡。