李夢圓++段靈子++栗夢妍++張博宇
摘 要:以往的研究一般是從社會學和心理學的角度出發分析人類從眾行為的合理性,本課題應用演化博弈理論對人類社會中廣泛存在的模仿行為進行分析。基于模仿行為最本質的兩個特征,即初始策略與模仿強度,我們定義了重復公用品博弈中的模仿策略集,并通過計算不同類型模仿策略在重復公用品博弈中的收益,得到不同博弈參數下的最優模仿對策。在選擇-突變框架下,本課題給出了重復公用品博弈情境下嚴格模仿策略的局部(演化)穩定性條件,并證明了其在模仿策略集內是不可被入侵的。
關鍵詞:重復公用品博弈 嚴格模仿策略 演化穩定性 社會學 心理學
中圖分類號:TP18 文獻標識碼:A 文章編號:1674-098X(2015)02(a)-0018-02
在公用品博弈中,每一個參與者在游戲開始之前被給予一筆資金,他可以把它直接據為己有或者從中拿出一部分向一個公共儲備池(common pool)投資,公共儲備池中的資金被放大一定倍數后平均分配給所有參與者,不論其貢獻多少[1]。根據傳統的經濟學理論,公用品博弈中唯一的理性結果為所有參與者均不捐獻任何資金。
在真實的公用品試驗中,只有少數人的行為符合經典經濟學的預測。大量的實驗證據顯示大多數受試者在博弈開始時一般會往公共儲備池中投入接近一半的資金。隨著博弈重復進行,貢獻率逐漸下降到0[2]。例如在Fehr和G?chter[3]的重復公用品博弈實驗中,在第一輪中平均捐獻率能達到初始資金的40%~60%,而在第十輪中超過70%的參與者選擇了0貢獻的行為。Traulsen等人[4]指出,在重復公用品博弈中,如果將降低貢獻視為對低貢獻者行為的模仿,那么這類行為的比例一般能占到全部行為的70%。
本研究中,我們將策略空間限定在重復公用品博弈的模仿行為類里。考慮一個n人t輪重復公用品博弈,每一輪中,公共儲備池會將當輪所有貢獻的資金放大r倍后平分給n個人。對于采用模仿策略的個體,在首輪博弈中他將按照自己意愿貢獻一定比例的資金,然后在之后的每一輪中對其他n-1個個體的貢獻平均值進行一定力度的模仿。在一個重復博弈進行過程中,每個個體的模仿策略始終保持不變,其收益定義為t輪重復博弈中每輪博弈結束后結余資金的平均值。一個模仿策略被稱為是(演化)穩定的,如果大多數個體都采用該對策時,任何突變對策無法獲得更高的收益[5]。
1 模仿對策模型的建立
假設重復公用品博弈參與人數為n,公用儲備池的放大倍數為r,博弈輪數為t。通過包含兩個參數的向量(x,p)來定義個體的模仿策略,其中x∈[0,1]表示在重復公用品博弈中首輪的貢獻率,p∈[0,1]表示之后的每一輪對于組內其他斜-1個個體平均貢獻值的模仿強度。嚴格模仿策略可寫為(x,1),即首輪貢獻x,從第二輪開始,每輪嚴格貢獻上一輪組內其他個體貢獻的平均值。
我們假定n人重復公用品博弈中n-1個參與者所采用的模仿策略為S1=(x,p),另外1個參與者采用突變策略S2=(y,q)。所有采用S1策略的個體行為變化是同步的,并且每輪的貢獻值只依賴于上一輪組內其他n-1個成員的平均貢獻比率,因此這類個體第t輪的貢獻率xt可以通過下面遞推式表示:
(1)
類似的,采用策略S2的個體在第t輪的貢獻率yt可以表示為:
(2)
下面我們利用待定系數法求解xt和yt的具體表達式。不妨設
, (3)
其中α和β為待定系數。
將方程(3)帶入(1)和(2)的第二個等式,解得
。
將上面結果帶入方程(1)和(2)的第二個等式,可以得到
由此解得S1策略個體和S2策略個體第t輪的貢獻分別為
因此使用S1策略的個體在t輪重復公用品博弈中的貢獻總和為
使用S2策略的個體在t輪重復公用品博弈中的貢獻總和為
n人公用品博弈中,如果n-1個個體采用S1策略,1個個體采用S2策略,那么使用S1策略和S2策略的個體在第t輪的收益可以表示為以下形式
(4)
所以由方程(4),兩類個體t輪重復公用品博弈中的每輪平均收益分別為
(5a)
(5b)
2 嚴格模仿策略的局部穩定條件
2.1 模仿策略的局部穩定性
一個模仿策略(x,p)被稱為局部(演化)穩定的,如果對于任意局部突變策略(x+△x,p+△p),采用該突變策略的個體在一個由采用(x,p)策略的個體構成的群體中,其收益低于使用原策略(x,p)帶來的收益[7]。這種情況下,此個體顯然沒有動機堅持使用突變策略(x+△x,p+△p),而會改回使用原對策(x,p)。
在n人重復公用品博弈中,模仿策略S1=(x,p)是局部穩定的,當且僅當對任意S2=(x+△x,p+△p),(6)
當△x→0,△p→0時,S1的局部穩定性可以等價的表示為下面兩個條件
(7)
其中原策略S1=(x,p),突變策略S2=(y,q)。
2.2 n人重復公用品博弈嚴格模仿策略的局部穩定條件
在n人重復公用品博弈情境下,方程(7)給出了模仿策略S1的局部穩定性條件。將原策略記為S1=(x,p),突變策略記為S2=(y,q),由方程(5b),
(8)
(9)
方程(8)當r>1和t>>1時,總有,即單輪平均收益隨著首輪貢獻率的增加單調遞增。因此在n人重復公用品博弈情境下,當輪次t足夠大時,唯一可能的局部穩定嚴格模仿策略是(1,1)。
我們接下來討論(1,1)對策在n人t輪重復公用品博弈中的局部穩定條件。當t=1時,首輪全部貢獻是穩定的當且僅當r>n,即個體單獨提高貢獻值能使其收益增加。當t>1時,將原策略(1,1)和突變策略(y,q)=(1-△y,1-△q)帶入方程(8)和(9),(1,1)是局部穩定的當且僅當下面兩個不等式成立endprint
(10)
綜上所述,(1,1)的局部穩定條件為
(11)
當r>n時,(1,1)在任意輪次的重復公用品博弈中都是穩定的。另一方面,注意到當t>>1時,方程(10)中兩個不等式的右邊均趨近于1。這意味著當r>1時,只要博弈重復的輪次充分長,嚴格模仿策略(1,1)就會成為局部穩定的,此時每名參與者都會選擇全部貢獻。
在實驗經濟學中,重復公用品實驗一般4人分為一組[4-6],此時嚴格模仿策略(1,1)的局部穩定條件如圖1所示。例如當t=5時,局部穩定條件為r>1.49;當t=10時,局部穩定條件為r>1.24;當t=20時,局部穩定條件為r>1.11。注意到在這些實驗中r的取值均大于1.5,且重復的次數一般超過10輪,因此(1,1)在模仿策略集中是局部穩定的,并且每輪平均收益隨首輪貢獻率的提高單調上升。這可能是重復公用品博弈中貢獻率居高不下的一個原因。
2.3 重復公用品博弈嚴格模仿策略局部穩定條件的進一步研究
上節中我們得到了n人重復公用品博弈中嚴格模仿對策(1,1)的局部穩定條件。由于方程(10)包含兩個不等式,一個自然的問題是哪個不等式條件更強。這里我們給出此結論在n人重復博弈下的一個一般性證明。
對方程(10)中兩個不等式的右邊項做差,當t較大時,
這表明當t較大時,方程(10)的第2個不等式比較強,即如果個體收益隨著模仿強度單調增加,那么其收益也會隨著首輪貢獻值單調增加。
因此,對于較大的t,(1,1)策略的局部穩定條件可以簡化為
(12)
注意到方程(12)不等式右邊包含兩個變量n和t,我們進一步分析(1,1)的局部穩定性與n和t的關系。
當t較大時,有
(13)
因此不等式(12)的右邊項隨著n單調增加而隨著t單調減小。即給定重復輪次t時,隨著公用品博弈參與的人數增加,(1,1)的局部穩定性條件越來越嚴格。但是對于任意r>1的n人公用品博弈,只要重復的輪次足夠長,(1,1)就能夠成為局部穩定的。特別的,當n和t都較大時,(1,1)局部穩定的一個近似的條件是r>1+n/t。
3 結語
在本課題中,我們考慮僅僅引入兩個變量——初始貢獻率及模仿強度來刻畫人們在社會生活中所采取的行為。基于人類模仿行為最本質的特征建立起相對簡單的數學模型,并通過對最優模仿策略的研究拓展了學習理論對人類社會中真實現象的解釋力度。
參考文獻
[1] Hardin G.The tragedy of the commons[J].Science,1968,162:1243-1248.
[2] Chaudhuri A.Sustaining cooperation in laboratory public goods experiments:a selective survey of the literature[J].Experimental Economics,2011,14(1):47-83.
[3] Fehr E,G?chter S.Cooperation and punishment in public goods experiment[J].The American Economic Review,2000,90:980-994.
[4] Traulsen A,Semmann D,Sommerfeld RD,et al.Human strategy updating in evolutionary games[J].Proceedings of the National Academy of Sciences,2010,107:2962-2966.
[5] Hofbauer J,Sigmund K.Evolutionary Games and Population Dynamics.Cambridge[M].Cambridge University Press,1998.endprint