周明華,鄭婷婷,陸 川,孫長啟
(浙江工業大學 理學院,浙江 杭州 310023)
?
多人智豬博弈及其在羊群模型中的應用
周明華,鄭婷婷,陸川,孫長啟
(浙江工業大學 理學院,浙江 杭州 310023)
摘要:在原始雙人智豬博弈模型的基礎之上,引入懲罰因子和反省機制,提出了一個N人擴展智豬博弈模型.由于在現實的金融市場中經紀人的能力存在差別,因此將N人擴展智豬博弈與羊群模型相結合,提出了一個帶有智豬博弈的羊群模型,使得當經紀人做決策時并不是單一地選擇跟隨.最后,對該模型進行了實驗仿真,實驗結果表明:帶有智豬博弈的羊群模型能較好得反應金融市場的行為和特性.
關鍵詞:智豬博弈;羊群模型;懲罰因子;反省機制
在博弈論經濟學中,智豬博弈是一個經典的模型.1979年動物心理學家Baldwein和Meese做了一個著名的實驗[1]:在豬圈里放一大一小兩頭豬,在豬圈的一頭裝一個控制豬食的拱桿,另一頭裝一個供應食物的實槽,每拱一次拱桿食槽中便會有食物落下.經過多次博弈之后,達到一個均衡狀態:大豬出力,小豬搭便車.1989年,E.Rasmusen[2]將該現象引進博弈論,提出了原始的智豬博弈模型.目前,該模型的研究都是在原始雙人智豬博弈模型的一些條件上進行改進[3-4],以及該博弈模型的一些實際應用[5-6].但是,考慮到實際情況中,博弈個體往往是多方的,如團體內個體間的博弈,此時,原始智豬博弈的應用存在一定的局限性,為了克服這種局限性,在雙人博弈模型的基礎上對此進一步改進,提出了一個帶有懲罰因子的N人擴展智豬博弈模型,使得智豬博弈模型的應用能更為廣泛.
近年來,隨著行為金融學和計量經濟學被廣泛認知,學者們對投資者行為及金融時間價格收益率的研究也愈來愈熱.Eguiluz和ZimmermannEZ[7]在Physical Review Letters中提出了一個羊群模型,從金融市場的微觀機理上解釋了金融時間價格的收益率為何存在尖峰胖尾的現象,從而獲得了許多學者的重視.從此,羊群模型的研究及應用迅速引起了相關學者的興趣.目前許多學者都對羊群模型做了更深入的研究,如鄭波,董林榮,Arne C.Klein等[8-16].我們發現,目前已有的研究羊群行為的各種模型,大都遵循EZ羊群模型的提出的同一個集團中的經紀人會因為羊群行為而采取相同策略的假設,但是這一假設過于理想化.根據現實的金融市場,由于集團內的各經紀人得到不同的信息,擁有多樣化的資源,他們的認知能力,判斷能力,心理因素等都存在著或多或少的差異,因而同一集團中的經紀人做決策時,并非所有人都選擇跟隨,經紀人與經紀人之間會有一個相互博弈的過程.因此,為了更貼近現實的金融市場,我們將多人智豬博弈模型與羊群模型結合,提出了一個帶有多人智豬博弈的羊群模型,并對其進行了仿真分析.仿真結果表明:帶有智豬博弈的羊群模型符合現實金融市場的程式化規律.
1N人擴展智豬博弈模型
1.1原始智豬博弈簡介
在智豬博弈(Boxed pigs)中,假設豬圈里有兩頭豬,一頭大豬,一頭小豬.豬圈的一邊是一個供應食物的食槽,另一邊是一個控制食槽中食物供應的踏板.當有豬踩踏板時,位于另一頭的食槽就會有一份食物落下.若小豬選擇踩踏板,大豬會在小豬跑到食槽前吃光一整份食物;若大豬選擇踩踏板,小豬只能在大豬到達前時吃掉半份食物.并且假設大豬吃的速度是小豬的兩倍,大小豬跑路均需要消耗一份食物1/4的能量.表1為其支付矩陣.在支付矩陣中,我們注意到,不論大豬怎么選擇,等待均是小豬的最優選擇.因為,若大豬踩踏板,小豬如果也踩踏板則收益為1/12,選擇等待的收益為8/12;若給定大豬等待,小豬選擇踩踏板的收益為-1/4,選擇等待則是0.所以等待是小豬的占優策略.在小豬總是選擇等待的情況下,踩踏板是大豬的最優選擇.所以,納什均衡是:大豬踩踏板,小豬等待.

表1 智豬博弈支付矩陣
1.2N人擴展智豬博弈模型
由于在現實世界中博弈方往往不止兩個,比如金融市場中的經紀人.由此提出了一個N 人擴展智豬博弈模型.
該模型假設:一個豬圈中共有N′ 頭豬,其中大豬N1頭,小豬N2頭,并且假設N1=0.4N′,N2=0.6N′,即N1+N2=N′.其中踩踏板的大豬有n1頭,踩踏板的小豬有n2頭,n表示踩踏板的豬的總數,即n=n1+n2.在初始狀態下選擇踩踏板的概率為p.a為一只大豬踩踏板落下的食物,b為一只小豬踩踏板落下的食物(a>b),選擇踩踏板的豬需要消耗的能量為d.由于考慮到實際情況中博弈者做出決策往往需占用或使用如資金、材料而引起應當支付的費用,或需付出一定的時間代價,以及在這等待時間中造成的市場機會的丟失等等,而這時的時間成本會隨著決策人數的變化而變化,當做決策的博弈者越多時,所需付出的時間成本越少.為了簡化計算,筆者使用了反比例函數來計算時間成本,記需要消耗的時間成本為 l=α/n(α為一個常數).若不踩踏板,還需要受到一定的懲罰,引進懲罰因子Q.則集團的總收益為an1+bn2.由于大豬的吃食速度大于小豬的吃食速度,則可假設所有大豬可獲得總收益的60%,小豬獲得總收益的40%.因此可得2種收益函數:
1) n=0時,P=0(即所有豬的收益均為0).
2) n≠0時,分別考慮大豬與小豬的情況,即
(1)大豬:

(2)小豬:

在博弈中假設行為主體具有完全理性思維,即所有參與者都是理性的,并且所有參與者知道其他參與者也都是理性的,這在實際情況中,對于行為主體的認知能力而言是一項非常嚴格的假設,通常得不到保證.在該假設下,只要納什均衡存在,不需要任何的動態調整過程,只需博弈一次就可以直接達到納什均衡,這顯然不符合現實的市場.因此筆者進而引進了一個演化機制下的N 人擴展智豬博弈模型,該模型中假設行為主體是有限理性的,他們無法在博弈中瞬間獲得最優的結果,而是在博弈過程中不斷的修正和改進的,這是一個動態的調整過程.這與現實情況更符合.
1.3演化機制下的N人擴展智豬博弈
在演化博弈中,通常代理人需要按照一定的規則對他們的使用策略進行更換,采用“自我反省”的機制進行更換.所謂反省機制,即單輪博弈結束后,代理人可以獲悉此輪博弈中的合作代理人數,不合作代理人數,通過計算采取相反策略獲得的虛擬收益(PV)與實際收益(PR)的差別來決定下一輪博弈中采取何種策略:如果PR>PV,下一輪博弈中代理人不改變策略;若PR 在反省機制下,多人智豬博弈可分為4 種情況(n≠0時): 1) 大豬實際踩踏板: 2) 大豬實際不踩踏板: 3) 小豬實際踩踏板: 4) 小豬實際不踩踏板: 證明:令ΔP1=0,則 得證. 1.4模型仿真分析 圖1 智豬博弈關于p的演化Fig.1 Evolution of boxed pigs game on p 2帶有多人智豬博弈的羊群模型 考慮到實際的金融市場中經紀人的能力存在差異,如決策能力,判斷能力等,正如智豬博弈中的大豬與小豬的區別.在決策過程中,一個集團的經紀人,并不是所有人選擇跟隨,從而均采取相同的策略,經紀人相互間有一個博弈的過程,以判斷是否采取跟隨策略,因此提出了一個帶有智豬博弈的羊群模型.我們將集團中能力較強,擁有資源較多的經紀人視為大豬,將其余的經紀人視為小豬,因無法具體甄別個體與個體間的差別,因此隨機選出集團中40%的經紀人視為大豬.則此時集團間的博弈即多人智豬博弈.該模型包含了N個人的經紀人系統,經紀人的狀態用φl={0,+1,-1}表示(0表示等待,+1表示買入,-1表示賣出),其初始條件與EZ羊群模型相同.各經紀人在初始狀態下均處于等待狀態(φl=0,?l),此時各經紀人都是獨立的(每一個經紀人構成了一個集團).在接下來的某一時刻t: 1) 隨機選擇一個經紀人i. 2) 判斷經紀人i所在集團的規模是否大于1. (2) 若等于1:(a) 經紀人以概率p選擇交易,繼而隨機選擇擇φi取+1或-1,接著經紀人i依舊保持獨立狀態;(b) 經紀人i以概率(1-p)選擇等待,此時,隨機選擇i所在集團外的擇經紀人j,i與j所在的集團合并為更大的集團. 2.1仿真結果 為了更全面地考察帶有智豬博弈的羊群模型是否符合現實金融市場,我們用Matlab編程對其進行模擬. 在計算過程中,具體計算公式為 P(t+1)=P(t)est/λ R(t)=ln[P(t)]-ln[P(t-1)] 通過Matlab編程進行動態模擬,得到集團中經紀人規模的頻率分布,收益率分布及其規范化收益率分別如圖2~5所示. 圖2 參與交易的集團中經紀人規模的頻率分布圖Fig.2 Plot of distribution of size of agents in the cluster belonging to trade 圖3 收益率R分布示意圖Fig.3 Plot of distribution of return R 圖4 規范化收益率分布圖Fig.4 Plot of distribution of normalized return 圖5 規范化收益率stR頻率分布的雙對數圖Fig.5 Log-log plot of distribution of normalized return stR 如圖2~4所示,參與交易的集團中經紀人規模的頻率分布,收益率R分布,規范化收益率分布均呈現出尖峰胖尾現象,這與實際金融市場中的動力學特征相符合.由圖5可知:規范化收益率的概率呈冪次率分布,通過擬合,得到冪次率的斜率約為4.2,這符合真實的市場規律[12].這在一定程度上說明:帶有N人智豬博弈的羊群模型符合現實金融市場的程式化規律. 3結論 現實博弈中的參與者往往是多人,而不僅僅是兩個人,根據對現實情況的考慮,筆者對原始智豬博弈進行了一些修改,提出了一個帶有懲罰因子和反省機制的N人擴展智豬博弈,并對該模型進行了Matlab仿真.隨即針對現實金融市場中各經紀人的的能力存在差別(即進行大豬與小豬的區分),在集團做決策時并不是盲目地跟隨而是有選擇性地選擇跟隨,因此將N人智豬博弈與羊群模型相結合,提出了一個帶有N人智豬博弈的羊群模型,使得羊群模型更具有實際意義,并且對該模型進行了動態模擬,仿真結果表明:此模型符合現實金融市場的程式化規律. 參考文獻: [1]BALDWIN B A, MEESE G B. Social behavior in pigs studied by means of operant conditioning[J]. Animal behavior,1979,27(3):947-957. [2]RASMUSEN E. Games and information: an introduction to game theory[J]. Basil blackwell,1989,9(3):841-846. [3]蔣夢晴,姜殿玉.基于踏板時間的智豬博弈吃食量與Nash均衡集合研究[J].淮海工學院學報,2012,21(1):1-6. [4]吳航.智豬博弈與改進[J].商情,2014(7):79-79. [5]陳永宇.“智豬博弈”模型改進與團隊激勵策略研究[J].人才開發,2009(6):19-21. [6]鄧明然,吳艷.“智豬”博弈在中小企業模仿創新中的應用[J].文教資料,2006,25:189-190. [7]EGUILUZ V M, ZIMMERMANN M G. Transmission of information and herd behavior: an application to financial markets[J]. Physical review letters,2000,85:5659-5662. [8]ZHENG B, REN F, TRIMPER S, et al. A generalized dynamic herding model with feed-back interactions[J]. Physica a statistical mechanics & its applications,2004,343:653-661. [9]DONG L R. Interacting herding model: memory and oblivion[J]. Acta physica sinica,2006,55(8):4046-4050. [10]DONG L. Volatilities and desires of the agent clusters drive together markets[J]. Physica a statistical mechanics & its applications,2007,380(7):512-518. [11]余義龍,成丹丹,劉鴻鳴,等.具有長程記憶和市場判斷力的異質經紀人Herding模型[J].浙江工業大學學報,2011,39(2):231-236. [12]余義龍.金融市場中羊群行為的研究[D].杭州:浙江工業大學,2010. [13]KLEIN A C. Time-variations in herding behavior: evidence from a Markov switching SUR model[J].Journal of international financial markets, institutions and money,2013,26(2):291-304. [14]HUANG T C, LIN B H, YANG T H. Herd behavior and idiosyncratic volatility[J].Journal of business research,2015,68:763-770. [15]DEMIRER R, LEE H T, LIEN D. Does the stock market drive herd behavior in commodity futures markets?[J]. International review of financial analysis,2015,39:32-44. [16]周明華,陸川,俞偉,等.一個隨集團規模改變的集團部分分解羊群模型[J].浙江工業大學學報,2015,43(1):115-118. (責任編輯:陳石平) N-person boxed pigs game and its application in the herding model ZHOU Minghua,ZHENG Tingting,LU Chuan,SUN Changqi (College of Science, Zhejiang University of Technology, Hangzhou 310023, China) Abstract:In this paper, the penalty factors and reflection mechanism is introduced and an N-person Boxed Pigs model on the basis of the original Boxed Pigs is proposed. In fact, different agents in real financial markets may have different abilities. The article puts forward a model which is called herding model with the boxed pigs, combining the N-person Boxed Pigs model and the herding model. It gives the agents more choices while they make decisions. Finally, the model is simulated. The experiments show that the behaviors and characteristics of financial markets can be better reflected by the herding model with Boxed pig. Keywords:boxed pigs; herding model; penalty factor; reflection mechanism 收稿日期:2015-10-12 基金項目:浙江省自然科學基金資助項目(LQ16A010008) 作者簡介:周明華(1959—),男,浙江紹興人,教授,研究方向為金融數學,E-mail:mhzhou@zjut.edu.cn. 中圖分類號:F832.48 文獻標志碼:A 文章編號:1006-4303(2016)02-0231-06


























