姜羅羅, 汪秉宏
(1.溫州大學物理與電子信息工程學院,溫州 325035;2.中國科學技術大學近代物理系,合肥 230026;3.上海理工大學復雜系統科學研究中心,上海 200093)
復雜系統的研究具有天然的綜合性和交叉性,既包括了物理學、生物學等自然科學學科,也包括了經濟學、社會學等社會科學學科.統計物理為理解復雜系統中大量個體的集體行為提供了一些重要的概念和方法.在這些紛呈復雜的集體行為中,大量個體間的合作行為尤為引人矚目.合作行為廣泛存在于人類社會和動物世界,從單細胞的微生物到高級哺乳動物,從社會性昆蟲到人類社會.個體為維持整體利益而付出部分自身代價的利他行為被稱為合作;反之,個體為尋求自身利益的最大化而導致整體利益受損的行為被稱為背叛.眾所周知,合作是人類文明進步的基石.然而,根據達爾文的自然選擇法則,自然界的生物個體趨向于采取能夠最大化自身利益的背叛策略[1],這種背叛策略將導致整體利益受損.當體系中所有個體都選擇背叛策略時,整體利益和個體利益都會受到最大程度的損害,這顯然不能解釋處處可見的合作行為.因此,理解合作行為成為復雜系統中最根本也是最具挑戰性的課題之一[2].一些重要的問題就很自然地呈現在人們面前:自私個體間合作行為是如何自發涌現的;合作怎樣演化;大量個體形成怎么樣的空間自組織斑圖等.
最近幾年來,應用統計物理的概念和方法,人們在復雜系統研究領域內取得了令人矚目的成就[3].對于復雜系統中合作與競爭現象的研究,人們通過對大量個體間的合作行為進行定量統計,研究其中所隱藏的統計性規律,并根據所研究的問題,提出基本假設,建立理論模型,來探索這些規律的產生機制和可能的動力學影響.基于這種統計物理的研究方法,一些重要的合作機制被發現,如群體選擇(group selection)、親緣選擇(kin selection)、直接/間接互惠(direct/indirect reciprocity)、聲望(reputation)、懲罰(punishment)等[4-6].特別是從2008年以來,僅在《Nature》、《Science》、《PNAS》、《PRL》等強影響因子期刊上就已經發表了10余篇文章[7-20].這些發現引發了人們從統計物理的角度進一步探索復雜系統中大量個體的合作演化及其自組織斑圖.
von Neumann和Morgenstern在1944年出版的《博弈論和經濟行為》一書為經典博弈論奠定了理論基礎.他們提出了合作博弈,其基本思想就是指博弈雙方的利益都有所增加,或者是一方得到的利益等于另一方失去的利益[21].合作博弈廣泛存在于現實生活中,如簽訂勞動合同、商業契約等.我國古代的“田忌賽馬”就是一個合作博弈的例子.《史記》記載,戰國時期齊國大將田忌與齊國貴族賽馬,設重金賭注.田忌聽從兵法家孫臏的建議用下等馬與貴族的上等馬,上等馬與貴族的中等馬,中等馬與貴族的下等馬比賽.結果兩勝一負,贏得重金.從博弈的角度看,在賽馬中,田忌和貴族們商定3次賽馬中贏的次數多的人獲得賭金.在這個前提下,各人利用自己的馬匹和策略進行比賽,結果田忌贏得的金錢等于貴族們失去的金錢.隨后,Nash于20世紀50年代提出了非合作博弈,特別是Nash均衡的提出,使得經典博弈論有了非常優美的數學形式,并被廣泛地應用于經濟學領域.合作博弈強調群體理性(group rationality),就是從群體的角度考慮策略的選擇,使得整體收益最大.所以合作博弈研究的是參與者在達成合作時如何分配合作得到的收益,即收益分配問題.而非合作博弈強調個體理性(individual rationality),就是從個體的角度考慮策略選擇,使得個體收益最大.所以非合作博弈研究的是參與者在利益相互影響的情況下如何選擇策略使自己的收益最大,即策略選擇問題.在日常生活中,非合作博弈比合作博弈更為普遍,如價格戰、軍備競賽、污染、貿易壁壘等.
盡管經典博弈論被廣泛地應用于經濟、政治等領域,但其在生態博弈中的不足之處是非常明顯的.按照經典博弈論,生態系統中,雄性個體間爭奪配偶的競爭將是以生命為代價的,因為它們被假定為超理性的,它們的策略不會更改.但現實中種群個體爭奪配偶往往不會出現這種慘烈的情景.1973年,Smith等[22]提出了演化博弈,指出動物種群間的有限代價競爭能夠促進物種整體的適應性.從此,演化博弈被廣泛地用于研究各式各樣的合作現象.本文將首先簡要介紹社會復雜系統和生態復雜系統中演化博弈的模型,包括囚徒困境博弈、鏟雪堆博弈、公共品博弈和石頭-剪刀-布博弈.
囚徒困境博弈和鏟雪堆博弈演化動力學可以通過以下的收益矩陣進行刻畫.

這里的矩陣元代表行方向上博弈參與者的收益,C表示合作者,D表示背叛者.兩個合作者進行博弈后,兩者均獲得“獎勵(reward)收益R”;兩個背叛者進行博弈后,兩者均獲得“懲罰(punishment)收益P”;當合作者與背叛者進行博弈后,背叛者獲得“誘惑(temptation)收益T”,而合作者則獲得“被騙(sucker)收益S”.囚徒困境博弈與鏟雪堆博弈的根本差別在于這些收益矩陣元大小的順序不同.對于囚徒困境博弈,收益矩陣元的順序為:T>R>P>S;而對于鏟雪堆博弈,收益矩陣元的順序為:T>R>S>P.
假設有N個個體構成的體系擁有一個公共基金,每一個體可以選擇投一個單位的貨幣量進入公共基金(合作),也可以選擇不投資(背叛).如果有a個合作者,公共基金將在投資的基礎上以r的倍數增值,即a·r個單位的貨幣.所得的貨幣由N個人平均分配.合作者之前付出了一個單位貨幣的投資,所以合作者獲得的收益為(a·r/N)-1;而背叛者的收益為a·r/N.顯然選擇背叛策略的個體獲得比合作更多的收益.但如果都選擇背叛的話,大家的收益都為0.
石頭-剪刀-布博弈是非常簡單的博弈形式,即3種策略循環抑制,其收益矩陣形式可以寫為

1996年,美國加利福尼亞大學的行為遺傳學家Sinervo和Lively首次發現真實生態系統中的石頭-剪刀-布博弈[23].生活在美國加利福尼亞的雄性側邊斑點蜥蜴(side-blotched lizard)的喉部呈現出黃、橙、藍3種不同的顏色,并且喉部不同顏色的雄性側邊斑點蜥蜴表現出不同的行為.黃喉雄性側邊斑點蜥蜴較為柔弱,行蹤詭秘,在與其它亞種蜥蜴爭奪配偶的競爭中扮演偷情者的角色;橙喉雄性側邊斑點蜥蜴較為生猛好斗,占據較大的領地,擁有為數眾多的雌性配偶,奉行一夫多妻制;藍喉雄性側邊斑點蜥蜴的武力介于其它兩個亞種蜥蜴之間,同伴間相互合作捍衛自己的領地和雌性配偶,奉行一夫一妻制.在這個循環博弈中(見圖1),橙喉雄性側邊斑點蜥蜴武力爭奪藍喉雄性側邊斑點蜥蜴的雌性配偶(石頭抑制剪刀);藍喉雄性側邊斑點蜥蜴武力捍衛自己的雌性配偶不受黃喉雄性側邊斑點蜥蜴襲擾(剪刀抑制布);由于橙喉雄性側邊斑點蜥蜴領地太大,顧此失彼,黃喉雄性側邊斑點蜥蜴得以偷偷摸摸地溜到沒有設防的領地,找到雌蜥蜴成功交配(布抑制石頭).這種雄性個體間繁殖策略的石頭-剪刀-布博弈直接導致了各亞種的種群數量呈現周期振蕩.Sinervo等發現,各亞種的種群數量在1990~1995年6年間呈現周期振蕩.當藍喉雄性側邊斑點蜥蜴的數量占據優勢時,橙喉雄性側邊斑點蜥蜴的數量增加,從而抑制藍喉雄性側邊斑點蜥蜴繼續占據優勢;隨后橙喉雄性側邊斑點蜥蜴占據優勢,黃喉雄性側邊斑點蜥蜴的數量增加,從而抑制橙喉雄性側邊斑點蜥蜴繼續占據優勢;緊接著黃喉雄性側邊斑點蜥蜴占據優勢,藍喉雄性側邊斑點蜥蜴數量增加,抑制黃喉雄性側邊斑點蜥蜴繼續占據優勢.如此往復,三亞種雄性蜥蜴互相制約,輪流居于優勢地位,從而使蜥蜴總體數量上不會繁殖過快.盡管利他主義行為可能會損害某一只參加戰斗的藍喉雄性蜥蜴自身的繁殖機會,但是它卻成全了其它藍喉雄性蜥蜴與雌性交配,從而保護了它們的基因在下一代個體中能夠繼續存在[24].生態系統中石頭-剪刀-布博弈的另一個經典范例是大腸桿菌3個亞種之間的循環制約競爭食物資源[25].

圖1 三亞種雄性側邊斑點蜥蜴繁殖策略的石頭-剪刀-布博弈示意圖Fig.1 The rock-paper-scissors game in competitive reproduce strategies among three subspecies of Inner Coast Ranges lizards
在演化博弈中個體如何更新自己的策略,是一個非常重要的研究內容.為了研究沒有權威干預下的自私個體在什么條件下會合作,Axelrod[26]設計了以下收益矩陣的重復囚徒困境博弈.在兩人進行博弈時,如果兩人都選擇合作策略,那么雙方的收益都為3;如果兩人都選擇背叛策略,那么雙方的收益均為1;如果一人選擇合作而另一人選擇背叛,那么選擇合作策略的人收益為0,而選擇背叛策略的人收益為5.Axelrod邀請其他科學家一起參加這個比賽,要求參加比賽的科學家把自己如何選擇策略的想法編寫成計算機程序,然后用單循環賽的方式將參賽程序兩兩博弈,以找出得分最高的策略選擇規則.在博弈過程中,收益矩陣都是相同的,重復博弈的次數未知.第一輪比賽征集到了14個程序,每個程序運行300次.最終,加拿大學者Rapoport編寫的“針鋒相對(tit for tat,TFT)”策略選擇規則獲勝.“針鋒相對”規則很簡單,即第一次博弈選擇合作策略之后選擇對手上一次的策略.Axelrod等檢查了程序運行結果后發現,“針鋒相對”規則能夠促進合作的產生.因為這個規則具有善良(niceness)、報復(retaliation)、寬容(forgiveness)以及清晰(clarity)的特點[26-27].個體一開始就選擇合作,就是善良的體現,保持了合作的積極性,使得自身獲得利益的同時也給對方利益.報復就是如果對手上一次選擇背叛,那么下一次個體也會選擇背叛,讓對手明白是對方先錯而付出的代價.寬容則有助于在對方背叛后重新開始合作,而簡單清晰的規則易于被人理解,有利于長期合作.在兩人靜態囚徒困境中,使用“針鋒相對”規則的個體其收益不可能超過對方,最多打個平手,但它的總收益最高.它賴以生存的基礎是很牢固的,因為它讓對方獲得高收益.
在一個動態進化的群體中,這種合作能否產生、發展、生存下去;群體向合作的方向進化,還是向背叛的方向進化;如果大家開始都不合作,能否在進化過程中產生合作,對于這些疑問,Axelrod用生態學的原理來分析合作的進化過程.假設參與者所組成的策略選擇規則是一代一代進化下去,進化的規則包括:第一,試錯.人們在對待周圍新環境時,起初不知道該怎么做,嘗試不同的策略.第二,遺傳.一個人如果合作性好,他后代的合作基因就多.第三,學習.在博弈過程中個體相互學習收益高的策略選擇規則.如果“針鋒相對”的策略選擇規則收益高,那么就越多采取這種策略選擇規則.按這樣的思路,Axelrod設計了一個計算機實驗,假設63個參與者中,誰在第一輪中的得分高,其在第二輪的群體中所占比例就越高,這就是該個體的適應性(fitness).這樣,群體的結構就會在進化過程中改變,最終達到穩定.實驗結果非常有趣,“針鋒相對”起初在群體中僅占1/63,經過1 000代的進化結構穩定下來后,它占了24%[27].
Axelrod一方面揭示了“針鋒相對”規則能夠促使合作策略占據優勢并穩定下來;另一方面,個體通過學習更新自己策略的思想使得人們更清晰地認識到合作機制研究的重要性,進一步激發了人們探索合作產生根源的激情.在真實世界中,個體并不能確定每一次跟同一個體進行博弈,同一時刻也可以同其他個體進行博弈,而且在真實世界中個體間的連接具有空間.因此,這樣個體的策略選擇需要考慮更多因素,譬如空間效應.無論在生態復雜系統中還是在社會復雜系統中,自私個體間的相互作用都使得體系出現自組織斑圖,如合作團簇、螺旋波以及靶波.
Nowak和May在1992年提出了忽略個體策略歷史的囚徒困境博弈[28].個體分布在二維空間正方格子上,格點即代表個體,每一個體都有4個最近鄰.每一輪博弈中,個體與最近鄰進行囚徒困境博弈,并把該輪4次博弈所得的收益相加作為總收益.在下一輪博弈之前,個體對自己的總收益和近鄰中最高總收益比較,如果近鄰的最高總收益比自己的總收益大,那么個體的策略就跟隨總收益最高的個體;若自己的總收益最高,則不改變自己的策略.這樣N個參與者在二維空間規則正方格點上進行博弈.不失一般性,收益矩陣取為R=1,T=b(b>1),S=P=0.也就是說,兩個合作者博弈時其收益均為1;合作者遇見背叛者時,合作者收益為0,背叛者收益為b;兩個背叛者博弈時其收益均為0.這個模型只有一個參數b,用于刻畫背叛者對合作者的優勢.在N=L×L(L>20)無流邊界的正方規則格子中,初始狀態為合作者和背叛者隨機分布.通過計算機模擬,Nowak和May發現,當b>1.8時,2×2或者更大的背叛者簇能夠繼續增大;而當b<1.8時,2×2或者更大的背叛者簇會減小.反之,當b<2.0時,2×2或者更大的合作者簇能夠繼續增大;而當b>2.0時,2×2或者更大的合作者簇會減小.在2.0>b>1.8的時候出現非常有趣的現象:合作者簇可以在被背叛者包圍的情況下繼續增長,而背叛者簇也能在被合作者包圍的情況下繼續增長.在這種情況下,由于合作簇和背叛簇的相互競爭,體系呈現出非常復雜的空間斑圖,并且合作者所占比率最終在0.318附近.取中心有一個背叛者,其余均為合作者的情況為初始狀態,體系呈現出具有對稱結構的自組織斑圖.圖2(見下頁)展示了這些空間斑圖隨時間t演化的情況,體系大小為99×99,無流邊界條件,1.8<b<2.0.藍色代表合作者堅持合作策略,紅色代表背叛者堅持背叛策略,黃色代表合作者轉變為背叛者,綠色代表背叛者轉變為合作者.這些斑圖都具有分形結構,隨時間動態變化.在囚徒困境博弈中,由于個體僅限于與局域的近鄰進行博弈,空間分布有利于合作.然而,這一結論并不對鏟雪堆博弈有效[29].Hauert和Doebeli研究了具有空間結構和完全均勻混合(well-mixed)體系的鏟雪堆博弈,發現當合作的付出-回報因子比較小的時候,空間效應有利于合作,即合作比率大于相同參數時完全均勻混合的合作比率;而當回報因子比較大的時候,空間效應抑制合作,即合作比率小于相同參數時完全均勻混合的合作比率.

圖2 囚徒困境博弈中隨時間演化的空間自組織斑圖Fig.2 Evolution of spatial self-organized patterns in prisoners’dilemma games
基于Nowak等的工作,作者研究了空間囚徒困境博弈財富的不均勻性對合作的影響[30].個體分布在二維正方格點上,可以采取兩個策略中的一種:合作(C)或者背叛(D).個體進行空間囚徒困境博弈的收益矩陣元仍為:R=1,T=b(b>1),S=P=0.個體i進行博弈獲得收益Q后,其財富為Wi=Qα,Wj表示個體j的財富.此時,α因子代表著對收益的調控,如稅收等.極端的例子為α=0,即所有個體最終的財富均為1.α=1時個體的收益沒有被調控,α?1則會出現貧富差距加大.進行策略更新的概率為

式中,K為噪音.
研究發現適當的α值能夠促進合作,太大或者太小的α值都不利于合作.圖3展示了α在較小值、中間值和較大值時,體系達到穩定狀態時所呈現的自組織斑圖.圖中,L=100,b=1.01,綠色(淡色)代表合作者,藍色(深色)代表背叛者.顯然,合作者并不是孤立的分布,而是形成團簇.當收益沒有被調節或調節太大時,即α=1.0和α=0.3(α為對收益的調控因子),體系中只有少量的合作者團簇;當α=0.5時,體系中出現很多合作者團簇,使得合作得以明顯地促進.作者也研究了最大合作者簇的大小和合作者簇的平均大小隨α的變化.盡管α太大或者太小時合作者簇消失,合作者簇的數目在很大范圍內沒有明顯變化;然而,最大合作者簇的大小和合作者簇的平均大小隨α變化非常明顯,在α=0.5附近達到最大值.

圖3 穩定狀態時體系在不同α時的自組織斑圖快照Fig.3 Typical snapshots of self-organized patterns at different values ofα
采用周期邊界條件的二維規則正方格點代表參與博弈的個體,每一個體有4個近鄰,共有N=L× L格點.每個格點被一個體或空位占據.空格代表空間資源可供個體遷移[31].空格密度d0定義為空位在所有格點中所占比率,那么人口密度則為(1-d0).采用隨機方式異步更新個體策略狀態的方法,每一次操作包含兩個步驟:遷移和策略更新.在每一時間步內,平均所有個體都進行一次操作.隨機選擇一個體,計算其近鄰中背叛者的數目nD用于確定其是否進行遷移.如果該個體近鄰中有空位,該個體則以nD/4的概率向其近鄰的空位遷移.如果該個體的近鄰有多個空位,則隨機選擇一個空位遷移.若所有近鄰都是空位,該個體將沒有博弈的收益,則任意選擇一個空位遷移,以期獲得可能的博弈收益.遷移之后,個體以1-θ的概率學習其近鄰中收益最高個體的策略.但如果其自身收益比其收益最高個體還高,則不學習,以θ(θ?1)概率隨機重新設置自己的策略.在這里θ扮演著噪聲的作用,由環境噪聲或者作決定時的不確定因素引起.值得注意的是,在策略更新中,受噪聲影響和向更高收益個體學習是兩個排他的過程,即個體以1-θ的概率學習而以θ的概率重新設置自己的策略.
自適應遷移能否使合作簇有效地抵御少數背叛者的入侵.為了回答這個問題,作者研究了特殊初始條件下的斑圖演化.在這種特殊的初始條件中,一個包含大多數人口的合作簇中有極少量的背叛者.為了更好地評估自適應遷移的有效性,還對比了隨機遷移的情況,如圖4(a)(見下頁)所示.在隨機遷移的情況下,背叛者可以從合作簇的內部瓦解合作者之間的聯系,而且隨機遷移的合作者也不利于合作簇的形成.最終,背叛者占據整個系統.相反,對于自適應遷移,如圖4(b)(見下頁)所示,背叛者的數量僅僅是在剛開始的時候有所增加,但最終合作者把背叛者從合作簇中驅趕出去.在演化過程中,起初合作簇受到背叛者的沖擊,合作簇被分割成小塊;隨后,由于個體遷移,合作者和背叛者被越來越多的空位隔離,背叛者從近鄰中獲得的收益也隨之減少,所以背叛者變得不穩定;最終合作者占據絕對優勢.對比圖4(a)和4(b),可以得出這樣的結論:自適應遷移能夠促進合作,而隨機遷移則有利于背叛.
圖4(c)和圖4(d)(見下頁)解釋了為何空位密度可以極大地影響體系的合作頻率.特別地,在圖4(c)中,背叛者的增加使得合作簇更加緊湊.但由于有限的空位,在大合作簇中的合作者難以遷移,所以沒有足夠的空位把背叛者和合作者隔離開來.盡管合作簇仍然能夠抵御背叛者的入侵,但是,背叛者可以通過與其近鄰的合作進行博弈而獲得較高的收益.這樣背叛者與合作者的收益就旗鼓相當,從而阻止了合作簇的進一步擴張.另一方面,當體系中有很多空位的時候,如圖4(d)所示,合作者有很多可能的空位可以選擇來遷移,這樣合作者之間都很難接到,也就難以形成大的合作團簇.所以,大的空位密度抑制合作,而有利于背叛.
生物多樣性是生態學的最核心問題之一.從真實生態系統中提煉出來的石頭-剪刀-布博弈為研究生物多樣性提供了一個非常重要的平臺.假設一個體系中有A,B,C三物種,這3個物種形成相互循環捕食的生態鏈,這也類似于三物種循環捕食的Lotka-Volterra模型.當各物種間的相互作用(反應速率)是相同的時候,可以寫出物種個體間博弈的收益矩陣.當系統演化達到平衡狀態后,如果三物種仍然能夠共存,那么就說明生物多樣性得到了維持;反之,如果某一物種消失,那么說明生物多樣性被破壞了.Reichenbach等研究了完全均勻混合(wellmixed)情況下A,B,C三物種進行石頭-剪刀-布博弈的演化情況.他們發現,在三物種等量均勻分布的初始狀態下,依據確定性的平均場方法物種不會出現滅絕,而隨機過程的數值模擬得到的結果卻是會出現物種滅絕.在石頭-剪刀-布博弈中,相互循環抑制是維持物種多樣性的重要機制.物種多樣性的維持除了受噪聲的漲落影響外,還受物種個體空間分布的影響.這種物種個體的分布,特別是自組織結構,對物種多樣性的影響有待于進一步研究[32].
受大腸桿菌和阿米巴蟲cAMP周期調制實驗的啟發,作者研究了受周期調制的石頭-剪刀-布博弈中的自組織斑圖結構,以揭示其特征和形成的原因[33].周期節律是體系中局部不均勻引起的,具有固定的頻率.研究發現,這種局部的周期驅動可以使得全局出現非常規則的自組織結構——靶波.根據局部驅動頻率與全局靶波率的關系,靶波的形成有3種模式:a.局部驅動頻率與全局靶波頻率同步;b.局部驅動頻率與全局靶波頻率間歇同步;c.局部驅動頻率遠大于全局靶波頻率.研究表明可以通過調節驅動頻率對斑圖進行控制,同時也揭示了循環競爭物種間形成斑圖選擇的部分規律.
與Reichenbach[32]等的工作一樣,作者也是在石頭-剪刀-布博弈的框架下研究三物種的循環競爭.L×L的規則格子代表移動個體或空格.這些移動個體屬于三物種中某一物種,三物種分別表示為A,B,C.空格則代表個體繁殖下一代所需的空間資源,表示為?,⊙表示任意物種或空格.個體間(或個體與空格)發生3個可能的過程:捕食、繁殖、遷移.捕食——物種A的個體以速率1捕食物種B的個體,那么B個體所在的位置就變為空格;同樣方式,物種B的個體以速率1捕食物種C的個體;物種C的個體以速率1捕食物種A的個體.繁殖——個體以速率1在近鄰的空格上產生一個后代.遷移——相鄰的兩個體或空格以速率γ交換位置.只有近鄰間的個體(空格)才能發生這些相互作用的過程,并且可以用以下的反應式表達.

圖4 不同空位密度情況下囚徒困境博弈中的空間斑圖演化Fig.4 Evolution of spatial patterns for different values of vacation density in prisoners’dilemma games注:L×L=50×50.綠色(淡色)代表合作者;藍色(深色)代表背叛者;白色代表空位.t表示系統演化的時間.

根據隨機行走理論,個體的移動可以通過交換位置的速率進行定義,M=2γ/L2,表示移動個體在單位時間內走過的面積.與確定性過程不同,引入隨機演化算法.在確定性算法下,演化時間被認為是連續的,系統不存在漲落(fluctuation).在隨機算法中,瞬時過程類似于隨機行走,系統存在漲落.常用的隨機算法由Gillespie在1976年提出.該數值算法最初用于計算化學反應方程式,認為在分子間是隨機發生化學反應的.在作者的數值算法中,捕食和繁殖均以1/(γ+2)的概率發生,而遷移(交換位置)則以γ/(γ+2)的概率發生.如果不考慮個體的分布不具有空間結構,而認為是完全均勻混合的(well-mixed),那么體系可以用偏微分方程組描述.以下的結果是在L×L規則正方格子上,無流邊界,Gillespie隨機算法,通過Monte Carlo數值模擬獲得的.在每一Monte Carlo時間步內,首先隨機選擇一個體,然后隨機選擇其4個近鄰中的一個體(空格),根據Gillespie算法確定是否發生捕食、繁殖、遷移或者什么也不發生.一個Monte Carlo時間步由N=L2這樣的操作組成,平均每個格點都一次被隨機選到.
在石頭-剪刀-布博弈中引入局部不均勻的周期節律,通過在注入區周期注入三物種的個體,在小區域就形成一個周期節律對整個體系進行驅動.周期節律定義如下:在時刻t=0,注入區域被A物種的個體所占據;在時刻t=T0(T0表示注入物種的時間)注入區域被B物種的個體所占據;在時刻t=2T0,注入區域被C物種的個體所占據;在時刻t=3T0,注入區域又被A物種的個體所占據;如此往復,注入周期T=3T0.在n T0<t<m T0時間間隔內,其中m=n+1(m和n為大于0的自然數),注入區的個體仍然由Monte Carlo數值模擬更新.作者研究了不同的M和T0值的情況下系統的自組織結構.值得注意的是,當沒有周期驅動的時候,模型得到的結果與Reichenbac等人的結果是一致的,即在遷移率M小于臨界值時,物種多樣性能夠得到維持;而M大于臨界值時,物種多樣性被破壞.
如圖5(a)所示,在參數M=10-4(M=2γ/L2表征個體的遷移快慢),T0=150和L=500下,隨機的初始狀態在周期節律的驅動下,逐漸被高度有序的靶波所代替(t=600T0).圖中,黃色、紅色和藍色分別代表物種A,B和C;灰色代表空格.在演化過程中,t=T0時,位于體系中心的注入區開始注入物種A;t=2T0時,注入物種B;t=3T0,注入物種C;t=4T0,注入物種A;如此往復,注入區開始出現靶波.當t=200T0時,注入區的靶波開始向外擴大,但由于外圍仍然是三物種的個體比較無序的分布靶波被約束在很小的范圍內.當t=400T0時,靶波進一步擴大,最終在t=600T0時,靶波占據整個空間.從圖5(b)中靶波形成的時空斑圖,可以獲得靶波形成的清晰圖景.為了清晰起見,t1≤t≤t2是不連續的,t1和t2分別對應于33T0和466T0.在t<t1時間內,時空斑圖比較紊亂,表明這一時期體系還沒有出現規則的自組織結構;在t1≤t<t2時間內,中心區域的規則自組織結構開始向外擴大;當t≥t2,體系出現非常規則的自組織機構,這種結構隨著時間演化,由里到外傳播.當體系出現靶波之后,三物種所占比率隨時間的變化呈現周期振蕩,如圖5(a)所示.與此同時,注入區三物種所占比率隨時間變化也呈現周期振蕩.這一周期振蕩的頻率與周期節律的頻率相同.圖5(b)是在靶波占據整個體系后物種A在整個體系(全局)和注入區(局部)所占比率隨時間的振蕩圖.研究發現,靶波占據整個體系后,物種A的全局振蕩與局部振蕩同步,其它物種所占比率也有同樣的結果.

圖5 靶波的涌現過程Fig.5 Emerging of target waves
物種多樣性和生物個體的空間分布是生態體系的兩個主要特征.最近,種群的空間分布不均勻受到越來越多的關注,因為它與物種演化的穩定性和多物種共存有著密切聯系.兩個重要的因素影響著生態體系的生物多樣性和物種的空間分布.第一個因素是物種間的捕食強度(相互作用強度).在生物鏈中,不同物種具有不同捕食強度.Huntley和Kowaleski研究了海洋動物顯生宙地質年代的化石記錄,發現捕食(競爭)強度與生物多樣性具有強關聯.最近的理論研究也聚焦于不同競爭強度的情況下,從物種多樣性向物種單一性轉化的相變是如何發生的,以及物種個體的空間自組織結構如何演化的問題.第二個因素是噪聲.噪聲能夠影響物種個體空間自組織結構的形成,進而影響物種多樣性的維持.為了研究競爭強度對物種多樣性和自組織斑圖的影響[34],作者修改了此前的反應式:個體以p/(p+q+γ)的概率競爭,以q/(p+q+γ)的概率繁殖,以γ/(p+q+γ)的概率遷移,p、q、γ分別代表發生競爭、繁殖和遷移的速率,如式(4)~(6)所示.

除了以上的隨機方法外,基于擴散的偏微分方程也可以描繪以上過程.

式中,ρ0表示空位所占比率,D表示擴散系數,z和t分別表示個體所處的位置和演化時間.
圖6展示了不同競爭強度p值的情況下體系演化到穩定狀態后的自組織斑圖.圖6(a)為隨機方法模擬所得,圖6(b)為解偏微分方程所得.當p=0.1和1.0時體系出現全局有序的螺旋波;而當p=10.0時全局有序螺旋波破碎成無序的小螺旋波.可以通過觀察螺旋波的波長變化獲得更深入的理解.螺旋波波長被定義為:λ=X/L,其中X表示兩相同物種形成的波的前直線距離(見圖6).通過大量數值模擬發現,螺旋波的波長隨著p的增大而減小,同時螺旋波的邊緣變得越來越粗糙,這兩個因素最終導致了p較大時螺旋波破碎.當p>pc時,全局有序的螺旋波破碎成為無序的小螺旋波.有趣的是,在生態系統中的石頭-剪刀-布博弈中,空間拓撲結構和物種間的疾病傳播也對物種多樣性和空間斑圖有較大影響[35-38].

圖6 不同競爭強度值下的空間斑圖快照Fig.6 Typical spatial patterns emerging for different competition rates
由于人類處于復雜的人際關系中,僅僅通過空間斑圖來理解合作行為是不夠的,人際關系可以用復雜網絡加以描述.網絡結構對合作行為的影響,在復雜網絡方面,人們在小世界網絡和異質網絡上進行了深入研究,發現網絡的拓撲結構極大地影響著系統中個體間的合作程度.蘭州大學的吳枝喜和汪映海等研究了NW(Newman-Watts)小世界網絡上的囚徒困境博弈[39],發現個體在小世界效應的驅動下更傾向于參與博弈.浙江大學鄭大昉和鄭波發現小世界網絡上適當地隨機斷邊重連可以促進合作[40].中科大的任杰和汪秉宏等利用在小世界網絡上交叉換邊的方法,發現適當地隨機換邊能夠促進囚徒困境博弈中的合作[41].北京大學的陳小杰和王龍基于學習理論發現適當的收益期望能夠促進小世界網絡上的合作[42].蘭州大學的陳勇等發現在兩個耦合的NW小世界網絡中合作呈現出不同的同步行為[43].南昌航空大學的邱天等研究了有向小世界網絡上的合作現象[44].吳枝喜和汪映海等則比較了隨機網絡、規則網絡和無標度網絡上的合作演化情況,發現無標度網絡相對于其它兩種類型的網絡更有利于合作[45].北京大學的伏鋒和王龍等研究了可以調節異質性的小世界網絡,發現適當異質的網絡拓撲結構能夠促進合作[46].陳小杰和王龍等則進一步研究了異質的無標度網絡上不同初始狀態對合作演化的影響,當初始狀態中合作者占據度大的節點時,最終背叛者趨于消失[47].復旦大學的李翔和周水根等發現無標度網絡和具有團簇結構的網絡均能夠促進合作[48].上海交大的榮智海和汪小帆等發現網絡中心節點間的連接能抑制合作,而非中心節點與中心節點間的連接能夠促進合作[49].中科大的杜文博等發現加權無標度網絡上的邊權對合作具有較大影響[50].中科大汪秉宏研究組的王文旭、楊涵新、張海峰、史冬梅、劉潤然和賈春曉也對復雜網絡上合作演化動力學進行了深入研究[51-56].
與此同時,網絡拓撲結構與博弈動力學共同演化也是人們關注的熱點.北師大的李偉和胡崗發現當個體在博弈過程中連接局域收益最高的個體,能夠讓整個體系的拓撲結構呈現出自組織的無標度特性[57].北京大學的伏鋒等發現個體選擇學習對象以及博弈對象都對合作有較大影響[58-61].蘭州大學汪映海、吳枝喜、黃子罡和關劍月等發現博弈動力學和偏好選擇共同演化有利于合作[62-63].南京航空航天大學朱陳平等基于競爭個體形成無標度拓撲結構[64].廈門大學的楊冬平和帥建偉等研究了網絡結構與博弈演化動力學共同演化機制,發現合作者的核心團簇對合作起關鍵的促進作用[65].
盡管網絡結構和博弈動力學有了比較深入的探索,合作的穩定性仍然沒有得到很好的理解.在具有平均度為4以及冪指數為-3的冪率度分布無標度網絡中,基于公共品博弈理論,作者研究了合作在系統的連邊受到攻擊時的穩定性[66].在博弈動力學開始之前,先刪除mL條與最大度節點相連的邊.根據Albert等的工作,這種刪除邊的方式對應于網絡受到攻擊的情形.作者感興趣的是刪邊數目如何影響合作的穩定性.在通常的網絡動力學中,節點或者連邊的毀壞將導致功能的級聯失效.有趣的是,在公共品博弈動力學中,合作頻率ρc先隨刪邊數目的增加而減少,隨后又隨著刪邊數目的增加而增加[66].圖7(a)(見下頁)展示了在不同刪邊數目情況下體系中合作頻率隨收益增值因子r的變化情況,對于相同的r值合作頻率在mL=0時具有最大值.從圖7(b)(見下頁)中可以更清晰地發現合作頻率在r=1.8和r=2.0時先隨mL增大而減少,然后隨mL增大而增大.可見網絡拓撲結構的毀壞導致合作的不穩定.

圖7 合作頻率隨增值因子及不同隨刪除邊數目的變化Fig.7 Fraction of cooperators varies with the multipli-cation factor and the number of deleted links
對于合作現象的研究,一方面合作機制仍在進一步的探索中;另一方面,一部分學者開始關注合作行為的傳播及其穩定性.研究合作行為的傳播,能夠更深層次地理解合作機制.特別是目前發現的群體選擇、親緣選擇、聲望、懲罰以及空間效應等合作機制中究竟何種合作機制起主要作用并不清楚.研究合作傳播及其穩定性能夠定量衡量各種機制對合作的促進作用.
[1] Dugatkin L A.Cooperation among animals[M].New York:Oxford University Press,1997.
[2] Nowak M A.Evolutionary dynamics:exploring the equations of life[M].Harvard:Harvard University Press,2006.
[3] Castellano C,Fortunato S,Loreto V.Statistical physics of social dynamics[J].Rev Mod Phys,2009,81(2):591-646.
[4] SzabóG,Fáth G.Evolutionary games on graphs[J].Phys Rep,2007,446(4/5/6):97-216.
[5] Nowak M A,Sigmund K.Evolution of indirect reciprocity[J].Nature,2005,437(7063):1291-1298.
[6] Nowak M A.Five rules for the evolution of cooperation[J].Science,2006,314(5805):1560-1563.
[7] Santos F C,Santos M D,Pacheco J M.Social diversity promotes the emergence of cooperation in public goods games[J].Nature,2008,454(7201):213-216.
[8] King-Casas B,Sharp C,Lomax-Bream L,et al.The rupture and repair of cooperation in borderline personality disorder[J].Science,2008,321(5890):806-810.
[9] Cesarini D,Dawes C T,Fowler J H,et al.Heritability of cooperative behavior in the trust game[J].PNAS,2008,105(10):3721-3726.
[10] Reichenbach T,Frey E.Instability of spatial patterns and its ambiguous impact on species diversity[J].Phys Rev Lett,2008,101(5):058102.
[11] Clutton-Brock T.Cooperation between non-kin in animal societies[J].Nature,2009,462(7269):51-57.
[12] Rand D G,Dreber A,Ellingsen T,et al.Positive interactions promote public cooperation[J].Science,2009,325(5945):1272-1275.
[13] Helbing D,Yu W J.The outbreak of cooperation among success-driven individuals under noisy conditions[J].PNAS,2009,106(10):3680-3685.
[14] Wu J J,Zhang B Y,Zhou Z X,et al.Costly punishment does not always increase cooperation[J].PNAS,2009,106(41):17448-17451.
[15] Hamilton M J,Burger O,DeLong J P,et al.Population stability,cooperation,and the invasibility of the human species[J].PNAS,2009,106(30):12255-12260.
[16] Traulsen A,Hauert C,De Silva H,et al.Exploration dynamics in evolutionary games[J].PNAS,2009,106(3):709-712.
[17] Galla T.Intrinsic noise in game dynamical learning[J].Phys Rev Lett,2009,103(19):198702.
[18] Segbroeck S V,Santos F C,Lenaerts T,et al.Reacting differently to adverse ties promotes cooperation in social networks[J].Phys Rev Lett,2009,102(5):058105.
[19] Traulsen A,Semmann D,Sommerfeld R D,et al.Human strategy updating in evolutionary games[J].PNAS,2010,107(7):2962-2966.
[20] Kümmerli R,Burton-Chellew M N,Ross-Gillespie A,et al.Resistance to extreme strategies,rather than prosocial preferences,can explain human cooperation in public goods games[J].PNAS,2010,107(22):10125-10130.
[21] von Neumann J,Morgenstern O.Theory of games and economic behavior[M].Princeton:Princeton University Press,1944.
[22] Smith J M,Price G R.The logic of animal conflict[J].Nature,1973,246(5427):15-18.
[23] Sinervo B,Livel C M.The rock-paper-scissors game and the evolution of alternative male strategies[J].Nature,1996,380(6571):240-243.
[24] Sinervo B,Chaine A,Clobert J,et al.Self-recognition,color signals,and cycles of greenbeard mutualism and altruism[J].PNAS,2006,103(19):7372-7377.
[25] Kerr B,Riley M A,Feldman M W,et al.Local dispersal promotes biodiversity in a real-life game of rock-paperscissors[J].Nature,2002,418(6894):171-174.
[26] Axelrod R.The evolution of cooperation[J].New York:Basic Books,1984.
[27] Axelrod R,Hamilton W D.The evolution of cooperation[J].Science,1981,211(4489):1390-1396.
[28] Nowak M A,May R M.Evolutionary games and spatial chaos[J].Nature,1992,359(6398):826-829.
[29] Hauert C,Doebeli M.Spatial structure often inhibits the evolution of cooperation in the snowdrift game[J].Nature,2004,428(6983):643-646.
[30] Jiang L L,Zhao M,Yang H X,et al.Reducing the heterogeneity of payoffs:an effective way to promote cooperation in the prisoner’s dilemma game[J].Phys Rev E,2009,80(3):031144.
[31] Jiang L L,Wang W X,Lai Y C,et al.Role of adaptive migration in promoting cooperation in spatial games[J].Phys Rev E,2010,81(3):036108,.
[32] Reichenbach T,Mobilia M,Frey E.Mobility promotes and jeopardizes biodiversity in rock-paper-scissors games[J].Nature,2007,448(7157):1046-1049.
[33] Jiang L L,Zhou T,Perc M,et al.Emergence of target waves in paced populations of cyclically competing species[J].New Journal of Physics,2009,11(10):103001.
[34] Jiang L L,Zhou Tao,Perc M,et al.Effects of competition on pattern formation in the rock-paperscissors game[J].Phys Rev E,2011,84(2):021912.
[35] Ying C Y,Hua D Y,Wang L Y.Phase transitions for a rock-scissors-paper model with long-range-directed interactions[J].Journal of Physics A,2007,40(17):4477.
[36] Zhang G Y,Chen Y,Qi W K,et al.Four-state rockpaper-scissors games in constrained Newman-Watts networks[J].Phys Rev E,2009,79(6):062901.
[37] Yang R,Wang W X,Lai Y C,et al.Role of intraspecific competition in the coexistence of mobile populations in spatially extended ecosystems[J].Chaos,2010,20(2):023113.
[38] Wang W X,Lai Y C,Grebogi C.Effect of epidemic spreading on species coexistence in spatial rock-paperscissors games[J].Phys Rev E,2010,81(4):046113.
[39] Wu Z X,Xu X J,Chen Y,et al.Spatial prisoner’s dilemma game with volunteering in Newman-Watts small-world networks[J].Phys Rev E,2005,71(3):037103.
[40] Zhong L X,Zheng D F,Zheng B,et al.Networking effects on cooperation in evolutionary snow-drift game[J].Europhys Lett,2006,76(4):724.
[41] Ren J,Wang W X,Qi F.Randomness enhances cooperation:a resonance-type phenomenon in evolutionary games[J].Phys Rev E,2007,75(4):045101.
[42] Chen X J,Wang L.Promotion of cooperation induced by appropriate payoff aspirations in a small-world networked game[J].Phys Rev E,2008,77(1):017103.
[43] Chen Y,Qin S M,Yu L C,et al.Emergence of synchronization induced by the interplay between two prisoner’s dilemma games with volunteering in smallworld networks[J].Phys Rev E,2008,77(3):032103.
[44] Qiu T,Hadzibeganovic T,Chen G,et al.Cooperation in the snowdrift game on directed small-world networks under self-questioning and noisy conditions[J].Computer Physics Communications,2010,181(12):2057-2062.
[45] Wu Z X,Guan J Y,Xu X J,et al.Evolutionary prisoner’s dilemma game on Barabási-Albert scalefree networks[J].Physica A,2007,379(2):672-680.
[46] Fu F,Liu L H,Wang L.Evolutionary prisoner’s dilemma on heterogeneous Newman-Watts smallworld network[J].Eur Phys J B,2007,56(4):367-372.
[47] Chen X J,Fu F,Wang L.Influence of different initial distributions on robust cooperation in scale-free networks:a comparative study[J].Phys Lett A,2008,372(8):1161-1167.
[48] Li X,Wu Y H,Rong Z H,et al.The prisoner’s dilemma in structured scale-free networks[J].Journal of Physics A:Mathematical Theoretical,2009,42(24):245002.
[49] Rong Z H,Li X,Wang X F.Roles of mixing patterns in cooperation on a scale-free networked game[J].Phys Rev E,2007,76(2):027101.
[50] Du W B,Zheng H R,Hu M B.Evolutionary prisoner’s dilemma game on weighted networks[J].Physica A,2008,387(14):3796-3800.
[51] Wang W X,Ren J,Chen G R,et al.Memory-based snowdrift game on networks[J].Phys Rev E,2006,74(5):056113.
[52] Yang H X,Wu Z X,Zhou C,et al.Effects of social diversity on the emergence of global consensus in opinion dynamics[J].Phys Rev E,2009,80(4):046108.
[53] Zhang H F,Liu R R,Wang Z,et al.Aspirationinduced reconnection in spatial public-goods game[J].Europhys Lett,2011,94(1):18006.
[54] Shi D M,Zhuang Y,Wang B H.Group diversity promotes cooperation in the spatial public goods game[J].EPL,2010,90(5):58003.
[55] Liu R R,Rong Z H,Jia C X,et al.Effects of diverse inertia on scale-free-networked prisoner’s dilemma games[J].EPL,2010,91(2):20002.
[56] Jia C X,Liu R R,Yang H X,et al.Effects of fluctuations on the evolution of cooperation in the prisoner’s dilemma game[J].EPL,2010,90(3):30001.
[57] Li W,Zhang X,Hu G.How scale-free networks and large-scale collective cooperation emerge in complex homogeneous social systems[J].Phys Rev E,2007,76(4):045102.
[58] Fu F,Chen X J,Liu L H,et al.Social dilemmas in an online social network:the structure and evolution of cooperation[J].Phys Lett A,2007,371(1/2):58-64.
[59] Fu F,Hauert C,Nowak M A,et al.Reputation-based partner choice promotes cooperation in social networks[J].Phys Rev E,2008,78(2):026117.
[60] Fu F,Wang L,Nowak M A,et al.Evolutionary dynamics on graphs:efficient method for weak selection[J].Phys Rev E,2009,79(4):046707.
[61] Fu F,Wu T,Wang L.Partner switching stabilizes cooperation in coevolutionary prisoner’s dilemma[J].Phys Rev E,2009,79(3):036101.
[62] Wu Z X,Wang Y H.Cooperation enhanced by the difference between interaction and learning neighborhoods for evolutionary spatial prisoner’s dilemma games[J].Phys Rev E,2007,75(4):041114.
[63] Wu Z X,Xu X J,Huang Z G,et al.Evolutionary prisoner’s dilemma game with dynamic preferential selection[J].Phys Rev E,2006,74(2):021107.
[64] Zhu C P,Zhou T,Yang H J,et al.The process of coevolutionary competitive exclusion:speciation,multifractality and power-laws in correlations[J].New J Phys,2008,10(2):023006.
[65] Yang D P,Lin H,Wu C X,et al.Effect of mortality selection on the emergence of cooperation with network dynamics[J].New J Phys,2009,11(7):073048.
[66] Jiang L L,Perc M,Wang W X,et al.Impact of link deletions on public cooperation in scale-free networks[J].EPL,2011,93(4):40001.