劉雪萍 尚麗輝 李軒宇



摘 要:在現實生活中,觀點更改與達成共識是社會行為動力學研究的一個重要方面,受到了不同領域研究者的關注。基于演化博弈論建立一致性觀點模型,研究了個體學習能力對無標度網絡上個體觀點演化的影響。依照個體度值,網絡中的個體被分為A、B兩類,A類表示參與者度值高且學習能力強,B類則與之相反。仿真結果表明,個體學習能力對觀點演化行為具有重要影響。當學習系數小于0.001時,參與者傾向于保持自己的觀點,使整個網絡的觀點在有限時步中難以達到一致。當A類所占比例提高時,網絡達到一致的時間縮短,但當A類所占比例增加到0.8~1時,網絡達到一致的時間幾乎保持不變。
關鍵詞:無標度網絡;觀點動力學;演化博弈論;學習能力;異質性群體
DOI:10. 11907/rjdk. 192608 開放科學(資源服務)標識碼(OSID):
中圖分類號:TP393文獻標識碼:A 文章編號:1672-7800(2020)008-0197-05
Abstract: In real life, the change and consistency of peoples opinions is an important aspect of studying social behavior dynamics, which has attracted the attention of researchers in different fields. Consensus opinion model is constructed based on evolutionary game theory. We study the influence of individual learning ability on the opinion dynamics in scale-free network. According to the size of the degree, all of the individuals are divided into class A and class B. Class A has high degree value and strong learning ability, while those in class B has the opposite. The simulation results show that the individual learning ability has an important influence on opinion evolution. When the learning ability coefficient is less than 0.001, individuals tend to maintain their own opinions, making it difficult for the opinions of the whole network to be consistent in the finite time steps. When the proportion of class A increases, the consistent time is shortened. The consistent time between 0.8 and 1 for the proportion of class A is almost equal.
Key Words: scale-free network; opinion dynamics; evolutionary game; learning ability; heterogeneous groups
0 引言
復雜系統無處不在,大量復雜系統都可通過網絡加以描述,如神經網絡系統[1]、道路交通網絡系統[2]、郵件網絡系統[3]等復雜系統都可抽象為節點與連邊構成的網絡進行分析。基于這種思想,可以在演化博弈理論中引入網絡拓撲的概念,將個體看作網絡中的節點,并且僅與和它有連邊的個體進行交互[4-5],其中由于無標度網絡(BA網絡)能很好地呈現現實社會社交結構,因此運用更為廣泛[6]。復雜網絡上的演化博弈主要研究策略演化規則對群體合作行為的影響[7-8]以及不同網絡拓撲結構[9-10]等對合作演化的影響。近幾年,復雜網絡研究領域還延拓到大數據和人工智能方向[11-12]。由于博弈中的任意兩個個體不可能完全相同[13],即異質性廣泛存在,因此相關聲譽[14]、記憶[15]和學習能力[16-17]等個體特征受到了研究者們的廣泛關注。
由于受到個體間相互交流及個體內在因素等方面影響,人們針對相同的人或事物,不同的人持有不同觀點,并且有可能隨時間改變[18]。由于觀點動力學和演化博弈具有相似性,故可運用博弈論的策略更新規則研究觀點動力學的觀點演化過程。最新研究是楊涵新[19]在博弈理論基礎上提出的一種一致性觀點模型,在該模型中,如果個體與其鄰居持有的觀點相同,則均可獲得相同的收益,若相反,均獲得一個相同的懲罰,并且發現總存在一個最優懲罰值使得系統達到一致性的時間最短。
基于上述內容,本文在演化博弈論基礎上建立一致性觀點模型,采用BA網絡作為模型的網絡結構,將個體學習能力引入到該模型中,進而研究個體學習能力對群體達到一致性的影響。結果表明,當個體學習能力低于0.001時,網絡中的觀點很難達到一致。隨后,將個體分為A、B兩類,A類的度較高且具有較強的學習能力,B類則與A類相反。當A類的比例達到0.8~1時,網絡達到一致的時間相差無幾,表示在網絡中如果存在少量學習能力較差的個體時,并不會對網絡達到一致的時間產生較大影響。
1 博弈模型
1.1 網絡結構模型
BA網絡生成規則參考Dorogovtsev等[20]的研究,具體生成規則如下:
(1)首先將期望網絡達到的平均度設置為網絡初始節點個數m0,并使初始節點互相連接。
(2)在演化的每個步驟中引入一個新節點,并且選擇m個已存在的節點,與其進行連邊。
(3)新加入節點與之前節點s的連接概率為[Πks=][ks/jkj],其中[ks]表示節點s的度,[jkj]表示當前所有節點的度之和。
重復步驟(2)、(3),直到經過t個步驟后,節點個數符合期望網絡尺寸。最終期望網絡中共有[m0+mt]個節點,以及[m0m0-12+mt]條連邊。
1.2 個體收益
本研究采用離散觀點動力學模型,初始網絡中有+1和-1兩種觀點,且二者所占比例相同。在每一時步內,都需要計算每個個體獲得的整體收益。對于某一個節點x,觀察它及其所有鄰居節點所持觀點的情況,可得到節點x的整體收益為:
1.3 觀點更新過程
觀點更新采用異步更新規則[21]。在每一個完整的蒙特卡洛步驟中,每個節點平均有一次機會可以改變自己的策略。節點y學習節點x觀點的概率如式(2)所示。
在演化過程中,主要研究網絡中所有節點達到一致的時間[Tc],其是衡量整個系統達到穩定狀態快慢的重要參數。本次研究中涉及到3個重要的可控參數,分別為懲罰值c、B類參與者學習能力[ωx],以及A類參與者所占比例 。此外,網絡平均度
2 仿真實驗
根據上文描述,個體整體收益是由獎勵值b與懲罰值c共同決定的。首先令b=1,研究不同懲罰值c對于系統達到一致時間的影響。為了體現在不同外界條件下系統的演化結果,為4個基本參數分別設定了3種情況。在這些情況下,先不討論[ωx]和 對演化過程的影響,故暫時將[ωx]和 設置為1,具體演化過程如圖1所示。初始值設置如下:平均度
為了驗證以上結果,本文進行了如下研究,結果如圖2所示。在c分別為0.1、1.2和4的3種情況下,研究[Tc]與4種基本參數之間的關系。由圖2(a)-圖2(c)可得到[Tc]隨
接著考慮個體學習能力對觀點演化的影響,令 =1,觀察[Tc]與[ωx]以及4種不同參數之間的函數關系,結果如圖3所示。可以觀察到在4種不同的基本參數下,當[ωx]<0.001時,在有限個時步內網絡觀點很難達到一致,這是由于過小的[ωx]會使網絡中參與者很難學習其鄰居的觀點,因而保持自己的觀點不發生變化。在圖4中,[Tc]的變化趨勢與圖2類似。
BA網絡中領導節點對觀點演化的影響一直是學者們的研究熱點[22]。幾乎在所有真實社交網絡中都存在領導者,他們憑借著自身的條件使得網絡中其他成員在作決定時會學習他們的觀點。這里將A類節點作為領導者,研究A類節點所占比例 對系統演化結果的影響。設置A類節點的[ωx]為1,B類節點的[ωx]為0.1。因此,與B類相比,A類是具有更強學習能力的領導者。接下來通過控制參數 研究觀點演化過程,結果如圖5所示。由圖5可知,在每一個基本參數下,[Tc]都隨著 的增加呈現越來越緩慢的下降趨勢。并且當 =0.8和1時,二者[Tc]的最大差值約為2,兩條曲線幾乎完全重合。此外在圖5(d)中,當2<γ<3時,網絡在度分布上的非均勻性較強,即某些中心節點的度較大;當γ>3時,系統會趨向于隨機網絡。當 =0.2時,則會在γ=3附近使[Tc]最短。
當c取不同值時,[Tc]作為[ωx]或 的函數,結果如圖6所示。在圖6(a)中, =0.6,在圖6(b)中,[ωx=0.1]。由圖6可知, 和[ωx]的大小不會影響最優c,只會影響[Tc],并且隨著 或[ωx]的增加,[Tc]呈下降趨勢。
最后研究領導節點的觀點是否對[Tc]造成影響,首先將領導節點的觀點設置為+1,結果如圖7(a)所示,再將領導節點的觀點設置為-1,結果如圖7(b)所示。在圖7中, ?=0.6, [ωx=0.1],其余參數設置保持不變。由圖7可知,當領導者節點為設定值時,系統達到一致時的觀點狀態即為該觀點值,并且不會對[Tc]有所影響。
本研究基于博弈論的觀點動力學模型,探討A、B兩類參與者的學習能力[ωx]與所占比例 對達到最短一致時間[Tc]的影響。通過在度可調的BA網絡上針對不同參數進行仿真,以及對相關數據的研究與分析,發現當系統中所有節點的學習能力[ωx]<0.001時,網絡中的觀點很難達到一致,但隨著[ωx]的不斷增加,[Tc]呈線性下降;當A類節點所占比例 增加時,系統達到一致觀點的時間更短,并且當 增大到0.8后,[Tc]幾乎保持不變。
3 結語