索琪 郭進利
〔摘要〕[目的/意義]合作網絡研究是近年來學者關注的一個熱點問題,然而傳統的網絡分析方法只適合刻畫兩兩合作者之間的合作關系,深入分析現實世界中的多人合作關系及其網絡發展、演化機制,具有重要的現實意義。[方法/過程]引入超網絡理論,構建節點具有鈍化和激活狀態的演化模型,探討隨機和擇優兩種驅動機制對合作網絡演化過程的影響。仿真發現,擇優機制驅動下點超度分布呈冪律分布;隨機機制驅動下點超度分布呈指數分布。[結果/結論]選取現實合作網絡的數據進行實證分析,實證結果與仿真結果相吻合。說明理論模型對于刻畫現實合作網絡具有一定的參考價值。
〔關鍵詞〕合作網絡;超網絡;演化;鈍化;激活
DOI:10.3969/j.issn.1008-0821.2018.05.009
〔中圖分類號〕G302〔文獻標識碼〕A〔文章編號〕1008-0821(2018)05-0060-06
〔Abstract〕[Purpose/Significance]Nowadays,the cooperative network has become a hot topic that researchers are focusing on.However,the traditional network analysis method is only suitable for depicting relationship between two partners.It is of practical significance to deeply analyze cooperation among multi-partners and its evolution mechanism in real world.[Method/Process]By introducing hypernetwork theory,the paper proposed an evolution model with vigorousness and dormancy effect.And then the influence of two driving mechanisms including random and preferential selection was discussed.The simulation results showed that the distribution of node hyperdegree followed power law distribution driven by preferential selection.On the other hand,the distribution of node hyperdegree followed exponential distribution driven by random selection.[Result/Conclusion]Selecting real cooperative network data for empirical analysis,the empirical results were consistent with the simulation results.Thus the theoretical model could provide valuable information for depicting the real cooperation network.
〔Key words〕cooperative network;hypernetwork;evolution;vigorousness;dormancy
現實世界存在著大量的合作現象,深入分析合作網絡的演化機制,揭示其拓撲結構特性,對于理解這一類復雜系統的形成和演化具有重要的現實意義。引文網絡可以視為典型的合作網絡,Price[1]最早對其進行了研究,將論文視為節點,引用關系視為連邊,認為“增長”和“擇優連接”兩大機制是驅動引文網絡演化的根本原因。那些引用率較高的文獻,往往代表著本領域的經典之作。新發表的文章會優先引用這些文獻,這種擇優連接機制導致經典文獻的引用次數隨時間增長而不斷增加。然而,科技論文同時也強調創新性,更多地關注最新的學術成果。隨著研究的深入,學者發現引文網絡的發展中呈現出復雜的衰弱現象[2],這種現象的作用機理類似于化學過程中的“鈍化”現象。節點存在著鈍化效應,這意味著文獻的吸引力會隨年齡的增加而降低。學者通過對引文數據庫的實證發現,引文網絡是一個老化網絡[3-5],文獻的引用率隨年齡增長呈指數衰減[6-7]。那些不經常被引用的文獻,其研究主題可能不再受當前學術界的關注,隨著時間的推移會逐漸淡出人們的視野,從而慢慢被遺忘。在引文網絡的連接中,應該考慮這種遺忘效應。事實上,在某些特定的研究需要下,那些處于鈍化狀態的文獻可能又有機會重新獲得引用。再如演員合作網絡中,著名的演員參演電影數量多,口碑良好。為獲得更高的收視率,新演員合作時會優先選擇他們,這體現了擇優連接機制。但部分老演員由于年齡及精力原因可能會退出影壇,這體現了鈍化現象。現實中也存在老演員復出的情形,這種現象可以用激活機制來刻畫。因此,在合作網絡中,普遍存在著鈍化與激活效應,在合作網絡的演化中應考慮節點狀態的變化。
目前,學者采用網絡分析方法對合作網絡進行了系統研究,內容覆蓋了網絡的靜態結構分析、演化模型、實證研究等方面[8-14]。然而,復雜網絡基于普通圖結構,只能刻畫兩兩合作者之間的關系,而現實中的合作關系都多屬于多人合作。Berge[15]最早給出了超圖的基本概念。由于超圖中的1條超邊允許連接任意數量的同質或不同質節點,更適合刻畫多個合作者之間的關系。因此,基于超圖的超網絡為更好地認識和描述現實復雜合作網絡提供了新途徑,越來越多的學者也將研究視角轉向于此。文獻[16-18]基于增長和擇優機制構建了超網絡動態演化模型。進一步,Yang和Liu[19]探討了局域世界在超網絡演化過程中的影響。郭進利[20]結合非線性擇優機制,構建了一個非均齊演化模型。上述超網絡模型認為節點一旦進入系統,其節點狀態是始終不變的。然而事實上,現實網絡中節點獲得連邊的能力依賴于其狀態的變化,在合作網絡的刻畫中應充分考慮這一問題。
本文的目的在于構建合理的演化機制,揭示現實合作網絡的發展過程。鑒于上述分析,將網絡中的節點狀態分為兩類:處于激活狀態的節點稱之為活性節點;處于鈍化狀態的節點稱之為休眠節點。活性節點憑借其活躍度,競爭獲得新節點的連邊。當節點隨著年齡的老化而逐漸失去獲得連邊的能力時,將其稱之為活性節點的鈍化過程。這些節點將轉變為鈍化狀態,這些休眠節點是無法獲得新連邊的;這個過程可以理解為網絡的遺忘過程。然而,休眠節點在某種特殊情況下可能被激活,重新轉換為活性節點,它們又具備了獲得連邊的能力。隨著新節點的進入和老節點狀態的變化,合作網絡得以演化發展。
1合作超網絡的演化機制
11超網絡的概念
超網絡(Hypernetwork)基于超圖理論,Estrada和Rodríguez-Velázquez認為,凡是可以用超圖表示的網絡就是超網絡[21]。超圖的嚴格定義[15]為:設V={v1,v2,…,vn}是一個有限集,若Ei≠(i=1,2,…,m),且Ymi=1Ei=V,記E={E1,E2,…,Em},則稱二元關系H=(V,E)為超圖,簡記為(V,E)或H。其中V的元素稱為超圖的節點,E中的元素稱為超圖的超邊。節點V的超度定義為包含該節點的超邊條數。如引文網絡中,將文獻視為節點,則其被引用次數就是該文獻的點超度。
12合作超網絡的模型描述
合作網絡是隨著新成員的不斷加入以及其與老成員的不斷合作得以演化的。在網絡演化的初始階段,只包含少量合作者。隨著新成員的不斷,導致整個網絡的節點數量不斷增加。點超度大的節點代表其參與過多個項目,對于其它節點具有較大的吸引力,這些節點被選擇連接的幾率更大。這種點超度擇優機制符合現實的合作特點,即大家都希望與實力較強的合作者合作。同時,一些合作者隨著年齡的老化,獲得連邊的能力減弱;也有些節點在特殊情況下重新被激活,重新具備了獲得連邊的能力。現實中可能存在著末位淘汰機制,則對應于擇優激活和鈍化過程;也存在由于隨機因素導致的鈍化效應,則對應于隨機激活和鈍化過程。
基于上述思想,構造節點具有鈍化和激活效應的合作網絡演化模型,其演化規則如下:
1)網絡初始時刻有m0個節點,這m0個節點包含在一條超邊中。其中m01個節點處于激活狀態,其余節點處于鈍化狀態。
2)節點按泊松過程到達,每批進入的新節點數量為m1個,新進入的節點處于激活狀態。新節點以概率W(hj(t,ti))從網絡中現有的活性節點中選擇m2個,共同圍成一條超邊。
W(hj(t,ti))=hj(t,ti)∑ij∈Ωhj(t,ti)(1)
其中,Ω代表活性節點集合,ti表示第i批節點進入網絡的時刻,hj(t,ti)表示第批到達的第j個節點在時刻t的超度。
3)以概率∏(hj(t,ti))選擇m3個休眠節點進行激活,被激活的節點狀態轉換為活性節點。
4)以概率T(hj(t,ti))選擇m4個活性節點進行鈍化,被鈍化的節點狀態轉換為休眠節點。
5)返回2),循環,直到網絡達到指定規模為止。
根據現實合作網絡的特點,將對節點的激活和鈍化過程分為“擇優選擇”和“隨機選擇”兩種機制。
機制一:擇優鈍化和激活,即假設∏(hj(t,ti))和T(hj(t,ti))均為擇優選擇。點超度大的休眠節點會被優先激活,點超度小的活性節點會被優先鈍化,即:
∏(hj(t,ti))=hj(t,ti)∑ij∈Vhj(t,ti)(2)
其中,V代表休眠節點集合。
T(hj(t,ti))=hj(t,ti)-1∑ij∈Ωhj(t,ti)-1(3)
其中,Ω代表活性節點集合。
機制二:隨機鈍化和激活,即假設∏(hj(t,ti))和T(hj(t,ti))均為隨機選擇。從休眠節點中隨機選擇m3個進行激活,從活性節點中隨機選擇m4個進行鈍化,即:
∏(hj(t,ti))=1nl(4)
T(hj(t,ti))=1nk(5)
其中,nl和nk分別代表t時刻休眠節點和活性節點的數量。
根據模型規則,圖1給出了m0=5、m1=3、m3=2、m3=1、m4=1時的演化過程示意圖。其中活性節點用紅色表示,休眠節點用灰色表示。初始t=1時刻,網絡中有5個節點,包含在一條超邊中。其中節點2、3、5處于激活狀態,節點1、4處于鈍化狀態。t=2時刻,3個新節點(6、7、8)進入網絡,新進入的節點均為激活狀態。依據概率W(hj(t,ti))從活性節點中選擇2個(假設2、3被選中),與新節點共同圍成一條超邊;從休眠節點中,以概率∏(hj(t,ti))選擇1個進行激活(假設1被激活);從活性節點中以概率選擇一個進行鈍化(假設5被鈍化)。t=3時刻,3個新節點(9、10、11)進入網絡,新進入的節點均為激活狀態。依據概率W(hj(t,ti))從活性節點中選擇2個(假設1、2被選中),與新節點共同圍成一條超邊;從休眠節點中,以概率∏(hj(t,ti))選擇1個進行激活(假設5被激活);從活性節點中以概率T(hj(t,ti))選擇一個進行鈍化(假設7被鈍化)。
2仿真結果與分析
根據合作網絡的演化機制,對其演化過程進行仿真分析,分析不同機制和模型參數對網絡演化結果的影響。通過仿真實驗發現,網絡的規模(即網絡中的總節點數量)不影響穩態時點超度的分布形式及結果,因此將網絡規模設置為5 000,仿真結果在雙對數坐標系下顯示。
21擇優鈍化和激活機制下的仿真結果
根據機制一,采取擇優鈍化和激活機制,由圖2~5可見,在不同的參數下超度分布均服從冪律分布。在擇優連接機制的驅動下會產生冪律網絡,體現了“富者越富”的現象。下面分別測試不同參數的影響。
211新進節點個數m1對網絡結果的影響
m1=1時,點超度的最大值為3 248;m1=3時,點超度的最大值僅為845。隨著m1的增大,節點的點超度值明顯減少;同時點超度小的節點比例略有下降。原因在于,隨著m1的增大,網絡能夠在更短的時間步內增長到指定規模。因此,m1=1時網絡的演化時間最長,超度大的節點累積獲得連邊的時間步更長,導致其超度值會更大。超度大的節點獲得了更多的連邊,必然導致超度小的節點獲得連邊的機會減少。m1越大,網絡分布相對更為均勻。這也與實際的合作情況相符,當新進成員增多時,必然會導致原有成員的合作機會增多,同時也削弱了原來核心成員的壟斷優勢。
212老節點個數m2對網絡結果的影響
m2=1時,點超度的最大值為3 546;m2=3時,點超度的最大值僅為1 576。超度分布整體趨勢類似于圖2。隨著m2的增大,更多的老節點會被選中與新節點共同圍成超邊,點超度小的節點比例下降。老節點之間會相互競爭以獲得新節點的連邊。因此,m2越大,點超度大的節點獲得連邊的能力在降低,網絡分布相對更為均勻。即新進成員選擇更多的合作伙伴進行合作時,必然為網絡中的成員帶來更多的合作機會。
213休眠節點被激活的個數m3對網絡結果的影響
m3=2時,點超度的最大值為1 576;m3=6時,點超度的最大值僅為188。且隨著m3的增大,點超度為1的節點比例由98%下降到63%。根據擇優機制,點超度值越大的活性節點被鈍化的概率越小,則其處于激活狀態的時間會越長,通過不斷累積連邊,得到的超度值導致更大。隨著m3的增大,網絡中那些相對超度較大的休眠節點有機會被激活,從而有可能被新節點選中;這樣必然會削弱原有超度大的節點的連邊能力。因此導致網絡的超度分布更為均勻。即隨著潛在的優勢成員的不斷激活,新的成員有更多的選擇機會,削弱了原有核心成員的壟斷地位。
214活性節點被鈍化的個數m4對網絡結果的影響
m4=2時,點超度的最大值為587;m4=6時,點超度的最大值為1 991。隨著m4的增大,超度較小的節點會被優先鈍化,則它們被新節點選中的機會在減少;這時超度大的節點獲得連接的優勢更明顯。點超度小的節點比例在上升,點超度大的節點的超度值在增大。這也體現了活性節點競爭獲得新節點連邊的結果。擇優鈍化體現了末位淘汰機制,這樣必然為優勢成員帶來更多的合作機會。
22隨機鈍化和激活機制下的仿真結果
根據機制二,采取隨機激活和鈍化機制,由圖6~9可見,在不同的參數下,超度分布均服從指數分布。在隨機激活和鈍化的驅動下,基本屬于無偏好選擇,往往會產生指數網絡。且和擇優機制相比,節點之間的超度變化范圍明顯縮小。下面分別測試不同參數的影響。
221新進節點個數m1對網絡結果的影響
m1=1時,點超度的最大值為37;m1=3時,點超度
的最大值為54。隨著m1的增大,點超度值為1的比例明顯上升。超度分布形態從指數分布逐漸趨于冪律分布。說明網絡的演化時間越長,隨機選擇效應越明顯,網絡分布相對更為均勻。而m1越大,網絡在更短的時間步達到預定規模,這時新節點進入時對老節點選擇的擇優機制還會占據主導地位。和擇優機制相比,合作網絡中的核心成員也可能被鈍化,導致其無法獲得新的合作機會。
222老節點個數m2對網絡結果的影響
m2=1時,點超度的最大值為12;m2=3時,點超度的最大值為27。隨著m2的增大,超度為1的比例由70%下降到45%。原因在于網絡中更多的老節點有機會獲得新節點的連邊。隨機選擇時,超度較大節點的競爭優勢不明顯,導致網絡分布相對更為均勻。
223休眠節點被激活的個數m3對網絡結果的影響
m3=2時,點超度的最大值為27;m3=6時,點超度的最大值為159。且隨著m3的增大,點超度為1的節點比例略有上升,由45%上升到63%。隨著休眠節點被激活的個數m3的增大,更多的節點有機會獲得連邊,必然導致度小的節點比例在降低;但各曲線之間差異不明顯。
224活性節點被鈍化的個數m4對網絡結果的影響
m4=2時,點超度的最大值為301;m4=6時,點超度的最大值僅為13。活性節點被鈍化的個數m4的增大,更多的節點有可能被鈍化,導致其獲得連邊的機會明顯減少。當鈍化數量較小時,擇優連接機制使得超度大的節點獲得連接的優勢更明顯。
3實證分析
為對理論模型進行驗證,選取兩個合作網絡的實證數據進行對比分析。
31引文網絡實證分析
在CNKI數據庫中以“復雜網絡”為主題詞,設置期刊來源為CSSCI期刊,檢索2000-2017年發表的文獻。經檢索,獲得938篇被引用次數不少于1次的文獻。將文獻視為節點,則其被引用次數為點超度。對文獻被引用次數進行統計,獲得點超度分布如圖10(a)所示,其中點超度最大的文獻其被引用次數為208次;364篇文獻其點超度最小,其被引用次數為1次;平均點超度為846,即平均每篇文獻被引次數為8次。
在CNKI數據庫中,以某CSSCI期刊為來源期刊,檢索該期刊在2000-2017年發表的文獻。經檢索,獲得3917篇引用次數不少于1次的文獻。將文獻視為節點,則其被引用次數為點超度。對文獻被引用次數進行統計,點超度分布如圖10(b)所示,其中點超度最大的文獻其被引用次數為182次;478個文獻其點超度最小,其被引用次數為1次;平均點超度為831,即平均每篇文獻被引次數為8次。
從上述兩個引文網絡的實證結果可見,文獻被引用的次數是非均勻的,且點超度分布不屬于冪律分布形式,近似于指數分布。與文中理論模型的仿真結果相吻合,即在引文網絡中存在明顯的鈍化與激活效應,且其機制可以用模型中的隨機鈍化和激活機制刻畫。
32電影演員合作網絡實證分析
數據來源于Mtime時光網(http://www.mtime.com/),以“國內電影”為檢索詞,獲得8 480部電影信息及其主演信息。將演員定義為節點,則其參演次數為點超度。如圖11所示,演員網絡的點超度分布服從冪律分布,數據存在明顯的重尾現象。大部分演員只參演了較少的幾部電影,而只有少量演員參與了多部電影的演出。網絡中最小點超度為1,最大點超度為82。平均點超度為256,即平均每
個演員參演了256部電影。點超度大的節點代表該演員參與了多部電影的演出,對應于知名演員。在演員合作超網絡的演化過程中,當新演員進入網絡參演電影時,為了提高影片的票房,一般會選擇知名演員合作,利用其良好的口碑提高電影的競爭力;而知名演員也獲得了更多的參演機會,導致了“富者越富”現象。說明前文理論模型中的擇優鈍化和激活機制在演員合作網絡中起到主導作用。
4結論
現實合作網絡中,節點獲得連邊的能力不是一成不變的,而與其節點狀態存在密切聯系。根據這一特點,本文提出了節點具有鈍化和激活狀態的合作超網絡演化模型,用以刻畫合作網絡的演化機理。現實合作網絡中,初始時一般具有較少的成員,隨著成員地不斷加入,網絡得以增長發展。整個網絡的合作動力學過程受到節點狀態的影響,只有活性節點有能力獲得新節點的連邊。進一步,文中將鈍化和激活機制分為擇優和隨機兩種方式。仿真結果顯示,擇優機制驅動下,獲得的點超度分布為冪律分布;隨機機制驅動下,獲得的點超度分布為指數分布。同時,本文探討和分析了模型參數對演化結果的影響。為對理論模型進行驗證,選取現實合作網絡的數據進行實證分析,將其抽象為超網絡,對真實數據進行統計分析,實證結果與理論模型的仿真結果相吻合。說明理論模型能夠較好地解釋現實合作網絡的生長與演化規律,對理解現實合作網絡具有一定的參考價值。目前,針對文中提出的理論模型進行了仿真分析,未來研究將結合平均場方法,以獲得模型精確的理論解析結果,使得模型結果的可信度更好。此外,模型結果是否具有普適性,未來將選擇更多的實證數據進行深入驗證。
參考文獻
[1]Price D S.A General Theory of Bibliometric and Other Cumulative Advantage Processes[J].Journal of the American Society for Information Science,1976,27(5):292-306.
[2]Amaral L A N,Scala A,Barthelemy M,et al.Classes of Small-World Networks[J].Proceedings of the National Academy of Sciences,2000,97(21):11149-11152.
[3]Zhu H,Wang X,Zhu J Y.Effect of Aging on Network Structure[J].Physical Review E,2003,68(5):056121.
[4]Hajra K B,Sen P.Aging in Citation Networks[J].Physica A,2005,346(1):44-48.
[5]Hajra K B,Sen P.Modelling Aging Characteristics in Citation Networks[J].Physica A,2006,368(2):575-582.
[6]Medo M,Cimini G,Gualdi S.Temporal Effects in the Growth of Networks[J].Physical Review Letters,2011,107(23):238701.
[7]Wang M,Yu G,Yu D.Effect of the Age of Papers on the Preferential Attachment in Citation Networks[J].Physica A,2009,388(19):4273-4276.
[8]高霞,陳凱華.合作創新網絡結構演化特征的復雜網絡分析[J].科研管理,2015,36(6):28-36.