999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人類時效交互網絡的建模與傳播研究綜述

2019-11-05 08:23:12靖,李聰,李
復雜系統與復雜性科學 2019年3期
關鍵詞:人類模型

李 靖,李 聰,李 翔

(復旦大學a.電子工程系自適應網絡與控制實驗室;b.信息科學與工程學院智慧網絡與系統研究中心,上海 200433)

0 引言

1 人類交互行為的時效網絡表示

在如今信息爆炸的大數據時代,人的集群交互行為使得豐富多樣的信息(輿論或謠言)得以在人群中快速地傳播。相比于傳統的結構化數據,采用網絡的形式來描述復雜的人類交互行為更加形象。人類交互網絡的定義是以人為節點,人與人之間的某種社會交互行為為連邊的網絡。個體間的交互行為隨時間推移不斷發生改變,對應到網絡上則表現為網絡拓撲隨著時間演化的過程。因此,實際的人類交互網絡是一個典型的時效網絡。接下來,我們介紹如何利用實際的人類交互數據構建時效人類交互網絡,主要從數據的采集手段、人類交互的類型與數據表示以及時效網絡構建3個方面說明。

1.1 人類交互數據的采集手段

1.2 人類交互的類型與數據表示

1.3 利用實際數據構建時效人類交互網絡

注:tw是聚集時間窗的持續時間。圖1 由交互序列構建時效網絡的一個例子Fig.1 Schematic illustration of the construction of temporal networks and the time slice of a contact sequence

2 時效人類交互網絡的特征

2.1 拓撲結構特征

2.1.1 節點度與節點度分布

2.1.2 節點可達性與時間相關路徑

2.1.3 聚類系數

聚類系數(Clustering Coefficient)這個概念最早發源于社會學。它刻畫了社交網絡中一個人和他朋友的朋友是否也互為朋友的概率,反映了網絡中朋友關系的緊密程度。傳統的靜態網絡研究表明,社交網絡具有“小世界”的特性,即該類型網絡相對于等規模的隨機網絡具有非常大的聚類系數和較小的平均最短路徑長度[2]。對于這種社交網絡上出現的聚類系數大的現象,社會學上的一個重要解釋為“三元閉包”原則[60]—即如果兩個互不相識的人的共同朋友數目越多,那么他們倆在未來某個時刻成為朋友的可能性越大。三元閉包原則實際上隱含了一種人類交互隨著時間演化的可能—有些交互關系會被動的加入到網絡,從而使得網絡中的閉合三角連邊數目增加,進一步的產生了實際存在的聚類系數很大的社交網絡。為了驗證這個想法,Medus等人[61]在對實際數據建模時引入了三元閉包原則來刻畫這種網絡上連邊建立時的偏好連接特性,并增大連邊的閉包概率,最終得到了具有高聚類系數的集聚靜態網絡。把靜態網絡上的聚類系數推廣到時效網絡中,Cui等人[53]提出了時延聚類系數和時長聚類系數兩種指標。文中指出,相比于靜態網絡中的聚類系數,時效聚類系數能夠充分刻畫隨著網絡演化帶來的時效特性,并且網絡的時效聚類系數越大,越能有效地促進網絡上的流行病爆發。

2.1.4 巨片

2.2 時效特征

人類交互網絡是以人為節點,以人與人之間的某種社會交互行為為連邊的網絡。對于網絡中任意一個個體交互對,它可能在整個數據采樣時期內存在多個交互事件,每個交互事件發生的持續時間不盡相同,相鄰兩次交互事件的間隔時間也存在一定差異。交互的持續時間,從字面意思來看,描述的是個體對之間發生的單次交互事件的持續時長。它在人類交互建模時往往被視為一種“富者愈富”的偏好機制,即如果個體保持活躍狀態的持續時間越長,或者發生在個體對之間的交互行為持續時間越長,那么他就越傾向于維持當前的狀態不變[66]。交互的間隔時間描述的是發生在同一個體對之間的相鄰兩次交互事件的間隔時長。它在建模時往往表征的信息更為豐富,既可以體現人類交互行為的陣發性,也可以表現個體交互行為的記憶性。另一方面,人類的日常行為往往具有一定的規律性,具有某種特定社會關系的個體對之間往往會周期性地發生交互。例如在公交車和大學校園這類人類活動周期性較為顯著的生活場景下,以往的研究發現具有“熟悉的陌生人”社會關系的兩個個體之間往往會頻繁地進行規律性的交互行為[36,44]。但有一點值得注意,人類的交互行為并非完全受社會關系驅動,由于現實環境的影響往往會存在一定的隨機性。這種隨機性的嵌入,導致了原本規律性的交互行為會存在一定的波動和偏差,主要體現在交互的對象發生改變或者時間上有所偏移等,從而使得人類的行為并不能百分百的被預測出來,而是存在一定的上限[37]。接下來,我們針對陣發性、記憶性以及周期與波動性這三個人類交互的時效特征來詳細展開介紹。

2.2.1 陣發性

(1)

其中,στ和mτ分別表示的是間隔時間分布f(τ)的標準差和平均值。B取值在-1~1之間。若f(τ)服從泊松分布,其均值和標準差相等,則陣發性B=0;若是服從重尾分布,標準差遠大于均值,則陣發性B→1;如果個體交互事件的發生極具有規律性,則間隔時間序列是一個周期規則信號。它的間隔時間分布為一個δ函數,標準差0,因此陣發指標B=-1。然而,對于實際得到的一些規模較小的數據集,在統計個體交互對時常常由于采樣時間有限而具有很短的時間序列,從而不足以準確衡量個體對交互連邊的陣發性(甚至無法衡量,若交互連邊在整個觀察時期僅出現過一次)。這意味著用以上的指標來計算個體交互對的陣發性仍然是存在很大偏差的。Karimi等人通過拼接間隔時間來計算時間序列的陣發性[74],但本質上仍沒有解決數據量有限的情況下,單個個體和連邊所獨有的交互模式的問題。

2.2.2 記憶性

除了陣發性以外,人類交互網絡上還存在的一個重要特征是記憶性。“記憶性”是人類在現實交互中(無論是在線交互還是線下交互)區別于隨機無規律的物質運動,并體現出人類獨有的主觀能動性的一種固有屬性。大量的實證研究發現,人類在現實世界交互中存在著各種各樣的記憶機制。Goh等人[73]利用Pearson關聯系數來衡量人類交互事件發生的記憶性強弱。假設個體在整個數據觀察時期內一共有n+1個交互行為發生,按行為發生的先后順序對其排列并計算相鄰兩次交互行為發生的間隔時間,則產生的間隔時間序列中一共有n個元素,令序列中前n-1個元素組成子序列1,后n-1元素組成子序列2,文中指出該序列的記憶性可以用皮爾森關聯系數進行計算如下:

(2)

其中,m1和m2分別表示序列1,2的均值。σ1和σ2表示序列1,2的標準差。記憶性指標M的取值范圍在-1~1之間。若M>0,則認為交互行為發生的間隔時間序列具有記憶性,表現為長的間隔時間后往往跟隨著一個也較長的間隔時間,而短的間隔時間后也往往跟著一個也較短的間隔時間;若M<0,則和前面描述相反,表現為長的間隔時間后往往接著一個較短的間隔時間,而短的間隔時間后跟著一個較長的間隔時間;若M=0,則說明交互行為發生的前后間隔時間無以上顯著規律。

到這里,可以發現,以上所討論的記憶性實際上刻畫的是個體交互事件(不管交互對象是否發生改變)發生的間隔時間序列的自相關性。然而,這可能與通常意義上所說的人類“交互記憶”有所不同。我們所說的“交互記憶”刻畫的是人類記住過去發生的某種特定事件—交互行為,并在未來再次發生的現象。通俗的說,對于某個個體,他在過去和許多其他個體發生了交互事件并且已經結束,由于人腦的記憶功能,他往往會記住過去交互過的對象,在當前時刻他要進行的交互行為可能會受到這些歷史記憶的影響,從而會傾向于和過去交互過的個體再次產生交互行為。

基于這種交互行為再現機制,已有大量的學者展開了研究。Karsai等人[12]通過分析手機通話數據指出個體能夠記住它們過去建立的交互關系,并且趨向于和之前建立交互的個體再次產生連邊。作者把這類反復出現的交互關系稱之為強社會關系(Strong Tie),并發現強社會關系有效阻礙了時效人類交互網絡上的流行病傳播。Kim等人[75]用時效網絡中節點間的交互方式和偏好連接機制來刻畫人類交互的記憶性。文中引入了個體交互時間步長的概念,這里的個體交互時間步長有別于交互持續時間,指的是發生在兩個個體之間的所有交互行為的累計時間步數。作者通過分析實際數據發現,個體的交互時間步長越大,他連接過去交互過的對象的概率越大。Vestergaard等人[66]通過分析會議和醫院的面對面人群交互數據,引入了四種不同的記憶機制來表征實際人類交互數據中持續時間和間隔時間的分布均呈現出冪律分布的特性。這些記憶機制包括:交互自增強機制(Contact Self-Reinforcement, CSR)—即交互持續的時間越長,交互結束的概率越低;活躍度自增強機制(Activity Self-Reinforcement, ASR)—即最近越活躍的個體,越容易產生新的交互連邊;個體導向優先連接機制(Agent-centric Preferential Attachment, APA)—即越最近活躍的個體越容易被其他的個體選擇而產生交互連邊;連邊導向優先連接機制(Link-centric Preferential Attachment, LPA)—即個體越趨向于與最近交互的個體進行交互。其中,ASR和APA表征了高度活躍的個體更傾向產生新的交互連邊并且更容易被其他個體所連接,而CSR表征了交互行為隨著持續時間變化的增強過程,LPA表征了個體傾向于與熟人進行交互。Colman等人[76]認為網絡中新的連邊產生的概率與產生連邊的兩端節點的固有活躍概率有關,并且前期發生的交互事件(連邊)能夠以一定的記憶規模儲存下來。文中給出了更新網絡中連邊的兩種記憶機制,一種是從系統過去發生的所有交互事件中隨機選一個被新的連邊替代的隨機記憶,另一種是基于交互事件的持續時長記憶,即每次網絡更迭時持續時間最長的連邊被新的連邊替代。盡管以上討論的這些人類交互行為的“記憶性”從形式上各不相同,本質上都是在刻畫個體在動態建立連邊時的偏好選擇機制。

2.2.3 周期與波動性

對于現實生活中的人類交互行為,一方面由于自然周期(如年、月、周、晝夜以及一些特定的人類行為活動周期)的存在,人往往會按照日程安排在特定的時間進行特定的行為,這種行為的發生具有一定的規律性和周期性[77]。另一方面,由于人的行為在一定程度上會受到各種外部環境因素的干擾,因而在行為的執行時會出現一定的偏差和波動。所以實際的人類交互行為還具有另一種明顯的時效特征—周期與波動性。如果把單位時間內個體參與交互行為的次數定義為該個體的活躍度,我們會發現在很多人類活動中個體活躍度的周期與波動廣泛存在,例如校園里的學生交互[44,78]、會場上參會人群的交互[14]、手機通話交互[77]、維基百科上用戶共同編輯內容構成的交互[79]等等。這種周期性的規律有時候還會直接反映在交互行為的間隔時間分布上,例如學生在校園內的上課周期是一星期,那么在每周的特定時間內將會有特定的一群人在同一個教室上課從而發生交互行為,當然這樣原本規律性的行為也可能因為調課或節假日休息而產生時間上的擾動。最近Liang等人[44]的工作就表明,在大學校園內具有“熟悉的陌生人”社會關系的個體的交互間隔時間分布呈現出顯著的周期特性,并且隨著間隔時間的增加整體上指數下降。

2.3 時間尺度

時間尺度是時效網絡中經常出現且不可回避的一個重要概念。它是衡量網絡拓撲隨著時間發生演化的特征標度。這里所謂的特征標度是指網絡中的大部分拓撲結構發生變化的時間取值應該落在以某個時間為中心的一個相對比較小的區間內。相對于時間尺度缺失的靜態網絡(例如BA無標度網絡),時效網絡對應著一類特殊的網絡,這類網絡自身拓撲結構的演化時間尺度要小于或者相近于網絡上發生的動力學過程(如流行病傳播、謠言傳播等)的時間尺度[80]。如果網絡演化的時間尺度大于網絡上發生的動力學過程,則可以認為動力學過程在網絡拓撲發生改變前已經完成,則相應的研究結論可以近似對標到傳統的靜態網絡上的研究。然而,對于時間尺度的認識遠不僅限于此。我們根據現有的認識[10,80]總結成如下幾點:

寶格麗腕間時計呈現美學工藝的創新之道,格調盡顯。自2014年以來,寶格麗研發并制造出以Octo Finissimo系列為代表的超薄腕表杰作,生動詮釋了這一理念。

1)現實世界中的很多時效網絡,發生在它們上面的動力學過程都有其各自所特有的時間尺度。以人類交互網絡為例,從一個人身邊經過僅需要數秒,進行一次談話需要幾分鐘,主持一場集會要幾小時,一系列會議的論壇可能需要連開數天,完成一項研究項目會耗時數月,兩個人成為要好朋友可能需要幾年甚至數十年時間。所有這些交互行為構建的時效人類交互網絡都遵循了各自所獨有的時間尺度(見圖2)[42]。

2)時效網絡上不同個體的交互模式迥異。有的節點和交互連邊的狀態變化極其活躍,有的甚至在很長的一段時間內狀態保持不變。這也會對網絡上發生的動力學過程產生巨大影響,例如性接觸網絡上的疾病傳播[56],社交媒體上的信息傳播[81]等。因此,文獻[82]甚至還考慮了是否存在交互連邊層面上的時間尺度特性。

注:從諸如節點和連邊的短的時間尺度到更慢的中觀社團結構以及網絡整體演化的時間尺度。圖2 手機通信網絡中時效和拓撲尺度的概述[42]Fig.2 An overview of temporal and structural scales in mobile call networks

4)衡量時間尺度劃分準確性的標準相差甚大,有的時候使用自然活動的時間尺度(如晝夜模式[14,77])來分析網絡上的動力學過程得到的結果較為準確,但使用其他的時間尺度來進行研究是否也同樣有意義仍有待考究。

5)確定實際數據中的時間尺度的另一大困難還在于,有時候很難把它從實際動態演變的網絡系統中剝離出來。例如,在社交媒體上的信息傳播,這種傳播過程主要基于網絡上的關注與被關注關系產生的交互連邊,從而有可能會出現誰關注誰取決于信息是如何傳播的情況,進一步地會導致最終網絡上的傳播動力學的時間尺度糾纏在社交媒體上關注網絡演變的時間尺度中難以分離出來。

3 時效隨機化零模型

時效網絡具有豐富的拓撲屬性和時效屬性,對時效網絡上的某種特定結構進行隨機化操作可以幫助我們更好地理解這種結構在網絡動力學方面所扮演的重要角色。例如,可以通過一定的隨機化操作,來移除網絡中的某種特定結構,并在移除該結構后構造的一系列隨機零模型上模擬動力學傳播過程(如流行病傳播、信息擴散、隨機游走等等),得到的結果與實際的時效網絡進行對比,從而得到該結構對于實際的時效網絡上的動力學過程是起到加速還是減緩的作用[13,43,80]。接下來,我們將回顧一些在時效網絡上比較常用的一些隨機化零模型。

3.1 隨機置換交互的時間標簽(Randomly Permuted Times,RPT)

1)從所有交互記錄中隨機選擇兩條交互記錄(i,j,t)和(u,v,t*);

2)交換兩條交互記錄的時間標簽,得到交互記錄(i,j,t*)和(u,v,t);

3)重復以上步驟,直至每條交互記錄被至少選擇一次結束。

這種隨機化過程保證了網絡中所有交互事件參與的個體對不變。同時,由于時間標簽的保留,記錄在實際數據時間標簽中的活動周期性(如晝夜和星期等)也能保持不變。但是,它會摧毀或者部分摧毀實際數據中的時效特征(如陣發性和記憶性),也摧毀了很多交互事件中所存在的時效相關性,如個體A與個體B進行交互會導致接下來個體B與個體C進行交互。

3.2 隨機置換連邊(Randomized Edges,RE)

這種方法與靜態網絡上的連邊置換類似,區別在于:在連邊置換時,每條連邊上發生的多個交互事件對應的時間標簽也會全部交換[13]。具體操作我們總結如下:

1)從所有連邊中隨機選擇兩條連邊(i,j):[tlist]和(u,v):[τlist],tlist和τlist分別表示這兩條連邊上交互事件發生的時間標簽序列;

2)置換兩條連邊的節點,以1/2的概率得到連邊(i,v):[tlist]和(u,j):[τlist],或者得到(i,u):[tlist]和(j,v):[τlist];

3)若在步驟2中產生自環或者重邊,則取消置換并重新回到步驟1。

這種隨機化過程會摧毀網絡中所有拓撲結構及節點和連邊活躍的時效相關性,但保留原始交互序列集聚而成的靜態網絡的度分布,以及所有交互事件發生的時間標簽和交互間隔時間。

3.3 隨機生成交互的時間標簽(Randomly Generated Times,RGT)

RPT和RE模型所構建的新的隨機化交互序列能夠保留原始交互序列的時間標簽。因此,雖然它能夠摧毀與節點和連邊相關的時效結構,但數據中所有交互事件發生的累計數目以及包含在交互事件中實際人類活動的周期節律仍保持不變。如果想要研究周期節律對于時效網絡上動力學過程的影響,則需要把所有交互事件對應的時間標簽數值隨機化,通常使用的方法是對所有交互記錄的時間標簽數值重新從一個均勻分布函數中隨機取樣分配[13]。當然,交互事件的時間標簽也可以取自其他特定的分布(如泊松過程),然后通過調節參數使得每條連邊的平均交互次數與實際數據相近。

3.4 隨機置亂連邊上的交互時間(Randomly Contacts,RC)

這種隨機化過程不改變網絡中節點間的連邊,保證了無權累積網絡的拓撲結構不變,卻對所有連邊上交互事件發生的時間標簽數目進行重新分配。這里的重新分配,具體操作如下:

1)將所有連邊上交互事件發生的時間標簽構成一個序列;

2)每次從序列中隨機選擇一個時間標簽并隨機分配給網絡中的一條連邊,若產生同一時間標簽的重邊則將時間標簽放回序列,重選;

3)從步驟1的序列中刪除已選時間標簽,直至序列為空則分配結束。

由于連邊上交互事件時間標簽的數目對應了個體間的交互次數,所以以上操作不改變網絡整體交互連邊的數目,但會使得網絡中所有連邊上交互的次數最終服從二項分布的特征[13]。它通常的目的是為了研究實際數據中(特別是在社交媒體或者其他形式的人類交互數據)不同連邊上交互次數相差很大并呈現出重尾分布的影響[43]。

3.5 等權值連邊隨機化(Equal-Weight Edge Randomization,EWER)

有時候需要移除存在于集聚的靜態網絡中拓撲結構的相關性(如網絡中個體對間的累積交互數目,對應于靜態網絡中連邊的權值),并保持網絡中連邊的時效特性不變(如間隔時間分布)[85]。在這種情況下,就需要對集聚的靜態網絡中具有相同權值的連邊進行隨機交換。具體操作是:隨機選擇兩組具有相同交互數目的個體對(連邊),然后保持連邊對應的時間標簽不變,交叉置換每條連邊的兩個個體。經過這種隨機化過程后,網絡中單個連邊存在的陣發性特征得到保留,同時其他在隨機置換時間標簽零模型中保留的性質(如每條連邊上的交互數目,整個系統層面的交互事件發生頻率,以及累積的加權交互網絡上的拓撲結構)也能得到保留。但是唯一的缺點是,這種零模型對于數據量的需求很大,這樣才能有足夠多的具有相同交互事件數目的連邊得以進行交換。

3.6 任意權值連邊隨機化(Edge Randomization,ER)

這種零模型和上面的等權值連邊隨機化零模型類似,唯一的區別在于該模型是對整個網絡中具有任意交互數目的連邊之間進行隨機交換[85]。這相當于隨機交換了集聚靜態網絡中所有連邊的權值(即每條連邊上發生交互事件的次數)。然而,得到的零模型中所有連邊的交互間隔時間分布仍然保持不變。

3.7 時間反演(Time Reversal,TR)

這種零模型是為了研究具有因果交互序列[86]出現的頻率及對于網絡結構的影響。這里因果交互序列指的是某個交互行為會觸發其他個體間進一步的交互行為。因此時間反演的做法是將原始交互事件的時間標簽次序完全顛倒過來。如果連續的交互事件是因為這種因果時效相關性引起的,則在反演后的交互序列中同樣會存在相近數目的交互事件。相比于原始交互序列,在時間反演的零模型中缺失的這種因果鏈式交互事件數目可以歸因為時間次序的影響。

以上討論的各種時效隨機零模型在一定程度上都保留或摧毀了網絡中存在的某些拓撲結構或時效特征。為此,在表1中我們總結了每種時效零模型對比原始數據保留和移除的特征。N為無權靜態網絡拓撲結構,WN為有權靜態網絡拓撲結構,DD為度分布,WD為權重分布,GT為全局時間序列,LT為單邊時間序列,R為時效相關性。隨機置換連邊和隨機化連邊上的交互時間分別摧毀了網絡連邊和交互事件的相關性,但兩者均保證了產生的集聚靜態網絡的度分布不變。這兩種隨機化技巧可用于研究時間相關性對時效網絡上的動力學過程的影響。隨機生成交互的時間標簽打亂了原始數據中人類行為活動所特有的周期節律,可以用來研究其對時效網絡上動力學的影響。如果想要研究網絡上連邊對應的個體對的特定交互時序和相鄰連邊的相關性,可以用等權值連邊隨機化和任意權值連邊隨機化分別對比隨機生成時間標簽的零模型,等權值連邊隨機化過程會摧毀原始數據集聚而成的靜態網絡中的連邊間的時效相關性,而任意權值連邊隨機化過程會進一步摧毀連邊上的交互事件數目與拓撲結構的相關性。時間反演零模型則往往用于研究個體對交互事件發生的特定時序對時效網絡上動力學過程的影響。綜上所述,想要研究時效網絡上的某種結構特征對網路上發生的動力學過程的影響,構造合適的零模型作為參考對照模型尤為關鍵。

注:√(保留的特征),×(不保留特征)。

4 時效網絡生成模型

時效網絡的生成模型稍微不同于靜態網絡。對于經典的復雜網絡建模工作,尤其在網絡科學誕生早期,大量的研究工作關注于生成帶有特定網絡結構(如冪律度分布[3],社團結構[87]等)的靜態網絡模型。近年來,以移動互聯網為代表的技術變革引發的“數據革命”使得獲取海量實時的人類行為數據成為可能。這為學者們使用時效網絡框架來對現實世界中動態變化的人類交互行為進行建模提供了溫床。利用實際數據來分析人類交互模式并進行建模產生了大量的時效網絡模型。盡管這些時效網絡模型從思路上各不相同,但本質上都是在完成兩個任務。其一,旨在復現實際數據中的基本網絡結構,以及這些不同的網絡結構對時效網絡上發生的動力學過程的影響。其二,提供一個理論研究框架,用以定量解析網絡生成模型中所涉及的主要參量及動力學規律。接下來,我們來簡要回顧一下目前常見的幾類經典的時效網絡生成模型。

4.1 嵌入連邊動力學的網絡模型

生成時效網絡的一個最直接的方法就是先通過已有的復雜網絡模型生成一個靜態網絡(如ER隨機網絡[88]、WS小世界網絡[2]和BA無標度網絡[3]等)。這個靜態網絡可以作為集聚所有時效網絡后最終期望得到的網絡形式。然后,可以對靜態網絡中的每條連邊分別賦予其活躍的時間標簽?;谶@個想法,Holme等人[89]提出了引入連邊動力學的網絡模型。該模型滿足如下規則:

1)通過配置模型[90]生成一個靜態網絡,去除網絡中的重邊與自環;

2)對于網絡中的每條連邊,賦予其一個活躍的時間區間,該活躍區間的持續時間取自一個冪律截斷的分布函數,區間的起始時刻從整個時間周期內隨機選取,在得到的活躍區間內該連邊對應的個體對可以發生有效的交互行為;

3)生成滿足一定分布函數的個體對交互事件發生的間隔時間序列;

4)用上面得到的間隔時間序列對每條連邊的活躍區間按其長度比例進行分段,然后將交互事件分別加在每個時間間隔處。

圖3 活躍度驅動網絡模型的示意圖[11]

這種把時間特性和網絡拓撲相耦合的建模方法非常簡單明了,底層的靜態網絡拓撲結構可以根據實際的聚集網絡任意配置。Rocha等人[91]還介紹了一種類似的建模方法,唯一的區別在于其考慮的節點活躍區間是緊跟著另一個節點活躍區間的結束,因此在任意一個時間段內活躍的節點數目保持不變,而上述的連邊激活方法不能保證在一個時間段內活躍的連邊數目恒定。

4.2 活躍度驅動網絡模型

Perra等人[11]討論的時效網絡模型(見圖3)不再是基于一個固定的底層靜態網絡拓撲,而是引入了圖序列來表示時效網絡在每個時間步的網絡。文中引入了節點活躍勢能的概念來刻畫節點在每個時間步活躍的概率。初始時賦予每個節點i一個給定的活躍勢能ai=ηxi,其中xi取自實際數據中觀察得到的概率分布函數F(xi),為避免概率發散xi∈[ε,1],ε是下限截止概率,參量η的引入是為了調節每個時刻的活躍節點數目使其固定為η〈x〉N。節點的活躍勢能衡量了時效網絡中個體參與社會交互的頻繁程度。定義Gt為每個離散時間步t的網絡快照。模型網絡的具體生成過程為

1)在時間步t,網絡Gt初始由N個孤立的節點組成;

2)對每個節點i,它以一定的概率aiΔt被激活,被激活的節點發出m條連邊隨機連接到m個不同的節點。不活躍的節點同樣可以被活躍的節點所連接。Δt是時間窗口的大小,同樣也為該時刻所有連邊的持續時間;

3)在下一個離散時間步t+1,網絡Gt中的所有連邊被移除;

4)重復以上過程,直至達到時間長度T。

4.3 節點-連邊記憶網絡模型

不同于活躍度驅動模型中每條連邊活躍的持續時長為一個時間步,Colman等人[76]認為個體在每個時間步移除所參與連邊的概率會受到該條連邊持續時長的影響,持續時長越久的連邊在每個時間步更迭連邊時越容易被移除。另外,活躍度驅動模型僅考慮了節點的活躍方式,在此基礎上,Vestergaard等人[66]提出了一種節點—連邊記憶的時效網絡模型。在該模型中,網絡中節點和連邊的活躍均會受到自身狀態持續時長的影響。文中考慮的網絡由N個個體構成,這些個體產生的N(N-1)/2個交互對(i,j)都是潛在的活躍連邊。如果個體i與個體j進行了交互,則連邊(i,j)活躍,否則不活躍。記t時刻網絡中活躍連邊的數目為M1(t)。個體的狀態持續時長由t-ti表征,其中ti是個體最后改變狀態(獲得或斷開當前某條連邊)的時刻。連邊的狀態持續時長由t-t(i,j)表征,其中t(i,j)是連邊最后改變狀態(變得活躍或者不活躍)的時刻。初始時,設定網絡中所有的個體都是孤立的,所有的連邊都是處于不活躍狀態。在每個時間步dt,對所有的個體和活躍連邊的更迭過程如下:

1)每個活躍連邊(i,j)以概率dtzfl(t-t(i,j))變得不活躍,其中fl是關于連邊的狀態持續時長t-t(i,j)的函數,z是控制連邊狀態改變速率的參數;

2)每個個體i與其他個體以概率dtbfa(t-t(i))建立連邊,其中fa是關于個體的狀態持續時長t-ti的函數,b是控制交互連邊建立速率的參數。個體j以概率πa(t-tj)πl(t-t(i,j))被其他未和個體i交互的個體選擇并建立連邊。其中πa和πl分別是關于t-tj和t-t(i,j)的函數。如果連邊(i,j)從未活躍,我們設定t(i,j)=0。

在該模型中,節點和連邊的記憶效應分別由它們狀態持續時長的記憶核函數f和π刻畫。這些核函數均采用了冪律函數的衰減形式來表征實際時效網絡中統計得到的時間特征,即交互持續時間分布和交互間隔時間分布。

圖4 空間偏好移動與隨機交互模型的示意圖[102]

4.4 面對面交互網絡模型

Starnini等人[101]提出了一個基于二維平面上的隨機游走模型來描述現實世界中的面對面人類集群交互行為。在該模型中,節點游走到一個節點的幾率與該節點的吸引力成比例。若節點的吸引力越大,它越會提高其他節點對該節點的興趣,從而減慢其他節點遠離該節點的隨機游走速率。另外,該模型糅合了節點活躍度、吸引力、隨機游走等概念,能夠很好的模擬現實世界中的會場、校園或醫院背景下的面對面交互數據,缺點是不能擬合無地理空間約束的交互行為,也不能擬合具有地點偏好移動的情況。Zhang等人[102]基于以上模型提出了一個更加精細的空間偏好移動和隨機交互模型(見圖4)。模型中假定M個移動個體在一個擁有M個交互地點的加權空間網絡g中,網絡中兩個地點之間的連邊權重表示個體在兩個地點間移動所花的時間。對每個移動的個體,他會以一定的概率自動激活為活躍狀態并進行移動,且存在一個偏好的停留地點,而對其他地點以等概率無偏好停留。初始時,所有個體都停留在各自的偏好地點。具體建模過程滿足以下規則:

1)每個個體i以給定的活躍率(活躍率a∈(0,1)滿足均勻分布)被激活;

2)當節點狀態為不活躍時,每個地點按照各自的吸引率q吸引非活躍個體向其移動。非偏好地點具有相同的吸引率q=(1-p)/(M-1)。偏好地點的吸引率為q=p+(1-p)/(M-1),其中p∈(0,1)代表偏好率。在移動過程中,個體不會被激活;

3)重復以上過程,直至達到仿真時間長度T。

此外,Zhang等人[14]還根據現實面對面交互數據中發現的群體活躍現象和短時高可達現象,進一步改進了Starnini等人提出的二維平面隨機游走模型,并引入了集體變化的個體活躍度、與個體活躍度相關的個體移動速度、以及變化的場地大小3種機制,經過改進后的機制可以很好的擬合真實數據中的群體活躍現象和短時高可達現象,同時對人造的模型網絡上進行傳播仿真也可以達到和真實時效網絡上一樣的感染規模。然而,很多發生在虛擬空間內的人類交互行為是沒有明確的地點屬性的,也不涉及個體的實際移動,例如人與人之間通過在線社交媒體工具進行的線上交互行為。以上的模型都不能擬合這種不帶有空間約束的人類交互行為。

4.5 時間演化網絡模型

圖5 記憶驅動網絡模型的示意圖[107]

以上這些研究工作僅考慮個體對上一時間步的鄰居進行連邊保留且與每個鄰居再次建立連邊的概率相同,因此忽略了交互事件發生的間隔時間對個體建立連邊時概率的影響。此外,個體的歷史交互信息對其自身活躍狀態轉變的影響在以往的研究工作中也同樣缺乏考慮?;诖耍琇i等人[107]通過對真實的人類交互行為數據進行實證分析,發現了兩種表征網絡演化的重要機制:個體活躍狀態轉變機制和連邊建立機制,并構建了一個記憶驅動的時效網絡模型。該模型假設N個個體在一個無權的人類交互網絡g中。每個時間步的網絡中所有個體存在兩種狀態:活躍態與不活躍態。假設個體能夠進行連邊保留的最大記憶步長為L,也就是說,個體在當前時間步的連邊建立只會受到過去L個時間步內建立的連邊關系的影響。這些連邊關系存儲在一個記憶網絡序列中GM={Gt-L+1,Gt-L+2,…,Gt-1,Gt}。我們產生L個隨機網絡[88]來對時效網絡g={G1,G2,…,GL}和記憶網絡序列GM={G1,G2,…,GL}分別進行初始化。每一個時間步t開始時,網絡Gt由N個孤立個體組成,整個時效網絡g={G1,G2,…,GL}的迭代過程如下(見圖5):

1)個體活躍狀態轉變機制:在時間步t度為k的活躍個體i以概率PA(k)=φk-a(φ∈(0,1])在時間步t+1變得不活躍,不活躍的個體以活化概率PA變得活躍。

2)活躍個體連邊建立過程:分配每個活躍的個體以s條連邊,其中連邊數目s從給定概率分布函數F(s)中得到。活躍個體的連邊建立依據以下策略:

(1)社交保留行為:個體i以保留概率p∈(0,1]從過去交往的個體中選擇個體建立連邊關系。選擇和其中任意一個個體j再次建立連邊的概率為pij。其中,pij是關于個體i與j上次發生交互行為的間隔時間Δ(i,j)的函數,滿足關系:pi,j=f(Δ(i,j))∝Δ(i,j)-γ,1≤Δ(i,j)≤L。

(2)社交探索行為:個體i以探索概率q=1-p隨機連接一個新的從未發生過交互行為(或已超出最大記憶時間步L)的個體。注意到,由于個體的交互記憶僅存在于有限的記憶網絡序列中,對在t-L時間步前發生過交互行為的個體不再進行連邊保留。

3)在下一個迭代時間步t+1,生成網絡Gt+1,更新記憶網絡序列為GM={Gt-L+2,Gt-L+3,…,Gt,Gt+1}。

4)重復步驟1)~3)直至達到仿真時間窗口T的結束時刻。

該模型可以成功復現出真實社交網絡中廣泛存在的爆發性交互特征和拓撲結構性質。同時,作者在利用實際數據構建的時效網絡上進行SI倉室模型的傳播仿真,發現相比于活躍度驅動模型該模型能夠更加準確地刻畫動態演化的真實時效網絡上發生的傳播過程。

5 基于人類交互行為的流行病傳播研究

在過去的20年間,移動互聯網技術和數據采集設備的廣泛應用為學者們帶來了大量高精度高質量的人類行為數據。從數據驅動的角度,學者們利用時效網絡來刻畫動態演化的人類交互行為,挖掘其背后統一的特征規律和行為模式,并通過對時效網絡上傳播過程的研究認識、理解和掌握真實人類交互行為對以流行病傳播為代表的傳播動力學過程的驅動作用。這也有助于人們設計控制干預的策略,并對所有具有類似傳播動力學特征的社會現象的演變提供有效評估,如信息輿論的傳播、創新思想的擴散和文化基因的流行等。

5.1 流行病傳播模型

圖6 不同倉室模型中個體狀態之間的轉換關系

1)在SI模型中,節點的狀態演化過程為S―I,當傳播過程結束后,整個網絡都會被感染成I狀態,因而一般用于近似模擬流行病傳播的早期階段。

2)在SIS模型中,節點的狀態演化過程為S―I―S,或流行病進入吸收態后一直保持S狀態,當傳播過程達到穩態時,整個網絡只會有S與I兩種狀態存在。

3)在SIR模型中,節點的狀態演化過程為S―I―R,當傳播過程進入吸收態或者達到穩態時,整個網絡只會有S與R兩種狀態存在。

進一步地,可以寫出3種流行病傳播模型的動力學方程。記ρS、ρI和ρR分別為網絡中處于3種不同倉室的個體密度。SI模型呈現出“滾雪球”的特點,網絡中感染個體數目按照如式(3)變化率增加:

(3)

顯然在每個時刻都有ρS+ρI=1。SIS模型和SIR模型的微分方程可以統一如下:

(4)

(5)

其中,χ=μ對應了SIS模型,而χ=0則對應了SIR模型。在SIR模型中,網絡中任意時刻恢復態個體的密度滿足條件ρR=1-ρI-ρS。

5.2 基于人類交互行為的流行病傳播研究

另外,陣發性和記憶性作為人類交互的兩大特點,在網絡的傳播過程中也起著非常重要的作用。Miritello等人[115]在利用歐洲一個國家的手機通話記錄構造的時效網絡上進行SIR傳播仿真,發現個體交互行為的陣發性和群組交互對網絡上的信息傳播具有截然相反的作用:個體的陣發性在大的尺度范圍內有效地阻礙了信息傳播,而群組交互則有利于信息在局部范圍內的擴散。更進一步,Kivel?等人[116]利用通話記錄構造的時效網絡和多個時效零模型網絡從單條交互邊、多條交互邊以及網絡整體層面等3個不同尺度上分別研究陣發性對時效網絡上傳播過程的影響,傳播仿真使用了SI傳播模型,結果發現3種尺度下的陣發性均對網絡傳播有減速效應,且隨著尺度的擴大,減速的效應也隨之衰減。Karsai等人[12]基于活躍驅動時效網絡模型[11],通過增加個體能夠記住過去發生交互的累計數目,并傾向于和之前已經交互過的個體再次建立連邊的記憶機制,構造了具有非馬爾科夫性的時效網絡。文中進一步研究謠言信息在由該模型產生的人工網絡上的SIR傳播過程,發現人類交互行為中存在的記憶機制會產生顯著的社團結構,并使得謠言信息無法在網絡中廣泛傳播。Sun等人[95]分別分析了活躍驅動時效網絡和帶有記憶性的活躍驅動時效網絡[12]對兩類經典的傳播模型—SIS倉室模型和SIR倉室模型所代表的傳播過程的不同影響。文中采用異質平均場理論進行理論解析并結合傳播仿真的結果,發現帶有記憶性的活躍驅動網絡會促進SIS傳播過程,但卻抑制了SIR傳播過程。為了有效地促進信息在網絡中的傳播,Gao等人[117]在傳統的SI傳播模型中引入了一種非馬爾可夫的傳播機制。作者考慮了個體在信息傳播過程中接觸到鄰居個體并傳播信息的概率會受到信息獲知者本身歷史交互記憶的影響。這里的歷史交互記憶指的是該個體在過去累計交往的個體中有多少已經被信息傳播過。文中通過在實際網絡上進行傳播仿真發現,度大的節點更容易在信息傳播的早期階段被觸及,而度小的節點則往往在信息傳播的后期才被接觸到。

5.3 流行病傳播的免疫策略研究

時效人類交互網絡中的流行病傳播的免疫問題是一個極具有應用性的問題,如何基于網絡中的某些特定拓撲結構和時效屬性綜合衡量個體的重要性程度,同時兼顧減少資源開銷及降低網絡爆發規模,來找到具有重要影響力的個體或交互鏈進行免疫尤為關鍵。當然,網絡傳播免疫除了應用在流行病免疫之外,在研究信息擴散、謠言傳播、產品推廣和社會影響力等方面,找到影響網絡傳播過程的關鍵節點都至關重要。

在時效網絡中,每個時間步的網絡隨時間不斷變化。如果直接把靜態網絡上的免疫策略照搬到時效網絡中,往往效果不一定顯著且可行性較低。一個可行的解決方案[22]就是把實際數據的采集時間(時間跨度為[0,T])分為[0,ΔT]和[ΔT,T]兩段。其中,[0,ΔT]作為“訓練窗口”負責采樣歷史的個體交互信息,利用這段時間內的數據構造時效網絡分析其特性,并據此對訓練窗口內網絡中出現的所有個體進行重要性排序。[ΔT,T]作為“測試窗口”負責衡量免疫效果的優劣,即從時刻ΔT開始,從訓練網絡中選取數目為f*N的重要節點進行免疫(其中,f為免疫的節點比例,N為網絡中所有節點的數目),并對整個數據進行流行病傳播仿真。

Tang等人[118]把靜態網絡上的中心性指標推廣到時效網絡上,提出了節點的時效介數中心性和時效接近中心性,用來衡量時效網絡中的節點重要性,并可以進一步用來設計合理的免疫策略。盡管這一方法保留了網絡中的時效信息,但作為一種全局性中心性指標,在計算復雜度上代價很大。為此,Lee等人[22]通過采樣一定時間窗口內的實證數據來獲取個體的局部信息,分別研究了采取免疫最近發生交互和最頻繁發生交互的個體的策略對SIS傳播過程的影響,發現隨機選取一個個體并對其最近發生交互的個體進行免疫是最為有效的免疫策略。在此基礎上,Starnini等人[23]進一步研究了免疫一定比率的個體分別對網絡傳播的時間延遲比例和爆發規模的影響,主要對比了包括基于節點度的免疫策略、基于節點的介數中心性的免疫策略、熟人免疫、最近交互免疫和隨機免疫等幾類傳統的免疫策略。此外,作者還著重研究了采樣實證數據的觀測窗口大小對傳播過程的影響,發現這些免疫策略的免疫效果并非一直隨著數據的觀測窗口時長的變大而不斷提升,而是達到一定觀測窗口大小后,免疫效果趨于飽和保持不變。Liu等人[93]基于活躍驅動時效網絡模型分別研究了隨機免疫策略、目標免疫策略和以個體為中心的免疫策略等三種不同的免疫策略,利用異質平均場方法進行理論分析并結合SIR模型進行傳播仿真,發現雖然目標免疫策略有利于阻礙網絡上的流行病爆發,但以個體為中心的免疫策略在實際應用中更易實現。

進一步地,Starnini等人[23]定義了兩種評價指標來衡量SI傳播中網絡免疫策略的效果。其中一種指標是感染延遲率。免疫節點集合v的感染延遲率τi可以計算為:

(6)

(7)

綜上,盡管對于時效網絡上傳播動力學的研究已有一些初步的理解和認識,但目前的研究工作還遠遠不夠,尤其是深入挖掘人類動力學與時效網絡結構之間的內在聯系,并進一步結合人類交互行為的動態演化特征來研究和控制傳播動力學,仍需要更加深入的研究。

6 展望

前文中,我們已經對時效人類交互行為的分析、建模以及以人類交互行為渠道的流行病的傳播等研究現狀作了較為簡要的回顧。近幾年,由于移動互聯網技術的飛速發展、智能可攜帶設備的普及以及大數據處理能力的提升,數據革命所帶來的海量數據使得學者能夠更加準確地感知和分析人類的交互行為模式。深入理解人類交互模式對以人類交互網絡為載體的各種動力學過程的影響,將為現實世界中的各種實際應用場景如流行病防疫、推薦系統設計以及謠言傳播的溯源與扼殺等等提供非常重要的理論指導。時效網絡作為一個新興的研究領域已經受到國內外學者的廣泛關注,也取得了一定的研究成果,但目前仍處于一個初期探索的階段,尚有待形成系統化完備的理論和技術支撐,仍有諸多挑戰性問題亟待解決。我們認為以下幾個方面將是研究的主要方向。

6.1 構建表征人類復雜交互行為的模型框架

6.2 設計有效的時效網絡上的疾病傳播免疫策略

正確認識并理解人類交互網絡上發生的動態過程,最終的目標仍然是回歸到實際的現實場景中,實現控制并干預以人類交互行為為渠道的流行病的傳播、信息輿論的擴散以及文化基因的流行等傳播過程。其中,一個很重要的應用就是針對實際網絡的拓撲特性和時效特征的不同“量身定制”一款最有效的網絡傳播免疫策略。一般而言,這些最優的免疫策略往往在一定程度上反映了節點的相應屬性在網絡中所起的作用,并進一步地可以體現出節點的重要性排名。真實的人類交互行為是動態變化的,所形成的人類交互網絡也在隨著時間發生改變?,F有的關于時效網絡上免疫策略的研究很多是把觀測時間內的人類交互行為集聚成靜態網絡,然后直接套用靜態網絡上節點的重要性評價指標。這類方法損失了人類交互行為中豐富的時效信息,無法捕獲人類交互網絡隨著時間演化的動態特征。另外,對靜態網絡上的指標進行時效擴展有時候不一定可行。例如,在時效網絡中,每個時刻節點的連邊不是固定不變的,隨著時間變化數目不斷改變。如果依據靜態網絡中的最大度免疫,則需要觀察完足夠長的時間并集聚得到靜態網絡后方能確定。同時,時間的引入也帶來了節點之間的時間相關路徑的問題,使得流行病在節點間的傳播會極大地受到連邊時序性的限制。以上這些表明,如何基于時效網絡設計更合理有效的疾病傳播免疫策略仍然是一個值得探討的課題。

6.3 厘清時間尺度不一致問題對網絡傳播動力學的影響

6.4 數據采樣所造成的信息不完整問題

由于數據采集設備的限制以及人類活動的影響,實際得到的數據集往往不可能完全覆蓋所研究的個體的所有交互行為,因此如何利用不完整的數據來挖掘人類交互模式[35]并研究構建的時效網絡上的傳播動力學[120]是一個非常重要的科學問題。文獻[121]通過對多個采集到人類行為數據集的重采樣和重建,估算數據不完整性對時效人類交互網絡中動力學過程的影響,以此來修正實驗得到的結論。但是,對于很多實際采樣得到的數據集,往往只是很短的一段時間內的一部分人群交互行為的小樣本數據,采樣到數據是否滿足獨立性以及一些統計分布的前提假設條件是一個問題,數據本身是否存在誤差也是一個不可避免的質疑。如何利用這些不完整甚至有一定數量的錯誤偏差的小規模數據集來研究人類行為有待進行進一步研究。

猜你喜歡
人類模型
一半模型
顫抖吧,人類
哈哈畫報(2022年4期)2022-04-19 11:11:50
人類能否一覺到未來?
人類會成長起來嗎?
英語文摘(2021年2期)2021-07-22 07:56:54
重要模型『一線三等角』
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
重尾非線性自回歸模型自加權M-估計的漸近分布
1100億個人類的清明
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 日韩黄色在线| 国产一区二区在线视频观看| 日韩欧美在线观看| 亚洲69视频| 国产在线观看91精品| 亚洲一区二区约美女探花| 国内熟女少妇一线天| 91视频国产高清| 欧美高清日韩| 亚洲成人黄色在线| 青青草原国产免费av观看| 国产一区二区精品福利| 国产精品亚洲va在线观看| 青青久视频| 99福利视频导航| 亚洲精品桃花岛av在线| 国产情侣一区二区三区| 最新日本中文字幕| 国产99精品久久| 欧美亚洲第一页| 久久久国产精品无码专区| 久操线在视频在线观看| 国产成人精品无码一区二 | 久久伊人操| 在线va视频| 久久精品亚洲热综合一区二区| 日本精品视频一区二区| 2021国产v亚洲v天堂无码| 亚洲 日韩 激情 无码 中出| 亚洲人成网站18禁动漫无码| 天堂网亚洲综合在线| 中文国产成人久久精品小说| 天天综合网亚洲网站| 91免费观看视频| 久久精品91麻豆| 99re免费视频| 在线毛片免费| 成人欧美日韩| 亚洲国产无码有码| 97成人在线观看| 亚洲免费福利视频| 99热这里只有精品免费国产| 97在线观看视频免费| 国产在线无码一区二区三区| 亚洲国产高清精品线久久| 国产在线观看91精品| 凹凸精品免费精品视频| 国产精品密蕾丝视频| 精品人妻系列无码专区久久| 五月激激激综合网色播免费| 高清亚洲欧美在线看| 日韩av无码DVD| 原味小视频在线www国产| 国产一区在线视频观看| 国产无码在线调教| 亚洲女同一区二区| 亚洲第一色视频| 国产男人的天堂| 激情国产精品一区| 久久亚洲国产最新网站| 久久久国产精品无码专区| 国产成+人+综合+亚洲欧美| 久久影院一区二区h| 亚洲第一国产综合| 亚洲日韩图片专区第1页| 国产一级二级在线观看| 国产精品丝袜在线| 欧美另类视频一区二区三区| 小13箩利洗澡无码视频免费网站| 国产精品无码一二三视频| 亚洲高清中文字幕在线看不卡| 国产不卡国语在线| 女同国产精品一区二区| 一本久道久综合久久鬼色| 99热国产在线精品99| 日韩A∨精品日韩精品无码| 国产成人午夜福利免费无码r| …亚洲 欧洲 另类 春色| 国产精品林美惠子在线观看| 91久久精品日日躁夜夜躁欧美| 2021国产精品自拍| 91久久国产热精品免费|