潘樂,李弼程,萬旺,曾榮燊
(華僑大學 計算機科學與技術學院,福建 廈門 361021)
互聯網的迅速發展及移動設備的快速更新換代助推了在線社交網絡的發展,極大拓寬了人們獲取消息、傳播信息的渠道,傳播主體的下沉使每個人都能成為信息傳播的主體。然而個體意見通過社交網絡匯聚成集體意見,民意的自由表達若被有心人利用,將引發社會輿論。因此,社交網絡信息傳播的研究是必要的。
近年來,深度學習技術在眾多領域的不同任務中均展現了較為優異的性能。在信息傳播領域,利用深度學習技術處理信息傳播預測任務有一套較為通用的流程:首先,將社交網絡用戶節點與連邊進行網絡表示學習(Network Representation Learning,NRL)[1],將網絡結構數據表示為低維稠密向量;然后,將低維稠密向量的網絡節點作為輸入進行各類信息傳播預測任務。BOURIGAULT等[2]利用現有擴散級聯進行信息傳播的表示學習;LI等[3]利用表示學習進行信息擴散概率預測。要提升信息傳播預測的性能,合適、高效的NRL 方法顯得尤為重要。
隨著微博、知乎等開放型即時信息交流平臺的發展,信息傳播不再局限于好友關系之間,更多的是陌生人間出于對某個言論的贊同而進行的轉發操作。在信息傳播網絡中,關聯可以表示為一個人與另一個人存在好友或關注關系,而信息傳播可以發生在兩個好友之間的消息交流(存在關聯邊)或陌生人之間的信息轉發(不存在關聯邊)。區分并同時考慮這兩種傳播情形才能更好、更完整地描述節點之間的信息傳播。
為增強信息傳播網絡動態表示的有效性和效率,本文基于社交網絡關系強度理論和信息反饋機制,提出動態網絡表示(Dynamic Network Representation,DNRep)模型。將信息傳播動態網絡劃分為傳播網絡(弱關系網絡)和關系網絡(強關系網絡),使用強關系變化輔助影響弱關系交互,以動態變化驅動網絡,并用歸納式的方法從兩個子網絡的相互驅動中得到網絡表示。此外,引入反饋機制,在節點聚合更新信息之后將信息反饋到鄰域,提高動態網絡表示的效率。
靜態網絡表示方法早期大多基于譜聚類[4-5],但這類方法的時間和空間復雜度較高,無法滿足日益增長的網絡規模的需求。隨著網絡表示學習的發展,許多新的表示學習模型被提出。DeepWalk[1]將網絡嵌入問題描述為一個序列建模問題,通過隨機游走的方式生成節點序列,并使用Skip-Gram 學習節點表示。基于DeepWalk 模型,Node2vec[6]集成了深度優先搜索和廣度優先搜索策略,能更靈活地挖掘網絡結構信息。結合外部信息的方法有TADW[7]、CANE[8]、MMDW[9]。以上靜態網絡表示學習方法嘗試解決目前網絡空間大規模性、高維性難題,然而真實世界的互動系統是動態的,其連邊、節點都隨時間不斷變化。這些時間特性是動態網絡的重要體現,也反映了網絡演化的機制。因此,在信息傳播領域的研究中靜態網絡表示學習并不適用。
關于動態網絡的研究相對較少,且大多數研究局限于表示為圖的快照序列的離散時間動態圖[9-11],通過忽略時間演化特性將靜態網絡深度學習模型應用于動態網絡中,但這并非最優方案,且這些方法對于每一個時間片都需要進行重新訓練,時間成本巨大。此外,這些方法雖然能夠展現網絡在不同時刻的變化特征,但缺乏對網絡動態變化本質屬性的挖掘,對現實網絡的高度動態性建模不夠[12]。
近期,有學者提出幾種支持連續時間的動態網絡表示學習方法。XIONG等[13]提出DynGraphGAN模型,利用生成對抗網絡(Generative Adversarial Networks,GAN)捕獲因節點或邊的變化而導致的網絡局部結構的變化。Dyngraph2vec[14]使用長短期記憶(Long Short-Term Memory,LSTM)網絡模型捕獲節點的變化特征,包括每個時刻節點間的非線性交互結構特征和節點多個時刻間的變化特征。DyRep[15]模型將網絡中的演變劃分為關聯演變和社交演變,運用注意力機制聚合節點變化,從而對網絡結構產生影響。
對于社交網絡中的信息傳播而言,動態網絡表示學習依舊存在如下2 個挑戰:
1)結合傳播學理論建立更貼合真實世界的有效網絡表示。本文在進一步分析社交網絡中的信息傳播時發現,在信息傳播網絡中普遍存在著區別于社交強關系的弱關系(即存在非好友關系的用戶形成了信息傳播關聯)。強弱關系假設是社會學與傳播學中一個很重要的理論,FRIEDKIN等[16]認為弱關系在信息流傳播過程中起推動和“橋梁”的作用,連接了不同的關系群體。而在現今開放社交網絡蓬勃發展的情景下,弱關系的存在可使信息傳播得更快、更廣,因此弱關系的存在是不可忽視的。
如圖1 所示為信息傳播動態網絡示意圖,可以看到在社交網絡中存在用戶之間單向或雙向的關注形成的強關系,同時,更普遍存在著關系疏遠、互動頻率較低,但在信息的傳播中發揮一定作用的弱關系。此外,在信息傳播過程中,也會有新節點的加入以及新關系的形成。
2)及時捕獲網絡動態演化信息。自然觀察到的關聯以及之間的交互行為存在動力學關系,但目前沒有方法能夠對它們進行聯合建模,進而通過動態圖進行表示學習。此外,當前大部分算法都是直推式的,即針對特定領域或特定網絡結構生成固定節點嵌入,而當網絡結構或信息發生改變時,直推式表示學習模型就需要進行重新訓練,相較之下歸納式學習的方法更適用于網絡變化。然而大多數歸納式學習的方法僅采用聚合的方式生成節點表示,對于信息傳播網絡容易造成延遲,導致下游機器學習任務的性能受到影響。
為解決以上2 個問題,本文受DyRep[15]模型的啟發,結合社會傳播學中的關系強度等相關理論,加入信息反饋機制,建立更適用于社交網絡信息傳播擴散分析的動態網絡表示模型DNRep,用以對信息傳播網絡進行動態網絡表示,解決現有方法不能很好地反映真實傳播網絡、忽略信息傳播中的動力學特征等問題。
人與人之間的關系有強弱之分,美國的社會學家KEUCHENIUS[17]認為劃分人際關系的主要標準是雙方互動和情感維系的強弱,其中互動較多且雙方關系比較緊密的是強關系,而互動較少且沒有較強情感維系的就是弱關系。文獻[18]將此種關系強度理論引入到社交網絡的劃分中,可以認為用戶間已建立的關系網絡就是一種強關系,信息能夠輕易地在強關系網絡中傳播。而由用戶間的信息交流構成的傳播網絡則可以認定為弱關系,只在某一時刻針對特定事件或特定信息產生互動,是一種臨時性的短期關系。
基于以上理論,本文定義t時刻的傳播動態網絡:

其中:Vt為節點集合;et表示邊的集合。在時間窗口[0,t]中網絡變化的集合定義如式(2)所示:

其中:u,v表示發生變化的2 個節點;t表示時刻;k作為一個標記,k=0 代表網絡拓撲結構演變(即關系網絡的變化),k=1 代表“固定”網絡拓撲結構上的交互活動(即傳播網絡的變化)。在信息傳播網絡中t時刻發生的變化也可簡化描述為ti,k,k∈{0,1}。
本文定義Ei∈Rd為節點i的d維表示,而節點表示隨時間的推移而變化,因此本文將其定義為關于時間的函數Ev(t)。
在建立DNRep 模型時,本文結合了傳播學中的關系強度理論,將信息傳播動態網絡劃分為關系網絡(強關系)和傳播網絡(弱關系)。考慮到在信息傳播過程中,關系網絡和傳播網絡都在不斷變化,而兩者是共存的,且變化相互影響,形成傳播動力學演化機制,因此將表示學習過程作為2 個網絡的中介過程,將2 個網絡的變化過程聯系起來,從而驅動2 個網絡演變,并使節點表示隨時間動態演化。DNRep模型的整體框架如圖2 所示。

圖2 DNRep 模型的整體框架Fig.2 Overall frame of DNRep model
圖2 中關系網絡的連邊表示用戶之間的關注、好友等強關系的建立,一旦連接會造成長期性的路徑變化,導致當前網絡拓撲結構的改變。網絡中節和邊的增加是關系網絡演變的過程,在輿論事件發生時,往往伴隨著大量節點的增加,網絡拓撲結構會不斷改變,而在關系網絡中兩節點間如果存在關注或好友關系,事件信息就會沿著這條路徑傳播,且這種傳播路徑是長期存在的。
傳播網絡只表示了當前網絡中已有節點之間的傳播行為,沒有考慮引入新的節點和新的關系連邊情況,并且這種傳播行為是臨時性的短期關系,屬于弱關系,這更貼合真實世界輿情事件發生時的傳播情況。
關系網絡與傳播網絡相互演化,兩者的變化更新了網絡表示,同時網絡表示的更新通過反饋機制將當前時刻的變化信息實時反饋至兩個網絡,保證了網絡表示的及時性。
在信息傳播網絡中影響節點表示變化的因素主要有3 個:
1)用戶節點間建立新的關系(強關系或弱關系),信息從一個鄰域傳播到另一個鄰域;
2)節點自身過去變化帶來的影響(如時間衰減);
3)外部因素影響。因此節點更新的表示可以描述為式(3)所示:

其中:Ev(t)為節點v在t時刻的節點表示;Ms(t-1)表示t-1 時刻用戶節點鄰域間的影響,即提取、聚合了網絡結構信息并反饋了變化信息;(t-1)是關于節點v的鄰居節點u的信息表示向量,其中包含注意力機制;Mr Ev(t-1)表示自身歷史變化帶來的影響;Ev(t-1)是節點v過去表示的周期性狀態;Mt(τ-τt-1)表示外部環境的影響,如與該節點相關的兩次網絡拓撲結構的變化之間會產生外部影響;τ表示時間點;Ms、Mr、Mt為可學習參數。
對于式(3),(t-1)為輸出的表示向量,包含節點注意力的更新、節點信息的聚合和變化信息的反饋,且鄰域帶來的變化對節點更新的表示影響最大,是本文重點研究和改進的部分。
信息傳播網絡中用戶節點的變化大致可以分為3 類:
1)該時刻節點間只形成弱關系;
2)節點間已存在關注、好友等強關系,該時刻發生了如轉發等的弱關系交互行為;
3)該時刻節點間既形成了強關系也形成了弱關系。
以第3類,即關聯網絡與傳播網絡同時發生變化為例,DNRep模型更新節點表示的流程圖如圖3所示。

圖3 DNRep 模型更新節點表示的流程Fig.3 Procedure of update node representation of DNRep model
圖3 展示了在t時刻,節點2 與節點4 之間發生關聯(強關系)與傳播(弱關系)行為,由于關系網絡與傳播網絡同時發生變化,因此需要更新相關節點的鄰接矩陣與注意力權重,同時聚合節點信息并反饋節點變化信息,最后結合自相關項與時間項更新節點表示。
由于節點間的變化可能有3 類不同的情況發生,因此對于節點鄰域信息的更新,本文對3 類情況分別進行討論。
1)節點i與節點j在t-1 時刻無關聯,t時刻發生i到j的傳播行為。
此時由于僅形成弱關系,因此節點的注意力關系強度矩陣S不變,即:

2)節點i與節點j在t-1 時刻已存在關聯,t時刻發生i到j的傳播行為。
為了度量節點對的關系強度,引入概率密度λ。考慮λ需要滿足計算結果為正值的條件下還需要區分關聯網絡與傳播網絡,本文利用Softplus 函數作為外部函數,概率密度λ的計算式如式(5)所示:

其中:ψk是可學習的標量時間尺度參數,表示對應網絡發生變化的速率;mk∈R2d為學習時間尺度特定兼容性的模型參數;[·∥·]為聚合過程,表示2 個節點上一時刻節點表示的聚合。
所以λ時刻節點的注意力關系強度矩陣S的計算式如式(6)所示:

其中:Ni(t)表示節點i的鄰居節點個數。
3)節點與節點j無關聯,t時刻同時發生關聯以及從i到j的傳播行為。
由于在t時刻產生關聯,所以節點i與節點j的鄰接矩陣更新為Ai,j(t)=1。關聯行為產生的網絡拓撲結構的改變也使得節點i鄰域注意力權重發生改變,同時在t時刻傳播網絡也發生了變化,因此節點i與鄰居節點的注意力關系強度矩陣S的計算式為式(7)所示:

其中:Ui表示節點i所有鄰居節點的集合。新產生關聯的節點i與節點j的注意力關系強度矩陣S的計算方式見式(6)。
如圖4 所示,在局部傳播部分,模型捕獲了節點豐富的鄰域結構信息,下一步需要進行節點信息的聚合。目前信息聚合常用的方法有均值聚合、pooling 或者使用LSTM 框架等,但這些方法普遍存在忽略節點重要性或復雜度過高的缺點。
本文將注意力機制應用到動態模型中來度量各個節點的權重,考慮了網絡動態變化對注意力的影響,并利用Softmax 函數將聚合信息以向量形式輸出,因此節點i鄰域信息聚合的輸出向量(t) 的計算式如式(8)所示:

其中:Si,r(t)表示節點i與鄰域的注意力關系強度矩陣;Er(t-1)表示節點i的鄰居節點t-1 時刻的節點表示;Mh與bh為可學習的、控制信息傳播的參數;Ui(t)表示節點i的鄰居節點集合。
在式(3)中,由于Ej(t-1)為自相關項,(τ-τt-1)為時間相關項,兩者均可通過直接計算得到,因此可以根據式(3)計算得到i時刻的節點表示Ei(t-1)。
為提高網絡更新的速度,本文引入反饋機制,將節點i的信息反饋到其鄰居節點。在發生動態變化的節點i更新了節點表示后,節點i向鄰域反饋了自身變化信息,鄰居節點的表示Er(t)的更新公式如式(9)所示:

其中:Er(t-1)為t-1 時刻節點i的鄰居節點表示;Md為可學習向量;(Ei(t)-Ei(t-1))表示節點i的變化信息;Ui(t-1)表示t-1 時刻節點i的鄰居節點的集合。
模型采用無監督的學習方式,整個模型待學習的參數空間Ω表達式如式(10)所示:

模型的訓練過程通過最小化負對數似然實現,對于一個在時間窗口[0,T]上產生了n次變化的集合O,損失函數L的定義如式(11)所示:

其中:n≠0;λ為節點對關系強度的概率密度函數;等式右邊最后一項表示總的殘存概率。
為評估DNRep 模型學習到的節點表示,將其應用于動態網絡的鏈接預測任務。
為更好地評估模型的性能,提高模型的可比性,本文選用前人工作所使用的數據集,包括Social Evolution 數據集和Github 數據集。
Social Evolution 數據集[19]是麻省理工學院人類動力學實驗室利用手機應用程序,收集了參與實驗的83 名師生在2008 年10 月—2009 年5 月期間的社會關系、政治觀點、通信等記錄。該數據集包含了超過200 萬個事件(包括信息傳播事件與關系建立事件)。本文將觀點交換等信息傳播事件作為模型的傳播網絡,將師生間的親密朋友關系作為模型的關系網絡。由于相鄰間隔記錄的數量太大并且包含大量噪聲,因此本文采用與DyRep 模型[15]相同的方式對該數據集進行預處理,根據相鄰間隔記錄發生的概率進行過濾。
Github 數據集[20]根據時間軸記錄了開發人員編寫代碼、提交文檔、訪問、收藏等內容,數據集每小時更新一次。本文選取了自2012年12月28日—2013年12 月31 日的數據。本文將開發人員間的關注、收藏等行為構成的網絡作為模型的關系網絡,將文檔的訪問、提交等行為構成的網絡作為模型的傳播網絡。采用與LDG 模型[21]相似的預處理方法后,得到的數據集統計如表 1 所示。

表1 數據集信息 Table 1 Dataset information
鏈接預測就是預測下一時刻可能產生交互關聯的用戶。由于存在大量潛在的目標用戶,因此精確地預測下一個用戶通常是不現實的,但是可以預測一個用戶候選集。預測下一個可能轉發信息的用戶可以被視為一個檢索問題,將所有下一時刻可能產生鏈接的用戶進行排序,采用排名指標作為評價標準。參照現有的信息傳播擴散研究[15,21-22],選擇前10 命中率(HITS@10)和平均排名(MAR)作為評價指標。
HITS@10:在預測任務時對于給定元組,計算其與其他節點的條件密度,并對它們進行排名,再與下一時刻進行對比,測試節點出現在前10 名的次數比例。HITS@10 值越高表示實驗評價結果越好。
MAR:測試元組的平均排名。MAR 越小則實驗評價結果越好。
實驗的超參數設置:訓練的batch_size=200,dropout=0,隱藏層的神經元個數d=32。本文使用Adam 優化器[23]來訓練模型,學習率為0.000 2,每個模型運行10 次取平均結果。
為更好地對比模型性能,本文選擇7 種具有代表性的模型作為對比模型,具體如下:
1)Node2vec 模型[6],指利用網絡中存在類似結構特征(即社區結構)的特點而設計的一種既保持節點鄰居信息又能體現網絡信息的易訓練網絡嵌入模型,其基本思想和DeepWalk 類似,也是生成隨機游走,對隨機游走進行采樣得到網絡節點表示。
2)DynGEM 模型[10],一種動態網絡表示學習模型,使用深度自編碼器對動態圖的快照進行編碼,將時間線劃分為離散的時間點,并保留結構,學習在這些時間點上的圖形快照嵌入。
3)GraphSage 模型[24],一種歸納式表示學習模型,采樣圖中每個節點的鄰居結構信息,再通過聚合函數聚合采樣信息,從而得到圖中各個頂點的向量表示。
4)GAT模型[25],在GraphSage 模型的基礎上對鄰域采用多頭非均勻注意力機制。
5)Know-Evolve 模型[26],是將時間點過程引入動態圖表示學習的先驅,模型結合動態時間點過程和深度神經網絡框架,考慮了知識隨時間的進化以及實體在多元關系中復雜的交互過程,通過參數化條件強度函數和關系得分將知識圖中事件的發生建模為多維點過程。
6)DyRep 模型[15],將圖結構的變化分為2 種過程,引入聚合機制并結合注意力機制,通過訓練對應的參數得到相關節點表示,且這種表示是可以動態變化的。本文所設計模型是基于DyRep 模型進行改進的。
7)LDG 模型[21],使用神經關系推理模型推理圖中的事件類型,可以同時考慮2 種以上類型的邊,將DyRep 模型拓展為研究多關系圖,同時還加入雙線性編碼層,用以捕獲不同節點間更深層次的交互。
對于Social Evolution數據集,本文對2008年1月—2008 年9 月10 日間的數據進行初始化,將2008 年9 月11 日—2009 年4 月的數據作為訓練集,將2009 年5 月及之后的數據用作測試集。對于Github 數據集,本文使用2013 年之前的數據初始化網絡,將2013 年1 月1 日—2013 年9 月30 日的事件作為訓練集,將2013 年10 月1 日—2013 年12 月31 日的數據作為測試集。將本文模型與Node2vec、DyGem、GraphSage、GAT 這4 種基于時間快照離散網絡的動態網絡表示模型在兩個數據集下分別進行鏈接預測任務,實驗結果如圖4、圖5 及表2 所示,其中圖4 表示Hits@10指標的對比結果,圖5 表示MAR 指標的對比結果。在表2中,性能最優的實驗結果用粗體標注,次優的用下劃線標注。

圖4 不同模型的Hits@10 指標結果對比Fig.4 Comparison of Hits@10 indicator results of different models

圖5 不同模型的MAR 指標對比結果Fig.5 Comparison of MAR indicator results of different models

表2 不同模型的實驗結果對比 Table 2 Comparison of experimental results of different models
Node2vec、DynGEM、GraphSage、GAT 這4 種表示模型在處理動態圖時的主要思路都是將動態圖切分成離散的快照圖,然后對當前時刻的快照圖進行靜態網絡表示。然而真實世界的信息傳播網絡是動態的,且變化發生的時間分布不均勻,在連續的時間序列中靜態網絡表示性能受到極大影響。由圖4、圖5 及表2 可知,這4 種模型在真實世界動態網絡數據集上的預測任務中效果并不好。
由圖4和圖5可知,在Social Evolution 數據集下,4 種模型中性能最優的是GraphSage 模型,HITS@10 和MAR 值分別為0.12 和37.0。在數據量較大、節點分布較稀疏的Github 數據集下,GAT 模型由于引入了多頭非均勻注意力機制,所以處理稀疏數據的性能在四者中較優,HITS@10 和MAR 值分別為0.21 和107.1。而較為經典的Node2vec 模型由于通過隨機游走對結果進行采樣,結合社區結構等特征生成節點表示,因此在處理數據規模大、節點稀疏的Github 數據集時的效果并不好,MAR 值為139.4(隨機預測的MAR 值約為140)。本文模型是一種處理連續時間網絡的動態網絡表示模型,在連續變化的動態網絡中有較優異的性能,實驗證明本文模型明顯優于以上4 種模型。
針對圖4、圖5 及表2 的實驗結果,將本文模型與其他基線模型做對比,作出如下分析。
1)與Know-Evolve 模型對比
Know-Evolve 模型主要適用于知識圖譜的表示學習,對于真實世界動態網絡數據集的表示效果有限,在Social Evolution 數據集下的HITS@10 和MAR值分別為0.25 和30.0,在Github 數據集下的HITS@10 和MAR 值分別為0.17 和109.8。Know-Evolve 模型相較于前3 種切分成離散快照圖形式的網絡表示學習模型在性能上有一定優勢,但明顯不如本文模型。
2)與DyRep 模型對比
DyRep 模型由于缺少源代碼、數據集的預處理以及模型的具體實現,導致實驗結果產生較大誤差。為提高可比性,表2 中DyRep 模型的實驗結果參考自文獻[23]。本文主要基于DyRep 模型框架進行改進,在該模型上考慮了傳播學的關系強度理論以及在節點信息聚合后引入信息反饋機制。在Social Evolution 數據集的實驗中,本文模型在HITS@10 和MAR 值上分別比DyRep 模型提高了0.09 和1.6;在Github 數據集中,本文模型在2 個評價指標上分別高出了0.03 和25.7,由此說明本文模型性能更好。
3)與LDG 模型對比
LDG 模型使用神經關系推理改進DyRep 模型,突破了DyRep 模型只能研究兩種關系類型的限制。另外該模型加入了雙線性編碼層,使模型能捕獲更多節點信息。在沒有加入雙線性編碼層的條件下,本文模型在兩個數據集上的各項評價指標均優于LDG 模型。
與加入雙線性編碼層的LDG 模型相比,本文模型在Social Evolution 數據集上的實驗結果在HITS@10和MAR 兩個指標上分別提高了0.19 和2.5。而由于Github 數據集數據量大且節點分布稀疏,因此雙線性編碼層在大型稀疏網絡中捕獲的潛在關系能有效提高下游預測任務的性能,所以本文模型在Github數據集上的實驗結果是次優的。
本文在Intel?Xeon?W-2102 CPU,NVIDIA GeForce GTX 1080 GPU,32 GB 內存,Windows 10 Professional系統環境下,對本文模型與加入雙線性編碼層的LDG模型在兩個數據集上進行鏈接預測任務的時間效率測試,測試進行10次,結果取平均值,測試結果如圖6所示。

圖6 不同模型的時間效率對比Fig.6 Time efficiency comparison of different models
由圖6 可知,本文模型在Social Evolution 數據集、Github 數據集上的平均時間效率與加入雙線性層的LDG 模型相比,分別提高了91.8%、87.2%。
綜上,本文提出的DNRep 模型在真實網絡數據集的實驗中各項評價指標都是最優或次優的。加入雙線性編碼層后的LDG 模型在Github 數據集上表現出較優異的性能,然而在時間效率上本文模型顯著優于LDG 模型。對于真實世界中只包含強弱兩種關系的較為稠密的信息傳播網絡,本文提出的DNRep 模型更為適用,綜合性能更佳。總體而言,本文做出的改進是有效的,所提出的DNRep 模型對于提高下游預測任務的性能有著顯著成效。
傳統的靜態網絡表示學習方法不能很好地反映網絡結構的動態變化特性,與真實世界的信息傳播網絡不貼合,且存在延遲性問題。本文結合傳播學理論,引入反饋機制,在改進DyRep 模型框架的基礎上提出DNRep 模型。使用圖神經網絡學習得到交互結構的序列相關性,并利用用戶輔助信息實現個性化推薦。實驗結果表明,與Know-Evolve、DyRep、LDG 等模型相比,本文模型的命中率和平均排名提升顯著。下一步將關注大規模動態網絡上的網絡表示學習,并利用表示學習改進下游機器學習任務,從而提高信息傳播動態模型的效率。