999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于結(jié)構(gòu)熵的注意力流網(wǎng)絡(luò)異構(gòu)性研究

2021-12-12 02:50:18馬滿福郭晨彪張鐘穎王常青
計算機工程與應(yīng)用 2021年23期
關(guān)鍵詞:結(jié)構(gòu)

馬滿福,郭晨彪,李 勇,張鐘穎,張 強,王常青

1.西北師范大學 計算機科學與工程學院,蘭州 730070

2.中國互聯(lián)網(wǎng)絡(luò)信息中心 互聯(lián)網(wǎng)基礎(chǔ)技術(shù)開放實驗室,北京 100190

復(fù)雜網(wǎng)絡(luò)能夠很好地描述自然科學、社會科學、管理科學和工程技術(shù)領(lǐng)域等相互關(guān)聯(lián)的復(fù)雜模型,是研究復(fù)雜系統(tǒng)中子系統(tǒng)交互和關(guān)系的重要工具,是網(wǎng)絡(luò)科學中重要的研究方法[1]。錢學森給出了復(fù)雜網(wǎng)絡(luò)的一個較嚴格的定義:具有自組織、自相似、吸引子、小世界、無標度中部分或全部性質(zhì)的網(wǎng)絡(luò)稱為復(fù)雜網(wǎng)絡(luò)。復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜且節(jié)點數(shù)目巨大,呈現(xiàn)多種不同特征,雖然各部分之間相互聯(lián)系,但在功能結(jié)構(gòu)上存在差異[2-3]。網(wǎng)絡(luò)的拓撲性質(zhì)、功能以及動力學行為均與網(wǎng)絡(luò)的復(fù)雜性緊密相連,復(fù)雜網(wǎng)絡(luò)中節(jié)點間的聯(lián)系對于網(wǎng)絡(luò)復(fù)雜性刻畫十分有意義,也一直是復(fù)雜網(wǎng)絡(luò)研究的熱點[4]。

復(fù)雜系統(tǒng)中病毒傳播[5]、社區(qū)結(jié)構(gòu)劃分[6]、節(jié)點重要性排序分析[7-9]、信息擴散[10]等,都與網(wǎng)絡(luò)的異構(gòu)性不無關(guān)系[11-12]。熵是描述復(fù)雜系統(tǒng)結(jié)構(gòu)的物理量,而關(guān)系結(jié)構(gòu)的熵可以定量描述網(wǎng)絡(luò)狀態(tài),是測度網(wǎng)絡(luò)結(jié)構(gòu)無序性的重要指標。通過定義網(wǎng)絡(luò)結(jié)構(gòu)熵評價網(wǎng)絡(luò)異構(gòu)性,一般地,網(wǎng)絡(luò)結(jié)構(gòu)熵值越小,網(wǎng)絡(luò)越混亂,意味著網(wǎng)絡(luò)各部分間的差異越大,異構(gòu)性越強;反之網(wǎng)絡(luò)結(jié)構(gòu)熵越大,網(wǎng)絡(luò)越有序,意味著網(wǎng)絡(luò)結(jié)構(gòu)越趨于均衡,異構(gòu)性越弱[13-15]。目前,已有大量的研究各自從不同角度出發(fā)提出定義網(wǎng)絡(luò)結(jié)構(gòu)熵,主要有度分布熵[15]、吳結(jié)構(gòu)熵[16]、剩余度熵[15]、蔡結(jié)構(gòu)熵[17-19]等。

網(wǎng)絡(luò)結(jié)構(gòu)熵是研究復(fù)雜網(wǎng)絡(luò)的重要工具,能夠很好地度量網(wǎng)絡(luò)結(jié)構(gòu)的特征,反映了網(wǎng)絡(luò)節(jié)點和鏈路的異構(gòu)性。傳統(tǒng)的異構(gòu)性度量指標度分布熵、吳結(jié)構(gòu)熵、SD結(jié)構(gòu)熵等,均從網(wǎng)絡(luò)中“點”或“邊”的特征來定義結(jié)構(gòu)熵。注意力流網(wǎng)絡(luò)是基于在線行為數(shù)據(jù),通過點擊網(wǎng)站序列而構(gòu)建成的有向加權(quán)圖。在網(wǎng)絡(luò)中的節(jié)點代表Web站點,用戶從一個Web站點通過點擊跳轉(zhuǎn)到了另一個Web站點形成邊,站點之間的跳轉(zhuǎn)次數(shù)表示邊的權(quán)值,Web站點的特殊屬性就是站點的停留時長。根據(jù)注意力流網(wǎng)絡(luò)的結(jié)構(gòu)特征,傳統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)熵不能準確地度量注意力流網(wǎng)絡(luò)的異構(gòu)性。因此,尋找一種針對注意力流網(wǎng)絡(luò)異構(gòu)性特征的測度方法是本文研究的目的所在。本文的主要貢獻如下:

(1)以中國互聯(lián)網(wǎng)信息中心(CNNIC)提供的海量在線上網(wǎng)行為大數(shù)據(jù)構(gòu)建注意力流網(wǎng)絡(luò)。

(2)基于復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)異構(gòu)性的研究方法,結(jié)合注意力流網(wǎng)絡(luò)的站點及結(jié)構(gòu)特征,建立了注意力流網(wǎng)絡(luò)拓撲結(jié)構(gòu)站點重要度的評價指標,構(gòu)建了注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵模型,提出了注意力流網(wǎng)絡(luò)異構(gòu)性度量算法ANSE。

(3)通過實驗分析,注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵夠更好地刻畫注意力流網(wǎng)絡(luò)的結(jié)構(gòu)特征,準確地度量注意力流網(wǎng)絡(luò)中各站點的差異性,從而分析各網(wǎng)絡(luò)各站點的屬性特征。

1 相關(guān)工作

1.1 注意力流網(wǎng)絡(luò)

注意力流網(wǎng)絡(luò)作為網(wǎng)絡(luò)科學的一個重要分支,吸引了大量的研究人員的關(guān)注。基于加權(quán)復(fù)雜網(wǎng)絡(luò)方法研究注意力流網(wǎng)絡(luò),研究人員在已有的研究中發(fā)現(xiàn)了多個重要的普適規(guī)律,例如:Web站點間注意力流演化的異速標度律和耗散律、在注意力流網(wǎng)絡(luò)中發(fā)現(xiàn)了引力律、在注意力流中還發(fā)現(xiàn)了Heaps律等[20-23]。文獻[24]提出了一種在不同網(wǎng)站之間分配和流動的幾何表示方法,根據(jù)網(wǎng)站流動距離將大量網(wǎng)站嵌入20維歐氏空間中,發(fā)現(xiàn)20%受歡迎的網(wǎng)站吸引了75%的注意力流;文獻[23]基于在線集體注意力流研究網(wǎng)站的站點影響力,將網(wǎng)絡(luò)視為虛擬生物,根據(jù)代謝理論,網(wǎng)站必須吸收“能量”來生長、繁衍和發(fā)展,將新陳代謝和用戶注意力的影響視為網(wǎng)站的能量,基于網(wǎng)絡(luò)科學理論建立注意力流網(wǎng)絡(luò),研究了集體注意力在不同站點間的分布、流動以及Web的新陳代謝規(guī)律。研究發(fā)現(xiàn)站點的影響力與注意力在該站點上的停留時間呈亞線性關(guān)系,亦即Web版的Kleiber律。然而很少有學者研究注意力流網(wǎng)絡(luò)異構(gòu)性,研究注意力流網(wǎng)絡(luò)的異構(gòu)性,分析站點的差異及網(wǎng)絡(luò)結(jié)構(gòu)特征具有重要的理論意義和應(yīng)用價值。

1.2 網(wǎng)絡(luò)結(jié)構(gòu)熵

網(wǎng)絡(luò)結(jié)構(gòu)熵主要基于網(wǎng)絡(luò)中節(jié)點、邊的特征來定義,其中網(wǎng)絡(luò)節(jié)點的差異性由節(jié)點概率分布來度量。反映網(wǎng)絡(luò)連接特征的熵有度分布熵、吳網(wǎng)絡(luò)結(jié)構(gòu)熵、蔡網(wǎng)絡(luò)結(jié)構(gòu)熵等。

(1)度分布熵[15],以邊為研究對象,根據(jù)網(wǎng)絡(luò)節(jié)點度概率分布,對網(wǎng)絡(luò)的異構(gòu)性進行了測度,定義度分布網(wǎng)絡(luò)結(jié)構(gòu)熵。

(2)吳結(jié)構(gòu)熵[16],以節(jié)點為主體,通過分析網(wǎng)絡(luò)節(jié)點所擁有的邊的條數(shù),即各節(jié)點度值之間的差異來反映網(wǎng)絡(luò)的異構(gòu)性,從而提出了基于網(wǎng)絡(luò)中節(jié)點的特征的網(wǎng)絡(luò)結(jié)構(gòu)熵。

(3)SD結(jié)構(gòu)熵[17],為了綜合考慮網(wǎng)絡(luò)結(jié)構(gòu)中“點”或者“邊”的作用,蔡萌等綜合考慮了“點”和“邊”差異性,定義網(wǎng)絡(luò)中節(jié)點的結(jié)構(gòu)重要性,提出了一種新的SD網(wǎng)絡(luò)結(jié)構(gòu)熵,反映網(wǎng)絡(luò)的異構(gòu)性。

文獻[15]指出度分布熵可以測度網(wǎng)絡(luò)異構(gòu)性,當網(wǎng)絡(luò)中各節(jié)點的度值均不相同,即P(k)=1/(N-1)(?k=1,2,…,N-1)時,網(wǎng)絡(luò)的度分布熵取最大值,=ln(N-1);相反,對于網(wǎng)絡(luò)中各節(jié)點的度均相同的規(guī)則網(wǎng)絡(luò),則有,對于星型網(wǎng)絡(luò)等特殊網(wǎng)絡(luò)異構(gòu)性度量的準確性不夠。文獻[16]吳結(jié)構(gòu)熵以節(jié)點為主體,通過分析網(wǎng)絡(luò)節(jié)點所擁有的邊的條數(shù),即各節(jié)點度值之間的差異來反映網(wǎng)絡(luò)的異構(gòu)性,吳結(jié)構(gòu)熵的最小值對應(yīng)于星型網(wǎng)絡(luò);最大值對應(yīng)于最近鄰耦合網(wǎng)絡(luò)Hmaxwu=lnN,吳結(jié)構(gòu)熵關(guān)注網(wǎng)絡(luò)連接的度分布定義節(jié)點重要性,忽略了節(jié)點本身的特性,例如在稀疏網(wǎng)絡(luò)中忽略了孤立節(jié)點對網(wǎng)絡(luò)的影響。文獻[17]從“點”差異性和“邊”差異性兩方面提出了點邊差異性SD結(jié)構(gòu)熵。該網(wǎng)絡(luò)結(jié)構(gòu)熵是一種有效度量網(wǎng)絡(luò)異構(gòu)性的指標,并對稀疏網(wǎng)絡(luò)和星型網(wǎng)絡(luò)有很好的解釋,但該方法的本質(zhì)仍是以節(jié)點度值為基礎(chǔ),與度分布熵和吳結(jié)構(gòu)熵等其他指標一樣,過多強調(diào)網(wǎng)絡(luò)的局部特征,而忽略了特殊網(wǎng)絡(luò)的拓撲特征。然而很少有學者研究注意力流網(wǎng)絡(luò)異構(gòu)性。

以上幾種結(jié)構(gòu)熵,均基于網(wǎng)絡(luò)中節(jié)點、邊的特征來定義的網(wǎng)絡(luò)結(jié)構(gòu)熵,針對注意力流網(wǎng)絡(luò)的web站點停留時長等特殊屬性不適用,即通過傳統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)熵無法準確地度量注意力流網(wǎng)絡(luò)Web站點的差異,對刻畫注意力流網(wǎng)絡(luò)異構(gòu)性不夠準確。因此,本文基于注意力流網(wǎng)絡(luò)結(jié)構(gòu)及Web站點的特征,定義注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵,提出注意力流網(wǎng)絡(luò)異構(gòu)性算法。本文提出的注意力流網(wǎng)絡(luò)異構(gòu)性算法具有重要的理論意義與應(yīng)用價值。從理論價值來看,異構(gòu)性研究能夠很好地刻畫注意力流網(wǎng)絡(luò)的結(jié)構(gòu)特征,在站點重要性排序分析、網(wǎng)站影響力分析、網(wǎng)站分類、社區(qū)發(fā)現(xiàn)等研究中發(fā)揮重要作用;從應(yīng)用價值來看,站點重要性排序等方面研究已廣泛應(yīng)用于網(wǎng)絡(luò)輿情監(jiān)控、個性化推薦、廣告精準投放等方面。

2 注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵

2.1 注意力流網(wǎng)絡(luò)構(gòu)建

在線用戶行為日志數(shù)據(jù)采集中,用戶每次一開機就會建立一個在線行為日志數(shù)據(jù)文件,該日志數(shù)據(jù)記錄每兩秒檢查一次用戶計算機當前的焦點窗口,如果檢查相比前兩秒發(fā)生了變化,則增加一條記錄來描述當前焦點窗口信息。在保證用戶隱私的前提下,詳細記錄了開機時間與上次關(guān)機時間、焦點窗口的窗口進程名稱、URL地址、當前標簽頁句柄、程序名稱、程序所屬公司名稱以及用戶人口屬性等信息。表1為在線點擊流序列樣例。

表1 在線點擊流序列樣例Table 1 Example of online clickstream sequence

對于一個有N個節(jié)點注意力流網(wǎng)絡(luò),其拓撲結(jié)構(gòu)由一個加權(quán)有向圖G=(V,E,T,Z)表示,如圖1所示。其中V={v0,v1,…, }vN+1表示N+2個注意力流網(wǎng)絡(luò)的站點;E∈V×V為圖中的邊集;T表示集體用戶在一個站點上停留的總時間;Z表示邊E的權(quán)重,是一個正的自然數(shù)集,邊權(quán)值Z表示各個站點間轉(zhuǎn)換的強度,若不存在的邊其權(quán)值為0,表示用戶在網(wǎng)絡(luò)中Web節(jié)點的入度或出度,注意力流網(wǎng)絡(luò)示意圖如圖1所示。

圖1 注意力流網(wǎng)絡(luò)示例Fig.1 Example of attention flow network

在一個會話期間(session),一個用戶進入一個Web站點后必定會在一段時間后離開該Web站點,所以注意力流網(wǎng)絡(luò)是平衡的,表明每個頂點的總?cè)肓鳎╥nflow)與總出流(outflow)相等關(guān)系。在網(wǎng)絡(luò)中增加了兩個額外節(jié)點“source”節(jié)點(表示為節(jié)點0)和“sink”節(jié)點(表示為節(jié)點N+1),分別表示點擊流的“源”和“匯”。每個用戶從“source”節(jié)點開始上網(wǎng),當該會話結(jié)束后進入“sink”節(jié)點,用戶結(jié)束其上網(wǎng)行為。會話(session)表示用戶在一個Web站點上瀏覽的時間間隔,把會話時間間隔閾值定義為30分鐘是學術(shù)界針對萬維網(wǎng)研究普遍采用的標準值[25]。

2.2 注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵模型

根據(jù)傳統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)熵模型,依據(jù)網(wǎng)絡(luò)的結(jié)構(gòu)特征,通過站點之間跳轉(zhuǎn)的次數(shù)(即邊的權(quán)值)、停留時間等,綜合定義Web站點的流強度、站點之間的轉(zhuǎn)移概率、站點總時長、站點吸引注意力的能力,結(jié)合Web站點的注意力總流量計算站點的綜合力,用站點綜合力來度量站點的差異性,刻畫注意力流網(wǎng)絡(luò)的異構(gòu)性,基于此基礎(chǔ)的Web站點重要度來定義注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵。對比傳統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)熵,該模型綜合考慮了Web站點、站點之間的跳轉(zhuǎn)、停留時間等,進而全面準確地度量注意力流網(wǎng)絡(luò)的異構(gòu)性。

通過網(wǎng)絡(luò)有向圖計算流矩陣,然后確定概率轉(zhuǎn)移矩陣,由站點總時長計算對站點的吸引能力,最后通過站點耗散能力和概率轉(zhuǎn)移矩陣得到基本矩陣。由基本矩陣計算從源節(jié)點到目的站點的總流量,最終得到網(wǎng)絡(luò)站點的綜合力。

在一個有N節(jié)點的注意力流網(wǎng)絡(luò)中,網(wǎng)絡(luò)中增加了兩個額外節(jié)點“source”節(jié)點和“sink”節(jié)點,圖G中定義一個帶權(quán)(N+2)×(N+2)的流矩陣S(G),流矩陣S(G)中的元素Zij=(i,j)表示從站點i到站點j的注意力流強度,Zij=0表示從站點i到站點j的無鏈路。圖G的流矩陣S(G)可以表示為:

由流矩陣S(G)定義一個概率轉(zhuǎn)移矩陣P(G),P(G)表示圖G上的馬爾可夫鏈概率轉(zhuǎn)移矩陣,其中,在概率轉(zhuǎn)移矩陣P(G)中,Pij表示從站點i到站點j之間的轉(zhuǎn)移概率。圖G上的概率轉(zhuǎn)移矩陣P(G)表示為:

在注意力流網(wǎng)絡(luò)中,假設(shè)有k個用戶瀏覽了Web站點i,每個用戶瀏覽的時間長度為tj,那么網(wǎng)絡(luò)中所有用戶在該Web節(jié)點的總時長Ti,定義總時長Ti為:

用βi表示W(wǎng)eb站點i對注意力流的耗散能力,來度量Web站點吸引注意力的能力,采用文獻[26]方法定義βi為:

定義矩陣D(G)為:Dij=βPij,由于β∈(0,]1,所以矩陣D(G)為去除源節(jié)點為(N+1)×(N+1)的矩陣。對于一個吸收馬爾可夫鏈[27],定義基本矩陣X(G)為:

其中,I為單位矩陣。

由定義的基本矩陣計算源節(jié)點流到Web站點i的注意力總流量,用Mi來表示,Mi定義為:

根據(jù)Web站點i的注意力總流量來定義Web站點的綜合力為:

其中,Ei為Web站點i綜合力,xij為基本矩陣X(G)中的元素。

通過Web站點的綜合力的差異性來反映注意力流網(wǎng)絡(luò)的異構(gòu)性,提出基于注意力流網(wǎng)絡(luò)站點特征的網(wǎng)絡(luò)結(jié)構(gòu)熵。

根據(jù)網(wǎng)絡(luò)異構(gòu)性矩陣、Web站點流強度、站點總時長、站點吸引注意力的能力等,結(jié)合Web站點的注意力總流量計算Web站點的綜合力,可求得Web站點i相對重要度Ii,其計算公式為:

若某Web站點的綜合力越大,可認為該站點在注意力流網(wǎng)絡(luò)中的影響力越大,其Web站點越重要,為了衡量注意力流網(wǎng)絡(luò)在各Web站點重要度或者影響力的差異,結(jié)合信息論中熵的計算方法,以及基于公式(9)Web站點i的重要度計算方法,可得到注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵,其計算公式為:

其中,HA為注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵,Ii為站點的相對重要度。在注意力流網(wǎng)絡(luò)中HA的值越小,說明網(wǎng)絡(luò)在Web站點綜合力尺度下的異構(gòu)性越強,反之網(wǎng)絡(luò)的異構(gòu)則越弱。

2.3 注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵算法ANSE

基于注意力流結(jié)構(gòu)熵模型,提出注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵算法ANSE(Attention flow Network Structural Entropy),由此得到網(wǎng)絡(luò)的流矩陣、站點上停留時長、站點的綜合力等,最終通過算法輸出注意力流網(wǎng)絡(luò)的結(jié)構(gòu)熵。

算法1構(gòu)建注意力流網(wǎng)絡(luò)計算流矩陣

輸入:Si={T,P,IDi},其中T為開始時間,P表示為web站點,IDi表示用戶標識;得到注意力流網(wǎng)絡(luò)G=(V,E,T,Z),V表示頂點集,E表示圖中的邊集,T表示頂點權(quán)重,Z表示流強度

輸出:注意力流網(wǎng)絡(luò)的流矩陣S(G)

1.G=nx.DiGraph

2.G.add_node(‘source’,time=0 pages=0)

3.G.add_node(‘sink’,time=0 pages=0)

4.For i in Si:

5. G.add_node(i,time)

算法2注意力流網(wǎng)絡(luò)的基本矩陣算法

輸入:注意力流網(wǎng)絡(luò)的馬爾可夫矩陣,網(wǎng)絡(luò)Web站點總時長。

輸出:基本矩陣X(G)

算法3注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵算法

輸入:注意力流網(wǎng)絡(luò)基本矩陣X(G)及流矩陣S(G)

輸出:注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵值

3 實驗分析

3.1 實驗數(shù)據(jù)

以中國互聯(lián)網(wǎng)信息中心(CNNIC)提供的海量在線用戶行數(shù)據(jù)為實驗數(shù)據(jù),累積已達PB量級,該數(shù)據(jù)集為CNNIC目前提供的最新數(shù)據(jù),為實驗分析方便,本文隨機抽取該數(shù)據(jù)集中1 000名用戶1個月大約1.3億條數(shù)據(jù)記錄進行實驗研究,數(shù)據(jù)樣例如圖2所示。

圖2 在線行為日志數(shù)據(jù)樣例Fig.2 Example of online behavior log data

3.2 注意力流網(wǎng)絡(luò)結(jié)構(gòu)特征分析

對在線行為日志數(shù)據(jù)進行清洗處理,使用網(wǎng)絡(luò)科學的建模方法,Web站點看作節(jié)點,用戶的站點轉(zhuǎn)移流動看作邊,站點停留時長作為節(jié)點權(quán)重,建立有向加權(quán)的注意力流網(wǎng)絡(luò),通過集體用戶的數(shù)據(jù)構(gòu)建集體注意力流網(wǎng)絡(luò)圖,構(gòu)建的注意力流網(wǎng)絡(luò)中擁有20 746個節(jié)點和135 771條邊。注意力流網(wǎng)絡(luò)圖如圖3所示。

圖3 集體注意力流網(wǎng)絡(luò)Fig.3 Collective attention flow network

在構(gòu)造的注意力流網(wǎng)絡(luò)中,分析注意力流網(wǎng)絡(luò)出入度、站點的總停留時長的排名以及相關(guān)網(wǎng)絡(luò)結(jié)構(gòu)的其他特征。如圖4是出度前20名的站點降序排名圖,然后以出度為排序的方式繪制入度的折線圖,從圖上可以看出,其網(wǎng)絡(luò)的站點出、入度值非常接近,而且每個站點出度和入度的排序基本是一致的,再次說明注意力流網(wǎng)絡(luò)是平衡的。

圖4 站點度值前20降序排序圖Fig.4 Descending order of top 20 websites

表2是所有站點總時間排名前10的站點,根據(jù)站點分析,排名前10的站點均為常用的站點,其中排名第一的qq.com為娛樂、社交、新聞類站點,第二的baidu.com為搜索引擎類網(wǎng)站,第三的taobao.com為購物類網(wǎng)站;對比停留時間排名與站點以度值排名的結(jié)果有差異,單獨從站點度值或者總停留時長等方面排名來衡量站點的重要度是不準確的。因此需要從站點的度值、停留時長等多個方面綜合度量站點差異性,以站點的綜合力來測度網(wǎng)絡(luò)結(jié)構(gòu)的異構(gòu)性。

表2 站點總停留時長前10排名Table 2 Top 10 websites for total length of stay

3.3 注意力流網(wǎng)絡(luò)異構(gòu)性分析

根據(jù)注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵算法ANSE,實驗分析注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵。在注意力流網(wǎng)絡(luò)中,基于整體網(wǎng)絡(luò)結(jié)構(gòu)異構(gòu)性的度量,注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵算法ANSE綜合考慮了站點的度值大小、停留時間、站點的總流量等,以站點的綜合力為度量網(wǎng)絡(luò)異構(gòu)性更為準確,在本文實驗中記吳結(jié)構(gòu)熵為Wu結(jié)構(gòu)熵,注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵為Ha結(jié)構(gòu)熵,度分布熵為Du度分布熵,蔡SD結(jié)構(gòu)熵為SD結(jié)構(gòu)熵。

在注意力流網(wǎng)絡(luò)中,節(jié)點數(shù)為20 746個,不同邊值的節(jié)點數(shù)量為280個,按照度分布熵模型,Du度分布熵最大值5.634,隨著相同度值節(jié)點數(shù)的增加,網(wǎng)絡(luò)度分布熵值也也會逐漸變小,當20 746個節(jié)點全加入時,Du度分布熵達到了最小2.491。因此,依據(jù)注意力流網(wǎng)絡(luò)的結(jié)構(gòu)特征,用度分布熵來度量注意力流網(wǎng)絡(luò)的異構(gòu)性是不準確的。其中蔡SD結(jié)構(gòu)熵結(jié)合度分布熵和吳結(jié)構(gòu)熵,單一地考慮節(jié)點和邊,因此度量注意力流網(wǎng)絡(luò)中也是不準確的。

分析注意力流網(wǎng)絡(luò)的結(jié)構(gòu)特征,適合用吳結(jié)構(gòu)熵和注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵來度量注意力流網(wǎng)絡(luò)的異構(gòu)性。通過實驗得到網(wǎng)絡(luò)結(jié)構(gòu)熵值如表3所示,Wu結(jié)構(gòu)熵值為7.875,Ha結(jié)構(gòu)熵值為6.579,在該注意力流網(wǎng)絡(luò)中Ha結(jié)構(gòu)熵小于Wu網(wǎng)絡(luò)結(jié)構(gòu)熵,網(wǎng)絡(luò)結(jié)構(gòu)熵值越小,注意力流網(wǎng)絡(luò)越混亂,意味著網(wǎng)絡(luò)各部分間的差異越大,異構(gòu)性越強。因此,從網(wǎng)絡(luò)整體結(jié)構(gòu)熵分析,注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵能更好地度量網(wǎng)絡(luò)的異構(gòu)性。

表3 網(wǎng)絡(luò)結(jié)構(gòu)熵對比Table 3 Comparison of network structure entropy

3.4 站點差異性分析

分析發(fā)現(xiàn),采用熵值算法計算單個站點的熵值,利用注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵模型,站點的綜合力越大站點熵值越大,所有站點的熵值如圖5所示,最大從0.135依次降低,到最后站點時熵值接近0;利用Wu結(jié)構(gòu)熵模型,結(jié)果如圖6所示,隨著站點的綜合力降低站點熵值也基本整體依次降低,但有個別站點存在前一站點熵值高的情況。圖7為排名前30的Ha和Wu結(jié)構(gòu)熵站點熵值對比。例如sogou.com的Wu熵值為0.075 5,taobao.com站點Wu熵值為0.047 2,按照注意力流網(wǎng)絡(luò)站點綜合力的比較taobao.com站點要比sogou.com站點值大,Wu結(jié)構(gòu)熵只考慮站點的度值的大小,說明Wu結(jié)構(gòu)熵在刻畫注意力流網(wǎng)絡(luò)站點的差異性時存在不足。因此,注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵能夠很好度量網(wǎng)絡(luò)站點的差異性。

圖5 Ha結(jié)構(gòu)熵站點熵值Fig.5 Entropy of Ha structure entropy websites

圖6 Wu結(jié)構(gòu)熵站點熵值Fig.6 Entropy of Wu structure entropy websites

圖7 Ha和Wu結(jié)構(gòu)熵站點熵值對比Fig.7 Comparison of entropy values of Ha and Wu structure entropy websites

表4 各種站點重要性算法排名前15的站點Table 4 Top 15 websites ranked by various website importance algorithms

以上實驗分析得出,Web站點之間有著很大的差異,注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵能夠更準確衡量站點的重要性,利用注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵進行節(jié)點重要性排序分析,站點的Ha結(jié)構(gòu)熵值越大,說明站點越重要,站點的影響力越大。在構(gòu)建的注意力流網(wǎng)絡(luò)中用ANSE算法和經(jīng)典的節(jié)點重要性算法對比分析,分別和度中心性DC、中介中心性BC、接近中心性CC、特征向量中心性EC、PageRank對比分析。

表4顯示了各種站點重要性算法排名前15名的站點。用各種算法的站點排名和中國的Alexa排名對比(Alexa排名是指網(wǎng)站的世界排名,是當前較為權(quán)威的網(wǎng)站綜合排名評價指標。),本文提出的算法和Alexa排名更加接近一致,其他傳統(tǒng)算法和Alexa排名有差異。在各種算法前15排名中,站點基本一致,但站點排名卻不同,因此,說明本文算法的有效性和優(yōu)越性,能夠更好地度量站點的影響力。

實驗得出,本文提出的注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵模型的熵更小,能夠更好地度量網(wǎng)絡(luò)異構(gòu)性;在站點重要性排名方面,本文提出算法排名更接近Alexa排名,ANSE算法能夠有效度量網(wǎng)絡(luò)站點的重要性。

4 結(jié)束語

本文利用在線點擊上網(wǎng)行為數(shù)據(jù),構(gòu)建注意力流網(wǎng)絡(luò),分析注意力流網(wǎng)絡(luò)結(jié)構(gòu),基于網(wǎng)絡(luò)結(jié)構(gòu)熵研究注意力流網(wǎng)絡(luò)的異構(gòu)性。針對注意力流網(wǎng)絡(luò)的結(jié)構(gòu)特征,傳統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)熵不能定量地度量注意力流網(wǎng)絡(luò)的異構(gòu)性,本文構(gòu)建了基于注意力流網(wǎng)絡(luò)的結(jié)構(gòu)熵模型,提出了注意力流網(wǎng)絡(luò)異構(gòu)性度量算法ANSE,通過實驗分析對比,本文提出的注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵綜合地從網(wǎng)絡(luò)的站點度、停留時間等因素,能夠更好地刻畫注意力流網(wǎng)絡(luò)的異構(gòu)性。實驗表明,站點的注意力流網(wǎng)絡(luò)結(jié)構(gòu)熵值越大,其站點越重要,站點的影響力越大。依據(jù)注意力流結(jié)構(gòu)熵站點重要性排序,分別和經(jīng)典節(jié)點重要性算法度中心性DC、中介中心性BC、接近中心性CC、特征向量中心性EC、PageRank對比分析發(fā)現(xiàn),結(jié)構(gòu)熵能更好地度量注意力流網(wǎng)絡(luò)中站點的重要性,有效地分析站點差異性,為站點影響力排名提供理論依據(jù),該研究可應(yīng)用于社區(qū)發(fā)現(xiàn)、網(wǎng)絡(luò)輿情監(jiān)控、個性化推薦、廣告精準投放等方面。

猜你喜歡
結(jié)構(gòu)
DNA結(jié)構(gòu)的發(fā)現(xiàn)
《形而上學》△卷的結(jié)構(gòu)和位置
哲學評論(2021年2期)2021-08-22 01:53:34
論結(jié)構(gòu)
中華詩詞(2019年7期)2019-11-25 01:43:04
新型平衡塊結(jié)構(gòu)的應(yīng)用
模具制造(2019年3期)2019-06-06 02:10:54
循環(huán)結(jié)構(gòu)謹防“死循環(huán)”
論《日出》的結(jié)構(gòu)
縱向結(jié)構(gòu)
縱向結(jié)構(gòu)
我國社會結(jié)構(gòu)的重建
人間(2015年21期)2015-03-11 15:23:21
創(chuàng)新治理結(jié)構(gòu)促進中小企業(yè)持續(xù)成長
主站蜘蛛池模板: 精品国产网站| 亚洲av无码久久无遮挡| 狠狠色香婷婷久久亚洲精品| 亚洲三级视频在线观看| 中国国产A一级毛片| 成人免费视频一区| 国产精品丝袜视频| 日韩欧美中文字幕在线精品| 激情综合激情| 国产电话自拍伊人| 久久精品欧美一区二区| 国产一在线| 国产成人乱码一区二区三区在线| 日韩天堂在线观看| 欧美一区二区自偷自拍视频| 国产成人夜色91| 91久久偷偷做嫩草影院| 欧美三级自拍| 色网站在线免费观看| 久久不卡精品| 国产精品手机在线观看你懂的| 国产真实乱了在线播放| 国产丝袜无码精品| 精品伊人久久久大香线蕉欧美| 中字无码av在线电影| 欧美国产精品不卡在线观看| 夜夜高潮夜夜爽国产伦精品| 成人午夜久久| 国产免费久久精品44| 草草影院国产第一页| 国产欧美日韩综合在线第一| 青青草国产一区二区三区| 99久久99这里只有免费的精品| 国产精品真实对白精彩久久| 91小视频版在线观看www| 欧美日韩高清在线| 亚洲女同一区二区| 伊人网址在线| 亚洲人成日本在线观看| 91成人免费观看| 亚洲色欲色欲www在线观看| 五月婷婷欧美| 久久永久视频| 亚洲国产天堂在线观看| 国产成人精品日本亚洲77美色| 国产高清免费午夜在线视频| 亚洲性影院| 欧美专区在线观看| www.狠狠| 色综合婷婷| 国产永久在线视频| 国产成人三级| 依依成人精品无v国产| 香蕉网久久| 国产精品99久久久久久董美香| A级毛片高清免费视频就| 久久这里只有精品2| 午夜国产不卡在线观看视频| 欧美成人午夜视频免看| 亚洲无码视频图片| 欧美一区二区福利视频| 毛片视频网址| 1级黄色毛片| 亚洲精品大秀视频| 日本不卡视频在线| 国产免费福利网站| 亚洲资源站av无码网址| 四虎永久免费地址| 亚洲最大福利视频网| 日韩欧美网址| 麻豆国产精品视频| 强乱中文字幕在线播放不卡| 日韩亚洲综合在线| 欧美激情视频二区| 国产性生交xxxxx免费| 国产精品亚洲а∨天堂免下载| 福利片91| 91日本在线观看亚洲精品| 热99精品视频| 国产后式a一视频| 久草视频精品| 日韩毛片免费视频|