999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于復雜網絡的中文微博網絡結構研究

2019-02-13 01:36:06吳蓉賴偉杰孟佳娜左振飛
計算機時代 2019年1期

吳蓉 賴偉杰 孟佳娜 左振飛

摘? 要: 為了探討復雜網絡特征,文章通過爬取新浪微博數據,并對數據進行清洗,利用微博用戶的關注關系構建微博關系復雜網絡,建立微博關注模型。基于復雜網絡理論和分析方法,研究了微博的網絡特征,探討用戶關注關系網絡的小世界特性和無標度特性等特征。研究結果表明,微博關注網絡的度分布服從冪律分布,具有較高入度的用戶節點相比低入度的節點更容易被人關注,使得網絡整體的無標度特性加強。

關鍵詞: 微博; 關系網絡; 小世界網絡; 無標度網絡; 聚類系數

中圖分類號:G206? ? ? ? ? 文獻標志碼:A? ? ?文章編號:1006-8228(2019)01-33-04

Abstract: For discussing complex network characteristics, the micro-blog user's follower relationship was used to build the micro-blog relationship complex network and the micro-blog follower relationship model by crawling and cleaning the Sina micro-blog data. Based on the theory and the analysis method of complex network, in this paper the micro-blog network characteristics were studied, the small-world and the scale-free characteristics of users' follower network was discussed. The research results show that the degree distribution of micro-blog follower network follows the power-law distribution. Comparing with low in-degree nodes, nodes with higher in-degree were more likely to be concerned, which makes the network enhance the overall scale-free property.

Key words: micro-blog; relationship networks; small-world networks; scale-free networks; clustering coefficient

0 引言

復雜網絡是指具有自組織、自相似、吸引子、小世界、無標度中部分或全部性質的網絡。隨著復雜網絡的小世界效應以及無標度性的提出[1],復雜網絡理論被應用到各個領域,自然界中存在的大量的復雜系統都可以用網絡來描述,有學者發現社交網絡[2]也符合復雜網絡的模型,因此復雜網絡理論同樣被應用到了分析社交網絡。

微博是一種通過關注機制分享簡短實時信息的廣播式的社交網絡平臺[3],本文從微博平臺入手,使用復雜網絡理論對其結構進行研究。

1 微博關系復雜網絡的構建

在2017年6月時以第一作者的微博賬號作為種子,先獲取了所有第一作者關注的用戶的數據,再獲得了這些用戶所關注的用戶的數據,從而對微博網絡進行了三層的廣度優先遍歷。這里的用戶數據包括用戶的微博條數、獲得別人點贊的個數、用戶關注的人和關注用戶的人,數據包含2.6萬名用戶,461萬條關注連接。

對于微博來說,關注和被關注實際上是一件事情的兩個角度。A關注了B,等價于B被A關注。在所爬取的數據中,記錄了這2.6萬用戶中的每個人都關注了哪些人,及獲取了2.6萬用戶節點的所有外連邊。在根據以上用戶數據和關注連接,本文建立起基于用戶關注的復雜網絡模型。

對于現實生活中常見的復雜系統,如交通網絡、在線社交網絡,可以自然地將其建模成復雜網絡來進行抽象表達。圖作為一種數據結構,被應用到復雜網絡的描述中,其中網絡實體用圖的頂點表示,實體之間的聯系用關聯邊表示。本文模型中將用戶視為復雜網絡中的節點,將用戶的關注與被關注關系視作邊,節點的出度值是該用戶的關注數,節點的入度值是該用戶的粉絲數,邊上的權值為該用戶關注數量的倒數,整個網絡為有向網絡。

2 微博復雜網絡特征分析

復雜網絡具有小世界、無標度和集聚性[4-5]特性,社會網絡是復雜網絡的一種,所以一些復雜網絡的理論和研究方法也適用于社會網絡分析的研究。例如復雜網絡中的小世界效應、無標度網絡特性、聚類系數屬性等。

本文統計了微博的粉絲數量、微博條數、以及與其他人互動的點贊數和評論數,對這幾種指標求取了均值、中位數和標準差。如表1所示,標準差衡量了數據個體之間的離散程度,中位數遠小于均值,可以看出大部分用戶與均值的差距十分大。符合復雜網絡中的無標度特征。

在微博社交網絡數據中,冪率分布是數據的基本規律,冪率分布的長尾部分數據有明顯的稀疏性[6-7]。圖1與圖2的橫軸表示指標的具體數值,縱軸表示有多少用戶具有該指標值。橫軸值和縱軸值都取了以10為底的對數,在雙對數坐標下的圖像,前半部分的線性特性并不是很強,而在后半部分,則近乎為一直線,其斜率的負數就是冪指數。以粉絲分布圖為例,最左上方的點表示在這兩萬多微博用戶里面,有大于103的人沒有獲得一個關注。在圖1的雙對數坐標中利用線性回歸得到斜率為-1.65,回歸系數R2=1.65。大部分的節點只有少量的連邊,而少量的節點卻擁有大量的連邊,說明了所構建的網絡的冪律分布符合無標度網絡的特征。

為了分析網絡特點,本文對所爬取的數據的若干特征進行了計算,網絡整體計算結果見表2。網絡的聚類系數為1.453,結點平均距離為4.777,網絡直徑為12,可見,該網絡的聚類系數較大,結點平均距離較小,滿足小世界的特點。

圖的平均最短路徑長度是指將網絡所有點兩兩之間的最短路徑長度進行算術平均,可以用來衡量網絡中點之間的平均距離。六度分隔理論指的是一個網絡的平均最短路徑長度為6。在微博復雜網絡模型中反映用戶與用戶之間的平均距離,是評價一個用戶緊密度的重要指標。表3給出了粉絲數大于1萬的用戶中平均最短路徑為2.0547 。這意味著兩個粉絲數大于1萬的大V用戶想要相互認識平均需要兩個中間人。網絡表現出小世界的網絡特征。另外直徑這個參數表示大V之間相互認識的最壞情況,兩個大V之間的距離高達4個人。這是網絡中的一種極限情況,存在的數量極少。由表3可知,粉絲數量大于5萬的子集網絡密度大于粉絲數量大于1萬的子集。說明粉絲數量越高的群體之間的聯系就越為緊密,網絡越為健壯,不會因為失去少數節點而破壞網絡的連通性。

復雜網絡中已提出多種中心性指標來度量節點的重要程度,如度中心性、介數中心性、接近中心性、特征向量中心性等。目前應用較多的即為度中心性、介數中心性、接近中心性[8]。一個點的近性中心度較高,說明該點到網絡中其他各點的距離總體來說較近,反之則較遠。在微博復雜網絡中需要選某個用戶作為熱點消息中轉站,需要它到其他用戶的距離總體來說最近,方法就是找到近性中心度最高的那個用戶。

一個節點的介性中心度較高,說明其他節點之間的最短路徑很多甚至全部都必須經過這個結點。假如這個點消失了,那么其他點之間的連接可能消失。圖3給出了粉絲大于5萬用戶近性中心度分布圖,圖中橫坐標表示每一個特定的用戶,縱坐標是用戶相應的近性中心度。從圖3中可以看出,近性中心度服從冪律分布。

圖4給出粉絲大于5萬的用戶介性中心度分布,圖4中橫坐標表示每一個特定的用戶,縱坐標是用戶相應的介性中心度。圖4的后半部分表明大部分用戶的介性中心度接近0,說明這些用戶即使退出微博網絡,也幾乎不會影響其他用戶之間建立關注關系。橫向對比圖4,隨著圈子增大,冪律變得更強,除了少數點,大部分的人介性中心度都更趨近于0,人數的增加進一步稀釋了大多數人的“獨特性”,網絡健壯性越來越強。

3 結束語

本文以微博用戶關注數據建立了復雜網絡模型,運用了復雜網絡的一系列評估方法研究,結果表明微博用戶在微博上的參與度極其不均衡,大部分用戶的粉絲數都比較少。微博關注關系構成的網絡的度分布服從冪律分布,整體表現出了無標度的特性,隨著網絡節點的不斷增加,網絡健壯性越來越強。意味著即使少數節點離開了微博平臺,對于網絡連接影響較小。

參考文獻(References):

[1] 李清敏,張華平,劉金剛.面向話題的中文微博觀點傾向性分析研究[J].科學技術與工程,2014.14(2):227-231

[2] 彭希羨,朱慶華,沈超.基于社會網絡基于社會網絡分析的社會計算領域的作者合作分析[J].情報雜志, 2013.33(3):93-100

[3] 宋雙永,李秋丹,路冬媛.面向微博客的熱點事件情感分析方法[J].計算機科學,2014.39(6A):226-260

[4] Kolda T G, Pinar A, Plantenga T, et al. A scalablegenerative graph model with community structure[J].Siam Journal on Scientific Computing,2014.36(5):424-452

[5] 孟佳娜,孫雪蓮,云健.基于社會網絡分析的高校教師科研合作關系研究[J].大連民族學院學報,2015.17(5):525-528

[6] 孫奕菲,姚若俠,焦李成.基于Memetic算法和關聯學習的社會網絡聚類分析[J].復雜系統與復雜性科學,2017.14(2):89-96

[7] 曾潤喜,王晨曦,陳強.網絡輿情傳播階段與模型比較研究[J].情報雜志,2014.5:119-124

[8] 童林萍,徐守志,周歡等.復雜網絡中節點暫態中心性預測研究[J].計算機科學,2017.44(10):122-126

主站蜘蛛池模板: 思思热在线视频精品| 亚洲第一视频网| 亚洲专区一区二区在线观看| 国产国产人成免费视频77777| 亚洲天堂精品视频| 久久久久国产精品熟女影院| 亚洲精品制服丝袜二区| 欧美日本视频在线观看| 无码高潮喷水在线观看| 欧美自慰一级看片免费| 亚洲人成在线免费观看| 中文字幕欧美日韩| 一级爆乳无码av| 亚洲欧美日本国产专区一区| 国产一在线| 国产一二三区在线| 婷婷成人综合| 国产第三区| 日韩麻豆小视频| 99久久精彩视频| 高清不卡毛片| 日韩国产欧美精品在线| 国产毛片片精品天天看视频| 日本精品中文字幕在线不卡| 国产女人18毛片水真多1| 久草视频一区| 国产va免费精品| 欧美在线视频不卡| 欧美一区二区三区欧美日韩亚洲| 欧美伊人色综合久久天天| 国产成人亚洲毛片| 日韩精品一区二区三区免费在线观看| 日韩高清一区 | 在线观看热码亚洲av每日更新| 大学生久久香蕉国产线观看| 亚洲愉拍一区二区精品| 亚洲三级色| 亚洲婷婷丁香| 亚洲第一中文字幕| 国产尤物视频在线| 19国产精品麻豆免费观看| 欧美成人影院亚洲综合图| 亚洲综合激情另类专区| 欧美色综合网站| 国产91精品最新在线播放| 在线国产毛片| 国内精品九九久久久精品| 国产成人亚洲精品无码电影| 国产毛片基地| 九色视频一区| 国产一级二级三级毛片| 福利在线一区| 国产一级毛片yw| 一级毛片在线播放| 一本久道久久综合多人| 又粗又大又爽又紧免费视频| 久久毛片网| 国产一级特黄aa级特黄裸毛片| 男女男精品视频| 本亚洲精品网站| 露脸真实国语乱在线观看| www.日韩三级| 日本伊人色综合网| 一本久道热中字伊人| 亚洲人人视频| 亚洲激情99| 国产精品亚洲欧美日韩久久| 99久久免费精品特色大片| 91小视频版在线观看www| 久久精品aⅴ无码中文字幕| 亚洲婷婷丁香| 午夜毛片免费看| 97久久免费视频| 中文无码精品A∨在线观看不卡 | 成人在线亚洲| 亚洲精品中文字幕午夜| 日本在线免费网站| 妇女自拍偷自拍亚洲精品| 亚洲精品中文字幕无乱码| 亚洲伊人久久精品影院| 国产福利观看| 一级全免费视频播放|