999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于復雜網絡的中文微博網絡結構研究

2019-02-13 01:36:06吳蓉賴偉杰孟佳娜左振飛
計算機時代 2019年1期

吳蓉 賴偉杰 孟佳娜 左振飛

摘? 要: 為了探討復雜網絡特征,文章通過爬取新浪微博數據,并對數據進行清洗,利用微博用戶的關注關系構建微博關系復雜網絡,建立微博關注模型。基于復雜網絡理論和分析方法,研究了微博的網絡特征,探討用戶關注關系網絡的小世界特性和無標度特性等特征。研究結果表明,微博關注網絡的度分布服從冪律分布,具有較高入度的用戶節點相比低入度的節點更容易被人關注,使得網絡整體的無標度特性加強。

關鍵詞: 微博; 關系網絡; 小世界網絡; 無標度網絡; 聚類系數

中圖分類號:G206? ? ? ? ? 文獻標志碼:A? ? ?文章編號:1006-8228(2019)01-33-04

Abstract: For discussing complex network characteristics, the micro-blog user's follower relationship was used to build the micro-blog relationship complex network and the micro-blog follower relationship model by crawling and cleaning the Sina micro-blog data. Based on the theory and the analysis method of complex network, in this paper the micro-blog network characteristics were studied, the small-world and the scale-free characteristics of users' follower network was discussed. The research results show that the degree distribution of micro-blog follower network follows the power-law distribution. Comparing with low in-degree nodes, nodes with higher in-degree were more likely to be concerned, which makes the network enhance the overall scale-free property.

Key words: micro-blog; relationship networks; small-world networks; scale-free networks; clustering coefficient

0 引言

復雜網絡是指具有自組織、自相似、吸引子、小世界、無標度中部分或全部性質的網絡。隨著復雜網絡的小世界效應以及無標度性的提出[1],復雜網絡理論被應用到各個領域,自然界中存在的大量的復雜系統都可以用網絡來描述,有學者發現社交網絡[2]也符合復雜網絡的模型,因此復雜網絡理論同樣被應用到了分析社交網絡。

微博是一種通過關注機制分享簡短實時信息的廣播式的社交網絡平臺[3],本文從微博平臺入手,使用復雜網絡理論對其結構進行研究。

1 微博關系復雜網絡的構建

在2017年6月時以第一作者的微博賬號作為種子,先獲取了所有第一作者關注的用戶的數據,再獲得了這些用戶所關注的用戶的數據,從而對微博網絡進行了三層的廣度優先遍歷。這里的用戶數據包括用戶的微博條數、獲得別人點贊的個數、用戶關注的人和關注用戶的人,數據包含2.6萬名用戶,461萬條關注連接。

對于微博來說,關注和被關注實際上是一件事情的兩個角度。A關注了B,等價于B被A關注。在所爬取的數據中,記錄了這2.6萬用戶中的每個人都關注了哪些人,及獲取了2.6萬用戶節點的所有外連邊。在根據以上用戶數據和關注連接,本文建立起基于用戶關注的復雜網絡模型。

對于現實生活中常見的復雜系統,如交通網絡、在線社交網絡,可以自然地將其建模成復雜網絡來進行抽象表達。圖作為一種數據結構,被應用到復雜網絡的描述中,其中網絡實體用圖的頂點表示,實體之間的聯系用關聯邊表示。本文模型中將用戶視為復雜網絡中的節點,將用戶的關注與被關注關系視作邊,節點的出度值是該用戶的關注數,節點的入度值是該用戶的粉絲數,邊上的權值為該用戶關注數量的倒數,整個網絡為有向網絡。

2 微博復雜網絡特征分析

復雜網絡具有小世界、無標度和集聚性[4-5]特性,社會網絡是復雜網絡的一種,所以一些復雜網絡的理論和研究方法也適用于社會網絡分析的研究。例如復雜網絡中的小世界效應、無標度網絡特性、聚類系數屬性等。

本文統計了微博的粉絲數量、微博條數、以及與其他人互動的點贊數和評論數,對這幾種指標求取了均值、中位數和標準差。如表1所示,標準差衡量了數據個體之間的離散程度,中位數遠小于均值,可以看出大部分用戶與均值的差距十分大。符合復雜網絡中的無標度特征。

在微博社交網絡數據中,冪率分布是數據的基本規律,冪率分布的長尾部分數據有明顯的稀疏性[6-7]。圖1與圖2的橫軸表示指標的具體數值,縱軸表示有多少用戶具有該指標值。橫軸值和縱軸值都取了以10為底的對數,在雙對數坐標下的圖像,前半部分的線性特性并不是很強,而在后半部分,則近乎為一直線,其斜率的負數就是冪指數。以粉絲分布圖為例,最左上方的點表示在這兩萬多微博用戶里面,有大于103的人沒有獲得一個關注。在圖1的雙對數坐標中利用線性回歸得到斜率為-1.65,回歸系數R2=1.65。大部分的節點只有少量的連邊,而少量的節點卻擁有大量的連邊,說明了所構建的網絡的冪律分布符合無標度網絡的特征。

為了分析網絡特點,本文對所爬取的數據的若干特征進行了計算,網絡整體計算結果見表2。網絡的聚類系數為1.453,結點平均距離為4.777,網絡直徑為12,可見,該網絡的聚類系數較大,結點平均距離較小,滿足小世界的特點。

圖的平均最短路徑長度是指將網絡所有點兩兩之間的最短路徑長度進行算術平均,可以用來衡量網絡中點之間的平均距離。六度分隔理論指的是一個網絡的平均最短路徑長度為6。在微博復雜網絡模型中反映用戶與用戶之間的平均距離,是評價一個用戶緊密度的重要指標。表3給出了粉絲數大于1萬的用戶中平均最短路徑為2.0547 。這意味著兩個粉絲數大于1萬的大V用戶想要相互認識平均需要兩個中間人。網絡表現出小世界的網絡特征。另外直徑這個參數表示大V之間相互認識的最壞情況,兩個大V之間的距離高達4個人。這是網絡中的一種極限情況,存在的數量極少。由表3可知,粉絲數量大于5萬的子集網絡密度大于粉絲數量大于1萬的子集。說明粉絲數量越高的群體之間的聯系就越為緊密,網絡越為健壯,不會因為失去少數節點而破壞網絡的連通性。

復雜網絡中已提出多種中心性指標來度量節點的重要程度,如度中心性、介數中心性、接近中心性、特征向量中心性等。目前應用較多的即為度中心性、介數中心性、接近中心性[8]。一個點的近性中心度較高,說明該點到網絡中其他各點的距離總體來說較近,反之則較遠。在微博復雜網絡中需要選某個用戶作為熱點消息中轉站,需要它到其他用戶的距離總體來說最近,方法就是找到近性中心度最高的那個用戶。

一個節點的介性中心度較高,說明其他節點之間的最短路徑很多甚至全部都必須經過這個結點。假如這個點消失了,那么其他點之間的連接可能消失。圖3給出了粉絲大于5萬用戶近性中心度分布圖,圖中橫坐標表示每一個特定的用戶,縱坐標是用戶相應的近性中心度。從圖3中可以看出,近性中心度服從冪律分布。

圖4給出粉絲大于5萬的用戶介性中心度分布,圖4中橫坐標表示每一個特定的用戶,縱坐標是用戶相應的介性中心度。圖4的后半部分表明大部分用戶的介性中心度接近0,說明這些用戶即使退出微博網絡,也幾乎不會影響其他用戶之間建立關注關系。橫向對比圖4,隨著圈子增大,冪律變得更強,除了少數點,大部分的人介性中心度都更趨近于0,人數的增加進一步稀釋了大多數人的“獨特性”,網絡健壯性越來越強。

3 結束語

本文以微博用戶關注數據建立了復雜網絡模型,運用了復雜網絡的一系列評估方法研究,結果表明微博用戶在微博上的參與度極其不均衡,大部分用戶的粉絲數都比較少。微博關注關系構成的網絡的度分布服從冪律分布,整體表現出了無標度的特性,隨著網絡節點的不斷增加,網絡健壯性越來越強。意味著即使少數節點離開了微博平臺,對于網絡連接影響較小。

參考文獻(References):

[1] 李清敏,張華平,劉金剛.面向話題的中文微博觀點傾向性分析研究[J].科學技術與工程,2014.14(2):227-231

[2] 彭希羨,朱慶華,沈超.基于社會網絡基于社會網絡分析的社會計算領域的作者合作分析[J].情報雜志, 2013.33(3):93-100

[3] 宋雙永,李秋丹,路冬媛.面向微博客的熱點事件情感分析方法[J].計算機科學,2014.39(6A):226-260

[4] Kolda T G, Pinar A, Plantenga T, et al. A scalablegenerative graph model with community structure[J].Siam Journal on Scientific Computing,2014.36(5):424-452

[5] 孟佳娜,孫雪蓮,云健.基于社會網絡分析的高校教師科研合作關系研究[J].大連民族學院學報,2015.17(5):525-528

[6] 孫奕菲,姚若俠,焦李成.基于Memetic算法和關聯學習的社會網絡聚類分析[J].復雜系統與復雜性科學,2017.14(2):89-96

[7] 曾潤喜,王晨曦,陳強.網絡輿情傳播階段與模型比較研究[J].情報雜志,2014.5:119-124

[8] 童林萍,徐守志,周歡等.復雜網絡中節點暫態中心性預測研究[J].計算機科學,2017.44(10):122-126

主站蜘蛛池模板: 久久久久久国产精品mv| 成人毛片免费在线观看| 亚洲精品国产乱码不卡| 亚洲国产成人精品无码区性色| 国产资源站| 亚洲第一黄色网| 久久永久视频| 亚洲国产日韩在线观看| 国产黄色免费看| 99re66精品视频在线观看| 久久人体视频| 国产成人免费手机在线观看视频| 亚洲最大情网站在线观看| 亚洲天堂久久新| 欧美日韩亚洲综合在线观看| 成人欧美日韩| 国产人在线成免费视频| 欧美日韩国产成人高清视频| 9cao视频精品| 欧美性天天| 91福利在线观看视频| 重口调教一区二区视频| 91口爆吞精国产对白第三集| 无码AV日韩一二三区| 久草热视频在线| 欧美亚洲国产精品久久蜜芽| 久久青草精品一区二区三区| 欧美一区二区福利视频| 四虎永久免费地址| 亚洲中字无码AV电影在线观看| 亚洲欧洲综合| 国产成人精品无码一区二 | 蝌蚪国产精品视频第一页| 91青青草视频在线观看的| 无码AV高清毛片中国一级毛片| 欧美性猛交一区二区三区| 九月婷婷亚洲综合在线| 欧美一级在线看| 亚洲男人的天堂在线| 伊人成人在线视频| 在线精品亚洲一区二区古装| 亚洲成人精品久久| 97国内精品久久久久不卡| 综合色在线| 国产女人18毛片水真多1| 亚洲免费福利视频| 99青青青精品视频在线| 国产白浆在线| 国产亚洲精品yxsp| 国产免费久久精品99re丫丫一| Jizz国产色系免费| 少妇精品在线| 欧美国产在线看| 97狠狠操| 亚洲色图欧美激情| аⅴ资源中文在线天堂| 欧美一区二区三区不卡免费| 国产91特黄特色A级毛片| 亚洲欧美日韩另类在线一| 亚洲天堂网在线视频| 精品福利网| 久久精品无码中文字幕| 日本五区在线不卡精品| 最新午夜男女福利片视频| 日韩高清欧美| 国产精品片在线观看手机版| 污污网站在线观看| yjizz国产在线视频网| 最新国产网站| 国产精鲁鲁网在线视频| 亚洲h视频在线| 国产91麻豆视频| a亚洲天堂| 波多野结衣在线se| 国产成人精品免费视频大全五级| 亚洲天堂区| 久久国产精品娇妻素人| 国产精品视频系列专区| 97免费在线观看视频| a级毛片在线免费| 伊人婷婷色香五月综合缴缴情| 美女无遮挡被啪啪到高潮免费|