徐人鳳,李粵平,聶 哲,溫曉軍,肖正興
(深圳職業技術學院計算機工程學院,廣東深圳518055)
微博網絡互感知研究綜述*
徐人鳳,李粵平,聶 哲,溫曉軍,肖正興
(深圳職業技術學院計算機工程學院,廣東深圳518055)
針對微博的特有信息傳播方式,本文綜述了有關微博網絡互感知性質的研究方法和成果.同時利用微博網絡社區發現對互感知性質的重要性進行實驗驗證.實驗證明,微博網絡考慮了互感知性質的社區發現,在2個主流評價指標上比未考慮互感知的社區發現有明顯的優勢:傳遞性指標僅為后者的10.81%,而興趣指數為后者的2.135倍.
微博;互感知;社區發現
微博是微博客(MicroBlog)的簡稱,是一個基于用戶關系信息分享、傳播以及獲取平臺,用戶可以通過各種客戶端發送140字左右的文字信息,實現即時分享.2006年美國的Twitter最早提供微博服務,開通至今注冊用戶已經超過5億.國內具有代表性的新浪微博和騰訊微博,在開通的一年內均突破1億用戶[1].微博融合了即時通訊、博客和社交網站的功能,使得信息流通在速度和廣度層面都有大幅度的提升.
微博的出現和迅速發展引起了學術界和產業界的廣泛關注,涌現了許多研究成果.本文圍繞微博網絡的特點——互感知性對國內外微博研究的代表性成果進行梳理,指出互感知特點的影響及其解決方法,為對微博的研究和實踐提供參考.
微博誕生初期學者Gaonkar、Li和Choudhury等學者從技術層面給出了微博的定義:一種集合了手機傳感器、無線網絡、信息處理和空間可視這四要素的多媒體博客[2].在2010年學者Kaplan和Haenlein提出了較為廣泛接受的定義:“微博是一種基于互聯網的交換工具,允許用戶之間交換短篇內容,例如句子、圖像和鏈接等”[3].
由于微博的信息傳播機制與即時消息通訊、論壇和博客有著一定差異,從而導致微博網絡的節點種類更為多樣,節點之間的關系更為復雜[4].下面先介紹微博的信息傳播方式,再對微博網絡的結構和特點進行分析.
微博的信息傳播是通過用戶發布、轉發、評論及回復的功能,同時配合跟隨機制、搜索機制、鏈接機制和提醒機制完成的.
微博用戶在其主頁上發布一條博文,記為A,可能通過3種方式進行傳播:第一種被其他用戶轉發,記為F;第二種被其他用戶評論,記為C;第三種被其他用戶轉發同時也進行了評論,記為F+C.其中評論C可以僅發布在被評論博文的下方,也可以發布到評論者自己的微博主頁上.此外,微博用戶可以對評論進行回復,記為R.類似地,回復可以發布在被回復博文或評論的下方,也可以發布在回復者自己的微博主頁,如圖1所示.上述發布到微博主頁的評論或者回復等同于發布一條新的博文,可以進一步被轉發、評論和回復.


1)層次聚類算法性能的優劣很大程度上取決于相似度矩陣的計算是否合理.此性質非常適合用于評價相似度矩陣的刻畫質量;
2)層次聚類算法相對其他社區發現算法精度較好,效率也高.
實驗的數據集通過本文資助項目開發的軟件《微博輿情信息處理平臺》(軟著登字第553340號)對騰訊微博數據進行爬?。當祿闆r為:博主130個,博文(包括轉發和評論)4013條,時間跨度30天.
實驗步驟如下: 1)計算互信息矩陣;2)分別利用鄰接矩陣和互信息矩陣進行社區發現;3)對社區發現結構基于鄰接矩陣和基于互信息矩陣進行驗證.
實驗步驟流程示意圖,如圖3所示.
基于鄰接情況的社區結構驗證結果見圖4.從結果看出,基于鄰接情況的社區結構在兩種驗證下的質量相差不大.需要注意的是在傳遞性和興趣指數這兩個評價指標上的效果并不理想,說明基于鄰接情況進行社區發現,并不適用于微博網絡.
基于互信息的社區結構驗證結果見圖5.從結果看出,基于互信息的社區結構在兩種驗證下的質量相差顯著.特別是在傳遞性和興趣指數這2個評價指標上的效果遠優于基于鄰接情況的社區結構,說明基于互信息進行社區發現,更適用于微博網絡.互信息對微博網絡的刻畫更貼近現實.

圖3 實驗流程

圖4 基于鄰接情況社區結構的驗證結果

圖5 基于互信息社區結構的驗證結果
實驗結果表明,微博網絡考慮了互感知性質的社區發現在兩個主流評價“傳遞性”和“興趣指數”指標上比未考慮互感知的社區發現有明顯的優勢:傳遞性指標前者是后者的10.81%,興趣指標前者是后者的2.125倍.如今,社會化媒體的規模比以往任何時期都要龐大,媒體的形式也更為多樣.微博是社會化媒體的一個代表,微博的互感知性在其他社會化媒體中也不同程度的存在.本文探討的互感知的相關成果可以推廣到其他社會化媒體中[11].
[1]閆幸,常亞平.微博研究綜述[J].情報雜志,2011,30(9):61-65.
[2] Shravan Gaonkar, Romit Roy Choudhury. Micro-blog: map-casting from mobile phones to virtual sensor maps[Z].2007.
[3]Andreas M. Kaplan, Michael Haenlein. The early bird catches the news: Nine things you should know about micro-blogging[J].Business Horizons,2011,54(2):105-113.
[4]陳克寒,韓盼盼,吳健.基于用戶聚類的異構社交網絡推薦算法[J].計算機學報,2013,36(2):349-359.
[5]Howard Rheingold. The Virtual Community: Homesteading on the Electronic Frontier[M].MIT Press Cambridge, MA, USA, 2000.
[6]Steven G. Jones. CyberSociety: Computer-Mediated Communication and Community[M].SAGE Publications, 1995.
[7]Yu-ru Lin, Hari Sundaram,Yun Chi, Jun Tatemura, Belle Tseng. Discovery of blog communities based on mutual awareness[C]// Proceedings of the WWW06 Workshop on Web Intelligence,2006.
[8]Brin S, Page L. The anatomy of a large-scale hypertexttual Web search engine[J].Computer Networks and ISDN Systems, 1998,30(1-7):107-117.
[9]Brandes U, Gaertler M, Wagner D. Experiments on Graph Clustering Algorithms[C]//Proceedings of the 11th Annual European Symposium on Algorithms - ESA, Springer, 2003:568-579.
[10]Santo Fortunato. Community detection in graphs[J].Physics Reports,2010,486(3-5):75-174.
[11]蔣盛益,麥智凱,龐觀松,吳美玲,王連喜.微博信息挖掘技術研究綜述[J].圖書情報工作,2012,56(17):136-142.
A Survey on Mutual Awareness of Weibo Network
XU Renfeng, LI Yueping, NIE Zhe, WEN Xiaojun, XIAO Zhengxing
(School of Computer Engineering, Shenzhen Polytechnic, Shenzhen, Guangdong 518055, China)
Taking into the unique feature of weibo into consideration, this paper surveys research methods and results about mutual awareness of weibo network. The impact of network community discovery on mutual awareness is verified by experiments. The results show that the community discovery network with mutual awareness has a distinct advantage over that without. Conductivity index of the former is only 10.81% of the latter, while the interest index is 2.135 times of the latter.
weibo; mutual awareness; community discovery
TP368.1
A
1672-0318(2014)01-0032-05
2013-10-09
*項目來源:深圳職業技術學院科技基金重點資助項目(編號2212K3190005)
徐人鳳(1961-),吉林人,高級工程師,主要研究方向為數據庫應用、數據挖掘;李粵平(1980-),講師,主要研究方向為網絡計算;聶哲(1970-),教授,主要研究方向為網絡輿情;溫曉軍(1971-),教授,主要研究方向為量子密碼;肖正興(1976-),講師,主要研究方向為人工智能.