任曉龍,朱燕燕,王思云,廖 好,韓筱璞,呂琳媛(.杭州師范大學(xué)阿里巴巴復(fù)雜科學(xué)研究中心 杭州 ;.弗里堡大學(xué)物理系 瑞士 弗里堡 CH-700;.成都理工大學(xué)商學(xué)院 成都 60059)
在線社交網(wǎng)絡(luò)結(jié)構(gòu)與區(qū)域經(jīng)濟(jì)關(guān)聯(lián)性研究
任曉龍1,2,朱燕燕1,王思云3,廖 好2,韓筱璞1,呂琳媛1
(1.杭州師范大學(xué)阿里巴巴復(fù)雜科學(xué)研究中心 杭州 311121;2.弗里堡大學(xué)物理系 瑞士 弗里堡 CH-1700;3.成都理工大學(xué)商學(xué)院 成都 610059)
通過(guò)騰訊QQ數(shù)據(jù)集詳細(xì)分析了中國(guó)在線社交網(wǎng)絡(luò)中用戶的統(tǒng)計(jì)特征,交友、聊天等行為規(guī)律和地理分布規(guī)律。同時(shí),對(duì)比《中國(guó)城市統(tǒng)計(jì)年鑒》等權(quán)威統(tǒng)計(jì)資料,發(fā)現(xiàn)在線社交網(wǎng)絡(luò)的用戶和用戶行為數(shù)據(jù),例如各地區(qū)的用戶數(shù)、聊天數(shù)與該地區(qū)發(fā)展指標(biāo)呈正相關(guān),這表示在線社交網(wǎng)絡(luò)數(shù)據(jù)能夠在一定程度上反映各地經(jīng)濟(jì)、交通、通信等城市建設(shè)狀況,相關(guān)結(jié)果對(duì)于區(qū)域經(jīng)濟(jì)研究具有啟發(fā)意義。
行為特性;經(jīng)濟(jì)預(yù)測(cè);地理分布;網(wǎng)絡(luò)結(jié)構(gòu);社交網(wǎng)絡(luò)
社交是人類(lèi)最重要的行為之一,在人際交往與日常生活中時(shí)刻存在著。人們通過(guò)社交的方式傳遞信息、交流思想,以達(dá)到某種目的。這種人與人之間的社交關(guān)系就可以用社交網(wǎng)絡(luò)進(jìn)行刻畫(huà)。社交網(wǎng)絡(luò)是由社交活動(dòng)參與者(如個(gè)人或組織)以及表征這些參與者之間相互關(guān)系的連邊組成[1]。對(duì)人類(lèi)行為的研究離不開(kāi)對(duì)社交網(wǎng)絡(luò)的分析。早年間,由于離線社交數(shù)據(jù)的收集成本極高,人類(lèi)行為的研究常常囿于數(shù)據(jù)缺乏,因而只能在小規(guī)模范圍進(jìn)行。隨著互聯(lián)網(wǎng)的快速發(fā)展,可訪問(wèn)互聯(lián)網(wǎng)的智能設(shè)備的增多,以及無(wú)線網(wǎng)絡(luò)等相關(guān)基礎(chǔ)設(shè)施的大力建設(shè),在線社交網(wǎng)絡(luò)已經(jīng)從方方面面融入了人們的生活[2-3]。在線社交網(wǎng)絡(luò)能夠方便、及時(shí)且全面的記錄用戶的各種信息與行為,這為人們深入研究提供豐富的數(shù)據(jù)資源,并使得針對(duì)大規(guī)模人類(lèi)行為的研究成為可能[4-7]。
近幾年,在線社交網(wǎng)絡(luò)[8]在人們社交活動(dòng)中扮演的角色也發(fā)生了質(zhì)的變化:由一開(kāi)始作為離線社交網(wǎng)絡(luò)的補(bǔ)充,逐漸演變?yōu)榕c離線社交并重。越來(lái)越多離線社交的活動(dòng)內(nèi)容被在線社交替代,用戶體驗(yàn)的提升使人們通過(guò)網(wǎng)絡(luò)交流與互動(dòng)越來(lái)越得心應(yīng)手[9],在線社交逐漸可以給人們帶來(lái)與離線社交完全相同的情感體驗(yàn)[10]。一方面,離線社交的時(shí)間成本、經(jīng)濟(jì)成本等一直居高不下;另一方面,在線社交的門(mén)檻越來(lái)越低,互動(dòng)形式多樣化,趣味性與實(shí)效性大大增加。可以預(yù)見(jiàn),未來(lái),在線社交將在很大程度上從內(nèi)容上、形式上超越離線社交,在社交活動(dòng)的很多方面占據(jù)主導(dǎo)地位,只是當(dāng)在線社交無(wú)法完全滿足用戶需求的時(shí)候,人們才進(jìn)行少量的、必要的離線社交行為[11]。
在線社交網(wǎng)絡(luò)的興起也引起學(xué)術(shù)界的關(guān)注,催生了一系列重要的研究成果。2003年,文獻(xiàn)[12]分析了斯坦福大學(xué)早期的在線社交網(wǎng)絡(luò),印證了在線社交網(wǎng)絡(luò)上同樣會(huì)表現(xiàn)出小世界現(xiàn)象[13]和顯著的局部聚類(lèi)現(xiàn)象;文獻(xiàn)[14]發(fā)現(xiàn)了朋友關(guān)系和地理位置之間有著非常強(qiáng)的關(guān)聯(lián),文獻(xiàn)[15]更細(xì)致地分析了隨著用戶年齡的增長(zhǎng)以及地理位置的變化,親密朋友關(guān)系變化的規(guī)律;文獻(xiàn)[2]發(fā)現(xiàn)稍具規(guī)模的社交網(wǎng)絡(luò)都含有一個(gè)包含大多數(shù)用戶的強(qiáng)聯(lián)通片;文獻(xiàn)[16]發(fā)現(xiàn)在線社交網(wǎng)絡(luò)往往會(huì)傾向于形成緊密的社團(tuán);文獻(xiàn)[17]詳細(xì)分析了用戶和用戶之間的關(guān)系是如何一步步形成社團(tuán)的,發(fā)現(xiàn)一個(gè)人加入某個(gè)社團(tuán)不僅僅取決于他有多少個(gè)朋友在這個(gè)社團(tuán)中,還取決于這些朋友的連接方式如何;文獻(xiàn)[18]統(tǒng)計(jì)分析了中國(guó)最大的在線社交網(wǎng)絡(luò)騰訊QQ中的群結(jié)構(gòu);文獻(xiàn)[19]發(fā)現(xiàn)在含時(shí)網(wǎng)絡(luò)中,社交網(wǎng)絡(luò)中只有大約30%的鏈接在以月為單位的情況下持續(xù)互動(dòng),并且雖然兩個(gè)朋友之間的互動(dòng)情況隨時(shí)間變化非常大,但是整個(gè)網(wǎng)絡(luò)的基本性質(zhì)不易改變;文獻(xiàn)[20]研究了社交網(wǎng)絡(luò)中的謠言傳播問(wèn)題;文獻(xiàn)[21-22]分別討論了無(wú)向和有向社交網(wǎng)絡(luò)中的鏈路預(yù)測(cè)問(wèn)題;文獻(xiàn)[23-26]對(duì)社交網(wǎng)絡(luò)上的用戶影響力問(wèn)題進(jìn)行了深入的探討。這些研究成果吸引了包括社會(huì)學(xué)、網(wǎng)絡(luò)科學(xué)、統(tǒng)計(jì)學(xué)及圖論等領(lǐng)域的學(xué)者的廣泛關(guān)注。特別地,網(wǎng)絡(luò)科學(xué)在社交網(wǎng)絡(luò)分析中的應(yīng)用進(jìn)一步促進(jìn)了該領(lǐng)域的快速發(fā)展。目前,已有研究成果只是冰山一角,其內(nèi)涵和外延有很大的拓展空間,還有更多有趣的問(wèn)題值得探討。例如本文后面將討論的在線社交網(wǎng)絡(luò)和區(qū)域經(jīng)濟(jì)發(fā)展水平的關(guān)系。
中國(guó)在線社交網(wǎng)絡(luò)發(fā)展迅速,其中騰訊QQ(簡(jiǎn)稱“QQ”)是中國(guó)最受歡迎的在線社交軟件。截止2014年10月1日,QQ歷史最高同時(shí)在線人數(shù)為216 503 678人,是中國(guó)最具有代表意義的在線社交網(wǎng)絡(luò)。本文分析了QQ在線社交網(wǎng)絡(luò)數(shù)據(jù)的一個(gè)子集,包括了111萬(wàn)用戶以及他們的年齡、性別、最常登錄地點(diǎn)、聊天天數(shù)等信息,詳細(xì)分析QQ在線社交網(wǎng)絡(luò)的基本結(jié)構(gòu)與特性。同時(shí),發(fā)現(xiàn)社交網(wǎng)絡(luò)中用戶的行為模式與各地區(qū)經(jīng)濟(jì)、交通、通信等發(fā)展?fàn)顩r密切相關(guān)。通過(guò)對(duì)比分析《中國(guó)城市統(tǒng)計(jì)年鑒》等權(quán)威公開(kāi)的數(shù)據(jù),發(fā)現(xiàn)社交網(wǎng)絡(luò)的用戶數(shù)、聊天天數(shù)與地區(qū)多種發(fā)展指標(biāo)呈正相關(guān),這些結(jié)果對(duì)于區(qū)域經(jīng)濟(jì)的研究具有啟發(fā)意義。
本次分析中的QQ數(shù)據(jù)集的采集方法是:1)隨機(jī)抽取一萬(wàn)個(gè)用戶作為種子用戶,要求這些用戶比較活躍(即抽取前30天內(nèi)至少登錄一次的用戶),并且注冊(cè)時(shí)間超過(guò)一年;2)取所有與種子用戶有朋友關(guān)系的節(jié)點(diǎn)加入數(shù)據(jù)集,并將他們與種子用戶之間存在朋友關(guān)系的信息也加入數(shù)據(jù)集;3)補(bǔ)充當(dāng)前數(shù)據(jù)集之中所有節(jié)點(diǎn)之間存在、但尚沒(méi)有加入數(shù)據(jù)集的連邊;4)抽取數(shù)據(jù)集中所有用戶的年齡、性別、30天內(nèi)最常登錄地點(diǎn)、30天內(nèi)登錄天數(shù)、注冊(cè)時(shí)間等用戶的個(gè)人信息。

圖1 用戶朋友數(shù)量的概率分布
第一步抽取后,網(wǎng)絡(luò)中有10 000個(gè)注冊(cè)時(shí)間超過(guò)一年且比較活躍的用戶,沒(méi)有邊;經(jīng)過(guò)第二步抽取,網(wǎng)絡(luò)中有1 113 435個(gè)用戶,1 117 512條邊;經(jīng)過(guò)第三步的補(bǔ)充,網(wǎng)絡(luò)中有1 113 435個(gè)用戶和8 022 535條邊。實(shí)際上,第二步抽取的1 117 512條邊都是1萬(wàn)個(gè)種子用戶和他直接相連的朋友的邊,即這1萬(wàn)個(gè)種子用戶的朋友數(shù)之和。由此可估算出QQ社交網(wǎng)絡(luò)中注冊(cè)超過(guò)一年且最近30天內(nèi)至少登錄一次的用戶的平均朋友數(shù)約為111個(gè)。據(jù)統(tǒng)計(jì),2006年11月流行的社交網(wǎng)絡(luò)Orkut的用戶平均朋友數(shù)量為106.1個(gè)[5],2009 年Facebook上用戶的平均朋友數(shù)量約為120個(gè)[19]。對(duì)比說(shuō)明,在平均朋友數(shù)量方面中國(guó)的在線社交網(wǎng)絡(luò)與國(guó)際其他社交網(wǎng)絡(luò)基本一致,平均朋友數(shù)量不因人口密度、地理位置等外界因素而產(chǎn)生較大差異。
在網(wǎng)絡(luò)科學(xué)相關(guān)理論中,用戶朋友數(shù)的多少是該用戶影響力大小的體現(xiàn)[23],擁有越多的朋友意味著一個(gè)用戶的直接影響力越大,轉(zhuǎn)發(fā)信息的能力越強(qiáng)。圖1是QQ網(wǎng)絡(luò)中1萬(wàn)個(gè)種子用戶的朋友數(shù)量的概率分布圖。通過(guò)擬合可以看出,QQ社交網(wǎng)絡(luò)中用戶朋友數(shù)量的概率分布服從指數(shù)分布。

圖2 QQ網(wǎng)絡(luò)可視化(將網(wǎng)絡(luò)外層節(jié)點(diǎn)剝離之后,取shell>40的網(wǎng)絡(luò)核心部分,用Gephi[27]進(jìn)行畫(huà)圖)
網(wǎng)絡(luò)可視化能夠使人們對(duì)網(wǎng)絡(luò)結(jié)構(gòu)有一個(gè)直觀的印象。K-shell網(wǎng)絡(luò)分解法[28]可以將網(wǎng)絡(luò)最外層的節(jié)點(diǎn)像“剝洋蔥”一樣一層層剝離,使網(wǎng)絡(luò)只剩下最核心的部分,這種方法在分析大規(guī)模網(wǎng)絡(luò)時(shí)經(jīng)常用到,詳細(xì)過(guò)程請(qǐng)參考綜述[23]。QQ數(shù)據(jù)集中節(jié)點(diǎn)數(shù)過(guò)多,難以直接顯示,通過(guò)分析我們發(fā)現(xiàn),用K-shell分解法對(duì)QQ社交網(wǎng)絡(luò)進(jìn)行分解,最多可以將網(wǎng)絡(luò)分成101層,其中最內(nèi)層是一個(gè)由454個(gè)節(jié)點(diǎn)組成,相互之間連邊最小為452的高密度連通片。剝?nèi)ネ饷娴?0層外圍節(jié)點(diǎn)后,網(wǎng)絡(luò)的核心部分剩余8 308個(gè)節(jié)點(diǎn),616 297條連邊,其示意圖如圖2所示。從圖中可以看出非常明顯的群落結(jié)構(gòu),很多規(guī)模稍小的群落分布在一個(gè)大型群落周?chē)笮腿郝浒W(wǎng)絡(luò)中大部分的節(jié)點(diǎn)和連邊,不同的小型群落有不同的活躍程度。真實(shí)的社交關(guān)系也呈現(xiàn)出很明顯的群落結(jié)構(gòu)[16],與分析結(jié)果一致。
著重分析了QQ社交網(wǎng)絡(luò)中用戶的性別和年齡特征。在整個(gè)數(shù)據(jù)集中,有年齡信息的有效用戶總數(shù)為973 263人,占全體數(shù)據(jù)集中總用戶數(shù)的87.4%.有年齡信息的用戶中,已知性別信息的用戶占99.4%,其中男女比例為54.1:45.9,女性用戶比例要高于由中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)于2014年1月發(fā)布的《第33次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》(以下簡(jiǎn)稱“報(bào)告”)中提到的2013年中國(guó)互聯(lián)網(wǎng)用戶男女比例56:44。如圖3所示,在所有用戶中,20~29歲年齡段的用戶一共占所有用戶的58.2%,是QQ社交網(wǎng)絡(luò)用戶的主力軍。

圖3 QQ用戶的性別年齡結(jié)構(gòu)圖
在QQ社交網(wǎng)絡(luò)中,不同年齡階段的用戶數(shù)量差異非常大,如圖4所示,20~29歲年齡段的用戶數(shù)量占總量的58.9%,10~39歲年齡段的用戶數(shù)量占總量的93.7%(圖4的QQ用戶中包含男性、女性和未知性別用戶,圖3只包含前兩者)。與此形成鮮明對(duì)比的是,《報(bào)告》中相應(yīng)的用戶數(shù)量比例分別為30.7%和78.6%.這說(shuō)明,青年用戶更易掌握需要較為復(fù)雜操作的社交網(wǎng)絡(luò)軟件(如騰訊QQ,新浪微博等),相對(duì)而言,僅成為互聯(lián)網(wǎng)用戶則技術(shù)門(mén)檻低很多,只需要掌握點(diǎn)擊與瀏覽等基本技能。

圖4 中國(guó)互聯(lián)網(wǎng)網(wǎng)民分布與QQ用戶分布的對(duì)比,前者明顯較后者均勻
由于數(shù)據(jù)缺乏,在以往的社交網(wǎng)絡(luò)分析中很少涉及用戶的地理位置信息。本次采集的QQ社交網(wǎng)絡(luò)數(shù)據(jù)集中,含有用戶最近30天內(nèi)的登錄地點(diǎn),為深入分析中國(guó)社交網(wǎng)絡(luò)用戶與位置相關(guān)的行為規(guī)律提供了便利。為了對(duì)QQ社交網(wǎng)絡(luò)的地理分布有一個(gè)直觀印象,本文在中國(guó)地圖上統(tǒng)計(jì)343個(gè)較大的城市中用戶的分布圖(由于數(shù)據(jù)信息缺失,北京、上海、天津、重慶四個(gè)直轄市各視為一個(gè)城市)。顯然,圖5中經(jīng)濟(jì)發(fā)達(dá)地區(qū)和人口聚集地區(qū)社交網(wǎng)絡(luò)用戶明顯多于西北地區(qū)。直觀上看,人數(shù)分布的分割線與中國(guó)經(jīng)濟(jì)/人口分界線十分相似。
社交網(wǎng)絡(luò)中朋友之間的交友和互動(dòng)情況是一個(gè)研究熱點(diǎn)[29]。圖6是中國(guó)31個(gè)省級(jí)行政區(qū)(本文中31個(gè)省級(jí)行政區(qū)的序號(hào)依次是:1~5:北京、天津、河北、山西、內(nèi)蒙古;6~10:遼寧、吉林、黑龍江、上海、江蘇;11~15:浙江、安徽、福建、江西、山東;16~20:河南、湖北、湖南、廣東、廣西;21~25:海南、四川、貴州、云南、西藏;26~31:陜西、甘肅、青海、寧夏、新疆、重慶。不包含港、澳、臺(tái)地區(qū))之間的交友和聊天信息,其中圖6a是不同省份之間交友數(shù)量的關(guān)系。QQ社交網(wǎng)絡(luò)中不同省份交友數(shù)量之間差異非常大,如坐標(biāo)(x,y)=(11,11)處即“浙江-浙江”之間交友數(shù)達(dá)到393 954對(duì),而坐標(biāo)(x,y)=(11,2)處即“浙江-天津”之間交友數(shù)僅為2 732對(duì),不足前者的1%。為了達(dá)到更好的顯示效果,本文給圖6a中所有數(shù)據(jù)取log10。從圖中可以看出省內(nèi)交友數(shù)量遠(yuǎn)遠(yuǎn)大于不同省份間交友數(shù)量,距離對(duì)于朋友關(guān)系的建立與保持影響巨大。有若干個(gè)地理、經(jīng)濟(jì)聯(lián)系非常緊密的省份之間的交友數(shù)量明顯多于其他省份,比如序號(hào)為1、2的北京、天津,序號(hào)為9、10、11的上海、江蘇、浙江。序號(hào)為25、28的西藏、青海則由于人口、地理原因與其他省份聯(lián)系較弱,交友數(shù)量也明顯比較少。
對(duì)QQ數(shù)據(jù)集中每個(gè)用戶在30天內(nèi)與每個(gè)朋友的聊天天數(shù)數(shù)據(jù)進(jìn)行分析,本文將不同省之間的社交網(wǎng)絡(luò)用戶的總聊天天數(shù)累加,得到了圖6b。同時(shí),還計(jì)算出省份之間的平均聊天天數(shù),如圖6c所示。在圖6b中,同樣由于數(shù)據(jù)量級(jí)相差太大,給所有數(shù)據(jù)都取了lg。相比于圖6a的朋友數(shù)量分布,朋友的聊天天數(shù)分布更能反映一個(gè)人的強(qiáng)關(guān)系[29]。對(duì)比兩圖可以發(fā)現(xiàn),朋友之間的強(qiáng)關(guān)系的建立和保持更加受限于地理因素,大多數(shù)人的強(qiáng)關(guān)系都是分布在一個(gè)局域的范圍內(nèi),這與文獻(xiàn)[15]的結(jié)果相吻合。

圖5 QQ社交網(wǎng)絡(luò)中各城市用戶分布圖


圖6 QQ數(shù)據(jù)集中不同省份之間交友與聊天信息
中國(guó)是一個(gè)幅員遼闊的國(guó)家,對(duì)各省市進(jìn)行經(jīng)濟(jì)、交通、人口等普查往往需要耗費(fèi)大量物力、人力、財(cái)力。能不能從其他角度對(duì)地方的經(jīng)濟(jì)發(fā)展程度進(jìn)行描述是一個(gè)非常有意義的課題。為此,本文分析了QQ社交網(wǎng)絡(luò)中的用戶信息和《2013年中國(guó)城市統(tǒng)計(jì)年鑒》中的數(shù)據(jù),試圖通過(guò)社交網(wǎng)絡(luò)來(lái)推測(cè)區(qū)域人口、經(jīng)濟(jì)、交通、通信等的發(fā)展?fàn)顩r。圖7~圖10是每個(gè)城市的QQ用戶數(shù)量和城市的人口、GDP、公共汽(電)車(chē)數(shù)量、移動(dòng)電話用戶數(shù)等能反映一個(gè)城市建設(shè)水平的指標(biāo)之間的關(guān)系。在這些圖中,QQ用戶數(shù)與各個(gè)指標(biāo)的皮爾森相關(guān)系數(shù)分別是0.77、0.84、0.80與0.87。可見(jiàn),每個(gè)城市的QQ用戶數(shù)與這些主要指標(biāo)有著非常高的正相關(guān)性。不僅是QQ用戶數(shù),每個(gè)城市的累積QQ用戶聊天天數(shù)也與這些指標(biāo)有著比較高的相關(guān)性。表1詳細(xì)統(tǒng)計(jì)了每個(gè)城市QQ用戶數(shù)、城市的累積社交網(wǎng)絡(luò)聊天天數(shù)與各類(lèi)城市發(fā)展指標(biāo)之間的相關(guān)關(guān)系。QQ用戶數(shù)、城市累積QQ聊天天數(shù)都與固定電話、移動(dòng)電話、互聯(lián)網(wǎng)安裝數(shù)等能體現(xiàn)城市發(fā)展?fàn)顩r的指標(biāo)呈現(xiàn)出最強(qiáng)的相關(guān)性,皮爾森相關(guān)系數(shù)都在0.84以上。在交通運(yùn)輸方面,令人驚訝的是社交網(wǎng)絡(luò)中的用戶數(shù)量和聊天累積天數(shù)都與民航客運(yùn)量最為相關(guān),皮爾森相關(guān)系數(shù)分別為0.75和0.70,要高出與公路運(yùn)輸客運(yùn)量和鐵路運(yùn)輸客運(yùn)量。本文從網(wǎng)絡(luò)上爬取到不同省份之間民航客運(yùn)的運(yùn)輸關(guān)系,如圖11所示。可以看出,圖11與圖6社交網(wǎng)絡(luò)中不同省份用戶的互動(dòng)頻率非常吻合。

圖7 城市QQ用戶數(shù)與市轄區(qū)人口的關(guān)系分布
與人口普查、經(jīng)濟(jì)普查不同,在線社交網(wǎng)絡(luò)上的數(shù)據(jù)獲取成本更低,分析更加方便快捷。同時(shí),在線社交網(wǎng)絡(luò)越來(lái)越成為人們生活中不可缺少的一部分,其中隱含了人們?cè)谡鎸?shí)生活中的經(jīng)濟(jì)、交通、通信、教育等信息,并成為現(xiàn)實(shí)經(jīng)濟(jì)社會(huì)在網(wǎng)絡(luò)空間的一種映射。從在線社交網(wǎng)絡(luò)的角度對(duì)國(guó)民經(jīng)濟(jì)建設(shè)進(jìn)行分析是一個(gè)新的途徑的視角,本文僅給出了最初步的討論,還有很多更加多樣的分析形式、更加多元的分析方法有待進(jìn)一步探討。

圖8 城市QQ用戶數(shù)與城市GDP的關(guān)系分布

圖9 城市QQ用戶數(shù)與公共車(chē)輛的關(guān)系分布


圖10 QQ用戶數(shù)與城市各種發(fā)展指標(biāo)的關(guān)系分布

圖11 不同省份之間民航運(yùn)輸圖

表1 QQ網(wǎng)絡(luò)數(shù)據(jù)與眾多城市發(fā)展指標(biāo)的相關(guān)關(guān)系(用皮爾森相關(guān)系數(shù)衡量)
騰訊QQ社交網(wǎng)絡(luò)是中國(guó)具有代表性的在線社交網(wǎng)絡(luò)之一。本文詳細(xì)分析了QQ在線社交網(wǎng)絡(luò)的基本統(tǒng)計(jì)特征,用戶的性別與年齡構(gòu)成、交友與聊天信息的地理分布、不同省份之間交友與互動(dòng)之間的地域差別,以及按不同行政單位劃分社團(tuán)結(jié)構(gòu)時(shí)的模塊度等。最后,通過(guò)比較在線社交網(wǎng)絡(luò)結(jié)構(gòu)與中國(guó)城市的發(fā)展與建設(shè)狀況的指標(biāo),本文發(fā)現(xiàn)這兩者存在較強(qiáng)的關(guān)聯(lián)。這表明,人們有可能通過(guò)社交網(wǎng)絡(luò)結(jié)構(gòu)推斷城市發(fā)展?fàn)顩r,并通過(guò)社交網(wǎng)絡(luò)的演化趨勢(shì)來(lái)預(yù)測(cè)區(qū)域經(jīng)濟(jì)的發(fā)展。
社交網(wǎng)絡(luò)分析是一個(gè)長(zhǎng)盛不衰的話題,從不同的角度在不同的數(shù)據(jù)集上經(jīng)常能發(fā)現(xiàn)各種各樣有意思的結(jié)論。希望在接下來(lái)的工作中,更加深入地分析在線社交網(wǎng)絡(luò)上朋友之間的互動(dòng)信息與不同省市之間的經(jīng)貿(mào)來(lái)往之間的關(guān)系,并嘗試用在線社交網(wǎng)絡(luò)的結(jié)構(gòu)變化預(yù)測(cè)未來(lái)經(jīng)濟(jì)發(fā)展?fàn)顩r。相信該方向的研究將給人們對(duì)社交網(wǎng)絡(luò)的演化帶來(lái)新的理解與思考。
本文的研究工作得到杭州師范大學(xué)科研啟動(dòng)經(jīng)費(fèi)(PE13002004039)及杭州師范大學(xué)阿里巴巴復(fù)雜科學(xué)研究中心開(kāi)放基金(PD12001003002003)的資助,在此表示感謝。
[1]WASSERMAN S.Social network analysis:Methods and applications[M].Cambridge:Cambridge University Press,1994.
[2]KUMAR R,NOVAK J,TOMKINS A.Structure and evolution of online social networks[C]//Link mining:Models,algorithms,and applications.New York:Springer,2010:337-357.
[3]DOREIAN P,STOKMAN F.Evolution of social networks[M].New York:Routledge,2013.
[4]GARTON L,HAYTHORNTHWAITE C,WELLMAN B.Studying online social networks[J].Journal of Computer-Mediated Communication,1997(3):0-31.
[5]MISLOVE A,MARCON M,GUMMADI K P,et al.Measurement and analysis of online social networks[C]//Proceedings of the 7th ACM SIGCOMM Conference on Internet Measurement.New York:ACM,2007:29-42.
[6]周濤,韓筱璞,閆小勇,等.人類(lèi)行為時(shí)空特性的統(tǒng)計(jì)力學(xué)[J].電子科技大學(xué)學(xué)報(bào),2013,42(4):481-540.ZHOU Tao,HAN Xiao-pu,YAN Xiao-yong,et al.Statistical mechanics on temporal and spatial activities of human[J].Journal of University of Electronic Science and Technology of China,2013,42(4):481-540.
[7]ZHAO Zhi-dan,ZHOU Tao.Empirical analysis of online human dynamics[J].Physica A,2012,391:3308-3315.
[8]周濤,汪秉宏,韓筱璞,等.社會(huì)網(wǎng)絡(luò)分析及其在輿情和疫情防控中的應(yīng)用[J].電子科技大學(xué)學(xué)報(bào),2011,25(6):742-754.ZHOU Tao,WANG Bing-hong,HAN Xiao-pu,et al.Social network analysis and its application in the prevention and control of propagation for public opinion and the epidemic [J].Journal of University of Electronic Science and Technology of China,2011,25(6):742-754.
[9]WALLSTEN S.What are we not doing when we’re online[EB/OL].[2014-06-21].http://www.nber.org/papers/w19549.
[10]HOLMBERG L.Seeking social connectedness online and offline:Does happiness require real contact?[D].Orebro:Orebro University,2014.
[11]HRISTOVA D,MUSOLESI M,MASCOLO C.Keep your friends close and your facebook friends closer:a multiplex network approach to the analysis of offline and online social ties[C]//Proceedings Of the Eighth International Conference on Weblogs and Social Media.California:AAAI Press,2014:206-215.
[12]ADAMIC L,BUYUKKOKTEN O,ADAR E.A social network caught in the web[EB/OL].(2003-06-02).http://firstmonday.org/article/view/1057/977.
[13]POOL S,KOCHEN M.Contacts and influence[J].Social Networks,1979,1(1):5-51.
[14]LIBEN-NOWELL D,NOVAK J,KUMAR R,et al.Geographic routing in social networks[J].Proc Natl Acad Sci USA,2005,102(33):11623-11628.
[15]PALCHYKOV V,KASKI K,KERTéSZ J,et al.Sex differences in intimate relationships[J].Scientific Reports,2012(2):370.1-370.5.
[16]GIRVAN M,NEWMAN M E J.Community structure in social and biological networks[J].Proc Natl Acad Sci USA,2002,99(12):7821-7826.
[17]BACKSTROM L,HUTTENLOCHER D,KLEINBERG J,et al.Group formation in large social networks:membership,growth,and evolution[C]//Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM,2006,44-54.
[18]YOU Zhi-qiang,HAN Xiao-pu,Lü Lin-yuan,et al.Empirical studies on the network of social groups:the case of Tencent QQ[EB/OL].[2014-8-24].http://arxiv.org/pdf/1408.5558.pdf.
[19]VISWANATH B,MISLOVE A,CHA M,et al.On the evolution of user interaction in facebook[C]//Proceedings of the 2nd ACM workshop on Online social networks.New York:ACM,2009:37-42.
[20]CHIERICHETTI F,LATTANZI S,PANCONESI A.Rumor spreading in social networks[C]//Automata,Languages and Programming.New York:Springer,2009:375-386.
[21]LIBEN D,KELEINBERG J.The link-prediction problem for social networks[J].Journal of the American Society for Information Science and Technology,2007,58:1019-1031.
[22]ZHANG Qian-ming,Lü Lin-yuan,WANG Wen-qiang,et al.Potential theory for directed networks[J].PLoS One,2013(8):e55437.
[23]任曉龍,呂琳媛.網(wǎng)絡(luò)重要節(jié)點(diǎn)排序方法綜述[J].科學(xué)通報(bào),2014,59:1175-1197.REN Xiao-long,Lü Lin-yuan.Review of ranking nodes in complex networks[J].Chin Sci Bull(Chin Ver),2014,59:1175-1197.
[24]XIA Ying-jie,REN Xiao-long,PENG Zheng-chao,et al.Effectively identifying the influential spreaders in largescale social networks[C]//Multimedia Tools and Applications.New York:Springer,2014:1-13.
[25]Lü Lin-yuan,ZHANG Yi-cheng,YEUNG C H,et al.Leaders in social networks,the delicious case[J].PLoS One,2011(6):e21202.
[26]WENG J,LIM E P,JIANG J,et al.Twitterrank:Finding topic-sensitive influential twitterers[C]//Proceedings of the Third ACM International Conference on Web Search and Data Mining.New York:ACM,2010:261-270.
[27]BASTIAN M,HEYMANN S,JACOMY M.Gephi:an open source software for exploring and manipulating networks[C]//Proceedings of the Third International ICWSM,2009(8):361-362.
[28]KITSAK M,GALLOS L K,HAVLIN S,et al.Identification of influential spreaders in complex networks[J].Nature Phys,2010(6):888-893.
[29]ONNELA J-P,SARAM?KI J,HYV?NEN J,et al.Structure and tie strengths in mobile communication networks[J].Proc Natl Acad Sci USA,2007,104:7332-7336.
編輯 蔣 曉
Online Social Network Analysis and the Relation with Regional Economic Development
REN Xiao-long1,2,ZHU Yan-yan1,WANG Si-yun3,LIAO Hao2,HAN Xiao-pu1,and Lü Lin-yuan1
(1.Alibaba Research Center for Complexity Sciences,Hangzhou Normal University Hangzhou 311121;2.Physics Department,University of Fribourg Fribourg Switzerland CH-1700;3.Business School,Chengdu University of Technology Chengdu 610059)
In this paper,we investigate a sample of Tencent QQ online social network and analyze in detail the users’basic characteristics,users’behavior patterns of making friends and chatting,and the users’geographical distribution.In addition,comparing with an authoritative data acquired from China City Statistical Yearbook,we find positive correlations between the regional development indicators and the characteristics of online social networks,such as the number of online users,the total chatting days of a city.This indicates that users’behaviors in online social networks could reflect the development of local economy,transport,telecommunications,etc.Our findings are instructive for regional economic research.
behavior pattern;economic prediction;geography distribution;network structure;social networks
TP399
A
10.3969/j.issn.1001-0548.2015.05.001
2014?12-25;
2015-04-22
國(guó)家自然科學(xué)基金(11205042,11205040);2014年浙江省大學(xué)生科技創(chuàng)新活動(dòng)計(jì)劃(新苗人才計(jì)劃)項(xiàng)目(2014R421062)
任曉龍(1988-),男,碩士生,主要從事網(wǎng)絡(luò)科學(xué)與工程、信息挖掘等方面的研究.