錢穎 倪君彧 范明林



[摘要]文章研究了2012年臺風“??边@一突發事件的大量微博中@這一針對性分享行為與哪些內容有關。通過對518條關于??⒉┻M行內容分析,借助關聯分析的apriori算法得到與@相關的內容。本文的創新點在于通過研究針對性信息分享行為,以了解在突發事件中用戶與朋友分享的信息,從而揭示了用戶的信息需求,發現在“??边@一突發事件中用戶針對性分享的內容主要是突發事件的基本信息,包括基本情況、地點以及時間,同時還會使用多種表達方式,包括表情符號、圖片、詳細信息的短鏈接等。這對提高應對突發事件信息發布的有效性有借鑒作用。
[關鍵詞]微博;內容分析;關聯分析法;突發事件;信息行為
[中圖分類號]G203
[文獻標識碼]A
[文章編號]1008-0821(2015)04-0008-04
“突發事件”指突然發生,造成或可能造成嚴重的危害,并需要采取相應的應急措施來應對的自然災害事件、事故災難事件、公共衛生事件及社會安全事件。突發事件具有瞬時性、偶然性、危機性。突發事件中,由于主流媒體報道的不及時、不全面性,不能滿足用戶的信息需求。而微博以其實時性、便捷性、互動性等特點,使得大量信息能夠在短時間內得到擴散和傳播,彌補了傳統媒體的不足,成為了突發事件信息傳播的主要渠道。例如在“7·23甬溫動車事件”中,大量用戶對事件進行了多角度深層次的報道,促進了信息的公開,為救援提供了很大的幫助。但微博中信息傳播也存在著問題,比如“黃玉斌招待費事件”中,由于有關人員未能及時澄清而導致網絡謠言不斷,產生了嚴重的負面影響,這些都是因為用戶的信息需求沒有得到滿足,因此,研究突發事件相關微博內容,了解受眾的信息需求具有重要的價值。
國內外對微博文本內容進行分析的研究有很多,主要包括3個方面:話題檢測、情感分析和信息分析。這三方面研究的對象都是微博文本,研究方法都需要首先從微博文本中提取關鍵詞。針對話題檢測,學者們基于提取的關鍵詞使用了數據挖掘的方法進行研究,包括聚類、關聯分析等。唐曉波和王洪艷、鄭斐然都使用了聚類方法來識別話題。王熙則借助可信關聯規則來挖掘用戶關注的話題,并將最后得到的關鍵詞的極大團作為頻率最高的話題。情感分析主要是對內容的情感極性進行分類,主要分為正面、中性及負面情緒,通?;谔崛〉年P鍵詞采用SVM分類器、素貝葉斯分類器(NB)來進行分析。信息分析主要通過對高頻關鍵詞分類,用關聯分析等方法來分析微博中包含的主要信息之間的關系。姬浩、蘇兵、呂美總結出高校群體性突發事件中信息的關鍵分類為發生時間、地點、誘發因素、處置有效性及事件影響,并使用關聯分析對這些分類進行研究,發現決定事件影響大小的因素主要為誘發因素、應急處置的有效性等,其研究結果能夠為突發事件的預警和預測提供指導;龐穎對虛擬社區中用戶對商品的評論信息進行了分析,得到評論主要為產品的性能類信息,這些性能主要包括電池、像素、CPU頻率等,通過對這些關鍵信息進行關聯分析,有效挖掘出了企業需求的信息。Chew、Eysenbach在“2009H1N1事件”研究中,選取了2009年3月到12月中每月某天的600條微博文本,使用手工編碼并結合統計的方法總結出主要內容包括資源鏈接、個人經歷、個人觀點,并對不同時刻,各類微博的數量進行統計,并結合實際背景分析了峰值產生的原因,如個人經歷的兩個峰值的出現是因為世界衛生組織宣布6級流感的盛行及H1N1疫苗到達美國;Terpstra et al.對“Pukkelpop 2011”這一危機事件的微博內容進行了分析,提取出了整個事件中關鍵的信息,總結出極端的天氣情況、破壞、傷亡、救援等方面的信息是廣泛分享的信息,據此了解了事件中人們所需要的關鍵信息。
借鑒以上研究,分析了2012年臺風“??钡顷懮虾r的相關微博。不僅總結出哪些信息被廣泛地分享,并且應用共現分析,研究了@與哪些信息相關度高。@是針對性的信息分享行為,被@的用戶會收到提醒。微博上信息量大,沒有提醒時可能會忽視信息,因此包含@的微博相對有效。大多數包含@的微博是分享給親朋好友的,使得信息能夠通過較為密切的人際關系實現快速傳播,信任度更高,故研究突發事件中@與哪些內容有關可以了解人們在突發事件中@的主要信息,可供有關信息發布部門和個人借鑒。
1 微博文本分析
1.1數據獲取
本文選取的是上海大學學生在2012年8月1~28日期間發表或者轉發的有關“??边@一突發事件的微博。通過爬蟲軟件從新浪微博進行數據采集,共收集1127條微博,刪除了重復的微博,即轉發時沒有進行評論的微博,最后得到518條有效微博。表1給出了2條微博實例。
1.2文本處理
筆者對獲取的微博文本進行分詞處理,關注那些頻率較高的詞語,并將其他出現頻率較低而語義相同的詞語與之合并,繼而統計出了較高頻的關鍵詞(頻次大于50),即為28項二級分類,見表2。結合王炎龍、Terpstra etal.對突發災害中微博內容的幾項概括以及本文的微博文本對統計出的高頻詞進行分類,進一步概括出11項一級分類:基本情況、災難影響、有關人員、受災地點、發生時間、政府組織、救援行為、呼吁提醒,以及微博虛擬平臺所特有表情符號、圖片、短鏈接和@行為,見表2。
圖2中統計了一級分類所涉及關鍵詞在微博中出現的頻次,以受災地點為例,所有微博中有363條微博中包含與受災地點有關的詞。可以看到“??敝谢厩闆r(91.31%)、受災地點(70.08%)、發生時間(57.53%)出現的頻率是最高的。表情圖片鏈接(55.98%)、@(43.05%)出現的頻率較高,前者頻率高是因為微博用戶樂于在突發事件中傳播詳細的事件信息并表達自己的情緒;后者表明事件中微博用戶會傾向于將重要的信息傳遞給周圍人,因為災害與用戶的生活息息相關,需要與朋友分享這些信息,避免由于不知情而帶來不便甚至意外,但@出現的頻率不到50%,說明還是有很多人在發布信息的時候沒有@行為,所以需要研究究竟是哪些信息促使用戶針對性的分享信息。還有一些頻率相對較小的關鍵信息:有關人員(39.19%)、災難影響(38.99%)、受災之物(36.49%)、救援行為(32.05%)、政府組織(30.16%)、呼吁提醒(29.34%),說明微博用戶還會關心物品損壞及人員傷亡情況、政府企業等的救災行為、官方提醒信息。綜上所述,“??笔录腥藗冴P注的焦點是??l展的基本情況和發生的地點。時間也是一個相對重要的信息,可以使用戶知道出現某些災情的準確時間,以做好適當的應對措施。endprint
1.3分享內容共現分析
本文的目的是了解人們在突發事件中,會使用社會化媒體針對性的分享哪些信息,所以主要研究@這一行為會與哪些關鍵詞存在較強的關聯關系,以發現隱藏在大量數據信息中、不易被人察覺的關聯事件。應用Clementine軟件進行數據處理?;?.2的結果,筆者首先進行了共現分析,統計了哪些關鍵詞會與@較為頻繁的同時出現。
1.3.1一級分類與針對性分享的共現分析
表3是@與一級分類的共現分析,可以發現“基本情況+@”、“受災地點+@”這兩組的概率最高,都超過了33%,說明微博用戶更傾向于針對性的分享“??钡幕厩闆r,其次也關注災難發生的地點,因為這些是與突發事件直接相關,是大眾迫切需要的,能夠滿足基本需求,避免造成恐慌?!鞍l生時間+@”組合的概率為25.43%,可見人們也會針對性地分享時間信息,以了解事件的階段性進展,但它與前面相比概率小一些,這是因為微博用戶通常是在事件發生當下發布信息的,所以很多用戶不會再特意注明時間?!氨砬閳D片鏈接+@”組合的概率為23.51%,表明用戶針對性分享信息時圖片、短鏈、表情等出現較頻繁?!笆転闹?@”、“有關人員+@”、“災難影響+@”、“救援行為+@”、“政府組織+@”這些組合的概率依次減小,都低于20%,說明這些信息得到了關注,但關注度不夠。而“呼吁提醒+@”的概率更是低于10%,可見用戶很少將這些官方的提醒信息@給有密切關系的人,而是通過自己的方式表達關心。
表4中分別列出了兩個關鍵詞與@共現的情況。兩個關鍵詞與@共現的結果中,“基本情況”、“受災地點”、“發生時間”中的任意兩者與@共現的概率都達到了22%,說明這三者與@的關系都很緊密。其中,“基本情況+受災地點+@”這一組合的概率最大,為30.83%,與另兩種情況相差較大,說明人們最樂于針對性地分享的是某地的基本情況信息,這將會使得用戶了解到發生災難的某地的風力、雨量以及嚴重情況等。與期望的結果不同,結果中時間相對而言是次要的,是因為微博發布具有實時性,不必特意注明時間信息。“表情圖片鏈接+基本情況+@”這一組合的概率為21.39%,說明人們與指定的人分享的圖片鏈接內容主要與基本情況有關。
1.3.2二級分類與針對性分享的共現分析
進一步研究@與二級分類的共現分析。選取了一級分類下與@關聯度高的“基本情況”、“受災地點”、“發生時間”、“表情圖片鏈接”為對象,同時關注“有關人員”這一分類,因為它包括了典型人物與受災群眾兩個截然不同的對象,可進一步研究用戶的關注傾向。結果如表5所示。
“基本情況”中,“風+@”這一組合的概率為35.65%,顯著大于“雨+@”,說明用戶與指定的人分享時更關注風而不是雨,這是因為臺風中風力造成的影響會危險人身安全?!凹訌妵乐?@”的概率為18%,遠大于“雨+@”,說明當出現嚴重情況時,用戶將會@這類信息。
“受災地點”中,“上海+@”這一組合的概率為27.55%,顯著大于“浙江+@”的概率,因為筆者選取的微博是上海地區的,必然更加關注上海的情況。
“發生時間”中,“日+@”以及“時+@”這兩個組合的概率分別為19.84%、12.33%,相差較大,說明用戶每天都在關注臺風的情況,因為受眾需要及時地了解這些信息,來應對各種災難,但當事件更新頻率過高時(精確到時、分甚至秒),則不能時刻都關注到。
“表情圖片鏈接”中,“表情符號+@”的概率最高,表明圖片、短鏈、表情這三者中更關注的是表情符號,即用戶會通過表情符號來表達自己在突發事件中的情緒并@給朋友,相對而言圖片及鏈接這些包含事件詳細內容的信息關注度較低。
“有關人員”的二級分類中,“受災群眾+@”的概率與“典型人物+@”的概率相差較大,說明雖然人們在突發事件中需要正能量,但面對更需要幫助的群眾時,仍然更樂于@緊迫的信息。
2 結論
文章研究了在“??边@一突發事件的大量微博中@這一針對性分享行為與哪些內容有關。有@行為的微博體現了一種基于強關系傳播,傳播的雙方在現實中存在較為密切的聯系,可能是朋友、家人、同事等,傳播者希望特定的人了解到這些信息,而接受者也更容易接收并繼續轉發這類信息,這類研究具有較大的實用價值。
通過分析,筆者發現在“??边@一突發事件中人們針對性分享的信息主要是與事件本身密切相關的情況信息,包括基本的情況(風力、雨量、加強、減弱、路徑等)、受災的地點、發生的時間。但比起前兩者,微博用戶對時間的關注度較少,原本時間在突發事件中是極其重要的信息,但由于微博中發布信息具有實時性,因此很多用戶在微博中省略了關注時間的習慣,而將精力放在別的內容上。除了這三者,微博用戶@的內容還包括表情圖片短鏈,說明在微博中除了文字,用戶習慣于通過多種方式表達情緒和內容,在突發事件中更是如此。
針對更細致的內容,用戶更傾向于分享的是風力信息,因為臺風中風力造成的影響會危及人身安全。用戶會及時@每天的信息,但當事件更新頻率過高時,精確到時、分、秒時,則不能時刻都關注到。除文字外的多種表達方式中,用戶傾向于通過表情符號表達事件中的情緒并@給朋友。另外,雖然在突發事件中人們需要正能量,但面對需要幫助的群眾,還是愿意把更多的精力放在緊迫的事情上。
有關部門可借鑒這些分析結果發布與上面的內容相關的信息來引起用戶的@行為,從而更好地滿足用戶的信息需求。本研究尚存在不足之處,后續研究可以在更大范圍內搜集與“海葵”事件相關的微博,以發現受災地點信息與@之間更有意義更實用的關系。
(本文責任編輯:馬卓)endprint