王子豪 崔 浩
(中國傳媒大學 北京 100026)
移動通信平臺和無線網絡的迅猛發展,使人們更加經常地通過移動網絡獲取信息,而作為其副產品的網絡輿情也應運而生。互聯網空間可以被視為現實社會的虛擬映射,而網絡輿情則是社會輿情在互聯網上的映射,是社會輿情的另一種表現方式。作為大眾思想文化信息的主要集散地的互聯網,以其為平臺的新型媒體、通訊工具的影響力已形成規模。
舍恩伯格的《大數據時代》中有這樣一句話,“大數據帶來的信息風暴正在變革我們的生活、工作和思維,大數據開啟了一次重大的時代轉型。”①大數據背景下改變的還有輿情傳播形態等。大輿情亦是大數據,人類運營數據、人類感知數據、人類原創數據。海量的數據使得網絡輿情變得可預測其走向和傳播模式,更加科學地對輿情進行引導和化解。目前有關突發公共事件網絡輿情的研究點主要集中在理論框架內。實踐研究中首先暴露出來的第一個問題就是缺乏量化分析的體系,在量化分析之后如何實時將輿情可視化也是應該考慮到的方面。
將大數據移植到輿情應用。當公共事務發生后,網民在瀏覽、搜索、互動的過程中會隨時發表言論信息,這些信息直接呈現了網民的情緒、態度、意見,這些構成了網絡輿情的顯性和隱性輿情,而網絡社區用戶彼此之間建立相互關系網絡,建立了新的社會群體,帶來了新的群體行為,志同道合的人聚到一起,形成了具有影響力的輿情。
網絡輿情的定性方法可以為研究提供增量性的成果,但是卻并不能將網絡輿情的趨勢預測達到最高效度。傳統的網絡輿情的量化研究可以分為涉及數理結構模型、方法和技術,注重對輿情傳播過程中的數據統計及分析。在前面學者的努力下,大概形成了一系列體系和模型,種類數不勝數。
首先,傳播影響力的加速與擴大。網民們更喜歡選擇與自己觀點相近的內容,“沉默螺旋”的效果在網絡平臺有所加強,快速表達意見會加速網絡輿情的迅速反應,產生雪崩式一邊倒現象。因此,對于大部分網絡輿情事件,越早回應越主動。大數據時代要求我們對于網絡輿情的收集速度和深度要有所增加,收集的方式要由靜態向動態轉向。
第二,重視微力量。反饋式的閉環傳播會激蕩從而擴大某一個事件的傳播效果。一個郭美美會引起全國對于紅十字會的敵視,這種例子屢見不鮮。大數據分析可以幫助我們了解情況,那些小的情緒會引起未來雪崩式的輿情變化。
第三,大數據更重視相關。小數據注重回歸;大數據時代,我們更注重相關。澤字節的數據集,我們關注的是其宏觀的關系,而不是對其追根溯源,通過對信息的解構與重構,發現各個因素間的關系,進行輿情管理。
第四,大數據時代使得我們更重視輿情的主導者、人的存在,我們關注于有多少人有這樣的意見。對于文字的過分解讀,會使得我們忽視多元的社會價值觀的沖撞。
第五,顯性輿情和隱性輿情。常見的網民對于公共事務發表評論、消息轉發等,這些可以呈現網民直接態度的被定義為顯性的網絡輿情。大數據的到來,使得我們對于隱性的網絡輿情進行觀測的能力增強,像是服務器會記錄瀏覽的URL等,不是直接對于輿情內容進行反應,卻可以告訴我們網民的關注熱點是什么。
基于大數據背景下的網絡輿情分析技術,應有三個主要的功能模塊,信息采集模塊、數據處理模塊、前端應用模塊。②根據這三個模塊,應具有以下功能:
1.信息采集,可以代替人工搜索,自動發現輿情信息,比如自動對于媒體所發布的新聞內容進行抓取、對于微博的關鍵詞進行抓取;
2.數據處理,自動對所抓取的關鍵詞進行詞頻統計,當某一些或者某一類詞的數量達到一定限度,要對重大的負面輿情信息及時發出預警。除此之外,還應該定性定量相結合的分析輿情信息,幫助輿情管理,判斷某一輿情的發展變化趨勢;
3.前端應用,能夠自動生成輿情報道和數據。數據可視化技術,不但是簡簡單單地對于數據進行圖形化,更是會影響使用者對于輿情的反映速度和處理態度,提高工作效率,幫助決策。
網絡輿情信息與繁雜的大數據有著相似特征,由海量的結構化數據組成,但其中包含更多的非結構化數據。當今互聯網已經沒有時間再去允許你海底撈針般地對于數據結構化進行處理或者界定,傳統的量化方式已經無法滿足準確快速地對于輿情進行預警,大數據的分析技術也應運而生。
不同于引擎搜索注重的是信息的廣度,網絡輿情的數據抓取更注重深度和對于轉發、評論、搜索等的精確采集。采用專門的抓取器,像是Goseeker、import.io、編程語言Python,將抓取的數據結構化后存儲下來。文本挖掘利用網絡爬蟲技術,在制定的網站、特定的形式進行網絡數據收集,以備使用,但是這種做法會影響數據采集和分析的效率以及數據的精度。
蝴蝶效應用在當今互聯網空間再合適不過,每一條發布在網絡上的信息都有可能引起一場風暴,網絡預警模型是整個技術分析過程中關鍵的組成部分。大數據注重的是對于整體宏觀的走勢把握和數據的相關關系,但是要對于異常值很敏感,才能及時抓住癥結。
文本內容的挖掘是對于輿情信息內容最核心的處理,將整句按照詞性進行詞語劃分,經過詞頻統計和情感分析,很容易便知道大多數網民的態度傾向和關注熱點,從而對輿情進行分析和未來走勢預測。語義分析是網絡輿情定量分析的重要環節,相比直接的采訪和訪談,對搜集到的自然語言進行處理,也更為客觀和真實。
大數據分析得以實現的根本是數據可獲得,由大眾化向分眾化轉變,就像用戶由微博向微信轉變。而大數據的抓取卻無法向這類信息下手,大數據的輿情分析基于的是用戶想公開表達,否則輿情是不可測的。同時,像是微博平臺也在出臺一系列措施,防止隨意抓取數據。
產品社會,將以上技術組成相應的技術組件放在云平臺上,可以實時使用,這才是未來技術的發展方向,其組件包括可以抓取數據的爬蟲軟件、搜索軟件、云平臺提供的信息儲存器等。云平臺,將為未來大數據輿情分析提供強大的助力。
被譽為新時代黃金的數據,其最大價值體現在其二次分析上。二次分析和一次分析,表面上被告知和許可的信息不同,二次分析的結果是未知的,分析之后的結果可能讓人出乎意料。大數據時代的信息安全保護,應有所不同。
網絡輿情數據獲取與話題分析技術,限制著網絡輿情分析的質量。網絡輿情分析需要廣泛的數據來源、長時間的數據積累和成熟的分析技術作為支撐,大數據的誕生會成為當今網絡輿情分析新的助力,雖然還有很多限制和問題有待解決,但確實為作為社會科學的學科的輿情增添了一些更為科學的因子。
[1]葉平浩、張李義:《基于知識圖譜的網絡輿情研究現狀分析》,《情報雜志》2013年02期
[2]王青:《網絡輿情監測及預警指標體系研究綜述》,《情報科學》2011年07期
[3]朱毅華:《網絡輿情研究中的仿真方法應用綜述》,《情報雜志》2013年01期
注釋:
①維克托·邁爾-舍恩伯格、袁杰:《大數據時代》浙江人民出版社2013年1月
②尹培培:《大數據時代的網絡輿情分析系統》,《廣播電視技術》2013年07期