曹鑫+王良之+王云飛+熊學鋒+彭小慶+羅蘭溪
【摘要】 大數據時代的到來對人類的生活、工作與思維產生變革性影響,深刻改變著各個領域的面貌,“大數據”日漸成為各行業創新的助推器。當前中國網絡輿情環境復雜,網絡輿情危機時有發生,社會熱點輿情事件不斷涌現。大數據背景下的網絡輿情正在發生巨大的變化。
【關鍵詞】 大數據 輿情 監控
隨著國家電網朝著“三集五大” 的戰略要求開始轉型,國網公司將逐步走向集約化、標準化、規模化。“三集五大”是公司發展的深刻總結和高度指導,是公司走向國際化一流企業的必由之路。然而,任何一項變革都不是一蹴而就的,都將經歷探索、總結、提高這些階段,在“三集五大”發展戰略的實施過程中,必然涉及到機構調整、職能調整、規范調整、業務流程調整等全方位的改革,電力企業作為國家命脈息息相關的企業,其大的變動,必將引起社會方方面面的輿論反應,尤其是在變革中遇到困難、瓶頸的時候,各種懷疑、否定將紛至而來,因此及時監測、匯集、研判網上輿情,是正確引導輿論的重要前提。只有做好輿情工作才能為“三集五大”重大發展戰略順利開展保駕護航。隨著互聯網技術的迅速發展,信息量大、類型繁多、價值密度低、速度快、時效高的大數據吸引了越來越多的關注目光,大數據帶來的信息風暴正在改變我們的生活、工作和思維。毋庸諱言,輿情服務在進行行業規范和整合的同時,正面臨著大數據的挑戰。
一、大數據
“大數據”概念最早在20世紀80年代提出,2011年麥肯錫咨詢公司發布其研究成果《大數據:下一個創新、競爭和生產率的前沿》,使這個概念得以大范圍推廣。2012年3月29日,奧巴馬宣布將投入2億多美元啟動“大數據發展和研究計劃(Big Data Research and Development Initiative)”,將“大數據戰略”上升為國家戰略。近兩年,大數據備受學術界、產業界和政府部門的關注,成為國內外強有力的前沿詞匯。大數據又稱巨量數據、海量數據、大資料,指的是所涉及的數據量規模巨大到無法通過目前主流軟件工具在合理時間內進行抓取、管理和處理的數據集合,是必須通過深度挖掘、計算、分析才能創造價值的海量信息。大數據在體量、復雜性、產生速度及價值密度四個方面都極大地超越了傳統的數據形態,具有4V特征:大量(Volume)、多樣(Variety)、高速(Velocity)、價值(Value)。
二、大數據背景下的網絡輿情
大數據背景下網絡輿情管理面對著新的挑戰。海量數據的挑戰、信息選擇性傳播的挑戰以及輿論話語權分散的挑戰。海量的網上信息難以掌控,大量相關性、偶發性因素使輿情更加復雜多變,傳統的輿情監測研判手段和方法難以奏效,新的技術手段和方法要求更高。網上數據無限性和網民關注能力有限性之間的矛盾,加劇了社會輿論的“盲人摸象”效應。社會化媒體促進信息的開放和溝通的便捷,分眾傳播、個性化傳播凸顯,使偏激的觀點更容易找到“同類”,從而相互支持、強化放大,加劇輿論偏激情緒。大數據時代各類數據隨手可得,越來越多的機構、個人通過數據挖掘和分析得出的各種結論會不脛而走,有效管理輿情的難度越來越大。
三、大數據在網絡輿情監測的應用價值
由網絡輿情監測到網絡輿情預測是網絡輿情的發展趨勢,這一目標實現的關鍵技術就是大數據挖掘技術。
大數據價值的核心是輿情預測:傳統網絡輿論引導工作的氣墊,是對已發生的網絡輿情進行檢測開始。然而這種方式局限在于滯后性。大數據技術的應用,就是挖掘、分析網絡輿情相關聯的數據,將監測的目標時間點提前到敏感消息進行網絡傳播的初期,通過建立的模型,模擬仿真實際網絡輿情演變過程,實現對網絡突發輿情的預測。
大數據價值的條件是輿情全面:大數據技術要預測輿情,首要條件是對各種關聯的全面數據進行分析計算。傳統數據時代,分析網民觀點或輿情走勢時,只關注網民跟帖態度和情緒,忽視了網民心理的變化;只關注文本信息,而較少關注圖像、視頻、語音等內容;只觀察輿論局部變化,忽視其他群體的輿論變化;只解讀網民文字內容,而忽視復雜多變的社會關系網絡。從輿情分析角度看,網民僅僅是信息海洋中的"孤獨僵尸",猶如蟻群能夠涌現高度智能,而單個螞蟻如附熱鍋到處亂竄。大數據時代,突破了傳統數據時代片面化、單一化、靜態化的思維,開始立體化、全局化、動態化研究網絡輿情數據,將看似無關緊要的輿情數據納入分析計算的范圍。
大數據價值的基礎是輿情量化:大數據預測輿情的價值實現,必須建立在對已挖掘出的海量信息,利用數學模型進行科學計算分析的基礎之上,其前提是各類相關數據的量化,即一切輿情信息皆可量化。但數據量化,不等同于簡單的數字化,而是數據的可計算化。要在關注網民言論的同時,統計持此意見的人群數量;在解讀網民言論文字內容的同時,計算網民互動的社會關系網絡數量;對于網民情緒的變化,可通過量化的指標進行標識等。
大數據價值的關鍵是輿情關聯:數據背后是網絡,網絡背后是人,研究網絡數據實際上是研究人組成的社會網絡。大數據技術預測輿情的價值實現,最關鍵的技術就是對輿情間的關系進行關聯,將不再僅僅關注傳統意義上的因果關系,更多關注數據間的相關關系。按大數據思維,每一個數據都是一個節點,可無限次地與其他關聯數據形成輿情鏈上的乘法效應--類似微博裂變傳播路徑,數據裂變式的關聯狀態蘊含著無限可能性。
四、云計算在網絡輿情的應用
XML可擴展標記語言,一種簡單的數據存儲語言,使用一系列簡單的標記描述數據,而這些標記可以用方便的方式建立。雖然XML占用的空間比二進制數據要占用更多的空間,但XML簡單易于掌握和使用,XML是Internet環境中跨平臺的,依賴于內容的技術,是當前處理結構化文檔信息的有力工具。
DOM是DocumentObjectModel文檔對象模型的縮寫,根據W3CDOM規范,DOM是一種與瀏覽器、平臺、語言無關的接口,使得它可以訪問頁面其他的標準組件。DOM解決了Netscape的Javascript和Microsoft的Jscript之間的沖突,基于WEB設計師和開發者一個標準的方法,讓他們來訪問他們站點中的數據,腳本和表現層對象。
利用基于DOM的XML解析方法,用Prtllon實現了XML解析器,解析器先將各種XML內容轉換為DOM,然后對屬性結構遍歷所有屬性,再根據規范定義其語義并將結果封裝成可被各模塊使用的數據結構。
對數據進行規約后,系統采用HDFS系統實現分布式存儲,HDFS支持的高容錯性和低成本運行的特點以及大數據量吞吐的訪問級別和適應大事件集使之和其他分布式系統相比具有巨大的優勢。
通過數據計算時間對比可以看出數據量越大,基于云計算的輿情挖掘系統的運行效率比本地執行的運行效率越高。
數據對比表如下:
結束語:大數據是數字化生產時代的新型戰略資源,對社會發展所起的作用巨大,對電力公司的發展同樣至關重要。大數據的出現和引用,引起了各國科技界,產業界和政府部門的高度關注,因此,大數據時代的網絡輿情治理作為社會治理的一個方面,顯得尤為重要。
參 考 文 獻
[1] 劉葉婷,王春曉.“大數據”,新作為—“大數據”時代背景下政府作為模式轉變的分析[J].領導科學.2012(35)
[2] 李國杰,程學旗.大數據研究:未來科技及經濟社會發展的重大戰略領域—大數據的研究現狀與科學思考[J].中國科學院院刊. 2012(06)
[3] 趙路平,許鑫.淺析公共危機傳播中輿情分析研判機制的體系與流程[J]. 中國浦東干部學院學報.2011(04)
[4] 談國新,方一.突發公共事件網絡輿情監測指標體系研究[J].華中師范大學學報(人文社會科學版).2010(03)
[5] 吳新年,陳永平.決策支持系統發展現狀與趨勢分析[J].情報資料工作. 2007(01)