丁勝鋒+楊紹輝
[摘 要]目前,隨著海量網(wǎng)絡(luò)輿情成指數(shù)增加,傳統(tǒng)的數(shù)據(jù)處理技術(shù)不支持對海量輿情潛在信息的發(fā)現(xiàn)與挖掘,無法找到輿情信息之間的規(guī)則或關(guān)系,不能根據(jù)輿情現(xiàn)狀預(yù)測未來發(fā)展趨勢。在這種形勢下,非常有必要把數(shù)據(jù)挖掘技術(shù)應(yīng)用到網(wǎng)絡(luò)輿情管理中,充分發(fā)揮數(shù)據(jù)挖掘的具體優(yōu)勢,從而實(shí)現(xiàn)對網(wǎng)絡(luò)輿情的及時發(fā)現(xiàn)、快速分析、準(zhǔn)確追蹤和理性引導(dǎo)。
[關(guān)鍵詞]數(shù)據(jù)挖掘;網(wǎng)絡(luò)輿情;研究
[中圖分類號] G41,TP399 [文獻(xiàn)標(biāo)識碼] A [文章編號] 2095-3437(2016)11-0173-02
隨著因特網(wǎng)在全世界范圍內(nèi)的普及,作為繼報刊、廣播、電視之后發(fā)展起來的與傳統(tǒng)大眾媒體并存的新媒體,因特網(wǎng)被稱為第四媒體,它成為反映社會輿情的主要載體之一。隨著信息技術(shù)的高速發(fā)展,人們積累的數(shù)據(jù)量越來越多,僅依靠傳統(tǒng)的人工方法收集和處理海量網(wǎng)絡(luò)信息是十分困難的。在這種情況下,迫切需要更加科學(xué)有效的信息處理技術(shù),快速準(zhǔn)確地分析網(wǎng)絡(luò)輿情動態(tài),及時對網(wǎng)絡(luò)的熱點(diǎn)、焦點(diǎn)與敏感話題做出反應(yīng),從而提高網(wǎng)絡(luò)的監(jiān)管能力和網(wǎng)絡(luò)突發(fā)事件的處置能力。
一、數(shù)據(jù)挖掘概念
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘的對象是大量的、包含噪聲的數(shù)據(jù)源或數(shù)據(jù)庫,而挖掘的結(jié)果是對用戶有幫助且事先未知的信息或知識。
近年來網(wǎng)絡(luò)數(shù)據(jù)的爆炸性增長與數(shù)據(jù)處理技術(shù)的滯后之間的矛盾越來越突出,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,并能從實(shí)際的海量數(shù)據(jù)源中抽取知識。數(shù)據(jù)挖掘技術(shù)被越來越多的行業(yè)和領(lǐng)域所采用,取得了較好的效果,為人們的正確決策提供了有力的幫助。[1] [2]
二、新形勢下網(wǎng)絡(luò)輿情現(xiàn)狀分析
(一)大數(shù)據(jù)背景的網(wǎng)絡(luò)輿情更加復(fù)雜
第一,網(wǎng)絡(luò)輿情數(shù)據(jù)量巨大。數(shù)據(jù)的海量性和偶然性因素使社會輿情難以有效捕獲,演變和發(fā)展過程難以推測,傳統(tǒng)的處理方法顯得捉襟見肘。第二,網(wǎng)絡(luò)輿情選擇性傳播。網(wǎng)絡(luò)數(shù)據(jù)的無限性和網(wǎng)民關(guān)注能力的有限性之間存在矛盾,這導(dǎo)致網(wǎng)民不能全面、準(zhǔn)確了解輿情的真面目。網(wǎng)絡(luò)媒體具備人際傳播和大眾傳播的特點(diǎn),容易讓同類網(wǎng)民找到共鳴點(diǎn),從而使一些偏激輿論被放大。第三,網(wǎng)絡(luò)輿論話語權(quán)較分散。大數(shù)據(jù)背景下數(shù)據(jù)的獲取相對容易,更多的機(jī)構(gòu)或個人通過信息分析得出的結(jié)論迅速傳播,有效管理輿情的難度越來越大。
(二)網(wǎng)絡(luò)媒體影響力增強(qiáng)
在互聯(lián)網(wǎng)發(fā)展的早期,網(wǎng)絡(luò)媒體主要通過引用或轉(zhuǎn)載報紙、廣播、電視的報道內(nèi)容,然后進(jìn)行補(bǔ)充式的討論。隨著近年來移動客戶端設(shè)備、軟件的出現(xiàn)和網(wǎng)民數(shù)量的大幅度增長,傳統(tǒng)媒體的傳播優(yōu)勢逐漸減少。網(wǎng)絡(luò)媒體依靠其傳播的快速性和便捷性,吸引網(wǎng)民發(fā)布信息,引發(fā)輿論,反過來影響傳統(tǒng)媒體的討論。網(wǎng)絡(luò)媒體已經(jīng)成為傳統(tǒng)媒體報道內(nèi)容的重要來源之一。
(三)網(wǎng)絡(luò)輿情載體多樣化,影響力迅速提高
隨著微信、微博、QQ等網(wǎng)絡(luò)輿情載體的發(fā)展,網(wǎng)民的組織化程度越來越高。網(wǎng)民通過微信、微博、QQ、社交類網(wǎng)站來組建各種群組。這些網(wǎng)絡(luò)載體能為網(wǎng)民提供Blog、Microblog、微信、圖像、音頻、視頻等多種線上、線下互動功能。網(wǎng)民不再是一個獨(dú)立的個體,通過加入各種群組,他們能夠獲取小范圍的消息,并迅速把消息傳播到全世界的每個角落。同時移動互聯(lián)網(wǎng)的應(yīng)用擴(kuò)大了網(wǎng)民相互交流的時間域和空間域,“任何一個在場的人都可能一轉(zhuǎn)身,上網(wǎng)發(fā)送文字、圖片、視頻,給政府的事件處置及輿情應(yīng)對帶來挑戰(zhàn)”,“移動終端在突發(fā)事件‘現(xiàn)場直播的優(yōu)勢,讓其他媒體望塵莫及”。[3] [4]
(四)網(wǎng)絡(luò)輿情走向現(xiàn)實(shí)生活,推動事件發(fā)展
隨著社會的進(jìn)步,越來越多的網(wǎng)民不再在網(wǎng)絡(luò)平臺上議論和分析社會上的熱點(diǎn)、敏感事件,不再滿足于在網(wǎng)絡(luò)上等待熱點(diǎn)事情的真相,而是積極走向社會現(xiàn)實(shí),親自調(diào)查以還原事件真相。這增加了熱點(diǎn)事件的透明度,加快了相關(guān)政府部門、企事業(yè)單位或個人對事情的處理速度。
(五)網(wǎng)絡(luò)輿情導(dǎo)控與應(yīng)對存在不足
第一,輿情應(yīng)急準(zhǔn)備不足,響應(yīng)速度緩慢。目前網(wǎng)絡(luò)輿情管控體系還不完善,這導(dǎo)致我們在處理突發(fā)事件時反應(yīng)緩慢;在網(wǎng)絡(luò)輿論爆發(fā)之時,難以進(jìn)行有效監(jiān)測、研判和引導(dǎo)。第二,危機(jī)處理方式被動,缺乏有效的制度。在一些敏感事件的處理中,我們常常采取回避、封堵或冷處理的辦法,試圖淡化輿情,急于控制事態(tài)而非疏導(dǎo),這容易引發(fā)深層次的輿情危機(jī)。第三,輿情管控手段落后,設(shè)備投入不足。出現(xiàn)突發(fā)問題時,經(jīng)常采用簡單粗暴的手段來拖延或壓制,如刪帖、封IP、斷網(wǎng)等。第四,網(wǎng)民配合消極。強(qiáng)大的網(wǎng)民力量,沒有有效地配合相關(guān)部門的工作,容易被錯誤的輿論所引導(dǎo)和控制。[5]
三、數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)輿情管理中的應(yīng)用
(一)網(wǎng)絡(luò)輿情關(guān)聯(lián)分析
在網(wǎng)絡(luò)輿情管理中應(yīng)用關(guān)聯(lián)分析方法,能從海量、不完全、復(fù)雜多變的網(wǎng)絡(luò)輿情信息中尋找輿情演變的內(nèi)在原因和規(guī)律,分析各內(nèi)在因素之間的關(guān)系。禽流感該如何更好地監(jiān)控?今天你寫B(tài)log了嗎?這兩個事件放在一起看不出有什么特別的意義。但事實(shí)上,美國一家公司研究發(fā)現(xiàn),這兩個事件之間有聯(lián)系,可以通過互聯(lián)網(wǎng)上的Blog網(wǎng)頁挖掘出和禽流感相關(guān)的信息,從而建立一個禽流感預(yù)警機(jī)制。
(二)網(wǎng)絡(luò)輿情聚類分析
聚類分析是一個將數(shù)據(jù)集中的所有數(shù)據(jù),按照相似性劃分為多個類別的過程。聚類分析之后,應(yīng)盡可能保證類別相同的數(shù)據(jù)之間具有較高的相似性,而類別不同的數(shù)據(jù)之間具有較低的相似性。依照網(wǎng)民表達(dá)的特點(diǎn)和性質(zhì),網(wǎng)絡(luò)輿情聚類主要有過程聚類和觀點(diǎn)聚類兩種。過程聚類主要指分析網(wǎng)民的思想觀點(diǎn)、態(tài)度情緒的改變,從而掌握網(wǎng)絡(luò)輿情的演變過程,監(jiān)測二次輿情的發(fā)生。觀點(diǎn)聚類主要指把網(wǎng)民的相同觀點(diǎn)匯集起來,分析網(wǎng)民的各種觀點(diǎn)、情緒的分布和占比。
(三)網(wǎng)絡(luò)輿情分類分析
網(wǎng)絡(luò)輿情信息一般分為四類。第一,思想反映類。這主要是指社會上各個層次的網(wǎng)民的主流觀點(diǎn),思想動態(tài)。第二,問題傾向類。這主要是指政府機(jī)關(guān)、企事業(yè)單位工作中存在的問題及不足。第三,工作動態(tài)類。這主要是指宣傳思想政治工作的形勢和動態(tài)。第四,對策建議類。這主要是指針對社會熱點(diǎn)、焦點(diǎn)話題提出的對策和建議。
根據(jù)自身需求,首先對海量的網(wǎng)絡(luò)輿情信息進(jìn)行篩選,然后進(jìn)行分類和分組,如分成教育醫(yī)療、反恐除暴、網(wǎng)絡(luò)安全、食品安全、城鎮(zhèn)化等類別,為下一步的工作打下基礎(chǔ)。最后對各類別的輿情信息進(jìn)行分析和挖掘,得到有針對性的知識或經(jīng)驗(yàn)。
(四)網(wǎng)絡(luò)輿情預(yù)測分析
預(yù)測分析是指在掌握歷史資料和調(diào)研資料等現(xiàn)有信息的基礎(chǔ)上,依照一定的方法和規(guī)律,對事物未來趨勢或可能的結(jié)果進(jìn)行測算,以預(yù)先了解事情發(fā)展的過程與結(jié)果。例如美國最重要的以軍事為主的綜合性戰(zhàn)略研究機(jī)構(gòu)蘭德公司,運(yùn)用運(yùn)籌學(xué)理論和方法,曾經(jīng)就“中國是否出兵朝鮮”、“中美建交”、“古巴導(dǎo)彈危機(jī)”、“美國經(jīng)濟(jì)大蕭條”和“德國統(tǒng)一”等重大事件進(jìn)行了成功預(yù)測,揭示了事件的變化規(guī)律和趨勢。[6]
(五)網(wǎng)絡(luò)輿情序列分析及時間序列
序列分析是指通過對網(wǎng)絡(luò)輿情信息發(fā)生的時間序列進(jìn)行排序梳理,得出的重復(fù)發(fā)生概率較高的模式。序列分析技術(shù)可以很好地應(yīng)用于網(wǎng)絡(luò)輿情的監(jiān)控和預(yù)警。在輿情信息匯集和分析的基礎(chǔ)上,對社會運(yùn)行接近負(fù)向質(zhì)變的臨界值的程度做出初步確定的早期預(yù)報。事實(shí)證明,在一些危害社會穩(wěn)定的不良事件發(fā)生之前、發(fā)生過程中,甚至是結(jié)束后,都能通過大量的網(wǎng)絡(luò)信息的收集、整理分類,有針對地選取數(shù)據(jù)并對該數(shù)據(jù)進(jìn)行規(guī)律預(yù)測或優(yōu)先等級排序,從而有步驟、有計劃的處理網(wǎng)絡(luò)輿情,這樣就能通過對輿情的收集達(dá)到實(shí)現(xiàn)對不良事件的預(yù)防和控制的目的;能夠及時掌握網(wǎng)絡(luò)輿情動態(tài),避免很多事件向消極的方向發(fā)展,使對不良網(wǎng)絡(luò)輿情的處理從即時處置型向事前預(yù)警型轉(zhuǎn)變。在大規(guī)模輿情危機(jī)爆發(fā)之前,應(yīng)盡早針對熱點(diǎn)話題梳理情況,快速應(yīng)對。[7]
(六)網(wǎng)絡(luò)輿情偏差分析
偏差分析是指發(fā)現(xiàn)數(shù)據(jù)集中的異常數(shù)據(jù)。2008年3月14日發(fā)生在西藏拉薩的打砸搶燒事件,是一起駭人聽聞的嚴(yán)重暴力犯罪事件,給當(dāng)?shù)厝嗣袢罕娚敭a(chǎn)造成了重大損失,使當(dāng)?shù)氐纳鐣刃蚴艿絿?yán)重破壞。這一事件遭到了全國各族人民的強(qiáng)烈譴責(zé),但同時針對這一動亂事件,西方媒體卻歪曲事實(shí),混淆視聽,在報道中出現(xiàn)了極大的偏差,違背了新聞道德,損害了中國的國家利益。
四、結(jié)束語
隨著信息技術(shù)的快速發(fā)展,網(wǎng)絡(luò)輿情復(fù)雜多變,傳統(tǒng)的數(shù)據(jù)分析技術(shù)難以奏效。新興的數(shù)據(jù)挖掘技術(shù)能夠?qū)W(wǎng)絡(luò)輿情進(jìn)行關(guān)聯(lián)分析、聚類分析、分類分析、預(yù)測分析、序列分析和偏差分析,實(shí)現(xiàn)了對網(wǎng)絡(luò)輿情快速準(zhǔn)確的監(jiān)測、研判和引導(dǎo),取得了較好的效果。
[ 參 考 文 獻(xiàn) ]
[1] 趙新輝,郭瑞.基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)輿情智能監(jiān)測與引導(dǎo)平臺設(shè)計研究[J].電腦知識與技術(shù),2012(1):1-2,4.
[2] 殷衛(wèi)東,朱曉華,趙俊凱.網(wǎng)絡(luò)輿情技術(shù)淺析[J].信息網(wǎng)絡(luò)安全,2012(3):5-9.
[3] 柳勝國.網(wǎng)絡(luò)輿情中的具有影響力個體信息發(fā)現(xiàn)與WEB日志數(shù)據(jù)挖掘預(yù)處理技術(shù)[J].價值工程,2012(16):186-187.
[4] 楊永紅.基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)輿情研究[D].重慶:重慶大學(xué),2010.
[5] 徐曉日.網(wǎng)絡(luò)輿情事件的應(yīng)急處理研究[J].華中電力大學(xué)學(xué)報(社會科學(xué)版),2007(1):89-93.
[6] 樂爍.蘭德公司發(fā)展經(jīng)驗(yàn)與對我國智庫建設(shè)的啟示[D].武漢:湖北大學(xué),2013.
[7] 朱毅華,郭詩云,張超群.網(wǎng)絡(luò)輿情研究中的仿真方法應(yīng)用綜述[J].情報雜志,2013(10):29-35.
[責(zé)任編輯:陳 明]