◆劉娟 高嘉敏 紀學師
探析大數據技術在網絡輿情監控的應用
◆劉娟 高嘉敏 紀學師
(山東醫學高等??茖W校 山東 276000)
大數據時代全面到來后網絡輿情發生了變化,其數據規模大幅提升、增長速度顯著加快,網絡輿情監管工作在這種情況下變得更加困難。鑒于此,本文就網絡輿情與大數據技術的適用性展開討論,研究大數據思維方法在網絡輿情監控中的重要作用,對大數據技術應用于網絡監控后可能出現的問題進行深入討論,以期為網絡輿情監控提供全新的思維方式和解決辦法,對相關監管部門提供借鑒和參考。
大數據;網絡輿情;監控
我國網絡社會已經全面進入Web2.0時代,大數據技術以迅猛的態勢發展,互聯網每天產生以PB計的海量信息,這些信息匯集在一起形成龐大的數據資源。在這種網絡背景下,原本具有封閉性特點的數據已經全面轉變為具有基礎性特征的重要資源,對互聯網中的大量有價值信息進行挖掘并將無用、虛假信息摒棄已經是大勢所趨。
移動終端技術的日趨成熟使其制造成本大幅度降低,加之無線網絡傳輸速度呈指數性增長的特性使移動終端迅速普及,各種信息以不同的表現形式存在于互聯網中,互聯網作為各類人群無差別的集散地成為輿論的放大器,能夠吸納大量輿論也能夠放大一些意見或看法,而海量信息中極易存在一些帶有感情偏向的數據,這些言論會迅速發酵形成網絡輿情。
網絡輿情是不同社會群體在同一時間和空間內發表觀點的總和,是各類人群對某一社會熱點或焦點事件發表的帶有傾向性和影響力的情緒和認知。在大數據的環境下網絡輿情具有諸多特點,以信息復雜、數據離散、跨越性強為主,大數據同時也為網絡輿情監控提供了全新的思路與解決方式。采用大數據技術對輿情數據進行分析、挖掘可以構建網絡輿情監控體系,對正確引導網絡輿論、純正社會政治生態具有重要意義。
現階段,大數據以其科學實用的特點被廣泛用于社會的各個行業中,大數據與網絡輿情同樣具有適用性,這種一致性主要體現在以下三個方面中。
一是網絡輿情具有海量信息的特性,在大數據時代背景下這種信息量的特點更加凸顯,各種自媒體平臺使信息的聚集方式與傳播方式徹底改變,人們可以在網絡中突破時間空間的限制,快速高效進行信息發布,形成即時信息選擇與反饋機制,產生海量信息流。二是網絡輿情信息具有多樣性特點,這種多樣性特點體現在網絡輿情的信息形態與交互方式上,具體以非結構化的數據為主流數據形式,以結構化和半結構化的數據為輔助數據形式,網絡輿情信息同樣可以通過文本信息、圖像信息和視頻信息形式進行傳播。三是網絡輿情信息轉變同樣具有快速性,作為一個實時動態的傳播過程,網絡輿情在原始信息的基礎上出現扭曲和延伸,受到網民情緒的刺激,使一些關鍵信息迅速發生轉變。
實際上,網絡輿情體現的是民眾的看法與情緒,其數據信息以碎片化和顆?;姆绞酱嬖谟诰W絡空間中,而這種信息形式通常是隱性數據,需要大數據技術的支持以實現數據可視化以及信息價值的增值。從本質上對網絡輿情進行分析可以發現,網絡輿情所需要的數據信息可視化技術恰恰是大數據所能夠提供的技術,大數據可以為精準判斷輿論走勢提供技術上的支持,因此對網絡輿情進行監控迫切需要大數據技術的支持。
大數據的增值需要經歷挖掘信息、打通渠道、充分流轉的過程,最終的全新數據流量都要回到具體的業務當中才能實現增值過程,也在數據信息的運轉流通中自動形成一個信息流通閉環,價值增值過程如圖1所示。網絡輿情的信息價值增值過程與之并無差異,首先要在一些網絡社區中進行信息采集,對有價值的信息進行深入挖掘,明確碎片化信息之間的關聯情況,打通渠道以實現信息融合,使有價值的網絡輿情信息在媒體、公眾與政府之間充分流轉,從流通特點和數據增值方式上看二者的增值過程相同。

圖1 價值增值過程
綜上,大數據和網絡輿情在數據特征、技術需求以及增值過程等方面具有較高的適用性,大數據在網絡輿情監控方面有技術上實現的可能性。
大數據技術對這個時代的影響是顯而易見的,人們對數據結構和功能的認識以及數據使用方法都發生了質的改變。以大數據技術為基礎、用大數據思維構建模型可以將輿情監控工作分為數據的采集、處理與分析三個過程,實現大數據的思維模式、技術特點與輿情監控緊密結合,開創輿情治理的全新局面。
一是要注重廣泛采集各種數據,其中包含冷、溫、熱數據三種形式的數據。三種形式的數據是通過數據跨度時間區分的,冷數據的跨度時間較長的數據形式,溫數據與熱數據分別是非實時數據和實時數據形式,熱數據更傾向于表示用戶實時位置狀態、瀏覽行為與反饋的數據類型。目前冷數據占大數據總信息量的八成以上,溫數據和熱數據共占大數據總信息量的兩成,要完成模型構建與輿情監控任務就要并行采集三種不同類型的數據。
二是使隱性輿情顯性化,網絡上的各種數據不以顯性的文字、圖片和視頻存在,但是零碎的信息可以體現出網民情緒傾向特點、體現出網民關注點,這種信息體現出輿情的隱性特點。在進行隱性輿情處理時可利用大數據技術分析其瀏覽痕跡、關注重點以及關鍵詞的搜索記錄,這樣就可以建立輿情社會化網絡,通過該網絡可以實時監控重大輿情的產生與發展,選擇合適的時機對網絡輿情的重要節點進行強制切斷,這樣就可以控制住輿情的擴散與蔓延,這就是隱性輿情的顯性化過程,其最終目的是切斷輿情關鍵節點。
三是注重輿情數據精準性到容錯性的思維模式轉變,判斷網絡輿情不應該過分糾結于單一數據的準確性,而是將輿情放在整體性數據中進行統一考量,引導網絡輿情監控判斷向整體把握轉變,單一數據可以出現錯誤,這就是網絡輿情的容錯性思維。大數據技術有能力從海量數據中判斷出整體性輿情趨勢,在這種技術基礎的前提之下,微觀層面的絕對精確就顯得毫無意義。
在進行輿情處理時傳統方法是利用小規模網絡爬蟲對相關論壇的評論進行數據爬取,因此對于采集的數據,其結構和規模都相對單一,關系型數據庫和并行數據倉庫即可滿足數據處理的技術要求,所采集的樣本偏小,不具備普遍輿情的代表性。利用大數據進行網絡輿情信息采集時則是通過公開API提取海量非結構化數據,優點在于數據來源廣泛,數據類型豐富多樣。
第一,高維度輿情數據具有可視化特點。網絡輿情普遍存在于分布式數據庫中,而這種信息通常以細粒度分布,輿情關聯數據已經不再是一維、二維以及三維形式,逐漸轉變為高維數據,圖2為數據維度四象限示意圖。高維度數據有無關性、冗余性特別高的特點,因此只能利用大數據技術使其可視化。

圖2 數據維度四象限
第二,碎片輿情信息呈現聚合化特點。由于微博、微信等終端的信息編輯方式是不規則的、散點型的,這就導致大量信息以離散化的形式進行傳播,也就是信息具有碎片化特點。碎片化信息中存在大量的虛假、模糊信息,這對于技術人員的數據處理能力與信息認知水平是極大的考驗,因此運用大數據技術將網絡輿情的碎片化信息加以聚合整理,構建出相互關聯的網絡輿情邏輯結構,呈現出網絡輿情真正的面貌有助于網絡輿情的高效治理。
網絡輿情信息的產生和發展都不開人這個主體,網絡輿情的發展狀態隨著人內心的體驗與態度變化而發生微妙的變化,這種變化是有一定客觀規律的。對人的各種狀態進行分析可以有效引導輿情朝著樂觀的方向發現,而對不同的人群進行差異化的管理也可以使網絡輿情的引導工作過程更加具有針對性、實時性與策略性。為了研究輿情數據分析過程,以傳染病擴散為研究對象建立模型,我們將擴散模型設計為SIR模型。在模型中S代表易感染人員,I代表感染人員,R代表移出人員,用類似的思路進行分析,可以將輿情信息主體分為S、I、R三種狀態,各種狀態之間的聯系如圖3所示。

圖3 SIR擴散模型
將網民分為A、B、C三種類型,A類網民是轉發了某輿情信息的網民,其狀態可以稱為I狀態;B類網民是針對輿情信息持有保留中性態度的網民,其狀態可以稱為S狀態;C類網民是將自己置于輿情以外的R狀態。單位時間內I狀態網民與其他網民接觸的平均概率為?,經傳播感染為I狀態網民(I?)受輿論走勢等外部因素影響轉化為R狀態網民(R?)的平均概率為β,那么輿情信息主體的感染模型則可表示為:
I+R+S=N (1)
S+I?I?+I(?) (2)
I??R?(β) (3)
根據上述模型的內在聯系與分析可以對網絡輿情傳播有一個較為清晰的認知,也能夠通過模型研究出輿情信息主體的具體狀態,可通過信息主體對輿情的態度差異有針對性地制定不同策略,為精準引導不同種類的信息主體奠定堅實基礎。
大數據發展速度之快令人詫異又欣喜,但這背后隱藏的危機卻一直都沒有消除。一個重要問題就是網絡安全和個人隱私無法得到保護,大數據技術之下的安全保護與隱私保護技術始終都落后于大數據的主體技術水平。大數據技術在進行輿情監控時通常會查詢到個人瀏覽記錄、互動信息等,對這些信息進行有效利用的確可以使輿情監控工作更加高效地開展,但如果這些個人隱私被別有用心之人開發利用就會造成非常嚴重的后果,因此在相當長的一段時間內大數據技術不僅要提升技術本身的各項水平,還要研究與之配套的安全保護措施。
通過大數據進行輿情監控與處理需要經歷非常復雜的程序,要進行信息采集、信息處理、信息主體情感分析、輿情趨勢研判與引導等過程,整個過程需要用到很多種專業知識,也需要掌握各種技能和分析方法,在這種條件下選拔人才的過程比較嚴格、選拔標準相對較高,需要復合型人才從事相關工作。但目前大數據輿情監控學科剛剛處于起步階段,具有大數據分析處理、統計分析計算、信息挖掘與預測、社會學研究等多種能力的復合型人才嚴重匱乏,因此從現在開始就應該有針對性、目的性的培養多種能力的復合型人才,為日后的輿情監控事業發展奠定基礎。
近年來,我國計算機、信息、物聯網等技術取得了長足的發展進步,在此基礎上產生的大數據技術在多個領域中實現了廣泛應用。但大數據應用于輿情監控仍然處于起步階段,需要科研工作者不斷努力,解決各種技術難題,為我國輿情監控和社會穩定作出貢獻。
[1]蔡金勝,賈博亞,翁永杰.利用網絡輿情監控實施心理戰防御的幾種路徑[J].網信軍民融合,2021(03):46-48.
[2]梁瑛楠,于小云.突發公共事件網絡輿情政府監控體系構建研究[J].新聞研究導刊,2021,12(02):22-23.
[3]崇陽.面向網絡輿情監控的熱點話題發現技術研究[J].公關世界,2020(22):176-177.