雒辛芃

摘 要:我國地大物博,人口數量眾多,尤其是網絡輿情比較復雜,所以網絡輿情危機發生的概率比較高。如今,大數據背景下的網絡輿情更是發生了巨大的變化,基于此,本文試圖設計一款基于大數據的網絡輿情監控系統,以期望能夠及時監管以及感知輿情發展態勢,為輿情危機治理提供有價值的參考依據,進而保障網絡環境健康發展。
關鍵詞:大數據 網絡輿情 監控系統
中圖分類號:TP311.13;C912.63 文獻標識碼:A 文章編號:1003-9082(2020)05-000-01
引言
隨著互聯網的快速普及,我國移動網民數量已經超過11億,隨著數量的提升,網絡輿情傳傳播速度也越來越快。雖然互聯網為人們提供了極大的便捷,但是也為負面信息傳播提供了渠道。尤其是在大數據時代背景下,各種數據信息可以說是唾手可得,這也就意味著網絡輿情監控難度越來越大,因此,有必要設計一款基于大數據的網絡輿情監控系統,將能夠為公安機關和輿情防控部門開展輿情監控與引導奠定堅實的基礎。
一、基于大數據的網絡輿情監控系統總體架構分析
基于大數據的網絡輿情監控系統,能夠將眾多信息匯集到系統數據庫之中,通過全文索引功能對數據庫中的數據信息的威脅度進行評估,并對其威脅等級進行劃分,最后依托繪制圖表的形式進行可視化展示?;诖髷祿木W絡輿情監控系統總體架構如圖1所示。其中,通過HDFS分布式系統實現數據獲取以及存儲功能,而數據存儲的結構為HBase;同時,能夠嚴格按照實際輿情管理的需求,進而自動生成對應的表格。
二、數據庫設計分析
在基于大數據的網絡輿情監控系統中數據庫極為重要,因為數據的管理、檢索、匯總、分析等工作均在數據庫中完成。因此,在設計過程中應嚴格按照實際需求進行,這樣才能實現對輿情的有效監控,并對惡意輿情進行及時管控。監控系統能夠將網民的基本信息以及言論發布時間、內容等進行儲存,利用關鍵詞搜索功能,可以檢索獲得相關內容。Hadoop是數據庫系統的核心,通過Hadoop能夠將任務分布到每一個數據節點上并使其穩定運行。同時,所監控到的數據可以進行隨時備份與調用,從而能夠保障數據的完整性和安全性。
三、系統功能模塊設計分析
1.數據信息采集模塊設計
該模塊的作用是提升采集效率與精準度,因此,通常是利用網絡爬蟲技術在Web頁面上有針對性的采集數據,也就是通過關鍵詞進行搜索,這樣就能夠獲得對應的信息,同時也可以將無關的信息數據過濾掉,使其采集范圍縮小,以此實現采集速度的提升。在對網絡輿情監控過程中,通過數據信息采集模塊可針對某一個特定領域進行數據采集,將有利于提升監控的效率以及精準性。
利用網絡爬蟲技術可以在Web頁面上有針對性的采集數據,通過輸入關鍵詞,可快速獲得與關鍵詞有關聯的信息數據,同時無關的數據會被排除。為了能夠提升網絡輿情信息采集的效率與精準性,還需完善以下功能:第一,根據需求建立網絡輿情關鍵詞庫,并需要對每一個關鍵詞進行循環檢索,目的是保留有效數據,將無關數據清除;結合實際需求通過自定義的方式,可以有效采集與特定關注領域和話題相關的網絡輿情信息數據。第二,對個人信息進行采集,例如,個人基本信息、發送信息內容與時間等。第三,網絡爬蟲技術可以在某一個特定時間內發揮其價值,例如快速獲取發表言論用戶的各項信息,并將結果以結構化數據進行存儲,從而為輿情防控以及后續輿情引導、治理工作提供有價值的參考依據。
2.信息分析處理模塊設計分析
完成信息采集后,需要對其進行深入分析,這樣才能及時掌握某些觀點或某些傾向性評價是否對網絡輿情產生威脅以及其具體的威脅程度。互聯網環境開放且復雜,用戶所發布的觀點往往比較多元,且內容繁多,這就可能會影響網絡輿情監控的效率與質量。因此,為了避免這個問題,通常采用的是語義方法對其進行情感分析,主要是提取情感詞,常用的是詞典分析法與詞語分析法,從實際來看,任何一種方法單方面來使用都存在局限性,所以常常將兩種方法進行綜合使用,可及時感知并明確用戶發布內容的情感分值,根據分值的不同,主要有高、中、低三個輿論威脅等級。
3.信息交互模塊設計
基于大數據的網絡輿情監控系統的頁面是對信息獲取的主要窗口,基于實際需求,系統頁面需要體現人機交互,因此通常會采用前臺技術(HTML+CSS+Jquery+JSP)對系統頁面進行設計。要實現網絡輿情監控系統人機交互的目的,其方法比較多,其中報告文檔生成、報表統計交互、圖譜關聯交互、表單查詢交互等是常用的方法。例如表單查詢交互,能夠對所采集的信息數據進行直觀展示,同時能夠以Excel或Word形式進行呈現。
但是從實際網絡環境來看,網民之間的關系往往更為復雜,其中,有個人信息的發布,也有互相@的關系以及各種轉發的關系,所以信息交互的復雜度高,僅僅依靠表單查詢交互無法將網民之間關系精準呈現,所以可通過關系圖譜形態呈現網民與網民之間的關系和權重。具體來講,就是將用戶實體作為表達節點,例如,將關注數量很多的這類用戶作為一個節點,然后再進行延伸擴展到其他成員,以此類推就能夠形成一個有一定關聯的人物關系圖,從而為公安機關和輿情防控部門開展輿情監控與引導提供有價值的參考依據。
參考文獻
[1]賈夢久.基于大數據可視化的網絡意見領袖特征研究[J].信息技術與信息化,2020(02):15-18.
[2]雷凱.大數據時代重大網絡輿情事件治理研究[J].中國報業,2020(02):92-93.