李紅梅,常淑惠,劉麗娟,張立國
河北農業大學信息科學與技術學院,河北保定 071001
隨著計算機網絡技術及其應用的迅速發展,以數字內容為標志、以互聯網為主要載體、以開放、多元、虛擬、交互為特征的網絡文化,成為文化傳播的主要形式之一。互聯網在為人們提供大量的有用信息,給學習、生活帶來便利的同時,也帶來制造和傳播不良甚至非法網絡信息等新問題。在 Internet 普及的過程中,網民們積極參與網絡討論、自由表達個人觀點、自主傳播思想文化,從而形成網絡輿情,網絡輿情是社會輿情的直接反映。由于網絡的開放性和虛擬性,決定了網絡輿情具有直接性、突發性和偏差性等特點[1]。網絡輿情的廣泛傳播常常導致現實社會有關事件的放大升級,甚至對事件的發展和結果產生巨大的影響力。針對網絡文化中存在的安全威脅,實現對網絡文化內容的有效監管,加強對網絡輿情的及時監測和有效引導,成為當前亟待解決的問題。

要保障網絡文化安全,實現全面、準確、及時地掌握網絡輿情,必須依靠科學的方法體系,運用信息化手段,構建網絡文化安全監管系統,網絡文化安全預警系統是其重要組成部分。
首先必須明確網絡文化安全預警系統的性質和類型,采用科學的研究方法才能建立符合需求的應用模型,進而實現系統安全、可靠、有效的應用目標。
Internet安全對象不是一般的系統,而是開放、人在其中、與社會系統緊密耦合的復雜巨系統, Internet安全過程不是一般工程化的過程,而是一個時時處處有人參與的、自適應的、不斷演化的、不斷涌現出新的整體特性的過程[2]。因此,在建立網絡文化安全預警系統時是由人、機和環境構成的人機系統,應采用“人網結合、人機結合”的模式,運用錢學森提出的綜合集成方法[3],將各行專家的經驗、知識與先進的數據挖掘、檢測與阻斷、模式識別、趨勢分析等處理技術結合起來,充分發揮各自優勢,建立基于“專家群體+數據信息+計算機技術+專家經驗知識”的系統應用模型。圖1為運用綜合集成方法構建網絡文化安全預警系統的理想參考模型。
互聯網技術的發展日新月異,威脅網絡文化安全的網絡犯罪日益趨向智能化、技術化,要保障網絡文化安全,必須綜合運用互聯網技術、信息處理技術、人工智能技術及數據挖掘等技術。運用綜合集成方法構建的網絡文化安全預警系統模型分為支撐層、數據層、分析層和應用層四個層次,具體框架如圖2所示。
支撐層由Internet和計算機軟硬件平臺構成,利用互聯網技術,為系統上層提供海量數據源和信息處理平臺。

數據層實現信息采集的功能,利用網絡爬蟲對互聯網信息進行實時監控和采集,并進行有效的過濾和存儲,建立網絡輿情信息庫。
信息采集是網絡輿情分析的基礎,采用縱向橫向結合的采集方式,滿足實時網絡信息和互動信息源定點提取的需要。定向采集保證監控的深度和實時性,主要實現對新聞、論壇、評論、博客等設定站點板塊的信息采集。全網采集主要通過搜索引擎進行廣度采集,保證監控的覆蓋面。對采集到的信息需要進行必要的預處理,如格式轉換、數據清理、主題提取、相關性判斷等,最后形成格式化信息,存儲在數據庫中。
分析層作為系統模型的核心層,主要利用人工智能和數據挖掘等技術實現對輿情信息的智能分析,生成輿情分析報告提交給決策機構實現智能輔助決策。
1)自動摘要
自動摘要是通過智能手段為文檔自動形成摘要的技術,是進行信息抽取的重要形式,融合了數據挖掘和機器學習技術[4]。用戶無需查看全部文檔內容,通過該智能摘要即可快速了解文檔核心內容,提高信息利用效率。主要采用基于統計與基于理解的方法,對輿情信息中各類主題、各類傾向形成自動摘要。
2)熱點發現
根據輿情信息出處的權威度、評論數量、發言時間密集程度等參數,識別出給定時間段內的熱門話題,利用關鍵字布控和語義分析,識別敏感話題。
3)主題跟蹤
由于主題具有實時動態性,所以主題跟蹤是一個動態學習過程。針對熱點話題,實時地進行信息跟蹤,分析網絡上新發表的新聞文章和論壇帖子,關注話題是否與已有主題相同或類似。
4)趨勢分析
通過對某個主題在不同的時間段內被關注的程度進行跟蹤,可以獲取輿情隨時間的發展變化趨勢或規律,以及地域信息分布,從而提供階段性的分析,實現對輿情環境的監控和預警,進行適時控制和疏導。
5)傾向性分析
對每個主題,將各種信息進行自動聚合并利用文本聚類和觀點挖掘技術對信息闡述的觀點、主旨進行傾向性分析,判別信息的發展趨勢,從而明確公眾對相關熱點事件所持的態度和傾向,以便幫助政府職能部門及時了解社情民意,做出及時反饋。
6)輿情分析報告
將智能分析的結果形成簡報、報告、圖表等智能輿情報告,為相關職能部門快速、全面掌握網絡輿情爆發點和事態發展趨勢,做出正確輿論引導,提供可信的分析依據。
應用層是人機交互層,一方面用戶可以通過一定的軟件環境對輿情信息的采集及輿情分析過程加以指導;另一方面則將輿情分析結果以直觀、簡潔的形式展現給用戶,便于用戶深入理解輿情信息,同時,提供信息檢索功能,用戶可以針對系統預設關鍵詞進行定制查詢,并能夠根據指定條件對熱點話題、關鍵信息及傾向性進行查詢,采用多種檢索方式,可以有效提高信息檢索的準確率。
更為重要的是,應用層將結合智能決策系統實現對輿情信息的智能決策。針對熱點信息與突發事件進行監測分析,構建趨勢預測模型,根據知識庫存儲的先驗專家知識進行推理判斷,形成最終的輿情分析結果,進而實現輿情預警。同時,對每次輿情預警進行必要的評價,優化預測模型的參數,調整和完善知識庫存儲的知識,使預測意見更接近實際情況,提高輿情分析的準確率。
本文針對Internet安全對象的特點,運用綜合集成方法構建了網絡文化安全預警系統模型。該模型采用縱向橫向相結合的采集方式,保證了對互聯網海量信息監測的深度、廣度和實時性,運行人工智能、數據挖掘等技術和智能決策系統對輿情信息進行智能分析和智能決策,發現網絡熱點問題并實時跟蹤,從而實現對網絡文化安全態勢的預報和對危機的快速反應,通過輿情評價模塊將有助于完善系統模型,提高預警的準確率。
[1]張虹.基于統計分析和知識挖掘的網絡輿情管理決策平臺研究[J].科技信息,2011(7):495,502.
[2]何德全.互聯網時代信息安全的新思維[J].科學中國人,2003(1):14-15.
[3]于景元.錢學森綜合集成體系[J].西安交通大學學報:社會科學版,2006,26(6):40-47.
[4]于淼,李遠.網絡輿情的關鍵技術與系統構架研究[J].網絡信息安全,2011(1):21-22,45.