劉云花+黎泉
摘 要: 針對網絡輿情的隱蔽性與廣泛性對相關技術具有限制性的缺點,提出了一種基于MVC模式的網絡輿情管理系統。該系統基于Windows平臺,應用Apache服務器,采用Java開發語言,并結合AJAX技術,以實現對網絡輿情的高效采集、準確監控與預警。最后對該系統進行驗證,結果表明,該系統具有較強的實用性,滿足了用戶需求。
關鍵詞: 網絡輿情管理; MVC模式; 結構設計; 聚類; Java
中圖分類號: TN711?34; TP393 文獻標識碼: A 文章編號: 1004?373X(2017)24?0031?03
Abstract: In allusion to the covertness and extensiveness of network public opinions, and their constraints to the relevant technologies, a network public opinion management system based on MVC model is proposed. Apache server, Java development language and AJAX technology are used in the system based on the Windows platform to realize efficient collection, accurate monitoring and early warning of network public opinions. The system was verified. The results show that the system has strong practicality and can meet users′ needs.
Keywords: network public opinion management; MVC model; structure design; clustering; Java
0 引 言
互聯網隨著信息技術的發展已成為越來越重要的媒體,互聯網輿情監測能力也已備受政府關注[1?3]。針對網絡輿情的隱蔽性與廣泛性對相關技術存在限制性的缺點,本文提出一種基于MVC模式的網絡輿情管理系統,旨在提高互聯網輿情檢測能力。該系統基于Windows平臺,應用Apache服務器,采用Java開發語言,并結合AJAX技術,且實現基于模型?試圖?控制(Model?View?Control,MVC)的系統技術架構以解決系統結構設計問題。從而達到對網絡輿情的高效采集、準確監控與預警。
1 系統架構技術
本文通過分析網絡輿情管理需求,采用MVC三層架構設計該系統,以有效解決系統結構設計問題。其中MVC是應用于交互式的Web,尤其適用于存在大量客戶訪問的情況[4?5]。該系統架構所用技術包括網絡蜘蛛技術、垂直搜索采集、文本預處理與聚類和信息分析跟蹤技術。網絡蜘蛛技術輔助獲取輿情語料的核心是不斷通過網頁中的超鏈接獲取其他各個網頁內容,其工作流程如圖1所示。
垂直搜索采集技術是搜索引擎的一個細分。相比于普通搜索引擎是抽取所有網頁內容,垂直搜索引擎則僅是對相關行業信息進行整合[6]。網頁文本預處理技術是對網頁進行去重與特征提取,文本聚類則是為了方便人們在海量文獻中定位有用文獻而對文獻進行的有效分類方法,目前常用的有六類聚類方法:劃分、層次、密度分類、網絡分類和基于模型的方法。通過文本聚類得到關注的網站,對其進行輿情分析與跟蹤,并分析文章語境進行情感傾向性判斷。
2 網絡輿情管理系統需求分析
網絡輿情管理系統是實時分析管理與監督網絡輿情信息,并將處理結果向用戶展示的系統。在設計系統時,需考慮其功能可擴展性與后期的可維護性。同時,系統分析信息需全面廣泛覆蓋網絡媒介。網絡輿情監督管理系統結構圖如圖2所示。
網絡輿情監管系統功能主要包括輿情規劃、檢索收集、統計分析、預警和分類評估功能。網絡輿情規劃是設定監督主題,并確定搜索范圍;網絡輿情檢索由全文數據庫提供檢索功能;系統的關鍵是輿情分析,使用數據庫和數據挖掘等技術對海量數據進行分析以實現輿情信息的精確管理;通過設置閾值系統實現自動報警;輿情分類評估是分析總結與備案輿情事件,分析統計輿情熱點,為優化輿情監督系統提供依據。除以上所述功能外,該系統還包括個性化、用戶權限管理與數據維護等功能。系統簡要流程如圖3所示。系統功能結構關系圖如圖4所示。
該系統的性能需求是滿足準確數據輸入、輸出與遠程傳輸。系統對本地局域網的響應速度不超過5 s,遠程用戶的響應速度不超過10 s,且要保證數據訪問與傳輸的安全性,以及應用級數據庫的安全。
3 系統設計
3.1 系統架構
本文設計的系統采用MVC先進架構與B/S結構,根據監督站點數量決定信息采集服務器個數,服務器為主流服務器、Linux 操作系統。可根據實際情況調整其他應用模塊服務器的數量,最終實現基于瀏覽器的瘦客戶端模式[7?8]。該系統網絡拓撲圖如圖5所示。系統開發采用Java語言,使用標準通信協議,數據庫為SQL Server,以提高系統性能,網頁顯示界面采用HTML與AJAX集成技術。該系統技術架構如圖6所示。
3.2 數據庫設計
數據庫設計需要按照數據規模進行設計,并充分考慮數據容量。該設計主要有逐步分解數據流對數據進行分析與面向對象依據功能對數據分類這兩種策略[9?10]。數據庫根據系統功能而產生,一般設計過程包括目標確定與數據收集、概念設計、數據模型建立、數據庫的維護。
3.3 系統功能與安全設計endprint
該系統主要由信息采集、信息檢索、信息分析與服務三個模塊構成,如圖7所示。系統從大量Web頁面采集信息并進行結構化存儲供系統數據分析,系統中最為關鍵的處理模塊是輿情分析模塊,采用聚類方法分析挖掘預處理后的素材信息。
系統安全問題始終是系統構建者需要著重考慮的,本系統采用IP控制、驗證碼、三方認證和加密鎖等措施應對惡意攻擊與入侵情況。
4 系統實現與驗證
該系統基于Windows系統開發,運行采集爬蟲與并行搜索以提高效率。所實現系統的登錄界面如圖8所示。用戶管理界面如圖9所示。其包括用戶創建、刪改、訪問權限的管理與用戶信息查詢、登錄記錄等功能。輿情采集事件管理實現界面如圖10所示。本文最后對系統進行功能測試,并給出了測試報告。通過測試報告可看出,本文所設計的系統準確性高,具有較強的實用性,能滿足用戶需求。
5 結 語
針對網絡輿情的隱蔽性與廣泛性對相關技術存在限制性的缺點,本文提出一種基于MVC模式的網絡輿情管理系統。該系統基于Windows平臺,應用Apache服務器,采用Java開發語言,并結合AJAX技術,以實現對網絡輿情的高效采集、準確監控與預警。本文最后對該系統進行驗證,結果表明該系統具有較強的實用性,滿足了用戶需求。
參考文獻
[1] 丁學君.基于SIR的SNS網絡輿情話題傳播模型研究[J].計算機仿真,2015,32(1):241?247.
[2] 史玉珍,單冬紅.基于Hadoop的網絡輿情監控平臺的研究[J].電子測試,2015(9):71?73.
[3] 李宇博.基于文本聚類技術的網絡輿情分析系統的研究與應用[D].天津:天津工業大學,2016.
[4] 丁蒙蒙.突發事件網絡輿情監測指標體系構建研究[D].成都:電子科技大學,2015.
[5] EDWARDS J, MCCURLEY K, TOMLIN J. An adaptive model for optimizing performance of an incremental Web crawler [J]. Association for computing machinery, 2001: 106?113.
[6] 孟強,李海晨.Web數據挖掘技術及應用研究[J].電腦與信息技術,2017,25(1):59?62.
[7] 肖紅,許少華.改進的話題檢測和跟蹤算法研究[J].計算機技術與發展,2014(9):84?88.
[8] CHANG F, DEAN J, GHEMAWAT S, et al. A distributed storage system for structured data [C]// Proceedings of the 7th Symposium on Operating System Design and Implementation, 2006: 205?218.
[9] 房春波.“微時代”高校網絡輿情生成與干預機制研究[J].通訊世界,2016(5):252?253.
[10] MEHRA A. The development of social network analysis: a study in the sociology of science by Linton C. Freeman [J]. Empirical press, 2005, 50(1): 148?151.endprint