張雙獅 夏一雪 蘭月新 李亞峰
移動互聯網技術的快速發展使得精彩世界觸手可得,隨時隨地發布新聞、了解咨詢、關注國計民生以及發表個人觀點和看法成為新常態。網絡輿情大數據新生態,給警務工作提出了新的更高要求;境內外敵對勢力和一些別有用心的群體蓄意攪亂網絡輿論,丑化公安形象,降低公安公信力的活動一刻都沒有停止,意識形態領域的斗爭更具復雜性和艱巨性[1];公安系統自身仍然存在官僚主義作風強、為人民服務意識弱的現象,社會主義法治推進困難[2];我國學者結合我國國情,借鑒西方科學家在社會學、管理學、心理學、媒體傳播學、統計學、信息技術等方面理念、理論及方法對網絡輿情的演化發展進行了大量研究,取得了許多重要成果,為政府和執法部門制定輿情引導策略,進行輿情決策處置提供了豐富的理論參考。全國公安系統對網絡輿情的重視也在日益加強,成立專門應對機構,啟用輿情監測系統等[3][4]。當前,不論是學術領域,還是應用實戰中對于涉警網絡輿情的監測、分析和決策處置整體上仍然是從對立面的角度出發,采取引導、管控的辦法,也就是說處于相對被動的狀態。
習近平主席指出,“建設網絡良好生態,發揮網絡引導輿論、反映民意的作用,讓互聯網成為我們同群眾交流溝通的新平臺,成為了解群眾、貼近群眾、為群眾排憂解難的新途徑,成為發揚人民民主、接受人民監督的新渠道”[5]。由此可見,時代在進步,技術在發展,工作模式、工作方法的革新勢在必行。過去在網絡輿情處置中采用過“遮、掩、封、堵、刪”等極端手段,隨著“大數據+移動互聯網”的蓬勃發展,這些方法和手段往往會使問題復雜化,增加問題的神秘感,激發民眾的好奇心,給敵對勢力以大肆渲染和炒作的借口。不如敞開胸懷,正視問題,走入民眾,主動發聲,參與互動,利用大數據,依靠新技術,“治理+智理”,在解決問題過程中不斷提升解決問題的能力。
為此,本文提出面向大數據的警輿情監測、分析和決策新理念,新方法。按照圖1的邏輯流圖展開研究,面向大數據,分數據流和控制流兩方面。以數據流將涉警輿情的處理分為三個部分,輿情監測,輿情分析和輿情決策。每一個部分又按照研究對象、研究方法及研究結果的控制邏輯展開。

圖1:研究邏輯流圖
網絡輿情監測的數據是決策者進行數據分析和決策處置的基礎。警務部門首先要從思想上建立大數據戰略思維;以改革與開放的態度營造網絡輿情大數據新生態;依靠新興信息技術多角度廣泛采集涉警輿情數據,建立和完善輿情數據庫、知識庫和案例庫。
首先警務人員要以開放的姿態接受輿論監督,讓民眾發聲,不論是正面的或者是負面的,不論是恰當或者是過激的。面對事件,要積極主動發聲,公布事實真相,讓民眾享有充分的知情權,而不是封堵遮掩刪,致使充滿神秘感而懷疑與猜測,出現翻墻以探求真相,流言謠言四起的尷尬局面。事實上,當今的新媒體時代,人人都是媒體人,人人都是傳聲筒,也許一個不經意的涉警圖片和視頻發布都有可能瞬時引爆整個網絡,成為人們線上線下、茶余飯后的談資,彌漫在整個網絡及社會。用“封堵遮掩”的方法顯得無能為力,因為堵上論壇微博,堵不了微信朋友圈,堵上此話題,堵不上衍生話題。客觀上要求廣開言路,讓民眾敢說、想說、能說,充分表達自己的訴求,表達自己的意見、觀點和看法。這些言論整體上反映的是實實在在、真真實實的社情民意,這是我黨“立黨為公,執政為民”服務宗旨得以實現的不可多得的寶貴資源和財富。對于警務人員自身,只要按照“對黨忠誠,服務人民,執法公正,紀律嚴明”的十六字方針行事,又何所懼?如2016年5月的“雷洋事件”正體現了網絡輿論監督以及線上線下聯動的作用,有力地推進了我國法治建設的進程[6-9]。輿情大數據使得警務部門對網絡輿情從重視到重點關注輿情變化和處置方法,再到著重首先解決自身問題的轉變[10]。
輿情監測的總體思路由事件驅動向數據驅動轉變。有涉警事件發生,針對事件監測輿情的演化,沒有事件發生,同樣關注民眾的涉警言論和行為,甚至日常對警務工作的評價,從中發現潛在的輿情風險和警務工作中的不足。按照圖2所示流程展開監測。
涉警輿情數據主要來自三個方面:(1)警務部門官方媒體,如官方微博、微信公眾號、門戶網站及政務網等。這是民眾網絡參政議政了解國家動態的重要窗口,網站的結構固定已知,話題多為主動發起,便于設計爬蟲,并后期的網頁清洗和處理,可以實現動態輿情監測。(2)外部輿情集散地,如微信、微博、論壇、貼吧以及新聞媒體等網站。這些網站眾多,是民眾了解咨詢,發表個人觀點的主要場所,可定期進行廣度搜索掃描以發現熱點話題,了解社情民意,發現可疑人群及不良言論。另外,可以充分利用某些大型網站的媒體接口,如百度和新浪的API,省去大量數據抓取時間,同時可以緩解媒體網站的服務器壓力。憑借公安機關的業務優勢,與各網站合作,定時接收輿情更新推送,這樣可以緩解雙方的服務器壓力。(3)網上業務系統也是一個民意調查的重要途徑。針對民眾所辦業務進行滿意度調查,以及時發現警務工作中的不足。當然,這三種途徑都可以設計調查問卷,調查問卷既是民意調查的重要方法,也是輿情監測的重要途徑。

圖2:面向大數據的網絡輿情監測流程
輿情監測分兩個層次:第一個層次,主動到輿情集散地抓取數據,發現熱點,提取主題,分析情感傾向,縷清社會網絡,這個層次對技術要求較高,輿情的特征要素難于把握;第二個層次,設計并拋出輿情主題,以引來圍觀,引起討論,這個層次可以事先確定輿情的特征要素,輿情的決策處置方法,可以徹底改變過去被動監測,被動應急的尷尬局面。
網絡輿情數據多為非結構性的多元異構數據。輿情監測的步驟為數據采集→數據預處理→數據存儲。傳統處理網絡輿情數據的多為關系型數據庫,甚至是Excel文件或者文本文件,也有的數據適合用關系型數據庫。如信息檢索和分析要求建立關鍵詞倒排索引;文本處理需要進行切分詞處理,建立詞庫;語義分析要求建立語義語料庫,詞性標注庫;情感傾向性分析需要建立情感詞庫等。而案例數據庫是進行輿情分析和決策的基礎;通過知識挖掘建立的知識庫,輿情分析方法庫和輿情決策方法庫是輿情智能決策的基礎。這些數據和方法不適合用傳統的關系型數據庫。另外隨著移動互聯網的發展使得網絡輿情的大數據特性日益明顯,一方面數據量巨大,單個數據庫文件根本無法勝任;另一方面,數據分析對數據的原始性、多媒體性要求越來越強,比如音頻、視頻、圖片和表情也成為非常重要的數據內容,要求新的非關系型數據庫及其處理方法。
將抓來的網頁進行粗略處理或者不處理直接保存在本地,用非關系型數據庫進行管理,如NoSQL數據庫HBbase,采用的文件系統隨之需改為分布式文件系統,如HDFS。數據存儲模式的改變,導致數據處理手段和方法隨之改變,大數據對數據處理分析的擴展性、可靠性及時性要求不斷提高,需采用各種先進的大數據處理技術。考慮到采集平臺的存儲計算能力、可擴展性以及后期維護的方便性,可采用當前流行的開源分布式采集、存儲、計算和處理框架,如建設基于Hadoop的分布式計算平臺,可管理不同類型的數據,包括分布式文件系統HDFS、并行編程框架MapReduce、內存流式計算引擎Spark、大數據引擎Pig等。
針對事前、事中及事后的網絡輿情大數據,其分析流程為:統計、計數→聚類、分類→學習、識別→回歸、預測。輿情大數據分析需結合統計方法、機器學習方法以及人工智能算法進行數據挖掘和知識發現,給出各個階段的輿情風險評價,提供互動查詢、圖表可視化和分析報表服務,為決策提供參考,具體流程可參考圖3。

圖3:網絡輿情大數據分析邏輯框圖
輿情分析的核心是自然語言處理,主體是文本數據挖掘,中文分詞統計是網絡輿情大數據分析的基礎,是熱點發現,建立倒排索引的關鍵技術,比如可以對同一時段輿情主題進行分詞統計,當前熱點便一目了然。對同一主題一個時段內的關注量進行統計可以發現本主題的熱度變化。本文以百度搜索指數為例來說明中文分詞統計的意義。以“民警”為關鍵詞進行搜索,2017年12月4日—31日4周時間為監測時段,搜索量時序如圖4,4日—11日一周內出現了一個大的熱度波動。繼續統計與之相關度高的搜索詞頻如圖5。

圖4:搜索詞熱度時序圖

圖5:與關鍵搜索詞相關度最高的熱詞排序
進一步了解熱詞相關度如圖6,反映了民警及其相關關鍵詞之間的緊密程度,關鍵詞“十九”“心得”“體會”反映出全國民警本周興起學習十九大熱潮,寫心得體會,組織參加各類網絡知識答題等活動;關鍵詞“抓捕”指的是2017年12月10日河北民警在抓捕嫌犯時被刺犧牲事件。

圖6:與“民警”相關度圖譜(4日—10日)
以百度搜索指數12月11日—17日,關于“民警”的搜索來看涉警輿情,如圖7所示。

圖7:與“民警”相關度圖譜(11日—17日)
“蒼南”指的是2010年蒼南女民警被殘忍殺害的事件,一直受到廣泛關注。
以百度搜索指數12月18日—24日,關于“民警”的搜索來看涉警輿情,如圖8所示。

圖8:與“民警”相關度圖譜(18日—24日)
“閑事”和“交通”是人民警察貼近群眾的具體表現,一個是愛管閑事的社區民警,一個是交通警察,這二者是與民眾接觸最頻繁的警察,也是輿論最多的對象。
以百度搜索指數12月24日—31日,關于“民警”的搜索來看涉警輿情,如圖9所示。

圖9:與“民警”相關度圖譜(25日—31日)
近年來“酒駕”和“女司機”成為網絡熱詞,面對民警的檢查,許多女司機耍潑耍賴,丑態百出,從另一面體現了民警的素質和執法處置能力在不斷提高,其辛苦的工作得到眾多網民的理解和贊揚。“值班”和“犧牲”指的是2017年12月25日,廣東佛山倫教派出所民警陳順輝值班時因病犧牲在工作崗位上的事。反映了廣大網民對民警及其生死的關注與關心。
除了數字顯示外還可以將詞頻以詞云的形式更為直觀地顯示,如圖10為新浪司法轉載的微信公眾號“長安劍”的一篇關于“雷洋案”評論文章的詞云。

圖10:詞頻統計詞云
詞云以不同大小和形狀非常直觀地顯示關鍵詞的詞頻,給人以強烈的視覺沖擊。通過詞云可以看出該文的主題“社會輿論對社會主義法治公平、公正的影響”。
語料文本在分詞后可以按照關鍵詞進行聚類分析,提煉評論的觀點,然后對整個語料進行分類統計得知持各種觀點的人數以及占比,進一步對有關某一話題的網民進行分群統計,研究網民活躍度,發現意見領袖,探索各網民之間的關系,據此繪制相關主題的網民社會關系網絡圖。如圖11是用gephi繪制的社會網絡圖,可以根據網絡節點之間的邊及其權重繪制出所有節點的社會網絡圖。

圖11:相關主題網民社會網絡圖[11]
首先對抓取的輿情數據進行分詞處理,然后結合情感語料數據庫和情感分析算法對切分后的語料進行情感計算、分析,并進行情感標注[12][13]。通過聚類和分類得出個體情感傾向和群體情感傾向,以便進一步發現個體情感異常和群體情感異動,以便及時采取措施,疏導負面輿情。
對網絡信息發布者進行用戶畫像,包括年齡、性別、地域、使用終端等信息,用戶畫像便于對高輿情風險人群進行動態跟蹤監視;建立風險評價指標體系、風險評價模型,根據動態輿情數據,對事前輿情隱患風險、事中輿情惡化風險以及事后輿情衍生風險進行評價,并適時給出輿情風險預警。
通過對采集到的時序網絡輿情數據運用線性回歸分析、決策樹回歸分析、隱馬爾可夫預測、深度學習等方法進行回歸預測分析,可給出網絡輿情的演變趨勢,為風險預警和處置決策提供參考。
涉警網絡輿情大數據分析結果需能以操作簡單,圖表并茂的人機交互方式展現給警務人員,為其決策處置提供科學的數據支持和情報支持。
EXCEL內置的財務統計函數可以做一些統計分析,如計數、相關性分析、線性回歸等,如果能靈活應用VBA可以大大擴充Excel的統計分析功能;SPSS、SAS是專業的統計分析、數據挖掘工具,功能強大,接口豐富,編程簡單,但成本高昂,不便集成到網絡輿情系統中;Matlab是通用的數學數值計算、模擬仿真軟件,其統計分析、機器學習及人工智能方面有很豐富的函數支持,而且可視化效果也很好,是算法研究的有力工具;R語言是專業的開源大數據統計分析工具,有非常豐富的數據挖掘包,而且方便與第三方函數庫和算法庫集成,可視化也是其一大優勢,是網絡輿情大數據分析的首選工具;Python作為一門膠水式的開源編程語言,近年來以其編程簡單、功能強大受到各行業青睞,其有很強大的數據挖掘、機器學習和人工智能工具包,而且升級速度很快,是網絡輿情大數據分析的理想選擇。
互聯網已經成為輿論的集散地、輿論的放大器和意識形態斗爭的主戰場。境內外反華勢力借此采用各種手段宣傳西方社會文化、自由主義思想以及法律制度、政治制度,同時不惜重金雇傭大量漢奸小編,漢奸“大V”寫短文、寫段子,以丑化國家領導人、抹黑警察執法隊伍,降低政府和警察的公信力,離間警民關系、黨群關系。文化侵蝕,思想滲透更加廣泛、更加深入,不得不引起黨和國家的高度重視,這是一場沒有硝煙的戰爭,是一場持久的戰爭,是一場智慧和技術的較量,是日常警務工作的一個重要組成部分,不能以輿情應急處置簡單對待。因此,警務部門不僅要設置專職崗位,配備專職警務人員,更要建設專門從事輿情監測、分析、決策應對的專業隊伍。為此既要重視專家決策,又要積極推進智能決策。
面向大數據網絡輿情,要求公安隊伍“既要能使槍桿子,還能玩轉筆桿子”。根本任務有兩項,一是充分利用大數據技術和人工智能技術,做好對重點網站、重點人群的輿情監測,及時發現問題,評價風險,提出預警。同時,積極參與到各焦點話題的討論中,發帖子、發微博、發微信、寫文章、寫段子,引導輿論導向,為網絡注入正能量,注入社會主義核心價值觀;二是充分利用移動互聯網平臺,進行網絡民意調研,改變過去走街串巷式的、專門問卷式的調研,學會從網民對各類事件、各種話題所發表的圖、文、聲、像等多媒體意見的分析中挖掘提煉對警務工作的觀點、情感和態度,以找出工作中的不足。
海量異構輿情數據為輿情智能決策的知識挖掘提供了豐富的資源,以機器學習技術為核心的涉警輿情智能決策是未來警務工作的重要發展趨勢。網絡輿情智能決策的邏輯框圖如圖12,是決策支持系統和專家系統的合體,建設各種各樣的知識庫是智能決策的基礎,各類機器學習方法是智能決策的主要手段。

圖12:網絡輿情智能決策支持系統結構框圖
以黨的路線、方針、政策以及國家的法律、法規和政策的文件、文本、資料為原始數據建立知識庫,采用搜索引擎技術建立理論、政策及相關法律智能咨詢系統,提供便民服務,同時也為警務人員提供決策支持。
按照預設,到指定輿情集散地、重點人物微博、微信采集多媒體數據,識別輿情主題,分析情感傾向,建立主題識別知識庫、情感識別知識庫、決策模型庫,決策知識庫,最終實現政策解讀專家系統,機器人聊天交流系統,決策建議推送系統。其中決策建議推送可以結合微信公眾號、公安業務APP以及電子郵件等多種方式展開。另外智能郵件系統也是一種非常方便的民意調查方式。
本文針對涉警輿情研究其面向大數據的監測、分析及決策方法,按照源于大數據,歸于決策方案的總體思路展開研究。得出網絡輿情并非“洪水猛獸”,而是建設服務型智慧政府不可或缺的寶貴資源和財富。需以人工智能為牽引,大數據為支撐,充分利用信息技術的最新成果使警務工作深深扎根于廣大人民群眾中,以共產黨人博大的政治胸懷接受人民群眾的廣泛監督,切實將黨的群眾路線落到實處,不忘初心,牢記使命,在為人民服務的實踐中不斷提升執法能力和水平。
[1]徐亮武,羅云鋒.武警部隊網絡涉警輿情研判和輿論引導研究[D].上海:華東政法大學,2014.
[2]林輝煌,賀雪峰.法治的權力網絡-林鄉派出所的警務改革與社會控制(2003—2012)[D].武漢:華中科技大學,2013.
[3]張振龍,婁樹旺,周忠高.東營市公安輿情引導問題研究[D].濟南:山東師范大學,2017.
[4]陳劍濱,吳小穎.福建省網絡涉警輿情應對策略研究[D].福州:福建農林大學,2016.
[5]習近平.在網絡安全和信息化工作座談會上的講話[EB/OL].http://www.qstheory.cn/yaowen/2016-04/25/c_1118731738.htm.
[6]百度百科.雷洋[EB/OL].https://baike.baidu.com/item/雷洋/19658789?fr=aladdin.
[7]雷洋案尸檢結果公布 發現社會已經悄然改變?[EB/OL].http://finance.sina.com.cn/sf/news/2016-06-30/183235487.html.
[8]中國好網民.超越信與不信 雷洋案的輿論、謠言與真相[EB/OL].http://news.china.com.cn/2016-05/18/content_38476617.htm.
[9]人民政協網.雷洋案涉案警察處理結果公布:派出所副所長被雙開[EB/OL].http://www.rmzxb.com.cn/c/2016-12-29/1252361.shtml.
[10]姜華.互聯網時代提高公安民警媒介素養的必要性[J].遼寧公安司法管理干部學院學報,2015(3):86-88.
[11]SmartCountryLee.如何系統的繪制自己的人際關系網絡圖?[EB/OL].https://www.zhihu.com/question/53706132.
[12]呂姣蘭.網絡輿情評論文本信息的R挖掘研究[D].昆明:云南師范大學,2017.
[13]付光濤.大型電視節目網絡輿情大數據分析技術方案及實現[J].廣播電視信息,2017(7):97-98.