劉定一 應毅

摘 ?要:近五年以來,中國網民規模和互聯網普及率都在穩步增長。隨著網絡日益發達,相關部門對前期數據進行獲取,基于大數據技術對網絡輿情預測問題進行分析,通過網絡輿情預測混合算法、大數據輿情預測算法、網絡輿情生命周期模型的應用,發現潛在的輿情危機,科學迅速地采取適當措施,引導事件的正確發展,很有現實意義。
關鍵詞:大數據;網絡輿情;預測方法;算法研究;生命周期模型
中圖分類號:TP311.13;TP393.09 ? ? 文獻標識碼:A 文章編號:2096-4706(2019)12-0100-03
Abstract:In the past five years,Chinas internet users and internet penetration rate have been growing steadily. With the increasing development of the network,relevant departments have acquired the pre-data,analyzed the problem of network public opinion prediction based on big data technology,and applied the mixed algorithm of network public opinion prediction,big data public opinion prediction algorithm,and network public opinion life cycle model. It is of great practical significance to discover potential public opinion crisis,to take proper measures scientifically and quickly,and to guide the correct development of events.
Keywords:big data;network public opinion;forecast methods;algorithm research;life cycle model
1 ?研究意義
2019年2月28日,中國互聯網絡信息中心(CNNIC)在北京發布第43次《中國互聯網絡發展狀況統計報告》,從多個方面展示了2018年我國互聯網發展狀況。截至2018年12月,我國網民規模達8.29億,普及率達59.6%,較2017年底提升3.8個百分點,全年新增網民5653萬。我國手機網民規模達8.17億,網民通過手機接入互聯網的比例高達98.6%。
隨著網絡技術的不斷進步和網上媒體平臺逐漸趨于成熟,對于研究輿情的相關部門來講,通過前期復雜數據的獲取和后期數據的處理分析,找到老百姓關注的、感興趣的熱點話題,采用有效的預測方法來預估網絡輿情事件的發展態勢,發現潛在的輿情危機,科學迅速地采取適當措施,引導事件正確地發展,很有現實意義。在2016年4月的網絡安全和信息化工作座談會上,習近平總書記指出:“網民來自老百姓,老百姓上了網,民意也就上了網。”網絡起著引導輿論和反映民意的作用,因此,網絡輿情的監控預測能夠使得政府更加及時地了解群眾所思所愿、準確判斷和控制輿情發展趨勢、及時解疑釋惑以及引導事態的正常發展,從而讓互聯網成為了解群眾、貼近群眾、為群眾排憂解難的新途徑,成為發揚人民民主、接受人民監督的新渠道,形成良好網上輿論氛圍。
2 ?國內外研究現狀
輿情通常是指作為社會主體的民眾對社會事件與現象的看法、態度、情緒或意見的總和,是國情的重要組成部分。網絡輿情是由個人和各種社會群體構成的公眾,在一定的社會空間內,通過互聯網/移動互聯網對自己關心或與自身利益緊密相關的各種公共事務所持有的多種情緒、態度和意見交錯的總和。它是輿情在網絡環境下的表現。當前,網絡輿情研究的重點和難點主要體現在網絡輿情判斷機制的建立與預測方法論的研究。網絡輿情判斷是一個復雜的系統工程,涉及多種信息獲取渠道、信息采集和分析,用到了許多技術和方法理論;預測方法論大多取決于預測方法學的研究進展。
2.1 ?預測方法和預測模型的研究現狀
預測方法在當今許多領域得到了大規模的應用,在實踐過程中起到了很重要的作用。目前研究較多的預測模型分為兩種:一種是以傳統的數學和物理方法為基礎的預測模型,一種是基于智能機器學習算法的預測模型。
基于傳統的數學和物理方法為基礎的預測方法主要包括:微分方程模型、時間序列模型、參數回歸模型、指數平滑模型、ARIMA模型、移動平均模型。
基于智能機器學習算法的預測方法主要包括:灰色理論模型、支持向量機模型、神經網絡模型、馬爾科夫模型、混沌理論、貝葉斯網絡、EM聚類、群體智能算法。
2.2 ?網絡輿情預測的研究現狀
網絡輿情的預測是首先對輿情數據進行準確獲取,其次經過系統的數據分析,最后用先進的科學技術方法來對未來網絡輿情發展方向進行預測分析,判斷其發展態勢。
相較于2000年國內互聯網開始普及和快速發展,國內網絡輿情預測方面的研究起步較晚,從2008年至2012年才逐漸開始。隨著網絡輿情事件的不斷出現和爆發以及網民數量的不斷擴大,相關部門對網絡輿情的監控也越加重視;研究社會輿情的專家學者也越來越關注網絡輿情及預測,得到了一些研究心得。
但相對于網絡輿情這個研究的大方向來說,輿情預測的研究尚處于起步、探索階段,缺少輿情預測的模型。現有的網絡輿情預測分析,主要是對民眾感興趣、敏感的話題討論數據獲取、熱點事件的發展方向、模型的建立及預測。如圖1所示,是網絡輿情預測的一般處理過程。
3 ?大數據的網絡輿情預測研究
3.1 ?大數據輿情的現狀
傳統的社會輿情主要研究的是社會熱點新聞、新政策對老百姓的影響等,方法主要有問卷調查、訪談、分類統計,運用簡單的數學建模、函數處理結構簡單的輿情數據。
經過多年的快速發展,網絡已成為人民群眾獲取信息、表達觀點的最重要的渠道,各種新型社交平臺以及科學技術的進步,使得公眾的網上言論越來越豐富。目前網絡輿情分析方法常用的有:網絡調查、基于統計規則、基于內容挖掘的分析方法等。
當前社會輿情的研究正處于從網絡輿情分析到大數據輿情分析的過渡階段。在互聯網環境下,網絡輿情在數據的體量、復雜性和產生速度等方面,發生了翻天覆地的變化,網絡輿論處理方法已超出了傳統信息技術框架的能力。大數據輿情分析繼承了網絡輿情分析的許多方法,針對大數據的4V特征(Volume——數據體量巨大、Variety——數據類型多樣、Value——有價值、Velocity——處理速度快),需要運用大數據處理和數據挖掘相關技術從海量數據中提取有用的信息。
3.2 ?大數據網絡輿情預測混合算法
網絡輿情是一種復雜、多變的系統,它的發展趨勢由于有廣大網民的參與,具有爆發性、演變不確定性、隱匿性、互動性等特點。在網絡信息技術高速發展的今天,輿情對當今社會的穩定影響越來越大。一方面,網絡輿情能夠起到社會監督的作用;但另一方面,負面的網絡輿情也會對社會公共安全穩定形成較大威脅。
由于網絡輿情發展趨勢的預測具有較高的復雜性,采用傳統統計學的方法具有一定的局限性,因此非線性預測方法是一個大的方向。同時,傳統方法在參數方面沒有確定統一標準,對比神經網絡算法在預測準確性上沒有特別的優勢。
運用大數據技術能夠保存網民在網絡上發帖、跟帖的數據信息,反映人民群眾的想法和利益訴求,提高大數據輿情分析的科學性、全面性。傳統的輿情分析選擇的數據和信息不全面,會導致做出片面的輿情判斷,結果與真實的狀況存在較大偏差。運用大數據技術方法,可以獲得真實的、有效的數據來進行判斷分析。但是,輿情數據規模的膨脹使得傳統算法的時空開銷隨之增長,原本在小數據集上可以有效運行的計算復雜度,在大數據集上會變得不可接受。
4 ?擬解決的相關問題
4.1 ?輿情生命周期階段劃分的表征量選擇
以網絡輿情事件的關注度為依據,可將其生命周期劃分為若干階段,劃分依據是輿情事件的熱度表征量。表征量包括:關鍵詞出現次數及變化幅度、發帖總量及變化幅度、百度指數等。具體選擇哪一類表征量要根據輿情事件、媒體平臺及實驗來確定。
4.2 ?大數據網絡輿情生命周期模型
生命周期理論最早由Hill和Hansen提出,后被Vernon、Abernathy、Utterback等人廣泛地運用于產品、項目乃至企業。網絡輿情事件也同樣擁有獨特的生命周期。
網絡輿情事件的生命周期原理,包括兩層含義:一是網絡輿情事件具有一定的生命周期,即任一特定事件,都會從其萌發走向消亡;二是網絡輿情事件可以分為若干階段,其演進具有一定的規律性。在不同的生命周期階段,網絡輿情事件表現出不同的特點,各階段的特點決定了事件的應對方式,對輿情事件進行階段劃分,并找出相應的應對方式,對網絡輿情事件的管理至關重要。
借鑒生命周期理論,在輿情預測數據的基礎上,研究輿情話題出現后的演化機制和演化規律模型,以關鍵詞(百度指數)或發帖(主帖+跟帖)總量/變化幅度作為主要表征量,對輿情事件生命周期階段進行定量劃分,尋找各階段的輿情特征,提出相應的引控工作流程和要點。
通過對網絡輿情預測算法和網絡輿情生命周期模型的研究,為及時、準確地預測互聯網輿論熱點的走向和趨勢提供信息化支撐,有利于政府對輿情信息的監控和引導,也有利于社會的和諧穩定。
5 ?結 ?論
本文基于大數據技術,對網絡輿情預測問題進行分析,通過大數據網絡輿情預測算法、網絡輿情生命周期模型的應用,可以提高快速發現潛在輿情危機的能力,科學地判斷輿情事件發展趨勢,從而能夠進行有效的、正確的引導。
參考文獻:
[1] 游丹丹,陳福集.基于改進粒子群和BP神經網絡的網絡輿情預測研究 [J].情報雜志,2016,35(8):156-161.
[2] 應毅,劉定一,任凱.基于大數據技術的輿情分析與決策支持系統架構研究 [J].圖書情報導刊,2017,2(9):32-36.
[3] 游丹丹,陳福集.我國網絡輿情預測研究綜述 [J].情報科學,2016,34(12):156-160.
[4] 應毅,劉定一,任凱.社交網絡的輿情熱點發現模型研究 [J].圖書情報導刊,2018,3(9):68-71+77.
[5] 蘭月新,夏一雪,劉冰月,等.面向輿情大數據的網民情緒演化機理及趨勢預測研究 [J].情報雜志,2017,36(11):134-140.
[6] 錢愛玲,瞿彬彬,盧炎生,等.多時間序列關聯規則分析的論壇輿情趨勢預測 [J].南京航空航天大學學報,2012,44(6):904-910.
[7] 周耀明,李弼程.一種自適應網絡輿情演化建模方法 [J].數據采集與處理,2013,28(1):69-76.
[8] 夏火松,甄化春.大數據環境下輿情分析與決策支持研究文獻綜述 [J].情報雜志,2015,34(2):1-6+21.
作者簡介:劉定一(1983-),男,漢族,江蘇靖江人,碩士,研究方向:計算機應用與高性能計算。