999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據環境下網絡輿情管理方法研究

2017-04-20 21:12:51孫麗杰李春華
思想政治教育研究 2017年1期
關鍵詞:大數據

孫麗杰+李春華

摘 要:隨著互聯網技術的快速發展及其廣泛的應用,網絡輿論信息的產生體量、傳播速度和影響范圍等方面都發生了巨大變化。這些變化要求輿情管理工作者在輿情管理理念、管理方法等方面必須與時俱進。大數據既是一種新技術,也是一種新方法,它側重于信息挖掘和預測。將大數據運用到網絡輿情管理工作之中,必將對輿情管理產生重要作用。在大數據環境下,網絡輿情的管理方法也必將發生變革與創新。探討大數據環境下網絡輿情分析方法,以大數據為背景和前提創新網絡輿情管理方法,總結大數據下輿情管理理念、視角、方式和方法等方面的變革與創新的思路,具有重要意義。

關鍵詞:網絡輿情;大數據;管理方法;變革與創新

DOI:10.15938/j.cnki.iper.2017.01.025

中圖分類號: G641文獻標識碼:A文章編號:1672-9749(2017)01-0124-06

據《第37次中國互聯網絡發展狀況統計報告》(由中國互聯網絡信息中心(簡稱:CNNIC)在2016年1月發布)顯示,截至2015年12月,中國網民規模達6.88億,全年新增網民3951萬人。互聯網普及率為50.3%,中國手機網民規模達6.20億,手機上網使用率為90.1%[1]。隨著移動互聯網(Mobile Internet)、社交網絡(Social Networking)、電子商務(Electronic Commerce)等的迅速發展,互聯網的邊界和應用范圍有了極大擴展,各種信息和數據極具增多,并正在迅速膨脹變大。

網民們經常通過互聯網表達意愿、觀點,討論各種話題,以表達自己的思想觀點和訴求。互聯網既是一個收納器,聚集網民思想動態表達、文化和社會生活信息;又是一個擴音器,傳播大眾的社會輿論。在社交媒體時代,人們通過互聯網平臺表達社情民意,體現自己的意愿、態度和評論觀點。輿情作為社會輿論的一個風向標,開展輿情分析主要是針對民眾態度、觀點的收集整理,分析出民眾相關的意見傾向,客觀體現輿情動態。

作為世界上網民數量最多、互聯網訪問量最大的國家,有效地分析網絡輿情,對于政府,媒體、大型企事業單位都有著非常重要的意義。從政府的角度,有效的輿情管理有利于政府了解公眾態度和訴求,有助于提升政府的政務管理和構建良好的社會和網絡環境;從企業的角度,有效的輿情管理有利于企業掌握用戶和大眾對產品質量、產品功能與服務的評價及客戶特征信息,更好地提供個性化產品與服務,實現利潤增長,更有利于企業了解用戶和大眾對企業社會形象的反饋和認知,提升企業品牌知名度和社會聲譽;從媒體的角度,有效的輿情管理能夠突破傳統信息搜集和發布渠道,更能夠通過對公眾輿論深入分析,提升新聞效果,實現新聞價值增值。因此,社會各界都非常重視網絡輿情分析,并不斷創新輿情的分析和管理的方式和方法,都是想最大化輿情的價值。

一、大數據及網絡輿情的相關定義及特點

1.大數據的定義及特點

隨著人們對大數據的研究和理解的不斷深入,大數據已不僅僅是一個技術方面的名詞了。而今,大數據相關的理論無論從內涵還是外延上,都在不斷豐富和充實。關于大數據的定義,不同的機構和學者從不同的角度給出略有差異的定義:如高德納咨詢公司(2013)提出,大數據是指具有更強的洞察力和流程優化能力的海量、多樣化的信息[2]。維基百科對大數據的定義是“一個超大的、難以用現有常規的數據庫管理技術和工具處理的數據集”。Gartner對大數據的定義:“大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量高增長率和多樣化的信息資產” [3]。

IDC市場研究公司2012年提出,“大數據”是為了從大容量的、不同類型的數據中獲取有價值的信息而設計的新型架構和技術[2],并對大數據的采用三步法進行了界定,如圖1所示。首先,從數據源場景方面,可以有三種情況,或者說需要具備三種情況至少滿足一種,即大數據的容量大于等于100TB或數據源于超高速的數據流(Data Streaming),或數據產生的年增速大于60%;其次,必須部署在可動態適應的基礎設施(dynamically adaptable infrastructure)上。這里的基礎設施既可以是傳統的scale-up架構,也可以是水平擴展架構(scale-out infrastructure);最后,必須有兩個以上的數據源或數據格式,或者高速流數據源(如點擊流或機器產生的數據流)。有了以上三個步驟的界定,才可以形成大數據。IDC指出“大數據技術描述了一種新一代技術和架構,以非常經濟的方式,以高速的捕獲、發現和分析技術,從各種超大規模的數據中提取價值” [2]。

盡管對大數據的定義角度各有不同,但大數據的核心本質和特征的表述和定義相對比較統一,均認為大數據與傳統意義數據具有本質區別。較傳統數據相比,在數據基礎上,大數據更傾向于全體數據而非抽樣;在分析方法上,更強調相關分析而非因果分析;在分析效果上,追求的是效率而非絕對精確和在數據規模上強調相對數據而不是絕對數據。

在數據和信息的規模/體量方面、在內容形式和數據結構方面具有復雜性/變化頻度多樣、在產生速度方面及價值密度等四個方面都極大地超越了傳統的數據形態,具有4V特征:

第一,數據規模大(Volume)

第二,數據種類多樣(Variety)

第三,數據處理速度快(Velocity)

第四,數據價值密度高(Value)

如圖2所示:大數據的4V特征。

具體而言,一是數據規模大( Volume):從容量角度,大數據具有數據容量大,“容量”或“體量”,從 TB→PB→EB級,每級都是按照進率1024(2的十次方)計算,這足以說明大數據規模之龐大。二是數據種類多樣(Variety):結構化數據、非結構化數據以及半結構化數據,Web數據、文字、語音音頻數據、圖片圖像數據、視頻數據、模擬信號等數據都體現了數據的多樣性。三是速數據處理速度快(Velocity):對數據訪問、處理、交付等速度的要求快,而且數據產生速度也非常之快;四是價值(Value):大數據的核心價值在于資源優化配置,通過搜集海量數據,進而展開全量數據挖掘,分析數據背后的相關性,開展預測分析,獲得數據的應用價值。

這些特性使得大數據與傳統數據區別開來,強調了大數據是具有結構松散性、形式復雜性和有利用價值的數據信息資源[3]。

2.網絡輿情的定義與特點

“輿情(Public Opinion)”翻譯為“民眾或公眾的意愿、意見或觀點”。根據百度百科:輿情是“輿論情況”的簡稱,是指在一定的社會空間內,圍繞中介性社會事件的發生、發展和變化,作為主體的民眾對作為客體的社會管理者、企業、個人及其他各類組織及其政治、社會、道德等方面的取向產生和持有的社會態度。它是較多群眾關于社會中各種現象、問題所表達的信念、態度、意見和情緒等等表現的總和。

有學者從社會學視域考察輿情的定義,認為輿情是指社會各階層民眾對社會現象或事件所持有的情緒、態度、觀點、看法、意見和行為傾向等[4]。網絡輿情則是社會總體輿情的一個組成部分,是以網絡為載體存在,以網絡傳播方式匯聚、形成和表達的輿情,是在互聯網上的民眾情緒、態度和意見匯聚的總和[5]。

網絡輿情的信息來源主要有:網絡新聞(如:搜狐、新浪、人民網,或以RSS為基礎聚合類新聞,如頭條等),論壇貼吧(如:BBS,百度貼吧,天涯,西祠胡同等),新聞評論,社會化媒體社交網絡(即時通訊工具:如:聊天室、QQ、微信、微博、博客等),搜索引擎(如:百度,google等),網絡發起線上活動、網絡調查、電子郵件等。

通常我們把網絡輿情的基本特征概括為自由性與可控性、互動性與即時性、豐富性與多樣性、隱匿性與外顯性、情緒化與非理性、個體化與群體極化性[6]。如圖3所示:網絡輿情的特征

3.大數據是網絡輿情管理的有效方式之一

大數據的目的在于發現新的知識與洞察并進行科學決策。大數據與網絡輿情具有非常相似的特征。從這點上可見,利用大數據的手段管理網絡輿情是網絡輿情管理的有效方式之一。首先,大數據能夠全方位記錄民意,完整展現社會輿情,大數據體量巨大,從TB級到PB乃至ZB級別,能夠完全、完整的記錄社會民眾的社情民意;其次,大數據的特點是挖掘數據背后的相關聯性,因此,大數據能精準體現輿情背后的事件、相關人員以及讀者等要素內在邏輯和社會關聯;最后,大數據具有很強的預測能力,通過分析事件的讀者特征(群體肖像刻畫)、被關注程度/熱度、傳播速度、傳播范圍、發展趨勢、影響程度和網民情緒變化等,也可以針對某個觀點的深度研究,從而預測輿情走向,幫助決策者進行決策和判斷。因此,大數據技術為網絡輿情的預測提供了重要的技術、理論支撐和保證,也成為輿情研究關鍵技術的支撐和核心概念。

二、基于大數據技術網絡輿情管理的一般步驟與方法

網絡輿情的管理模型主要分為:信息采集、信息預處理、輿情分析、輿情報告四個步驟。如圖4所示:大數據管理模塊及流程示意。

1.信息采集

信息采集當前常用方式是網絡爬蟲技術。在網絡爬蟲的爬行策略中,應用最為基礎的是深度優先遍歷策略、廣度優先遍歷策略。對于信息抓取過程,要求信息抓取的覆蓋范圍要全面。高速發展的信息高速路使得網絡信息數據容量不斷增大、信息和數據的類型更加豐富和復雜、網頁數量不斷增多,這對輿情信息抓取的效率和全面性提出了更高的要求。

大數據網絡輿情信息搜集改變了傳統網絡輿情信息的搜索采集方式,采用定向站點信息抓取輔以全面的實時監控、聚合內容(RSS)、社交網站信息搜集和摘要搜集等搜集技術,與傳統人工監測采集相結合的方式進行,抓取效率和覆蓋范圍都有突破性進展。

數據監測要全面和實時,要做到精細采集信息數據。筆者整理了較為常用的監測范圍和基本監測指標,如表1所示。

2.信息處理

信息處理主要包括數據清洗(Data Cleaning)、信息提取、文本分類等。信息處理的主要任務是將采集的各種信息轉化成格式化文本存入數據庫。

網絡輿情在大數據環境中流動和變化速度非常快,因此,在信息處理部分,要求信息處理的時效性。

3.輿情挖掘與分析

大數據分析就是對海量數據進行分析、梳理和加工,獲得具有價值的產品(Product)和服務(Service)或深刻洞見(Insight)的數據及處理方法。數據分析的主要技術手段是采用數據挖掘(Data Mining),數據挖掘又稱數據庫中的知識發現,即從數據庫的大量數據中揭示出隱含的、前所未有的并具有潛在價值的信息的價值聚合、提煉的過程[7]。

輿情分析的技術方法主要有文本分類、聚類分析(不預先設定數據歸類類目,完全根據數據本身性質將數據聚合成不同類別)、熱點發現(利用關鍵詞過濾、語義分析、數值統計識別熱點和敏感話題)、話題識別、主題檢測與跟蹤、觀點/文本傾向性識別和分析(對文章的觀點進行傾向性分析和統計,識別正負面信息)、自動摘要等計算技術挖掘網絡文本內容蘊含的各種觀點(Opinion)、喜好(Preference)、態度(Attitude)、情感(Emotion)等,也可以明確網絡傳播者的意圖和傾向,以及影響程度、影響范圍和發展趨勢。

當前一些實驗室、研究機構等依據大數據分析的方法和實際的工作相結合,開發和建立了以下輿情專屬的分析模型和方法。如:人民網推出的“輿論共識度”指數將為中國網絡輿論場的研究和社會輿論的理性引導提供新的觀察視角和決策依據。它把網絡用戶分為媒體、網民和意見領袖三大群體,通過對不同群體的輿論分析,對每月前十或前100的社會熱點問題進行評估,形成“輿論共識度”,進而對用戶對輿論話題的共識程度進行評價。

互聯網與國家治理研究中心、中山大學大數據傳播實驗室設計的“網民認知模型”,通過透析網民對不同事件的情緒變化、態度偏向等,評測用戶“正負能量”,分別從“網民情緒指數”“網民理性指數”和“網民態度指數”三個維度來評價具體熱點事件當中網絡輿論場的“網民正能量指數”,對輿情分析和研判也非常有幫助。

還有機構建立的熱度評估指數,通過話題在傳統媒體報道量、網絡媒體報道量、微博量、論壇帖文量、博客文章量,轉發數量、用戶跟貼數量、評論數量、被關注數量、傳播的速度和范圍、關注的用戶形態特征等相關數據,之后加權各項指標,得到每個熱度事件或話題的綜合熱度指數。

更有一些專項深入分析,如針對傳播源頭的分析、傳播渠道的分析、意見領袖的分析、傳播主體挖掘分析或針對隱性數據(網絡日志)的分析。

也有專家學者提出,輿情分析需要是一個綜合分析模式,以大數據的方式為重點,同時要結合專項話題市場調研、綜合民意調查(定性與定量)、軟件與人工、分析師與專家會商等方式相結合的方法來分析。

4.輿情報告

輿情分析的結果需要以報告的方式呈現,并將分析報告反饋或發布,為用戶、管理者和決策者提供依據。

輿情報告要求輿情分析數據要真實可靠,分析方法要恰當準確,描述要符合客觀事實,結論要簡明扼要、通俗易懂。輿情報告中恰當采用示意圖、圖表、列表等展示形式,可以更形象、清晰、直觀,并且更邏輯地展示輿情事件的發生、發展和變化,輿情的發展態勢等。針對不同的表達目的可以選用不同的圖表或圖示方式,如:描述事件發展趨勢可用折線圖表示、展示用戶立場或觀點的比例可用餅狀圖、體現熱點人群的分布可以用散點分布圖、表示頻率分布可以用網狀圖或柱狀圖、說明事態發展變化可以用流程圖、用戶之前或背后的人際關系可以用網狀關系圖等。豐富的圖表工具可以更形象、生動的表述輿情的現狀、發展和變化。

三、大數據環境下輿情管理模式變革與管理方法創新

雖然,目前對大數據研究越來越熱,國內諸多大的互聯網公司、各行業內的企業及科研機構都投入了巨大的人力、物力開展大數據及大數據下輿情研究,但在我國大數據研究依然處于探索階段,在很多方面還只是停留在理論或對未來的暢想階段。例如:在技術方面,目前常見的輿情監測工作的主要手段仍以人工檢索為主,盡管也使用了市面相對成熟的相關搜索軟件進行輔助搜索,但搜索輿情的技術仍采用傳統的二維搜索方式,即主題關鍵詞和網絡平臺二維坐標,由輿情管理的工作人員對采集的信息進行二次加工成輿情產品。而且搜索的輿情信息結果多為一級文本信息,對于深層次的多級輿情信息,如新聞、微博后的評論,網民的社會關系,網民針對某一事件評論反映出的情緒變化等數據無法深度挖掘,仍靠人工采集和分析判斷。受制于輿情分析人員的知識水平和價值判斷的不同,極有可能導致有價值的輿情信息丟失,無法準確及時預測輿情走勢,大大降低了輿情監測工作的效率、準確性。

隨著互聯網的發展、自媒體的興起,網絡、通信技術在人們信息領域深入運用,發布者在人口統計學方面的特征、發布的載體、發布的形式、傳播渠道、信息的數量和形式等有了全新的變化,這對輿情的管理提出了更高的要求,要求變革網絡輿情管理方式以適應大數據時代的新形勢。因此,輿情管理工作者在輿情管理的理念、模式和方式方法上均需要有相應的變革與創新。

1.輿情工作者的研究視角需要發生轉變

輿情工作者要從全局角度,把輿情研究從單一向度的內容研究向多元化、多向度內容及關系研究方向轉化。網絡數據和信息背后體現的人的行為軌跡和復雜的人與人的社會關系(Social networking),所以關系研究將成為未來的研究重點。大數據的特征之一“關聯分析”,通過社會話語表達、社會關系分析、社會心理描繪、社會訴求預測等多個角度[8],進行多向度的分析研究能夠幫助構建立體化、全局化和動態化的網絡輿情數據系統,通過輿情分析,挖掘網絡輿情和社會動態背后的深層次關系,實現網絡輿情管理和社會治理的緊密聯動、同步推進。

2.輿情的研究方法需要創新

即便是研究的視角發生了改變,要想真正落實到具體工作中,研究方法的創新尤為關鍵。要在分析方法上更加豐富,結合數據挖掘技術分析(Data Mining)方法與行為分析(Behavior Analysis)方法的研究、結合云計算、移動可追塑性分析、個性化特征識別的網絡機器人與社會心理分析實驗因果模型等方法,一是要提升數據監測技術,實現對媒體、論壇、博客、微博、微信等各個網絡平臺數據的全面抓取和記錄,特別是要提高對圖片、音視頻、模擬信號等數據的自動識別能力;二方面提高數據挖掘技術,從海量數據中快速識別有價值數據,并挖掘數據背后隱藏的規律。三要注重數據分析技術,包括關聯分析、聚類分析、語義分析等等,自動分析網上言論背后的觀點、意見傾向和信息、相互之間的關聯性,揭示輿情發展趨勢。四是確保數據安全和保密技術,包括網絡攻擊與攻擊檢測與防范問題、安全漏洞與安全對策問題、數據備份與恢復問題、災難恢復問題等等,確保數據安全和保密[9]。

在數據分析方面,數據分析的準確性尤為重要。引入云計算的概念和技術,與大數據相結合,會使輿情分析更加準確。開展數據間、不同維度、不同領域的數據、多樣化的數據間的關聯分析,是十分重要的。專家認為輿情關聯關系是網絡輿情數據庫中存在的一類重要的、可被發現的知識,引入網絡輿情支持度和網絡輿情可信度,可以更準確表示網絡輿情間的關聯度,量化網絡輿情關聯規則的相關性,從而使挖掘結果更準確。

3.研究結果要易懂、易應用和可視化呈現

大數據的真正價值是運用,輿情的最終價值是指導工作。研究結果的使用者未必是大數據和輿情分析的專家。因此,研究結果要求易懂易識,界面必須友好,結果必須可以直觀識別。 “用數據說話”。數據最有說服力,由于圖表與列表能夠清晰、直觀、簡潔、深刻、形象地表現輿情事件,因此輿情的研究結果要注重運用圖表等可視化方式來展現。

4.重點強調輿情的預測,面向未來,做好輿情數據的再利用

大數據的核心是預測,未來輿情研究的重點應由輿情監測轉向輿情預警和預測。輿情工作者通過收集分析互聯網上關于社會熱點或網民關注焦點事件的大量消息報道,發掘背后隱藏關系,進而預測事態發展趨勢,為輿情事件處置提供決策參考。

展望未來,大數據時代數據使用的關鍵是數據再利用,數據再利用的意義在于:挖掘數據的潛在價值,實現數據重組的創新價值。基于大數據的輿情分析,能同時分析更多數據,揭露更多隱藏價值,使預測更準確,決策更合理。未來大數據將使輿情監測功能大大豐富,輿情分析功能更加強大,輿情預測能力進一步增強,這將實現全方位、立體式的綜合輿情管理模式,實現輿情管理的價值最大化。

參考文獻

[1] 中國互聯網絡信息中心(CNNIC).第37次中國互聯網絡發展狀況統計報告[EB/OL].[2016-01-22].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201601/PO20160122444930951954.pdf.

[2] 謝耘耕,劉銳,喬睿,等. 大數據與社會輿情研究綜述[J]. 新媒體與社會,2014(4):133-154.

[3] 張寧熙.大數據在突發公共事件網絡輿情信息工作中的應用[J]. 現代情報,2015(6):38-42.

[4] 王宏偉.輿情信息工作策略與方法[M]. 北京: 中國人事出版社,2012:6.

[5] 戴維民,劉軼. 我國網絡輿情信息工作現狀及對策思考[J]. 圖書情報工作,2014(1):24-29.

[6] 劉毅. 網絡輿情研究概論[M].天津: 天津人民版社,2007:74.

[7] 喻國明. 大數據分析下的中國社會輿情:總體態勢與結構性特征——基于百度熱搜詞(2009—2012)的輿情模型構建[J].中國人民大學學報,2013(5):2-9.

[8] 李小娜. 大數據時代社會輿情監測的轉變和發展[J]. 青年記者,2015(11):69-70.

[9] 卿立新. 創新大數據時代的網絡輿情管理[J]. 紅旗文稿,2014(22):28-29.

[責任編輯:張學玲]

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 国产偷国产偷在线高清| 欧美一区二区三区欧美日韩亚洲| 99视频精品全国免费品| 中文无码影院| 麻豆精品视频在线原创| 日本www在线视频| 国产成人在线无码免费视频| 一本大道视频精品人妻| 国产美女精品在线| 午夜无码一区二区三区在线app| 亚洲男女在线| 色香蕉影院| 精品无码一区二区三区电影| 国产精品综合色区在线观看| 国产精品片在线观看手机版| 亚洲AⅤ波多系列中文字幕| 日韩国产亚洲一区二区在线观看| 国产精品人人做人人爽人人添| 中国精品久久| 激情成人综合网| 夜精品a一区二区三区| 狠狠做深爱婷婷久久一区| 四虎国产精品永久一区| 色偷偷综合网| 狠狠综合久久| 黄色a一级视频| 亚洲视频一区| 日韩美女福利视频| 在线观看无码a∨| 尤物在线观看乱码| 欧美视频二区| 不卡无码网| 久久激情影院| 99久久精品国产自免费| 996免费视频国产在线播放| 色欲色欲久久综合网| 在线观看国产网址你懂的| 色综合成人| 曰韩人妻一区二区三区| 波多野吉衣一区二区三区av| 亚洲乱伦视频| 久久免费视频播放| 97视频免费看| 精品视频一区在线观看| 久久婷婷五月综合色一区二区| 中文无码伦av中文字幕| 日本午夜在线视频| 特级aaaaaaaaa毛片免费视频 | 成人免费网站久久久| 国产精品毛片一区视频播 | 无码中文字幕精品推荐| 欧美日韩一区二区三区在线视频| 国产在线91在线电影| 天天做天天爱天天爽综合区| 亚洲国产91人成在线| 日本人妻一区二区三区不卡影院| 香蕉在线视频网站| 中国国产A一级毛片| 五月婷婷综合色| 日韩视频免费| 青草国产在线视频| 日本三级欧美三级| 波多野结衣久久精品| 日韩视频福利| 欧美日韩精品在线播放| 精品精品国产高清A毛片| 精品久久蜜桃| 少妇精品在线| 国产精品亚洲一区二区三区在线观看| 精品久久综合1区2区3区激情| 日韩在线2020专区| 亚洲综合婷婷激情| 欧美日韩精品一区二区在线线| 在线看片中文字幕| 国产精品美女网站| 99国产在线视频| 乱码国产乱码精品精在线播放| 欧美无专区| 精品成人免费自拍视频| 国内精品久久九九国产精品| yjizz国产在线视频网| 色偷偷综合网|