傳統輿情數據的獲取主要是利用大數據處理技術在海量互聯網信息中自動抓取、類型檢測,并數據聚類。這些收集到的輿情數據是網絡輿情預警,治理研究開展的前提。但事實上,網絡中存在大量的“潛水黨”。這類用戶對于輿情事件有自己的價值判斷,但并未進行“跟帖”、“評論”、“點贊”等行為。因此,他們的觀點數據很難被作為輿情監測系統的原始數據信息加以收集。如何鼓勵用戶參與表態的過程,從而增進輿情數據的多源和豐富性,是一個有待解決的行業命題。
自2008年比特幣發明人中本聰在比特幣白皮書中提出“區塊鏈”這一概念后,伴隨互聯網的迅速發展,區塊鏈近年來成為技術創新和風頭的熱詞,被應用于各個行業領域中。區塊鏈技術本質上是一種分布式數據庫,與傳統數據庫不同的是,這種數據供基于互聯網,允許每一個人參與數據庫的增加、刪除等操作,這個數據庫被所有用戶共享。
區塊鏈技術的核心之一是“激勵機制”。比特幣系統中,激勵機制體現在賦予記賬人角色擁有使用系統發送交易的權利,作為激勵機制的獎勵形式。或是將經濟獎勵等因素運用到區塊鏈技術上,幫助信息發布個體按照一定的獎勵機制和分配原則,給予該個體(節點)合理的經濟激勵,從而保證本系統內個體或節點對區塊鏈上信息的維護共識,并吸引這些個體共享信息。
在這一激勵機制的基礎之上,論文擬提出一種面向網絡輿情數據多源化的區塊鏈保障機制。用戶通過提交有效輿情信息,獲得虛擬幣反饋。這一激勵機制使用戶更加積極主動提交信息,從而更大程度上豐富了網絡輿情的數據源信息。并為后期更有效的輿情監測、預警,乃至治理工作提供堅實的基礎。
國內網絡輿情研究逐年遞增,已是學術研究持續的熱點。其研究領域涉及圖書情報、政治學、社會學、新聞傳播學、管理學、信息科學等諸多學科。從研究版圖而言,國內網絡輿情的研究大致覆蓋如下幾個領域:網絡輿情基礎研究主要包括微觀方面網絡輿情相關概念界定[1]、中觀方面網絡輿情的特征分析[2],以及宏觀方面網絡輿情走勢的總體描摹;網絡輿情的形成、傳播及演變機制研究基本上包括輿情形成、演變的過程,以及對輿情事件涉及主體的不同而進行研究[3];在網絡輿情監測與預警的研究方面,涉及對網絡輿情預警的平臺搭建、指評測標體系設計、關鍵技術及算法,預警機制等[4];網絡輿情應對與輿情治理研究大致延續著從消極的“控制”網絡輿情,被動的“應對”網絡輿情,到主動“治理”網絡輿情的脈絡。而這一版圖中的現有成果,基本建立在“現存”的輿情信息源基礎之上,少有關涉如何增進信息源本身的研究。
在區塊鏈的基礎研究方面,不同學者對區塊鏈的定義不盡相同,但究其本質基本一致,即區塊鏈的核心特征:去中心化、共識機制、可信性、可靠性、開放性、智能合約等。互聯網中的信任問題是區塊鏈技術主要解決的問題之一,區塊鏈信任問題是一群認同并遵守這個規則的人共同參與,共同記錄一個去中心化的分布式賬本數據庫的過程[5]。在區塊鏈的技術架構中,激勵機制是建立在共識機制之上一種核心,其主要包括發行機制和分配機制,二者統稱為激勵機制[6]。激勵機制是區塊鏈系統對參與作為記賬人角色所做誠實勞動的補償方式[7]。
在激勵機制的基礎上,近兩年,學界涌現了一些將區塊鏈技術與數據共享相關聯的研究。宏觀思路方面,嚴振亞將共享經濟與區塊鏈技術相結合,構建基于區塊鏈的共享經濟新模式的基本思路[8]。在應用研究層面,有研究者提出了區塊鏈技術對促進智慧城市信息共享與利用的應用設想[9]。同時,在多個領域,也有更詳盡的應用設計被提出。諸如:余益民團隊針對政務信息資源共享實踐中諸多亟待解決的問題,提出去中心化政務信息資源共享及公開的解決思路,并給出基于區塊鏈技術的模型總體架構[10]。也有研究借助了區塊鏈中信用積分制度作為激勵機制,設計了一種競爭情報共享平臺模型架構[11]。在財務研究領域,朱建明等學者基于聯盟區塊鏈提出了一種新型財務共享模式,為財務共享模式目前的發展困境找出新出路[12]。賓晟等人在社交網絡中輿情傳播模型的研究中,考慮社交網絡中由合理量化用戶所產生內容的價值貢獻作為激勵機制,以期鼓勵用戶傳播優質信息,減少失真信息的傳輸[13]。
在區塊鏈的激勵機制保障下,個體或節點所提供的數據具有優質的多源化特質。基于此,論文擬提出將區塊鏈技術與網絡輿情研究相關聯的設想。在這一設想中,網絡輿情信息的可靠與否,是由用戶之間相互確認。而用戶通過提交有效數據信息,根據激勵機制,獲得虛擬幣反饋。這一激勵體制使得用戶更加積極主動提交信息,從而在更大程度上豐富了網絡輿情的數據源信息。
通過區塊鏈激勵機制搜集到的可靠信息,如何在最大程度上被利用?如何保證輿情數據的多源化,擴大輿情監控系統的信息規模,才能提高輿情預測的準確性?
區塊鏈技術作為互聯網上一種特殊的分布式數據庫技術,可以讓每個人都參與到數據庫記錄過程中。區塊鏈由各種不同的包含特定內容的區塊連接而成的一種分布式鏈的結構,其中區塊是數據信息的一種集合表示[14]。區塊鏈上的信息,均是由用戶來產生,并供所有用戶共享,保證信息完全透明化且無法更改。
傳統網絡輿情監測系統在搜集輿情信息時,通常是通過專業軟件對發布在網絡上的海量信息進行實時采集、分析、匯總,并識別其中的關鍵信息。實際上,網絡中存在“潛水黨”,這類用戶對于輿情事件有自己的價值判斷,但并未進行“跟帖”、“評論”、“點贊”等行為。這類“潛水”用戶的觀點,通常無法被輿情監控系統所捕捉到。如何鼓勵用戶參與表態的過程,從而提供較好的數據源、使輿情數據更加多源化,則可以通過區塊鏈共享機制來完成。

圖一:輿情信息區塊鏈平臺
如圖一所示,在輿情信息區塊鏈平臺上,我們給所有加入到輿情信息區塊鏈中的用戶一定數量的虛擬幣,虛擬幣達到一定數量時可兌換信息源平臺上的相應服務。同時,所有用戶可無償使用區塊鏈平臺中搜集到的信息。如此,用戶有利益收獲,根據激勵機制的原則,必然對于信息提供方面的意愿加強,輿情監測系統可得到更加多源化的網絡輿情數據。
輿情監測系統搜集輿情數據時,其真偽性直接影響最終的分析結果。以往網絡輿情監測系統在自動抓取輿情信息進行篩選分析時,在判斷信息真偽性方面通常需要由監測系統一方的人員進行驗證,由此耗費大量時間。而借助于區塊鏈的激勵機制,通過節點用戶受到一定獎勵,節點自愿提供更多信息,輿情信息采集可節省時間,大大提升搜集信息的效率,同時獲得更多可靠信息。具體的系統實現模塊圖如圖二所示。

圖二:輿情數據系統模塊圖
如圖二所示,基于區塊鏈激勵機制的輿情數據系統的用戶端,主要由三個模塊組成:用戶登陸模塊、信息管理模塊和賬戶登陸模塊。用戶在登錄界面輸入個人信息,本地加密后上傳到后臺數據庫中;而在信息管理模塊中,存儲所有用戶上傳的信息;賬戶登陸模塊中,則包含用戶獲得虛擬幣反饋、消費記錄及激勵子模塊。在數據區塊這一部分里,主要實現實時數據融合和數據質量管理,并提供激勵機制的功能實現。用戶提交的所有信息流入數據區塊中匯總,數據質量管理模塊負責對用戶提交的信息進行判斷,所有經過51%的節點用戶認證通過的信息為可用信息。最終,所有經判斷可用的數據信息將進入到中心數據庫中并存儲。中心數據庫還包含有多種激勵方法庫,以適應不同輿情源信息提供個體的鼓勵和獎勵。激勵反饋管理模塊判別當前激勵機制是否合理,是否能夠產生效用。除此之外,還可以對當前所采用的激勵機制及其方法進行評估,便于后續改進激勵方法。
這一系統中,對于數據源的用戶而言,其利用已有成熟的非對稱加密算法,來對輿情數據進行加密。用戶將加密后的輿情數據通過特定的接口上傳云中心的平臺,存放在區塊中,并將承載輿情數據的區塊廣播全網等待認證。當超過一定比例(比如51%)的節點數達成共識時,則通過認證, 對數據區塊增加時間戳,數據在網絡中,以P2P的模式流通。區塊鏈內置的智能合約機制用于執行認證、流轉、共享等環節,這些環節屬于數據認證機制中的內容。整個執行過程具有公開透明、不可篡改的特性, 對于每一個新上傳的數據,節點上的資源用戶對新資源的價值達到共識。輿情數據經過區塊鏈技術處理之后,可以刪除重復無效、低質量的輿情數據,從而有效提升輿情信息數據源的質量。具體流程如圖三所示:

圖三:輿情數據系統流程圖
如上圖所示,以用戶a為例,用戶在不同平臺上提交相關信息至數據區塊中,數據區塊進行匯總并及時廣播數據至全網所有用戶,當超過51%用戶節點認可信息達成共識并通過認證后,將認證結果再次返回至數據區塊中。所有經認證過的數據將被傳送到中心數據庫里得到整合,同時,中心數據庫將會回饋相應數量的虛擬幣來激勵所有提供經成功認證數據的用戶。數據認證過程均是由用戶之間相互認證,區塊鏈去中心化的特點可節省大量人力。同時,用戶在不同平臺提交各類信息,在更大程度上豐富了網絡輿情的數據源信息。
隨著信息時代的急速發展,較大規模的網民數量呈現出不斷增長的趨勢。智能終端設備技術的快速發展,降低了互聯網使用的門檻,巨大的智能終端設備的網民規模使得每個用戶個體都可能在輿情信息傳播的各個環節中扮演不同的角色。智能終端下的網絡時代,每個用戶都是一個信息傳播平臺,這些平臺上用戶觀點的傳播具有多方向、爆發式增長的特征。傳統網絡輿情數據的搜集需要針對不同平臺,分別進行信息抓取。例如通過“爬蟲”技術對今日頭條某新聞的評論區、微博某話題的評論區等進行信息搜集和整合。而基于區塊鏈激勵機制的網絡輿情數據系統,可以跨媒體跨平臺抓取信息,信息的多源獲取能夠使數據更加多源化,從而提高了后續分析的可靠性。
當網絡輿情數據可以得到價值反饋——虛擬幣時,用戶主動上傳、共享信息的意愿會大大加強。基于區塊鏈激勵機制的輿情數據多源化機制通過給予虛擬幣獎勵,激勵用戶共享信息,其共享過程安全保障性高,無須擔心信息泄漏。輿情信息在客戶端上傳前被加密處理,通過分布式存儲的方式上傳到共享區域空間內,當有查詢私密文件需求時,通過輸入相關信息密碼,就可以提取所要的輿情數據信息。整個過程中,用戶的數據在本地就已經進行加密,共享信息時免去個人信息泄漏的顧慮。共享數據信息,可以使輿情監測中心盡可能在短時間內大范圍獲取網絡輿情的全貌。多源輿情的監測基于更多數據,區塊鏈保障機制可以海量存儲輿情數據,神網算法所用的數據集較大,從而使得訓練的數據模型更為準確,大大提高了網絡輿情監測和預警工作的高效性。
綜上,基于區塊鏈的激勵機制,輿情源數據擁有者提供數據的積極性得以提高,使得輿情數據類型更趨于多源化和規模化。但這一設想運用在實際操作層面依然面臨一些挑戰。
第一、安全性問題。區塊鏈應用中的賬戶就是用戶的公鑰,進行信息交換的手段是私鑰。若私鑰丟失,用戶之前參與信息交互的權利即丟失。區塊鏈去中心化的特點使得沒有中心機構可以重置信息。另外,在防篡改方面,雖然全網超過一定比例以上客戶端節點發生改變,才能夠對區塊鏈的信息交互記錄機型修改,但不排除有技術可以掌握超過這種比例以上客戶端的節點,從而對區塊鏈應用的安全性造成威脅。
第二、延時問題。因為P2P網絡的工作原理,難以實現高度的實時同步。另一方面,區塊鏈平臺上的信息共享需要全網客戶端參與,同樣具有一定的延時特性。而突發事件的輿情信息通常需要在較短時間內搜集完成,如何解決延時問題,也是現有技術需要突破的方向。
第三、資源浪費問題。面向輿情數據多源化的區塊鏈保障機制需要輿情信息提供者與使用者都存儲整個輿情數據的交互賬簿,對輿情信息的存儲具有較高的規定。在這個過程中,重復的輿情數據存儲會造成一定的存儲資源浪費。在輿情數據交互中進行數據加密、哈希運算等也需要大量的算力,相對中心化結構而言,基于區塊鏈的這類應用又對計算資源增加了需求。
這些挑戰是區塊鏈技術應用于網絡輿情研究時,需要考量和突破的技術方向,這些需要學界和業界共同推進。