劉嘉欣 陳戲墨 柯家海
(廣州醫科大學信息與現代教育技術中心 廣東省廣州市 511483)
大數據時代,數據挖掘、人工智能等技術的快速發展,對社會各領域產生深刻影響。高校統戰工作順應技術發展的形式逐漸實現信息化已經是大勢所趨。高校統戰工作是全黨統一戰線工作的重要組成部分,也是高校黨建工作的重要內容。新時代下,高校統戰工作面臨著新使命、新機遇和新挑戰。大數據技術以其數據總量巨大、數據種類繁多、數據處理速度快等特點,其多樣性、關聯性、包容性等方面的優勢,為高校統戰工作信息化建設提供了廣闊的平臺。鑒于此,本研究立足于高校統戰工作,探索基于大數據技術的高校統戰工作信息化平臺的建設,對擴展高校統戰工作范圍、提升高校統戰工作影響力與成效,具有重要的理論意義與指導實踐的價值。
統一戰線工作是黨的事業取得勝利的重要法寶。高校統戰工作是黨的統戰工作的重中之重,也是高校黨建工作的重要內容。高校統戰工作的第一要務是做好黨外知識分子的團結工作[1]。新形勢下高校統戰工作范圍和對象主要是高校黨外知識分子,包括民主黨派成員,無黨派人士,出國和歸國留學人員,少數民族師生,在高校工作和學習的港澳同胞、臺灣同胞和華僑、歸僑及僑眷等[2]。高校統戰工作范圍廣、任務重、工作性質綜合性強,承擔著民主黨派和無黨派人士工作、黨外知識分子工作、民族工作、港澳臺僑海外統一戰線工作、黨外代表人士隊伍建設等方面的任務,在黨的統一戰線事業中具有特殊的地位和作用[3]。
進入新時代,高校統戰工作呈現出統戰對象多元化、統戰手段與方式多樣化、統戰環境復雜化等新特點[3]。為適應新時代日益增長的高校統戰工作需求,目前已有較多學者對新時代高校統戰工作方式進行相關研究。新時代高校統戰工作的主要方式包括:信息宣傳;主題教育培訓以及意識形態教育;支持建言獻策,參政議政,提供在線訪談、意見征集等形式的交流活動;建立資料動態管理檔案;樹立“大統戰”思維,共享平臺資源等。
當前高校統戰工作信息化建設的研究主要涉及兩個方面:一是探討新技術在高校統戰工作中的意義與應用。張澤天[4]認為互聯網與高校統戰工作進行深度融合,是高校統戰工作創新的內在需要。孫鵬等人[5]探討了大數據時代高校統戰工作的有效路徑,認為大數據技術為高校統戰工作搭建便捷的網絡平臺。陶儀聲等人[6]認為人工智能等技術可促進統戰工作的數據整理工作,并可通過對人物畫像等手段預測統戰對象的行為動態,提升統戰工作的針對性。二是探討現階段高校統戰工作信息系統建設存在的問題。劉娟等人[7]提出高校統戰工作信息化存在的問題主要是忽視對統戰網站的管理;缺乏信息服務意識;無法實現信息資源共享。李江濱等人[8]對42所一流大學建設高校的統戰宣傳網站進行調研,發現普遍存在宣傳方式單一、內容單薄、缺乏趣味性等問題。大部分高校的統戰宣傳缺乏交流,只是單向的信息傳輸,缺乏互動和反饋。
綜上所述,目前很少有學者根據高校統戰工作的業務特點和工作需求,探討高校統戰工作信息化平臺的建設。而且當前的建設普遍存在交互性差、功能少、使用率低等問題,已經無法滿足新時代下高校統戰工作的需求。
鑒于此,本研究順應時代與技術的潮流,根據新時代高校統戰工作的業務內容與特點,探索高校統戰工作平臺的信息化建設,試圖基于大數據技術對高校統戰工作平臺進行設計,以滿足新時代高校統戰工作需求。
關于大數據目前尚無統一的定義。維基百科對大數據的定義是:利用常用軟件工具捕獲、管理和處理數據所耗時間超過可容忍時間的數據集[9]。相較于傳統數據,業界普遍認為大數據具有5V 特征:海量性(Volume)、多樣性(Variety)、高速性(Velocity)、價值性(Value)、真實性(Veracity)。[10]海量性是指數據量巨大,規模達到TB 級及PB 級。多樣性是指數據格式與類型繁多。高速性是指數據創建、處理和分析的速度快。價值性指大數據的價值密度低。真實性是數據的準確性和可信賴度,即數據的質量。
大數據技術是指從海量不同類型的數據中,快速獲得有價值信息的能力。大數據處理的基本流程包括數據抽取與集成、數據分析以及數據解釋。[9]首先,對數據源的數據進行采集、抽取、清洗,從中提取出關系和實體、經過關聯與聚合等算法計算后采用統一定義的結構來存儲這些數據。[9]接著,實現對數據的深加工。根據業務需要,建立適用于業務的數據統計分析模型,建立大數據運行處理平臺,運用數據挖掘、深度學習等算法從生產數據集中挖掘出數據內在的價值,為業務系統提供數據和決策支持。
大數據是對巨量的數據進行分布式的數據挖據,需要依托云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術等,以有效并快速地處理大量的容忍經過時間內的數據。大數據的核心技術,一般包含了數據庫采集工具,基于MPP 架構的大規模并行處理數據庫、互聯網與云計算平臺、分布式文件系統等。Hadoop 憑其開源性、高容錯性、高拓展性、以及高擴展性的優點,成為了目前最為流行的大數據處理平臺。[9]Hadoop 為大數據的處理提供了并行計算的框架,包括提供存儲的分布式文件系統HDFS 并行計算模型以提供計算框架的MapReduce 編程模型。[10]Hadoop 是一個開源的大數據分析軟件,目前被廣泛認可適合應用于大數據存儲和大數據分析。

圖1:基于大數據的高校統戰工作平臺系統架構

圖2:高校統戰工作平臺大數據處理流程
大數據技術通過對高校統戰對象在線行為的數據采集與挖據,從海量數據中提取出政策制定者、管理人員、研究員認為有價值與有需求的數據流,瞬間實現統計分析、輿情預警、決策支持等功能,用于高校統戰工作的管理與服務、發展與創新。大數據技術對高校統戰工作的支持具體體現在以下三個方面:
3.2.1 大數據技術支持科學的決策管理
大數據技術對大規模數據進行采集、挖掘、清洗,經過各種算法與模型的計算分析,最后以可視化的方式將科學且有效的數據呈現出來。統戰部門在制定政策和規范時,依靠大數據進行統計分析,可以減少因缺少數據支撐而帶來的偏差,提高決策的科學性。
3.2.2 大數據技術支持精準的輿情預警
大數據技術能把數學算法運用到海量的數據上來發現以往難以察覺的事物運行規律,并據此預測可能發生的事情。統戰部門可以追蹤到統戰對象的基本狀況、思想動態、關注焦點以及意見建議,對其思想狀況、立場傾向等進行分析,針對異常現象構建輿情預警及應急處理機制。
3.2.3 大數據技術支持個性化的資源推薦
大數據技術對在線行為進行數據挖掘、分析,構建人物特征模型,采用人物特征和資源庫特征相互匹配的方法實現信息資源的個性化推送。統戰部門可以給統戰對象推送個性化的宣傳信息與教育資源,有針對性地開展思想政治工作。
基于上述大數據技術,結合高校統戰工作的業務內容與特點,本研究設計了基于大數據的高校統戰工作平臺架構。該架構設計采用經典三層架構:表現層、業務邏輯層和數據訪問層,目的是提高各模塊的內聚程度,減少各模塊單元之間的耦合性,增強平臺系統的可維護性和擴展性,如圖1所示。
4.1.1 表現層
其主要是展示平臺系統界面,實現用戶界面功能,將用戶的需求傳達和反饋。該平臺系統界面展示支持多語種界面切換的需求,呈現了平臺的主要功能,包括門戶網站、互動論壇、在線講堂等功能。
4.1.2 業務邏輯層
其主要功能是對具體問題進行邏輯判斷與執行操作,完成所有業務邏輯的處理。根據技術范疇的不同,各項業務邏輯可分為兩大類:基礎業務服務,提供諸如用戶管理、文件管理、數據統計等功能;大數據服務,為平臺提供大數據分析能力,提供如大數據分析、預警提示、個性化資源推薦等功能。
4.1.3 數據訪問層
其主要功能是負責數據庫的訪問,對數據庫完成增加、刪除、修改、查詢操作。該層主要包括用戶庫、業務庫、文件庫、互聯網數據、統戰對象模型庫等。其中,模型參數庫中存儲了所有統戰對象的模型,用于個性化資源推薦。
為了滿足新時代高校統戰工作的業務需求,本研究基于大數據技術,從宣傳、社交、學習、服務、綜合管理五大方面對高校統戰工作平臺的功能模塊進行設計。主要功能包括了門戶網站,個人中心,互動論壇,在線課堂,在線意見箱,資源個性化推薦、統計分析,預警提示。
門戶網站是提供信息宣傳與綜合服務的界面,集成了平臺的主要功能,主要用于發布高校統戰工作的宣傳內容,包括政策、理論研究、信息動態、工作通知、統戰新聞等黨務政務信息。
個人中心是統戰對象個人檔案管理中心,可修改、存儲個人信息資料,記錄個人使用平臺的動態,提供平臺相關應用的快捷入口。
互動論壇要是為統戰工作者與統戰對象搭建一個溝通交流的平臺,統戰工作者可以在論壇組織線上聯誼活動,發布在線訪談、網絡調查等。統戰對象也在可以在論壇發布主題討論。
在線講堂主要用于開展教育培訓工作,對統戰對象進行主題教育培訓以及意識形態教育。統戰工作者可以在該模塊建立在線課程,發布微視頻供統戰對象在線學習。
在線意見箱是供統戰對象建言獻策、參政議政的渠道。統戰對象可以提交建議和意見,參與政治活動。這有利于提高統戰對象的政治參與度。
資源個性化推薦是通過大數據、人物畫像等技術,向統戰對象提供高效的、富有針對性的個性化資源。資源的形式是多樣化的,包括文檔、視頻等。個性化的資源推送服務不僅可以提高資源的利用率,也可以提高統戰工作的成效。
統計分析與預警提示是對統戰對象在線行為進行統計,通過運用相關模型算法計算,對數據進行分析,結果用可視化的方式呈現出來。同時,通過設置預警參數,當數據出現異常便給管理員相關的提示。
鑒于上述大數據的關鍵技術,本研究對高校統戰工作平臺的大數據處理流程進行了設計。該處理流程共四個環節,包括了數據源、數據處理與存儲、數據建模與挖掘、數據應用,如圖2所示。
高校統戰工作平臺的數據源于兩方面,一方面是內部數據,即來源于高校統戰工作平臺產生的數據,一方面是外部互聯網的數據,即通過網絡爬蟲引擎抓取數據,再通過關鍵詞過濾等操作進行篩選和分析,從而實現從互聯網上獲取數據。在數據處理與存儲環節,對采集到的原始數據進行數據清晰、數據關聯、數據加工與數據轉換等操作,形成了可用于生產系統的數據,比如元數據、業務數據庫等,以Hadoop 分布式存儲的方式存儲在數據倉庫里。在數據建模與挖掘環節里,通過計算引擎與存儲引擎進行數據挖掘、算法分析。根據高校統戰工作平臺的需求確定建模方式,通過不斷測試來調整、優化模型,確定最優的算法模型庫。在數據應用環節,結合高校統戰工作的需求,提供可視化統計報表、智能預警方案、資源個性化推送等數據服務。
本研究設計的基于大數據的高校統戰工作平臺有助于推動高校創新統戰工作方式,提高高校統戰工作的科學性與實效性。同時,大數據技術也為高校工作帶來了挑戰。基于大數據的高校統戰工作平臺存儲了大量個人信息數據,涉及個人信息隱私,未來,要加強對平臺的安全維護工作,探索系統的安全保護措施;也要避免成為數據孤島,探索多端口對接技術,以實現與校內其他系統的數據互聯互通,與其他高校統戰工作平臺的資源共享。