劉邦凡,臧梓健
(燕山大學,河北 秦皇島 066004)
在當今時代,各種數據迅速生成、匯集,數據規模呈現爆炸式增長態勢,但在數據的流動與共享中稍有不慎就會引起數據泄露。我國政府不斷提高對國家安全問題的重視程度,把握一切機會積極探索和開展國家數據安全治理相關工作,頒布實行了一系列制度條例。
目前,數據安全治理領域的理論研究主要側重于數據安全治理單一方面的研究,如防護技術、系統構建等,缺乏整體的頂層設計和對政府行為的討論。鑒于此,選取中國知網(China National Knowledge Infrastructure,CNKI)數據庫收錄的國內有關數據安全治理的研究文獻,運用CiteSpace 軟件對其進行量化分析,借助知識圖譜梳理該領域的演化路徑和研究態勢,以期加深對數據安全治理的理解。
為了精準、科學地把握我國數據安全治理研究的演進歷程和前沿熱點,本文將CNKI 數據庫中的期刊論文作為數據樣本,年際跨度設為2015—2020年,并以“主題”為檢索項,“數據安全治理”為檢索詞,得到了425 條檢索結果,最終獲取有效相關文獻共401 篇。
CiteSpace 軟件通過進行文獻計量分析,探尋特定學科領域的演化路徑和知識拐點,并以知識圖譜的形式形成對學科未來發展的認識[1]。本文運用CiteSpace 軟件進行特征詞分析,對作者、機構、發文期刊、高被引文獻進行梳理,凸顯研究現狀。此外,本文通過分析高頻關鍵詞及其時區的知識圖譜辨析國內數據安全治理的未來研究熱點和演進趨勢。
本文統計了CNKI 數據庫2015—2020 年間國內有關數據安全治理研究的發文數量,其結果如圖1所示。具體地,數據安全治理正在獲得學者們的廣泛關注。究其根源,可能與目前我國專家學者對大數據時代下公共安全治理的持續關注和反思有關。

圖1 CNKI 數據安全治理領域的論文數量分布
2.2.1 作者分析
通過對發文作者及其合作網絡的分析,能夠了解該領域的核心作者及其團隊合作情況。根據普賴斯定律,核心作者發文數計算公式為:

式中:Nmax為2015—2020 年國內數據安全治理領域發文最多作者的論文數。已知最高產者為趙志遠、呂欣,發文4 篇。求得M=1.498,即核心作者最低發文量為1.498 篇,取整后,將發文在2 篇及以上的人視為核心作者。
經統計,2015—2020 年國內數據安全治理領域研究者共177 人(含論文第2、3、4 作者),其中,核心作者32 人,占總人數的18.07%。核心作者共發文69 篇,占總發文量的17.2%。但是在核心作者中,只有趙志遠(4篇)、呂欣(4篇)、王超(3篇)發文量超過2篇,其他29 位學者發文均為2 篇,這也從側面體現出我國數據安全治理領域的研究力量比較薄弱。另外,普賴斯理論提到核心作者的發文量大約占到總數量一半時才存在核心作者群,但17.2%遠低于50%,所以從嚴格意義上講我國數據安全治理領域的核心作者群還未形成。
通過CiteSpace 軟件生成作者及其合作網絡知識圖譜,如圖2 所示。其中,共現節點數量為178,連線數量為68,網絡密度為0.004 3。由以上3 方面大致可看出國內研究數據安全治理的人數雖多,但是相互之間缺乏聯系,合作網絡結構較分散,以致出現了多個作者群。

圖2 國內數據安全治理領域研究作者及其合作網絡
2.2.2 機構分析
從發文量看,蘭州大學管理學院發文最多,頻率達到6 次;其次是國家信息中心和中國信息安全測評中心,分別為5 次和4 次;發文頻率達到3 次的機構有中國電子信息產業發展研究院、上海社會科學院新聞研究所、上海社會科學院信息研究所。
從機構合作關系看,多數機構存在獨立發文或機構內跨部門合作的情況,跨院校的合作僅占據少部分,典型的例如華中科技大學輿情信息研究中心、北京大學政府管理學院、中國人民大學公共管理學院、中山大學政治與公共事務管理學院、華東理工大學社會與管理學院、北京師范大學政府管理學院之間的合作。
2.2.3 期刊分析
經主題詞檢索、人工篩選后共計論文401 篇,分屬于261 種期刊。首先在發文量排名前30 的期刊中,屬于中國社會科學引文索引(Chinese Social Sciences Citation Index,CSSCI)或北大核心期刊的有10 種,占比達30%,且以上權威期刊共刊發文獻36篇。其次從期刊類型看,信息科技類期刊發文數量居多,如發文最多的《中國信息安全》有29 篇、《信息安全與通信保密》11篇、《網絡安全和信息化》6篇、《中國新通信》4 篇等。最后對全部數據進行匯總,發現高發文量的期刊多分布于信息科技學、管理學等與數據安全治理研究有緊密關聯的學科領域。
2.2.4 高被引文獻分析
高被引文獻是某個學科領域的知識源流,是探索研究熱點的重要依據。對國內數據安全治理領域排名前10 的高被引文獻進行統計,被引頻次最高的文獻是《探索激勵相容的個人數據治理之道——中國個人信息保護法的立法方向》,被引頻次為249,主要內容是從風險管理角度切入,借鑒歐美國家發展經驗,推動激勵相容的數據安全治理體系的建立與實現。通過分析文獻可知,我國數據安全治理領域的多元化研究方向。
關鍵詞是論文內容的提煉。在學術研究領域,一定時段內研究成果的關鍵詞集合能夠反映出該領域研究成果的整體特征、研究內部之間的關系以及研究的發展脈絡等[2]。本文對整理的401 篇文獻進行關鍵詞詞頻分析得到表1,其中由高到低排序依次為大數據(120)、數據安全(97)、數據治理(87)、安全治理(28)、網絡安全(27)等。另外,根據中介中心性指標排序,關鍵詞聯系最為緊密的是大數據(0.44),剩下的依次為數據安全(0.42)、數據治理(0.25)、安全治理(0.25)、網絡安全(0.24)、大數據時代(0.12)、數據資源(0.11)、大數據安全(0.11)、大數據技術(0.1)等。

表1 我國數據安全治理研究前20 個高頻關鍵詞
為進一步了解數據安全治理研究熱點的知識結構,本文進行關鍵詞聚類分析。在CiteSpace 軟件中設置如下參數:

最終繪制出2015—2020 年間關鍵詞聚類可視圖,如圖3 所示。

圖3 數據安全治理文獻關鍵詞聚類
由圖譜可知,共有節點數量261 個;連線873條;網絡密度為0.025 7;S 值=0.805 1(大于0.7),說明此聚類視圖效果較好。整體來講是令人信服且合理的。從圖3 來看,基本形成了#0 數據安全、#1 大數據、#2 信息安全、#3 專項治理、#4 數據治理、#5 安全治理、#6 網絡空間治理、#7 大數據時代8 個聚類群。本文將圍繞以上聚類展開。
3.2.1 數據安全現狀研究
國內對數據安全現狀研究主要從兩方面展開:一是我國的數據主權及安全處于嚴峻局面,由于掌控數據的能力較弱并缺乏核心技術,所以我國時刻受到西方數據強國的干預;二是傳統設備和防護技術難以適應大量半結構化數據資源的生成,并且在數據資源產生、傳輸、處理過程中存在可行性、完整性等問題。沈國麟指出中國應加大對數據主權的重視程度,構建自己的國家數據戰略[3]。齊愛民認為我國政府應積極做好大數據安全防范工作[4]。可以看出,這些專家非常看重國家大數據主權安全及保護,但由于標準未得到統一界定,大數據權屬問題一直存在分歧。
3.2.2 數據安全治理體系構建研究
國內學者一致認為應該系統、規范、科學地構建數據安全治理體系。齊愛民指出要建立數據安全保障法律機制,即在探究大數據技術和產業發展基礎之上,努力找尋數據安全的法律保護路徑[4]。蔡蕙敏基于貴州省大數據應用實際情況,認為大數據安全保障體系的構建應覆蓋戰略、技術、監測預警、標準等多個方面[5]。王欣亮等人根據新時期精準治理的需求和思路,指出數據安全治理體系應該包括多元治理體系、科學預判體系、分類處置體系、動態保障體系等內容[6]。另外,嚴少敏等專家還積極推動建立數據安全治理的標準路徑,以此增強相應規則的彈性[7]。
3.2.3 數據安全防護技術研究
呂欣、韓曉露基于系統工程方法,從戰略規劃、安全運作管理、安全技術保障3 個維度提出了數據安全保障技術方案[8]。向宏通過總結當前不同的網絡安全可視化工具,指出已成熟的數據安全可視化技術能夠用于數據安全治理研究[9]。黃鐘通過分析大數據時代面臨的安全風險以及技術架構,指出應加快構建大數據安全測評框架[10]。王世晞等人基于數據全生命周期角度,提出數據收集、數據存儲、數據傳輸、數據共享、數據銷毀環節中的安全風險及防護方式[11]。
3.2.4 數據安全治理實踐應用研究
近些年,我國數據安全治理研究集中于城市治理、智慧校園、疫情防控、政府治理、以數據為核心業務的金融機構等領域,如惠志斌、李顧元指出面對突發公共衛生事件,數據安全治理機制的建立應根據應用場景實行合法的問責制,堅持透明度、保密性等原則,進行有效監管[12];陳晨、盛麗華提出了系統性的高校數據安全治理的框架模型,助力高校向“互聯網+智慧校園”的快速轉型[13]。
利用CiteSpace 軟件生成的關鍵詞時區視圖,如圖4 所示。
在圖4 中,橫軸代表具體年份,節點代表對應年份出現的關鍵詞,各節點通過交叉連線連接在一起,而這些連線表示不同關鍵詞之間的傳承關系。突顯詞是時區視圖下的產物,通過觀察突顯詞更易判斷學科領域內主題的發展態勢,抓住該領域的研究重點。

圖4 數據安全治理文獻關鍵詞時區
利用CiteSpace 軟件生成的突顯詞詞譜,如圖5 所示。在圖5 中,“Strength”表示突顯強度,“Begin”“End”表示關鍵詞突顯的起止年份,加粗部分則表示關鍵詞突顯的時間段。通過分析兩圖,發現國內數據安全治理領域的研究趨勢基本分為以下3 個階段。

圖5 數據安全治理文獻突顯詞詞譜
3.3.1 第1 階段:開創期(2015—2016)
這一階段的關鍵詞以“大數據時代”“大數據戰略”“政府治理”“大數據技術”“信息安全”等為主。該時期的研究緊跟“十三五”背景和形勢。“十三五”規劃適時地提出“實施國家大數據戰略,促進大數據發展行動”;此外,規劃中也提及“推進農業信息化建設”、“強化信息安全保障”等措施,解釋了該階段某些研究重點因何會突現。最后,為了規范數據治理的技術平臺和模型框架層面,該時期我國還制定出《數據治理白皮書》研究報告。總體而言,此階段數據安全治理研究剛起步,仍處于萌芽狀態。
3.3.2 第2 階段:發展期(2017—2018)
這一階段出現的關鍵詞主要有“公共管理”、“互聯網治理”“社會治理”“事故隱患”“公眾參與”“價值”“業務數據”“個人數據”“安全”。在這兩年間,數據泄露事件屢屢發生,數據泄露數量不斷增加,給社會帶來了不可估量的嚴重后果。為了探尋解決措施,也催生出“互聯網治理”“社會治理”領域的新變革。該時期的數據安全治理研究逐步發展,但在面對社會熱點問題上,僅進行了針對性的實踐應用探索。
3.3.3 第3 階段:深化期(2019—2020)
這一階段的關鍵詞以“個人信息”“網絡治理”“安全生產”為主。該時期的數據安全治理研究加速發展,尤其注重網絡技術與實際治理的應用結合,形成了城市治理、智慧校園、疫情防控、政府治理、金融機構領域下的研究重點,并出現了一批有代表性的研究學者,他們的研究成果很大程度上推進了數據安全治理研究的發展。此外,受到網絡強國建設的影響,“網絡治理”會是新時代下數據安全治理研究的研究熱點和研究難點。這一階段的研究成果突出,呈現欣欣向榮之態勢,順應國際發展潮流。
從整體態勢看,我國數據安全治理研究經過近幾年的發展,在發文量、機構和作者合作、多學科等方面取得了眾多研究成果,初步形成一套較為完整的數據安全治理研究體系。然而,國內數據安全治理研究仍需直面以下問題并期望得以突破。
一是從研究視角出發,致力于跨學科與多視角研究。首先,應積極吸納多知識體系進行跨學科研究。其次,應強化政府治理視角下的研究。今后國內數據安全治理研究應深入挖掘治理背后的政府因素及其作用機理。
二是從理論視角出發,未來中國的數據安全治理研究,國內學界應遵循科學研究的邏輯與本土情景。一方面,立足于我國特定的文化、制度之下,不斷提煉“真問題”,發展具有本土性的數據安全治理基礎概念。另一方面,基于本土化敘事,積極推動國內數據安全治理理論的一般化,構建具有中國特色的數據安全治理理論話語體系。