徐婧欣 郭 豐 蘇 鵬
(1.中國政法大學商學院 北京 100088;2.北京大學信息管理系 北京 100871;3.中國信息通信研究院 北京 100191)
數據分類分級政策是信息化時代的研究熱點,是開展數據治理及信息資源管理的關鍵環節,也是國際規則博弈中的戰略制高點,其在數據流通、數據安全、數據共享等方面發揮著重要作用。近年來,“數據分類分級”在國家政策中被頻繁提及,我國的“十三五”和“十四五”規劃都突出了數據分類分級的重要性[1-2]。2020年頒布的《中共中央 國務院關于構建更加完善的要素市場化配置體制機制的意見》首次將“數據”納入生產要素,并且提出要完善適用于大數據環境的數據分類分級安全保護制度[3]。要使數據發揮出最大生產力,就必須開展數據治理工作,而數據分類分級是一切數據資源管理的基礎,因此制定統一可行的數據分類分級制度迫在眉睫[4]。同時,針對數據分類分級的研究也日益受到學術界的關注。例如,完顏鄧鄧等調查分析了國外政府數據分類分級授權協議的應用情況[5];趙潤娣調查分析了國內8個開放政府數據平臺教育主題數據資源的分類分級狀況[6]90-100;洪延青從國家安全的角度闡述了數據分類分級保護制度[7];張勇在數據分類分級的基礎上,對數據犯罪進行了罪質界定和罪量評價,并對數據安全保護的關聯罪名予以界分[8]17-27;鄭曦探究了刑法領域的數據分類分級框架[9]3-16。以上研究有利于推動我國數據分類分級政策的制定和完善。不過,現有研究多局限于法學視角和技術視角,并沒有對我國已出臺的數據分類分級政策文本進行分析?;诖耍P者選擇我國已出臺的數據分類分級政策文本為研究對象,分析其外部特征及文本內容,并討論其演化趨勢,此研究對完善我國數據分類分級政策具有一定現實意義。
數據分類分級由“數據”“分類”“分級”三個概念組合而成。其中,數據(data)是信息(information)的載體。目前,學界對“數據”的定義主要有兩種,一是指對客觀事物的記錄和描述[10-11],二是指所有能輸入計算機并被計算機程序處理的數字、字母、文字、聲音、圖像等符號的總稱[12-13],本研究中的“數據”是基于第二個定義展開。數據分類分級包含數據分類和數據分級兩方面內容,相關部門和學界通常將其合并使用,但是兩者在概念界定方面存在一定差異。數據分類是指按照數據的內容、來源等屬性進行劃分和歸類[9]3-16,而數據分級是指按照一定的定級標準對數據進行層級劃分[8]17-27。目前,學者們對于數據分類分級的關注度尚不高,現有研究沒有對數據分類分級的概念進行統一的學術層面的界定[6]90-100,[14]。國家相關部門也沒有在已出臺的數據分類分級政策文件中對其概念進行界定,僅提出了數據分類維度和分級規則[15-18]。綜上所述,文章將數據分類分級的概念界定為執行數據分類分級的責任主體對組織內部的電子數據進行全面梳理,形成數據清單,按照國家和行業的分類分級要求,同時結合自身實際需求,對數據類別進行細化,判定數據安全級別的工作。
(Inducement)、能力建設式(Capacity-building)和機制變革式(System-Changing)4種類型的政策工具[23]。這種分類方法是較為全面、多維的[24],進一步突出了政府在推行政策時是以激勵為主要手段促進政策落地,還是以命令等方式強制推行[25]99-113。探究這種分類模式下的政策工具演化可更加鮮明地突出我國各級政府在推行數據分類分級政策時的力度,并進一步驗證該政策發展所處的階段。筆者通過分析我國數據分類分級政策文本和借鑒其他學者[26-32]的分類標準,討論細化了具體的工具名稱(如表2所示)。

表2 具體政策工具的含義
1.2.1 層級擴散及關聯演化
公共政策層級性擴散模式可依據政策行動主體的不同分為自上而下的層級擴散模式、自下而上的層級擴散模式、同一層級的區域或部門間擴散模式和不用發展水平區域間政策跟進擴展模式[19]。層級擴散演化可以剖析某一政策在各層級政府實施過程中的效力大小及受關注程度。層級關聯演化可以深入挖掘各層級政府在不同階段的各項特征及演化趨勢[20]87-106。本研究根據數據分類分級政策的發文機構,將其層級劃分為國家級、省級和市級,其中國家級指人民代表大會、國務院及其部委機關等;省級指省、直轄市、自治區人民政府及其各部門、各直屬機構等;市級指直轄市各區、地級市人民政府及其各部門、各直屬機構等(如表1所示)。

表1 發文機構層級界定的示例
1.2.2 政策工具關聯演化
政策工具是政府為達成既定政策目標而使用的方法和手段[21]。政策工具關聯演化可以揭示不同層級政府在不同時期對于某項政策的手段、力度、側重點以及發展趨勢。目前,學術界針對政策分析的不同目的,將政策工具劃分為不同類型,但不同分類之間也有一定的交叉和重合。結合現有數據分類分級政策文本的內容,本研究采用了McDonnell[22]提出的權威式(Mandate)、激勵式
1.2.3 應用領域演化
應用領域演化是政策文本的核心內容,也是政策演化研究關注的重點[20]87-106。剖析政策應用領域演化,可以厘清政策發展的脈絡及擴散趨勢,并確定該政策的先發應用領域。根據既往研究[33-37],結合數據分類分級政策文本的實際情況,筆者將該政策的應用領域劃分為18個,其中未提及領域是指在政策文本中沒有提及特定領域的數據,其他應用領域的具體分類情況詳見表3。

表3 應用領域的含義
筆者選取“Wolters Kluwer法律信息庫”作為政策文本的數據來源[38]18-30。該信息庫是我國首個本土化法律信息數據庫,收錄了自1949年至今的中央政府及各地級市政府的法律法規,是目前我國時效性最強的法律信息數據庫。
由于在政策文本中有“數據分類分級”和“數據分級分類”兩種表述,故筆者采集數據時構建了兩個檢索式:①“數據 分類分級” ~ 5;②“數據 分級分類”~5。搜索范圍限定為“全文”,發布時間限定為“2001年1月1日—2021年12月31日”,時效性限定為“現行有效”,檢索時間為2022年1月1日。去除重復的政策文本后,筆者共計獲得有效樣本327份。為盡可能查全相關政策文本,筆者又針對國家和省級政府的門戶網站進行了二次檢索,但未獲得新的政策文本,由此可以說已采集的數據基本涵蓋了當前的數據分類分級政策。
數據采集完成后,經人工剔除與數據分級分類不相干的政策文本,并剔除已出臺正式文件的“征求意見稿”后,共獲得有關“數據分類分級”的254份有效政策文本(如表4所示)。

表4 數據分類分級政策文本(部分)
筆者對 254份數據分類分級政策進行了數理統計和人工編碼,并分析了數據分類分級政策的外部特征及文本內容,用以討論其演化趨勢。編碼程序具體如下:
第一,研究者共同討論確定人工編碼規則[39]。首先,根據政策發文機構的級別將其劃分為3個層級,分別是國家級、省級和市級(詳見表1)。其次,將政策文本中分類分級的數據進行匯總歸納,按應用領域進行劃分,本研究的數據應用領域共計18個(詳見表2)。最后,依據數據分類分級政策文本內容和其他學者的分類標準,討論并細化具體的工具名稱(詳見表3)。
第二,研究者根據已確定的編碼規則分別展開編碼,并根據編碼結果進行一致性討論[40-41]。對于界定范圍不明確或不同編碼人有歧義的內容,再征求相關領域專家意見,最終形成數據分類分級政策文本的內容分析編碼結果。
第三,研究者對編碼結果進行統計和分析[42]。采用數據可視化來分析數據分類分級政策文本的外部特征及其文本內容的演化趨勢。
依據政策發布數量來劃分政策發展階段,可以揭示政策的發展規律以及政府對于該政策的推行力度,有助于剖析政策各階段的主要特征,預測政策未來的發展趨勢[43-44]。以我國數據分類分級政策數量變化及相關事件與背景等為時間節點(如圖1所示),本研究選擇2001年、2010年、2015年三個重要時間節點,將我國數據分類分級政策的演化歷程劃分為3個階段[45]。

圖1 數據分類分級政策發布情況變化趨勢
第一階段,政策發展起步期(2001—2009年)。在數據分類分級政策方面,可追溯的最早政策文本是《重慶市人民政府關于印發重慶市電子商務發展綱要和數字重慶地理信息系統發展綱要的通知》,提出了數據安全、數據共享等理念,這標志著我國數據分類分級政策發展步入起步期。
第二階段,政策發展調整期(2010—2014年)。在這5年之間,涉及數據分類分級政策文本的發文量較少,這符合政策發展規律及數據治理的時代背景,也意味著我國出臺數據分類分級政策在總體上比較審慎。在此期間,雖然發布的政策數量較少,但各級政府一直在進行積極探索,為數據分類分級政策發展儲備理論、技術、人才等。
第三階段,政策發展加速期(2015年至今)。2015年后,數據分類分級政策的數量再次呈上漲態勢,并逐步在更多領域得到實施應用,掀起了我國數據分類分級政策出臺的高潮。國家“十三五”規劃和“十四五”規劃先后提及數據分類分級,數據安全法中也有涉及數據分類分級的相關內容[1-2,46],這標志著數據分類分級工作越發受到相關部門的重視。
3.2.1 層級擴散演化分析:基層政府推動力不足
各級政府出臺數據分類分級政策的情況體現了我國數據分類分級政策的發展走向、各級政府對政策的響應程度以及政策的演化特征[20]87-106。本研究將政策發布機構劃分為三個層級,分別為國家級、省級和市級,各級政府的數據分類分級政策發布情況如圖2所示。

圖2 各級政府數據分類分級政策發布情況
在政策發展起步期,數據分類分級政策最先由省級政府發布,再分別自下而上、自上而下地向國家級、市級政府進行層級擴散。其中自上而下的層級擴散較為突出,各市級政府積極響應,在信息治理、數據治理等方面不斷涌現新的增長點[47]。在政策發展調整期,各級政府的發文數量均較少,層級擴散趨勢不甚明朗。在政策發展加速期,各級政府的發文數量均呈加速上升態勢。其中中央政府先后在“十三五”規劃和“十四五”規劃中提及數據分類分級,并出臺了有關數據分類分級的政策,從宏觀和微觀兩個層面重點推進數據分類分級工作,有關數據分類分級政策的具體制度、標準、細則等數量逐年提升,再次掀起數字化治理的浪潮[48]。這一階段的政策多由中央政府自上而下地向省級和市級政府進行層級擴散,但層級擴散剛開始時地方政府尚能積極響應,到了后期其響應積極性逐年降低,致使基層政府推動力不足。導致這一現象產生的主要原因是地方政府僅對中央政府的發文進行轉發及解讀,并沒有很好地結合自身特點進行融合創新,同時,地方政府也缺乏數據分類分級所需的高端技術及人才等。
3.2.2 政策工具關聯演化分析:政策工具使用不平衡
政策工具是政府用來實施某種政策[49],達成既定政策目標所采用的方法和手段[50]。政策工具在不同層級政府和政策發展不同階段的轉化情況可以反映出該項政策能否落實,以及是否朝著健康的方向發展[20]87-106。筆者通過對我國數據分類分級政策工具“層級—階段”關聯演化特征進行分析(如圖3所示),發現其有明顯的“層級演化性”“階段演化性”“層級—階段關聯性”等規律特征[20]87-106。

圖3 政策工具“層級—階段”關聯演化特征
數據分類分級政策工具的階段演化是由單一的權威式和能力建設式政策工具向多樣化的政策工具類型延伸,由構建數據分類分級所需的基礎設施,依靠強制力推行政策實施不斷向激勵引導或鼓勵政策自發落實演變,從多角度豐富數據分類分級政策的方法及手段。數據分類分級政策的層級演化是由中央政府自上而下地向地方政府擴散,地方政府在國家級政策工具的基礎上再演化延伸并進行一定的創新。
從數據分類分級整體的“層級—階段”關聯演化來看,我國的政策工具類型雖然在政策發展加速期得到了一定的拓展,但目前仍集中在權威式和能力建設式兩種類型,對于激勵及機制變革式政策工具的使用較少,在數據分類分級政策工具的使用方面不平衡。這意味著我國數據分類分級政策發展仍處于初級階段,對于政策工具的使用還在不斷探索,數據治理缺乏系統性。此外,對激勵式和機制變革式政策工具使用較少,說明目前我國數據分類分級沒有細化部門職責,缺乏政策落實的后續拉力,導致出現政策推行難、落實難、實施難等問題。
3.2.3 應用領域演化分析:營利類數據應用難度大
應用領域是政策演化的核心內容[25]99-113,也是政策演化研究者關注的重點[51]。對應用領域進行研究分析,可以有效地梳理出數據分類分級政策的發展趨勢及其關注點[38]18-30。我國現有的數據分類分級政策文本所涉及的應用領域共計18個(詳見表3),本研究主要從時間維度對其進行分析,總結我國數據分類分級政策應用領域的演化趨勢(如圖4所示)。

圖4 數據分類分級政策應用領域發布情況
數據分類分級的先發領域為科學和安全兩大主題,因為科學界最早關注數據分類分級,認為對科學數據進行分類分級管理有利于鏈接國家科技數據和開展信息交換[52-53]。相較而言,安全領域發布的數據分類分級政策數量更多,這反映了當時的數據治理更關注安全、應急管理等[54-55]。隨后,數據分類分級政策開始向其他領域擴散,正式進入多領域爭鳴時代。從現有的應用領域來看,該政策主要集中于政務、醫療、工業等公共數據和非營利數據,關于商業等營利性質的數據較少,這說明我國的數據分類分級政策仍停留在收集處理較為容易的公共數據和非營利數據,而對商業競爭等營利數據進行數據分類分級管理的難度較大。因此,我國需要不斷完善數據分類分級的相關技術、制度等。
隨著海量數據的爆發式增長和信息技術的發展,以及網絡空間治理和數據治理的不斷推進,相關領域對于數據分類分級處理的能力要求也越來越高。由于政策發展起步期的需求大多停留在戰略等宏觀層面,應用領域也主要集中在一些數據流動小、容易收集、易于管理的安全和科學領域,對于數據分類分級底層技術的要求較低。因此,地方政府在該階段熱衷于出臺一些數據分類分級政策,具有一定的先進性。在政策發展加速期,隨著分類分級規則、具體操作方式等微觀層面逐步細化,應用領域不斷擴大,數據管理難度增大,對技術的要求也會不斷提升。因此,國家級政府和地方政府在同一政策實施過程中出現兩極分化是不可避免的。
為了應對基層政府推動力不足的問題,我國需要加大地方政府在數據分類分級相關技術、資金、人才等方面的投入,提升其積極參與數據治理的能力。首先,中央各部門應按要求制定數據分類分級的詳細規則,設計并建設數據分類分級的平臺、基礎設施等,將其下發給地方政府,使各地可以在國家標準的基礎上,按自身發展特色進行完善創新,保持與中央高度相近的技術層級。同時,中央還應為地方政府開展數據分類分級的培訓活動,保障其技術的更迭速度,做到與時俱進。其次,應向地方政府劃撥專項資金,明確該項資金僅用于數據分類分級的技術擴展及專項人才引進,使地方政府具備高素質的專項人才和技術能力。最后,鼓勵地方政府積極參與數據治理工作。雖然國家需要統一的數據治理、數據分類分級標準,但是地方政府在處理數據時也應遵循具體問題具體分析的原則。因此,國家需要激發地方政府參與建設數據分類分級的積極性,以此保障我國數據分類分級政策的長久高效精準實施。
當前,我國數據分類分級政策階段和層級在不斷演化,政策工具日益豐富,但是仍較少使用激勵和機制變革式政策工具。政策工具類型對政策實施起著重要作用,每個類型的政策工具都有其自身獨特的優勢和劣勢。為了實現數據分類分級能力的有效提高與數據治理的可持續發展,政府應優化政策工具體系,使其具備多樣化特征,以全方位推動數據分類分級政策的實施。
針對現有政策工具使用不平衡的問題,我國應有針對性地豐富政策工具的使用類型。首先,在國家級的數據分類分級政策中,應增加激勵式政策工具,可以從正向激勵和負向激勵兩個角度引導或鼓勵政策實施主體開展數據分類分級工作。同時,增加機制變革式政策工具,可以采用機構設立、部門協調、職責分工等方式細化并明確負責數據分類分級的主體或部門,將其責任單獨劃分出來,提高政策落實的成效。其次,在優化國家級政策工具體系的基礎上,將政策工具類型自上而下地向各級地方政府擴散,使各級政府的政策工具體系均具備多樣性、完備性等特點。最后,不斷強化政策落實拉力。在政策初期,采用權威式和能力建設式政策工具能在一定程度上提升政策推行的力度和強度,但隨著政策的不斷演化,僅采用強制性措施無法保證政策落實的效果,還需要配合使用具有激勵性質的政策工具,為政策落實提供一定的拉力,助力政策實施主體認真并自愿進行數據分類分級工作。
在數據爆炸時代,要高效實現對海量數據的分類分級,數據收集能力是關鍵。我國提出數據分類分級的首要目的是保障數據的安全和共享開放,因此當前數據分類分級的應用領域集中在公共數據和非營利數據,因為這類數據不涉及資產,能相對較為容易地進行收集、管理等。在保障數據安全和共享開放的基礎上,數據分類分級還應賦予數據一定的價值,使一些數據在限定條件下實現資產化,并將其擴展到營利數據應用中,這是數字經濟環境下的必然趨勢。
為了解決當前營利數據應用難的問題,我國首先應發展數據收集能力,提升數據資源管理利用成效,這需要相關主體在底層數據平臺設計算法、數據庫硬件軟件運行以及數據挖掘處理等方面進行創新,發展數據收集處理能力。因為只有具備較高的數據處理能力才可以保障在遵循法律法規、人文倫理、商業道德等基礎上進行數據處理活動,并將其應用于營利數據領域。因此,注重營利數據分類分級有助于數據依法有序自由流動,促進以數據為關鍵要素的數字經濟不斷發展。
數據分類分級是我國網絡空間治理、信息治理、數據治理的基礎,自提出以來就備受各行各業的關注。筆者認為,從已有的政策文本出發進行政策演化分析,可以較為客觀地梳理出當前該項政策的發展趨勢和問題,有助于向政策制定者提供后續改進建議,使得數據分類分級政策更加系統化,網絡空間治理更加有效,進而推動我國充分管理和利用數據,使其發揮出最大生產力,構建持續穩定高效的數據市場。
我國數據分類分級政策主要有政策發展起步期、調整期和加速期三個階段。筆者經研究發現當前地方政府對數據分類分級政策的后續管理較為乏力,對現有文獻的政策工具使用不平衡,激勵及機制變革工具使用較少,主要應用領域集中在公共數據和非營利數據,對營利數據的應用難度較大等問題。綜上所述,我國數據分類分級仍處于初級階段,存在較大發展空間,如何優化實施數據分類分級政策是新階段亟待業界深入探究的重要課題。