何琳,劉燕濤,任興
(1.聯通大數據有限公司,北京 100013;2.北京泰策科技有限公司,北京 100081)
在數字化政務推進的過程中,政務數據的敏感性越來越成為政務數據開放和共享過程中需要重點關注的問題。對海量政府敏感數據的分級將是政務數據工作的重點。公共數據是指各級行政機關以及具有公共管理和服務職能的事業單位在依法履行職責過程中獲得的各類數據資源[1]。公共數據分級目的在于確定各類型政務數據的敏感程度,從而為政府不同類型數據的開放程度提供參考。本方案是對浙江省某市政務數據進行數據分級設計,為政府部門在開放和共享政務數據時正確數據定級提供參考。
數據分級管理是數據安全保護場景下的必要的前提條件。《數據安全法》規定國家建立數據分類分級保護制度[2],對數據實行分級保護,數據分級工作是基礎和核心,數據分級是數據使用管理和安全防護的基礎,為數據尤其是重要數據制定分級制度并依規管理,是實現數據安全目標的重要工作。
(1)公共數據管理
公共數據基于數據目錄進行管理,各單位應將本單位的公共數據資源進行全量編目,做到目錄之外無數據[3]。公共數據目錄可分為基礎庫目錄、重點領域資源目錄、省級目錄、市級目錄、區縣目錄等類型[4]。按照公共數據目錄中的某種共同屬性或特征(包括數據對象、重要程度、共享屬性、開放屬性、應用場景等),公共數據可進一步進行區分和歸類。公共數據共享交換,最小單位為公共數據目錄的單個數據資產。數據資產進行拆分或聚合,將產生新的一個數據資產。
(2)公共數據分級體系
按照公共數據遭到破壞(包括攻擊、泄露、篡改、非法使用等)后對國家安全、社會秩序、公共利益以及公民、法人和其他組織的合法權益(受侵害客體)的危害程度對公共數據進行定級,為數據全生命周期管理的安全策略制定提供支撐[5]。公共數據分為敏感數據(L4級)、較敏感數據(L3級)、低敏感數據(L2級)、不敏感數據(L1級)。
L4級有下列情形之一:對全社會、多個行業、行業內多個組織造成嚴重影響;對單個組織的正常運作造成極其嚴重影響;對人身和財產安全、個人名譽造成嚴重損害。
L3級有下列情形之一:對全社會、多個行業、行業內多個組織造成中等程度的影響;對單個組織的正常運作造成嚴重影響;對個人名譽造成中等程度的損害。
L2級 有下列情形之一:對全社會、多個行業、行業內多個組織造成輕微影響;對單個組織的正常運作造成中等程度或輕微影響;對個人的合法權益造成輕微損害。
L1級對社會秩序、公共利益、行業發展、信息主體均無影響。
公共數據分級基于公共數據目錄的數據資產開展,公共數據資產級別不低于所包含數據項的最高級別。
(3)公共數據級別變更
當應用場景、數據資產、數據項級別等方面發生變化,導致數據發生泄露、篡改、丟失或濫用后的影響對象、影響程度、影響范圍發生較大變化時,應重新對數據進行分級。
數據分級發生變化的情形包括但不限于:①數據資產發生了增加、減少、改變等情況;②數據在匯聚、加工、分析等過程中級別發生變化或產生新數據(如脫敏后的數據、統計產生的數據等);③數據應用場景發生變化導致數據級別變化。
公共數據分級流程包括6步:(1)公共數據獲取(公共數據目錄);(2)系統自動分級;(3)分級結果修正;(4)分級結果確認;(5)分級結果復核;(6)確定分級結果。公共數據分級流程具體如圖1所示。

圖1 公共數據分級流程
(1)公共數據獲取:根據數源單位編制的公共數據目錄,數據分級系統通過接口獲取公共數據目錄。
(2)系統自動分級:系統內置知識庫和規則字段進行自動分級,得到公共數據目錄初始級別。
(3)分級結果修正:結合現有和可預期的數據應用場景,補充對未自動標識字段進行分級,或修正級別建議值,初步確定數據級別。
(4)分級結果確認:數源部門進行分級結果確認,調整本部門待審核數據資產的級別值。
(5)分級結果復核:主管部門數據管理員復核各部門公共數據級別。若復核不通過,則駁回,給出建議,由數源部門重新分析,評定數據級別。
(6)確定分級結果:通過主管部門數據管理員復核后生成公共數據級別,并同步至公共數據目錄中。
由各數源單位將本單位公共數據進行編目。根據數源單位編制的公共數據目錄,數據分級系統通過接口獲取公共數據目錄。公共數據獲取通過配置公共數據目錄連接信息,包括名稱、主題、類型、URL、賬號等,對配置公共數據目錄連接信息進行管理,并可測試連接情況。
配置公共數據目錄連接的接口設計如下:
(1)接口:getdatacategorylevelinfo
(2)請求URL:http://ip:port/bdcl/s/api/getdatacategorylevelinfo
(3)請求參數

表1 請求參數列表
(4)獲取信息

表2 獲取信息列表
通過系統的知識庫對公共數據目錄按評估流程和評估模型進行評估定級,得到公共數據目錄初始級別。系統的知識庫包括公共數據分級規則庫、敏感度知識庫、合規知識庫等類型的知識庫。公共數據分級規則庫對分級數據的格式規則進行管理;敏感度知識庫對公共數據目錄的評估后的元數據級別進行敏感度分析;合規知識庫是對國內法律法規高敏感度級別數據和國內行業定義的高敏感度級別數據進行管理。
系統自動分級的設計如下。

結合現有和可預期的數據應用場景,數據安全技術團隊補充對未自動標識字段進行分級,或修正級別建議值,初步確定數據級別。數據安全技術團隊根據字段敏感度從業務、法規、安全等方面進行評估得到數據級別,評估規則包括去最值、去平均值和加權平均等方式。

圖2 公共數據分級評估模型
分級結果修正的操作設計:(1)通過公共數據管理平臺進入數據分級系統;(2)進入分級修正環節;(3)選擇需要修正的公共數據目錄;(4)查看每個字段的自動分級級別;(5)技術團隊從業務、法規、安全等方面進行評估確定初步級別;(6)級別確定完成后進行提交至分級結果確認環節。
數源部門進行分級結果確認,調整本部門待審核數據資產的級別值。數據源部門數據專員線下組織數據安全和業務專家,對數據分級進行評審,確定級別值,確保分級的準確性和科學性。
分級結果確認的操作設計:(1)通過公共數據管理平臺進入數據分級系統;(2)進入分級結果確認環節;(3)選擇要修改的公共數據目錄進行編輯;(4)查看每個字段的分級結果;(5)如果需要修改級別時對該公共數據目錄級別進行修改;(6)級別修改完成后進行提交;(7)修改完成并確認無誤后提交復核。
主管部門數據管理員復核各部門公共數據級別,復核通過后將數據級別同步到公共數據目錄中。若復核不通過,則駁回,給出建議,由數源部門重新分析,評定數據級別。
分級結果復核的操作設計:(1)通過公共數據管理平臺進入數據分級系統;(2)進入分級結果復核環節;(3)選擇需要復核的公共數據目錄;(4)依次核對公共數據目錄的級別;(5)當級別評定滿足評定標準時,則通過復核;當級別評定不滿足評定標準時,填寫駁回理由并駁回至數源部門。
通過主管部門數據管理員復核后生成公共數據級別,并同步至公共數據目錄中。在確定數據級別之后,將分級結果信息實時推送到kafka隊列中,公共數據級別信息同步規范設計如下:

表3 公共數據級別信息同步規范表

?
本文依據浙江省數字化改革的相關標準,通過對公共數據分級設計,將某市公共數據分級工作有效落實,為政務數據開放和共享工作進一步推進提供良好根基。