999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于等保2.0的鐵路敏感數據安全關鍵技術及研究

2021-01-15 09:22:20彭劍峰徐保民張義祥
網絡安全技術與應用 2021年1期
關鍵詞:鐵路分類系統

◆彭劍峰 徐保民 張義祥

基于等保2.0的鐵路敏感數據安全關鍵技術及研究

◆彭劍峰1徐保民2張義祥1

(1.中鐵信安(北京)信息安全技術有限公司 北京 100094;2.北京交通大學 北京 100044)

本文以等保2.0對鐵路貨運數據的安全要求及貨運數據規則為基礎,結合鐵路業務系統,從“數據安全使用”的角度,對以主動防護為手段的安全保護技術進行深入研究,包括數據的分類分級、敏感數據的自動識別、敏感數據的脫敏存儲和使用,設計開發出鐵路敏感數據自動識別與動靜態脫敏于一體的大數據平臺,可在大數據環境下準確高效地對多源非結構化數據源進行自動分類分級和脫敏操作。

數據脫敏;機器學習;信息安全;數據隱私

近幾年,云物大智移等技術正逐步應用在中國鐵路上。《鐵路信息化總體規劃》和《鐵路大數據應用規劃報告》里都對鐵路數據的價值利用提出了更高的要求,同時也提出了數據安全要求。隨著鐵路數據的深入應用,數據安全問題也會日益凸顯。鐵路數據是國家基礎戰略資源,也是中國國家鐵路集團有限公司的重要資產,關系到國計民生。傳統的防火墻、反病毒軟件、入侵檢測和數據防泄漏等信息安全防護措施,已經難以獨立應對數據安全問題,并且內部人員的泄漏比外部黑客攻擊帶來的后果更嚴重。

2019年發布的網絡安全等級保護制度2.0國家標準(以下簡稱等保2.0),注重全方位主動防御、動態防御、整體防控和精準防護。等保2.0結合數據的全生命周期提出了安全防護的要求,尤其針對重要的、敏感的數據,在傳輸、存儲、使用、消除、運維等方面均有具體要求,并且對個人信息保護單列了章節,這些都是等保1.0所沒有的。通過對等級保護三級的要求分析,共有18項控制點/要求項涉及數據安全,其中安全通用要求中的技術要求6項和管理要求7項,云計算安全擴展要求3項、大數據應用場景說明2項。在《國家網絡安全法》中明確提出國家實行網絡安全等級保護制度,對公共通信和信息服務、能源、交通、水利、金融、公共服務、電子政務等重要行業和領域,以及其他一旦遭到破壞、喪失功能或者數據泄露,可能嚴重危害國家安全、國計民生、公共利益的關鍵信息基礎設施,在網絡安全等級保護制度的基礎上,實行重點保護。

從2017年起,國內市場開始重視敏感數據安全這個細分方向。2015年Gartner首次提出了數據安全治理概念,2017年在Gartner全球安全大會中提出數據安全治理已成為數據安全中的“風暴之眼”(The Eye Of Storm),2018年,Gartner首次在數據安全治理方向上專門推出研究報告《如何使用數據安全治理》。在Gartner的數據安全治理理念中,提出了“數據分級分類,針對不同級別數據實行合理的安全手段;要明確數據的訪問者(應用用戶/數據管理人員)、訪問對象、訪問行為,基于這些信息制定不同的、有針對性的數據安全策略。”Microsoft 也推出了 DGPC 方案(Data Governance for Privacy Confidentiality and Compliance),該方案是專門強調隱私、保護與合規的數據治理技術框架,提出了安全的基礎架構、身份和訪問控制、信息保護、審計和報告四個技術領域。2019年,中國網絡安全與信息化產業聯盟數據安全治理委員會(簡稱數據安全治理委員會)發布了《數據安全治理白皮書》,在國內正式提出了“讓數據使用更安全”的體系化方法論,其核心是“要滿足數據安全保護、合規性、敏感數據管理三個需求目標,通過分級分類、角色授權、場景化安全等來實現數據使用安全的精細化管控。”

1 系統架構

當前,我國鐵路建設處于高速發展期,鐵路信息化建設也需要相匹配。增強網絡空間安全防護能力,需要聚焦鐵路網絡安全突出問題,數據安全問題是關鍵問題,以等保2.0對鐵路貨運數據的安全要求及貨運數據規則和特點為基礎,結合鐵路業務系統和大數據應用的實際,從“數據安全使用”的角度,對以主動防護為手段的安全保護技術進行深入研究,以鐵路貨運相關數據為研究對象,通過對其數據分類梳理來界定敏感數據范圍,并根據其數據規則和特點,提出敏感數據分類分級標準和建議,并設計開發出鐵路敏感數據自動識別與動靜態脫敏于一體的大數據平臺,可用于大數據環境下高效準確地對多源非結構化數據源進行自動分類分級和脫敏。

圖1 鐵路敏感數據安全系統架構圖

圖1是我們所設計的鐵路敏感數據安全系統架構圖[1]。它主要由敏感數據管理門戶、數據工作臺、權限管理、敏感數據安全管控平臺、數據質量監控與審計、敏感數據安全分類、基礎庫和脫敏庫等核心部件構成。其工作流程[2]:

1)數據源配置,管理者通過頁面輸入賬號、密碼、數據源類型、訪問類型、url等信息,系統后臺根據輸入的信息讓Durid和ShardingSphere-JDBC配合使用連接源進行驗證賬號和密碼是否正確,如果驗證成功會生成對應的任務加入工作隊列,任務調度會從線程池Durid里通過ShardingSphere-JDBC連接數據源,在Spark計算引擎上執行掃描任務,通過遍歷數據源的數據跟規則進行匹配,梳理出該源的敏感信息進行存儲。

2)靜態庫生成,如果配置的是靜態庫時,Oozie會調用Datax-web通過Spark對數據源進行數據同步,同步的過程中通過梳理表和脫敏規則生成新數據,新數據會存儲到用戶指定對應的數據源類型中,根據用戶的配置更新時間,Datax-web增量同步數據到數據源。

3)動態脫敏,當第三方應用或者數據工作人員通過頁面或API訪問生產庫時,首先網關Kong對訪問進行攔截,攔截后對用戶進行身份認證和權限認證,如果沒有權限,需要通過管理員對該用戶開放權限;如果有該權限,會從線程池Druid里通過ShardingSphere-JDBC連接配置的輸入源,連接后shardingSphere-JDBC對SQL進行解析、路由和改寫,然后再通過spark去對查詢的數據進行脫敏替換,把替換后的數據返回給用戶。

4)靜態脫敏,當第三方應用或者數據工作人員通過頁面或API訪問的源是在脫敏庫中時,首先網關Kong對訪問進行攔截,攔截后對用戶進行身份認證和權限認證;如果沒有權限,需要通過管理員對該用戶開放權限,如果有該權限,直接路由到脫敏庫進行訪問。

2 關鍵技術

2.1 分類分級標準

鐵路貨運業務種類繁多,數據呈現出復雜性高,多樣性強的特點。采用規范的數據分類、分級方法[3],有助于行業機構厘清數據資產、確定數據重要性和敏感度,并針對性地采取適當、合理的管理措施和安全防護措施,形成一套科學、規范的數據資產管理與保護機制,從而在保證數據安全的基礎上促進數據開放共享。

數據分類是數據保護工作中的一個關鍵部分[3],是建立統一、準確、完善的數據架構的基礎,是實現集中化、專業化、標準化數據管理的基礎。按照統一的數據分類方法,依據自身業務特點對產生、采集、加工、使用或管理的數據進行分類,可以全面清晰地厘清數據資產,對數據資產實現規范化管理,并有利于數據的維護和擴充。數據分類為數據分級管理奠定基礎。

數據分級有助于鐵路行業根據數據不同級別,確定數據在其生命周期各個環節應采取的數據安全防護策略和管控措施,進而提高機構的數據管理和安全防護水平,確保數據的完整性、保密性和可用性。

在調研現有各綜合分類法與行業領域學科專用分類方法的基礎上,結合鐵路數據所特有的行業屬性特征,以及鐵路數據開發和共享的需求,制定鐵路數據分類分級方法。

本次的分類方法是從數據的敏感度特點出發,采用多維度方法[4](組織架構、業務對象、貨運流程)來進行分類,從組織架構角度,相同的數據不同層級的人敏感度是不一樣的,高層的敏感度少,低層的敏感度多;從業務對象角度,有些數據本身就是敏感,不同的業務和不同的人對于數據敏感度也是不一樣的;從業務流程角度,相同的數據不同的業務操作,敏感度也是不一樣的。

我們從貨運流程、業務對象、組織架構三個角度對數據進行準確的定位,這三個角度之間相互依賴,缺一不可。

2.1.1貨運流程

根據信息來源不同將對貨運流程分成29類[5]:

1)貨主咨詢:來源于客戶關系管理系統,貨運電商(貨商)平臺,貨運服務系統。

2)貨運需求:來源于95306貨商平臺、客服系統、EDI系統。

3)確認貨主需求:來源于95306貨商網站。

4)提報月計劃:來源于95306貨商平臺、FMOS系統。

5)提報旬方案:來源于95306貨商平臺、集優信息系統。

6)上門取貨:來源于物流信息系統,接取送達信息系統。

7)貨主送貨:來源于貨運站信息系統中進門、專用線管理。

8)申請集裝箱:來源于集裝箱管理系統,95306電商平臺。

9)車站超重限貨物受理:來源于超限超重貨物運輸管理信息系統,貨運站信息系統。

10)車站危險品貨物受理:來源于危險平運輸管理信息系統,貨運站信息系統。

11)車站零擔集裝箱制票,貨主交費:來源于貨票系統,電子支付系統。

12)申報日空車申請:來源于貨調系統,計劃調度系統。

13)車站倉儲:來源于貨運信息系統。

14)車站空車入貨運線:來源于調度系統,現在車系統。

15)車站裝車:來源于貨運管理系統,零擔、集裝箱管理系統,裝載加固系統,抑塵管理系統等。

16)整車制票,貨主交費:來源于貨票系統,電子支付系統,軌道衡系統。

17)車站貨車出線:來源于現在車系統。

18)車站集結列車:來源于現在車系統,確報系統。

19)車站貨檢,核對車號:來源于貨檢系統,超偏載系統,確報系統。

20)調度安排途中作業:來源于確報系統,貨檢信息系統,編組站信息系統,調度系統。

21)調度貨車到達:來源于調度系統,確報系統。

22)車站貨車入線:來源于現在車系統。

23)車站卸車:來源于貨運信息系統,抑塵系統,集裝箱、零散快運信息系統。

24)車站貨物倉儲:來源于貨運信息系統,集裝箱信息系統,零散快運信息系統。

25)車站內交付:來源于貨運信息系統,貨票系統。

26)車站外交付:來源于貨運信息系統。

27)貨主拉貨出門:來源于貨運信息系統。

28)物流送貨上門:來源于物流信息系統。

29)辦理理賠手續:保價及貨運事故處理信息系統。

2.1.2業務對象

根據業務對象數據分為客戶基本資料、身份鑒權信息、客戶運輸信息和客戶運輸內容信息[5]。

(1)客戶基本資料

政企客戶資料:政企客戶信息(姓名、聯系電話、郵箱)、發貨信息(訂單號、起始日期、終止日期、發站、發專用線、發貨單位、發貨部門、發貨單位地址、電話等)、收貨信息(品名、車數、噸數、車種、運輸特征、換裝港、終到港、保價與否、怕濕與否、散堆裝、非散堆裝、裝卸方式、單件重量等)、貨物信息、發送物流服務信息、到達物流信息(接取:取貨地點、取貨時間、聯系人姓名、電話;配送:配送地址、配送時間、聯系人姓名、聯系人電話等;倉儲服務、搬運裝卸服務)、附加信息(是否整車列裝車、是否定制信息服務、客戶備注等)實貨確認時間、實貨確認人、集裝箱承認信息、提單信息。

個人客戶資料:客戶姓名、證件類型、證件號碼、證件影印件、客戶職業、工作單位、居住地址、聯系地址、聯系電話、銀行扣費賬戶、客戶編號、年齡、性別等。

各類特殊名單:客戶姓名、證件類型、證件號碼、證件影印件、客戶職業、工作單位、居住地址、聯系地址、聯系電話、銀行扣費賬戶、客戶編號、年齡、性別等。

(2)身份鑒權信息

用戶密碼:用戶服務密碼、登錄密碼、秘鑰、支付密碼等。

(3)客戶運輸信息

詳單:收貨、發貨詳單等,內含運輸物品類型、收發貨位置、重量、收發時間等。

賬單:每月出賬的貨物運費、特定線路運費、裝卸費、保價費、倉儲費、接取送達費等。

客戶歷史信息:貨票、商務記錄、貨物記錄、理賠信息等。

(4)客戶運輸內容信息

客戶貨物內容記錄:客戶運量、運費、收入率等運輸內容。

2.1.3組織架構[5](見表1)

表1 組織架構分類

數據分級是以數據分類為基礎,根據數據的價值、內容敏感程度、影響和分發范圍不同對數據進行敏感級別劃分[6]。一旦安全性遭受破壞將直接影響到國家安全、社會秩序、公眾利益的,劃分為高度敏感數據,涉及信息量大、對客戶造成輕度影響的劃分為一般敏感數據、對用戶和鐵路都沒有影響的劃分為開發/公開數據,劃分如表2[7]:

表2 數據分類

2.2 自動分類分級模型[8]

分類分級主要采用的是k-means和向量空間模型(SVM)來識別,主要架構如圖2所示。

主要流程如下:

(1)導入數據,從數據源獲取含有敏感數據的鐵路業務數據。(2)分詞,通過分詞工具對長文本進行分詞。

(3)構建詞袋模型,將切分后的單詞進一步轉換成向量。先將所有文本中的詞匯構建成一個詞條列表,其中不含重復的詞條。然后對每個文本,構建一個向量,向量的維度與詞條列表的維度相同,向量的值是詞條列表中每個詞條在該文本中出現的次數。

(4)權限轉換,用算法TF-IDF,用來評估一個詞條對于一個文件集中一份文件的重要程度。

(5)計算余弦相似度,計算兩個向量的夾角余弦值,就可以評估他們的相似度。

(6)數據經過k-means進行自動分類,再通過內部業務人員對數據進行標識,抽取80%的數據經SVM進行訓練,剩下的20%進行測試。

圖2 自動分類分級模型

(7)評測模型,通過2個指標(準確率和召回率)評估分類模型:

F作為兩者綜合考慮的評估指標

準確率是評估捕獲的成果中目標成果所占的比例;召回率是召回目標類別的比例;而F值,則是綜合這二者指標的評估指標,用于綜合反映整體的指標。

3 結束語

本文主要設計開發了一個鐵路敏感數據安全保護的大數據平臺,系統定義一套鐵路數據的分類分級標準,通過機器學習實現敏感數據自動識別,降低人工識別的工作強度,實現靜態和動態數據脫敏功能滿足不同的業務場景,功能中涵蓋了常用的隱私保護算法,用來解決低敏數據聚合變高敏的問題。通過鐵路敏感數據安全大數據平臺能有效解決鐵路敏感數據泄露的安全問題,促進鐵路敏感數據的規范管理和安全使用,后續研究考慮使用深度學習來提高自動識別敏感數據的準確率。

[1]《數據脫敏應用指南報告》發布[EB/OL].https://www.freebuf.com/company-information/220232.html.

[2]數倉深度|數據治理之數據脫敏[EB/OL].https://mp.weixin.qq.com/s/62_IFokAl53DOUUK9eyCjg.

[3]JR/T 0158-2018 證券期貨業數據分類分級指引.

[4]JR/T 0197—2020 金融數據安全數據安全分級指南.

[5]陳光偉.鐵路信息系統應用技術[M].中國鐵道出版社,2017.

[6]《數據安全能力成熟度模型》實踐指南:數據分級分類[EB/OL].https://www.secrss.com/articles/24907

[7]數據安全治理的關鍵步驟[EB/OL].https://www.dbsec.cn/zt/aqzl/zy-3.html.

[8]機器學習筆記(3)——使用聚類分析算法對文本分類(分類數k未知)[EB/OL].https://blog.csdn.net/leaf_zizi/article/details/82684921.

中國鐵路信息科技集團有限公司科技研究開發計劃課題(《基于等保2.0的鐵路敏感數據安全關鍵技術研究》KGZG-CKY-2019027(2019B07))

猜你喜歡
鐵路分類系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
分類算一算
WJ-700無人機系統
沿著中老鐵路一路向南
云南畫報(2021年12期)2021-03-08 00:50:54
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
分類討論求坐標
鐵路通信線路維護體制改革探索與實踐
數據分析中的分類討論
教你一招:數的分類
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
主站蜘蛛池模板: 国产亚洲高清视频| 国产无码网站在线观看| 精品国产美女福到在线直播| 国产呦精品一区二区三区网站| 国产区在线看| 国产成人一区| 色窝窝免费一区二区三区 | 亚洲欧美成人在线视频| 高清免费毛片| a在线亚洲男人的天堂试看| 日韩亚洲综合在线| 国产jizzjizz视频| 国产精品视频观看裸模| 极品尤物av美乳在线观看| 国产精品hd在线播放| 免费又黄又爽又猛大片午夜| 免费a级毛片18以上观看精品| 暴力调教一区二区三区| 亚洲精品第一页不卡| 久久国语对白| 亚洲欧美一区二区三区麻豆| 四虎AV麻豆| 国产成人久视频免费| 色天天综合| 欧美精品H在线播放| 久久女人网| 伊人天堂网| 色婷婷亚洲综合五月| 国产成人精品亚洲77美色| 成人精品午夜福利在线播放| 日本手机在线视频| 婷五月综合| 熟女日韩精品2区| 亚洲无码精品在线播放| 国产在线第二页| 亚洲综合天堂网| 日韩色图在线观看| 人人澡人人爽欧美一区| 久久99久久无码毛片一区二区| 青青热久麻豆精品视频在线观看| 久久综合伊人 六十路| 精久久久久无码区中文字幕| 制服丝袜在线视频香蕉| 毛片视频网址| 成人国产免费| 91欧美亚洲国产五月天| 欧美a级在线| 国产嫩草在线观看| 福利一区在线| 91美女视频在线观看| 精品视频一区在线观看| 欧美成人一区午夜福利在线| 国产69精品久久久久孕妇大杂乱| 老色鬼久久亚洲AV综合| 在线观看国产精品日本不卡网| 亚洲精品视频在线观看视频| 国产噜噜噜| 亚洲人成影院午夜网站| 精品亚洲欧美中文字幕在线看| 日韩国产另类| 亚洲无码视频一区二区三区| 一级毛片在线播放| 亚洲美女一级毛片| 久久精品丝袜| 日本91在线| 亚洲欧美精品日韩欧美| 国产成人精品在线| 国产主播在线一区| 亚洲福利视频网址| 日本午夜视频在线观看| 国产精品嫩草影院av| 久久久久人妻一区精品色奶水| 亚欧成人无码AV在线播放| 制服丝袜一区| 亚洲日韩久久综合中文字幕| 国产精品久久久久鬼色| 欧美激情第一欧美在线| 久久人人妻人人爽人人卡片av| 香蕉国产精品视频| 国产亚洲精品91| 欧美色香蕉| 欧美一级高清免费a|