李鵬 王明 張海洋


摘 ?要:本論文主要目標是討論民航旅客敏感信息保護的解決方案,介紹了中國民航信息網絡股份有限公司(本文簡稱:中航信)通過建設數據脫敏平臺、流程體系來達到數據保護的目標,并對中航信數據脫敏系統的建設經驗進行了總結。主要包括數據分類分級、敏感數據管理、數據脫敏平臺、數據脫敏算法等。
關鍵詞:民航旅客數據;數據脫敏;保密性;可用性
中圖分類號:V354-39;TP393.08 ? ? ?文獻標識碼:A 文章編號:2096-4706(2019)05-0150-03
Abstract:The main purpose of this paper is to discuss the solution of sensitive information protection for civil aviation passengers. It introduces that TravelSky Technology Limited (shorter form:TravelSky)achieves the goal of data protection by building data desensitization platform and process system,and summarizes the construction experience of TravelSky data desensitization system. It mainly includes data classification ,sensitive data management,data desensitization platform,data desensitization algorithm and so on.
Keywords:civil aviation passenger data;data desensitization;confidentiality;availability
0 ?引 ?言
0.1 ?數據安全背景
信息安全已上升到國家安全層面。一方面,《中華人民共和國網絡安全法》于2017年6月1日起施行,重在保護公民個人信息安全。另一方面,信息安全事件頻發,CSDN、12306和日本航空等數據泄露事件造成了極其嚴重的影響。
中國民航信息網絡股份有限公司(本文簡稱:中航信)所運營的民航商務信息系統被國務院列為八大系統之一,既包含旅客身份等敏感信息,也包含票價等商業機密信息。數據安全責任重大,數據脫敏則是保障數據安全行之有效的首選方案,通過數據脫敏還可以在保障數據安全的同時不影響正常測試、開發和數據分析工作的開展,符合數據使用需求。因此,針對本課題的研究工作十分必要。
0.2 ?研究現狀
在銀行、電信等數據敏感行業,數據脫敏工作已經廣泛開展。
IBM、Oracle已有成熟的數據脫敏產品,HP提供定制解決方案,天融信等國內企業也都有成功的實施案例。
中航信運營的信息系統安全性要求非常高;Unisys主機等特殊硬件及架構沒有成熟的經驗可借鑒;民航業務的復雜性決定了較多的定制化要求。因此,中航信自主建設了適用于民航旅客數據脫敏的技術平臺及解決方案。
1 ?應用前景和社會經濟效益
1.1 ?民航領域
隨著民航旅客運輸量持續高增長,2018年旅客運輸量6.1億人次,同比增長10.9%,國際航協預測到2037年全球航空客運量將達到82億人次。脫敏技術應用空間廣闊。
1.2 ?大數據領域
數據交換、融通的需求迫切,但數據的機密性要求制約了流動性,迫切需要一種業務和技術手段保障民航大數據的安全流動。
2 ?建設內容
2.1 ?敏感數據梳理
首先,中航信系統中存在海量高維度數據、分散在數百個系統、依賴關系錯綜復雜,需要詳細調研以確定數據脫敏范圍;其次,部分數據來源于航空公司等外部系統;最后,數據的存儲方式存在較大差異。
2.2 ?數據分類分級體系建設
為明確對業務數據的安全保護要求,首先需要對業務數據進行分類分級。數據分類分級是實施數據安全防護、確保系統信息安全的基礎。
數據分類可以有多種維度,常見的分類維度有數據主題、數據形態、數據元特征、數據應用、數據部署地點、數據生成時間等。本技術標準以數據主題為主維度,數據形態為輔維度進行分類。
2.3 ?脫敏平臺建設
數據脫敏平臺是實施數據脫敏的工具平臺(如圖1所示),需要滿足以下五點。
(1)關系型數據庫、大數據、Unisys主機、文件型數據脫敏;(2)脫敏后的數據需要保持一致性、關聯關系、數據格式合規性;(3)多種算法類型(如:證件、姓名、常客卡、電話等)及算法組合;(4)敏感數據的多種識別模式(智能識別)和動態脫敏;(5)其他:多線程并發;異常策略控制;性能;脫敏后數據業務可用性。
2.3.1 ?算法支撐
(1)業界通用原子算法。連接、哈希、截取、隨機、遞增、運算、替換、混淆、均化、老化(年輕化)、加密、映射等;(2)針對民航業務開發算法。結合中航信數據特征定制開發算法5大類20個子類,開發敏感數據識別規則30多種;(3)通過密鑰機制保障跨平臺脫敏后一致性。數據脫敏覆蓋Linux、UNIX、Unisys等環境,通過批次、因子、密鑰保障脫敏后數據的機密性、一致性和關聯關系。為避免密鑰被嗅探,只傳輸因子。管理員也無權訪問密鑰,規避人員風險(如圖2所示)。
2.3.2 ?數據庫類型支持
(1)業界常用數據庫:Oracle、SQL Server、MySQL、Informix、PostgreSQL、DB2、Sybase、EDB、達夢等;(2)Unisys主機系統,自主創新開發,該系統專業性強,采用獨特的文件型數據結構,缺乏數據脫敏案例和參考資料,需要根據需求自主定制開發;(3)大數據脫敏支持:同樣在沒有參考資料的情況下摸索開發,目前支持:GreenPlum、HDFS、HBase、HIVE、Impala等,屬于技術首創;(4)文件系統支撐:文本、XML、JSON、序列化格式文件。
2.3.3 ?定制化功能開發(如表1所示)
2.3.4 ?平臺自身建設
(1)分布式。為了更好發揮分布式計算的高性能和資源利用率,采用分布式架構設計。充分發揮大數據架構的優勢,同時支持MapReduce和Spark;(2)自主可控。中航信作為關鍵基礎設施的維護者,始終堅持自主可控,平臺代碼全部定制開發,平臺數據庫支持商業和開源數據庫軟件。
2.4 ?中轉環境建設
為保障數據傳遞安全,約定:
(1)非生產環境無敏感數據;(2)非生產環境不直連生產系統。
通過中轉環境存放生產數據、脫敏、脫敏后數據推送。為了保障生產與測試的安全隔離,參考完整性訪問控制Biba模型,通過中航信數據擺渡系統實現物理隔離、安全高效傳輸。
2.5 ?數據脫敏標準建設
依托數據脫敏工作的成果,結合敏感數據分類定級標準,建立數據脫敏標準及數據交換標準,其內容包括:敏感數據的定級;敏感數據的分類;敏感數據脫敏的標準算法;脫敏數據交換規則等。
2.6 ?數據脫敏非功能要求
非功能要求:性能、可擴展、安全性等均已經過實踐驗證,各系統24小時內完成脫敏。
2.7 ?數據脫敏效果驗證
為檢驗脫敏效果,采用技術驗證和業務驗證兩種方式:
(1)技術驗證:通過工具統計實際脫敏、未脫敏數據量,脫敏覆蓋率99%以上;(2)業務驗證:脫敏后數據導入業務系統,業務實測數據有效率99%以上。
3 ?數據脫敏工具簡介
3.1 ?商業的專業軟件
目前市場上主流的商業軟件Data Masking、Optim產品等。國內廠商的脫敏工具也可滿足傳統數據庫的脫敏需求。
3.2 ?ETL工具
使用ETL工具進行數據脫敏,比如:Data Integration(or Kettle)。開源脫敏工具大大降低了成本。同時,支持個性化開發。
3.3 ?中航信數據脫敏平臺
中航信數據脫敏平臺支持業界常見關系型數據庫、Unisys主機和大數據脫敏,部分技術屬于行業首創,同時支持國產數據庫。年累計脫敏數據量達到400億條以上。
4 ?全生命周期的數據脫敏工作流程
概括為:提交數據申請,數據申請審核,中轉平臺數據準備,數據脫敏(算法、配置、執行、驗證、分發)。
5 ?結 ?論
中航信數據脫敏解決方案在以旅客服務為核心的新一代民航信息系統建設中保障敏感數據安全和數據的可用性,起草行業標準,為民航企業間數據交換提供統一標準和安全保障,有助于提高民航IT企業的協同工作效率,為數據交換奠定基礎,為客戶帶來更多價值,為民航事業的蓬勃健康發展貢獻力量。
參考文獻:
[1] 宋燕妮.《網絡安全法》的主要特點及施行工作 [J].中國信息安全,2017(6):63-66.
[2] 彭明田.中國民航信息系統現狀及發展展望 [J].計算機工程,2005,31(S1):61-63.
[3] 陳瑜.80%大數據交易涉及個人信息 ?專家呼吁統一脫敏標準推行安全眾籌 [EB/OL].http://www.legaldaily.com.cn/IT/content/2016-07/11/content_6722436.htm?node=69477,2016-07-11.
[4] 夏冰.網絡安全法和網絡安全等級保護2.0 [M].北京:電子工業出版社,2017.
[5] 李呈祥.大數據與數據脫敏 [EB/OL].https://blog.csdn.net/wgrzhuaq/article/details/51984709,2016-07-21.
[6] Wikipedia.Data masking [DB/OL].Wikipedia,2017-06-25.
[7] IBM.Dynamic Data Masking with IBM Optim [DB/OL].www.IBM.com,2017-06-25.
[8] Net 2000 Ltd.“Data Masking:What You Need to Know” [Z].A Net 2000 Ltd. White Paper,Retrieved 2017.
作者簡介:李鵬(1979-),男,漢族,北京人,部門經理,高級職稱,從事軟件測試工作超過10年,碩士,研究方向:信息安全、測試管理;王明(1981-),男,漢族,北京人,高級測試管理工程師,工程師,本科,研究方向:數據安全、安全開發、自動化安全測試、滲透測試;張海洋(1985-),男,漢族,河北保定人,測試管理工程師,工程師,本科,研究方向:數據安全、源代碼安全、黑盒安全測試、滲透測試。