張維真,任 爽
(1.北京交通大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,北京 100044;2.中國(guó)鐵路濟(jì)南局集團(tuán)有限公司 濟(jì)南站,濟(jì)南 250001)
隨著移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等新興技術(shù)的應(yīng)用和傳播,數(shù)據(jù)的演變和發(fā)展為人們生產(chǎn)生活帶來(lái)了巨大便利。與此同時(shí),隱私泄露、數(shù)據(jù)買賣、網(wǎng)絡(luò)攻擊等數(shù)據(jù)安全問(wèn)題也日益凸顯,給個(gè)人、社會(huì)和國(guó)家造成了嚴(yán)重的安全隱患。近年來(lái),國(guó)家高度重視數(shù)據(jù)安全和隱私保護(hù),先后頒布了《中華人民共和國(guó)數(shù)據(jù)安全法》《中華人民共和國(guó)個(gè)人信息保護(hù)法》,完善了數(shù)據(jù)治理體系的頂層設(shè)計(jì),提供了解決數(shù)據(jù)安全問(wèn)題的具體思路。上述法律明確了面向生命周期的數(shù)據(jù)安全原則,提出了數(shù)據(jù)的分類分級(jí)保護(hù),完善了個(gè)人信息保護(hù)應(yīng)遵循的原則,是保障國(guó)家安全和社會(huì)穩(wěn)定、促進(jìn)我國(guó)數(shù)字化轉(zhuǎn)型的有力保障。
近年來(lái),隨著云計(jì)算、數(shù)字技術(shù)與鐵路業(yè)務(wù)的深度融合,鐵路行業(yè)也愈加重視網(wǎng)絡(luò)信息安全管控,鐵路數(shù)據(jù)安全是保障鐵路信息系統(tǒng)安全穩(wěn)定運(yùn)行的基礎(chǔ),在《“十四五”鐵路網(wǎng)絡(luò)安全和信息化規(guī)劃》中也提到加強(qiáng)數(shù)據(jù)安全保護(hù)。由于鐵路業(yè)務(wù)場(chǎng)景的復(fù)雜性和特殊性,鐵路行業(yè)面臨網(wǎng)絡(luò)數(shù)據(jù)的泄露、違規(guī)傳輸和濫用、新技術(shù)應(yīng)用被攻擊、供應(yīng)鏈管理等數(shù)據(jù)安全風(fēng)險(xiǎn),因此,對(duì)鐵路數(shù)據(jù)安全和隱私保護(hù)提出了更高的要求。本文結(jié)合鐵路業(yè)務(wù)場(chǎng)景,分析了鐵路數(shù)據(jù)安全與隱私保護(hù)需求,針對(duì)鐵路數(shù)據(jù)安全風(fēng)險(xiǎn),結(jié)合鐵路數(shù)據(jù)服務(wù)平臺(tái),構(gòu)建鐵路數(shù)據(jù)安全與隱私保護(hù)技術(shù)體系,實(shí)現(xiàn)對(duì)鐵路數(shù)據(jù)進(jìn)行分類分級(jí)和全生命周期的安全保護(hù)[1]。
鐵路數(shù)據(jù)服務(wù)平臺(tái)可以獲取鐵路內(nèi)、外數(shù)據(jù)、對(duì)數(shù)據(jù)進(jìn)行集中管理,包括數(shù)據(jù)集成、共享、存儲(chǔ)等功能。本文以其為研究對(duì)象分析鐵路數(shù)據(jù)安全與隱私保護(hù)需求。
鐵路數(shù)據(jù)來(lái)源廣泛且數(shù)據(jù)類型復(fù)雜,不僅包括鐵路內(nèi)部的業(yè)務(wù)數(shù)據(jù),還包括來(lái)自鐵路外部的相關(guān)數(shù)據(jù),同時(shí),鐵路數(shù)據(jù)還存在內(nèi)部不同業(yè)務(wù)系統(tǒng)之間的相互調(diào)用。對(duì)于處理不規(guī)范的數(shù)據(jù)容易造成數(shù)據(jù)丟失、數(shù)據(jù)泄露等數(shù)據(jù)安全風(fēng)險(xiǎn)。因此,需要在對(duì)其進(jìn)行數(shù)據(jù)收集開始前,采用數(shù)據(jù)分類、分級(jí)辦法,有針對(duì)性地對(duì)數(shù)據(jù)源進(jìn)行敏感性劃分,確定數(shù)據(jù)重要性和敏感度[2]。根據(jù)劃分的敏感程度結(jié)果,對(duì)不同類型的數(shù)據(jù)進(jìn)行分級(jí)分類管理,制訂不同安全等級(jí)的數(shù)據(jù)安全保護(hù)策略,對(duì)敏感型的數(shù)據(jù)重點(diǎn)保護(hù)。
鐵路數(shù)據(jù)隱私泄露風(fēng)險(xiǎn)出現(xiàn)在鐵路數(shù)據(jù)服務(wù)平臺(tái)數(shù)據(jù)生命周期管理的各個(gè)階段,主要體現(xiàn)在數(shù)據(jù)的集成、共享、存儲(chǔ)、傳輸和分析等階段。
(1)在數(shù)據(jù)集成階段,需要對(duì)已經(jīng)分類分級(jí)的敏感數(shù)據(jù)進(jìn)行數(shù)據(jù)集成、加密處理和匿名化處理,否則會(huì)出現(xiàn)信息泄露等問(wèn)題[3]。
(2)在數(shù)據(jù)共享階段,鐵路數(shù)據(jù)服務(wù)平臺(tái)可實(shí)現(xiàn)不同業(yè)務(wù)系統(tǒng)跨平臺(tái)的數(shù)據(jù)共享,并對(duì)不同數(shù)據(jù)加入不同權(quán)限進(jìn)行管理,在此過(guò)程中可能出現(xiàn)非法訪問(wèn)、數(shù)據(jù)泄露等風(fēng)險(xiǎn)。因此,需要建立嚴(yán)格的身份認(rèn)證和訪問(wèn)控制機(jī)制,實(shí)施細(xì)粒度的權(quán)限管理,保證用戶只能訪問(wèn)自己被授權(quán)的數(shù)據(jù),使用加密技術(shù),保證數(shù)據(jù)共享的安全性。
(3)在數(shù)據(jù)存儲(chǔ)階段,由于鐵路數(shù)據(jù)服務(wù)平臺(tái)涉及業(yè)務(wù)種類繁多,經(jīng)營(yíng)開發(fā)、運(yùn)輸生產(chǎn)、資源管理等不同系統(tǒng)的大量數(shù)據(jù)在存儲(chǔ)過(guò)程中可能存在存儲(chǔ)數(shù)據(jù)丟失或數(shù)據(jù)被盜取、病毒入侵等問(wèn)題,為防止存儲(chǔ)數(shù)據(jù)被泄露,保證關(guān)鍵業(yè)務(wù)的隱私性,需要對(duì)鐵路數(shù)據(jù)定期進(jìn)行備份管理,并在存儲(chǔ)中進(jìn)行加密處理,強(qiáng)化數(shù)據(jù)安全。
(4)在數(shù)據(jù)傳輸階段,可能出現(xiàn)竊聽者竊聽鐵路各部門的通信數(shù)據(jù),非法訪問(wèn)關(guān)鍵的業(yè)務(wù)信息,從而對(duì)數(shù)據(jù)進(jìn)行篡改等,導(dǎo)致敏感數(shù)據(jù)泄露或受損。為保證鐵路數(shù)據(jù)傳輸?shù)谋C苄院屯暾裕枰獙?duì)傳輸數(shù)據(jù)加以訪問(wèn)控制,對(duì)其進(jìn)行身份限制等操作。
(5)在數(shù)據(jù)分析階段,可能存在數(shù)據(jù)集再識(shí)別、屬性推斷、不當(dāng)使用等風(fēng)險(xiǎn)問(wèn)題。攻擊者可能對(duì)鐵路中已發(fā)布或共享的匿名化數(shù)據(jù)集進(jìn)行交叉分析、關(guān)聯(lián)分析,使得敏感信息被重新識(shí)別出來(lái),因此,需要采取更強(qiáng)的隱私計(jì)算方法對(duì)鐵路個(gè)人、業(yè)務(wù)等敏感數(shù)據(jù)進(jìn)行保護(hù)。
(6)在數(shù)據(jù)銷毀階段,若業(yè)務(wù)已完成或提前下線而敏感數(shù)據(jù)仍在系統(tǒng)中存在,會(huì)造成鐵路重要數(shù)據(jù)的泄露,因此,需要注重?cái)?shù)據(jù)生命周期閉環(huán)處理。
在鐵路數(shù)據(jù)服務(wù)平臺(tái)使用中,可能出現(xiàn)個(gè)人數(shù)據(jù)隱私泄露風(fēng)險(xiǎn)。數(shù)據(jù)隱私泄露的風(fēng)險(xiǎn)包括:濫用和擴(kuò)散數(shù)據(jù),侵犯?jìng)€(gè)人隱私權(quán);非法收集和傳播,損害公民知情權(quán)和信息自決權(quán);對(duì)實(shí)體生活造成侵害,威脅經(jīng)濟(jì)和基礎(chǔ)設(shè)施安全;給個(gè)人生活帶來(lái)困擾,加劇社會(huì)矛盾;危害國(guó)家安全和社會(huì)公共秩序。濫用和擴(kuò)散旅客基礎(chǔ)數(shù)據(jù)和職工信息、非法傳播鐵路業(yè)務(wù)關(guān)鍵數(shù)據(jù),不僅侵害個(gè)人的隱私權(quán)利,還會(huì)造成鐵路部門的經(jīng)濟(jì)損失,甚至威脅國(guó)家安全。因此,需要加強(qiáng)對(duì)隱私數(shù)據(jù)的保護(hù)。
數(shù)據(jù)匿名、數(shù)據(jù)加密、訪問(wèn)控制、隱私計(jì)算技術(shù)、區(qū)塊鏈技術(shù)都是當(dāng)前流行的數(shù)據(jù)隱私保護(hù)技術(shù),作為技術(shù)補(bǔ)充,將其在鐵路數(shù)據(jù)服務(wù)平臺(tái)中進(jìn)行應(yīng)用,對(duì)解決鐵路數(shù)據(jù)安全與隱私保護(hù)問(wèn)題具有一定的現(xiàn)實(shí)意義。
數(shù)據(jù)匿名技術(shù)是將明文轉(zhuǎn)換為非人類可讀形式的技術(shù)[4]。k-匿名和l-多樣性方法是該技術(shù)的經(jīng)典方法,k-匿名方法對(duì)數(shù)據(jù)進(jìn)行匿名處理,可以保證任意一條記錄與其余k–1 條記錄不可區(qū)分;l-多樣性方法將數(shù)據(jù)集劃分為不同的組,在匿名關(guān)系數(shù)據(jù)時(shí)確保每個(gè)等價(jià)類至少包含l個(gè)不同的敏感屬性值,保證了敏感屬性的多樣性,但忽視了敏感屬性的全局分布;t-closeness 算法要求等價(jià)類中敏感屬性值的分布與全局分布實(shí)現(xiàn)一致性,解決了l-多樣性的局限性問(wèn)題。
數(shù)據(jù)加密技術(shù)通過(guò)使用算法和密鑰對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,包括同態(tài)加密、安全多方計(jì)算等技術(shù)。Gentry 構(gòu)造了第1 個(gè)可行的全同態(tài)加密,并提出了僅在整數(shù)上進(jìn)行簡(jiǎn)單計(jì)算的全同態(tài)加密方案[5];Brakerki 等人[6]提出了第2 代全同態(tài)加密方案,使用重線性化等技術(shù),從速度、輕量級(jí)等方面提高了計(jì)算性能;第3 代全同態(tài)加密方案是Gentry 等人提出的[7],基于近似特征向量技術(shù),構(gòu)造出一種不需要計(jì)算密鑰的有限層次全同態(tài)加密。
安全多方計(jì)算最初由Yao 于1982 年提出[8],是基于加密協(xié)議,用于分布式數(shù)據(jù)集的數(shù)據(jù)加密技術(shù),常應(yīng)用于數(shù)據(jù)挖掘領(lǐng)域。除了計(jì)算的最終結(jié)果,安全多方技術(shù)不應(yīng)該向參與方透露任何新的信息。
訪問(wèn)控制技術(shù)確保只有經(jīng)過(guò)授權(quán)的用戶可以訪問(wèn)數(shù)據(jù)資源[9]。近年來(lái),基于訪問(wèn)控制技術(shù)出現(xiàn)了多種隱私保護(hù)技術(shù),例如,強(qiáng)制訪問(wèn)控制(MAC,Mandatory Access Control)、基于自由訪問(wèn)控制(DAC,Discretionary Access Control)、基于角色的訪問(wèn)控制(RBAC,Role-Based Access Control)、基于新型面向網(wǎng)絡(luò)空間的接入控制( CoAC,Cyberspace-oriented Access Control)等。MAC 著重保護(hù)系統(tǒng)的機(jī)密性,該機(jī)制實(shí)現(xiàn)強(qiáng)制存取控制,以防止高安全級(jí)別的信息流入低安全級(jí)別的客體,可應(yīng)用于鐵路高度敏感數(shù)據(jù)的管理中;DAC 是主體對(duì)客體進(jìn)行管理,由主體自己決定是否將客體訪問(wèn)權(quán)或部分訪問(wèn)權(quán)授予其他主體,這種控制方式是自主的;RBAC 是將權(quán)限與角色相關(guān)聯(lián),用戶通過(guò)成為適當(dāng)角色的成員而得到相應(yīng)角色的權(quán)限;CoAC 技術(shù)致力于實(shí)現(xiàn)細(xì)粒度的網(wǎng)絡(luò)資源和服務(wù)訪問(wèn)控制,根據(jù)用戶、設(shè)備、網(wǎng)絡(luò)條件等多個(gè)因素來(lái)決定對(duì)資源的訪問(wèn)權(quán)限。
隱私計(jì)算技術(shù)是一種通過(guò)在數(shù)據(jù)處理和分析過(guò)程中采取一系列的加密和隱私保護(hù)措施的技術(shù),在統(tǒng)計(jì)學(xué)中主要包括聯(lián)邦學(xué)習(xí)和差分隱私。聯(lián)邦學(xué)習(xí)是2016 年由Google 提出的一種分布式機(jī)器學(xué)習(xí)方法,旨在解決多個(gè)數(shù)據(jù)持有方之間數(shù)據(jù)隱私和安全性的問(wèn)題[10]。它能夠讓多個(gè)互不信任的訓(xùn)練數(shù)據(jù)提供方在不交換原始數(shù)據(jù)的情況下,通過(guò)交換梯度或參數(shù)等中間計(jì)算結(jié)果協(xié)同訓(xùn)練機(jī)器學(xué)習(xí)模型[11]。可以根據(jù)參與方相互之間的數(shù)據(jù)分布不同,一般把聯(lián)邦學(xué)分為橫向聯(lián)邦、縱向聯(lián)邦和聯(lián)邦遷移3 種。
差分隱私是通過(guò)在原始數(shù)據(jù)中添加噪聲從而對(duì)數(shù)據(jù)進(jìn)行加密的方法[12],可以保證對(duì)數(shù)據(jù)集進(jìn)行添加刪除操作不會(huì)影響輸出結(jié)果。實(shí)現(xiàn)差分隱私可通過(guò)指數(shù)機(jī)制、拉普拉斯機(jī)制等。
區(qū)塊鏈在隱私保護(hù)方面的具體技術(shù)、工作機(jī)制和實(shí)現(xiàn)協(xié)議可以從身份隱私保護(hù)、數(shù)據(jù)隱私保護(hù)和網(wǎng)絡(luò)隱私保護(hù)3 個(gè)方面進(jìn)行分析[13]。
身份隱私保護(hù)技術(shù)主要通過(guò)信息混淆機(jī)制對(duì)可能威脅到用戶身份隱私的事務(wù)數(shù)據(jù)進(jìn)行混淆。數(shù)據(jù)混淆技術(shù)可以通過(guò)中心化混幣或去中心化混幣機(jī)制來(lái)實(shí)現(xiàn)。Maxwell[14]提出了基于去中心化思想的混幣機(jī)制,采用用戶約定的分布式共識(shí)機(jī)制,從根本上解決了中心化混幣的潛在風(fēng)險(xiǎn)。
數(shù)據(jù)隱私保護(hù)技術(shù)主要是針對(duì)賬本信息的隱私保護(hù)。傳統(tǒng)的區(qū)塊鏈交易過(guò)程中,交易信息被記錄在賬本中,可以通過(guò)賬本信息獲取用戶賬戶地址、交易金額等隱私信息。為了隱藏相關(guān)信息,研究者們提出了零知識(shí)證明、環(huán)簽名、承諾方案、基于屬性的加密和可信硬件執(zhí)行環(huán)境等技術(shù)。
網(wǎng)絡(luò)隱私保護(hù)技術(shù)主要是針對(duì)區(qū)塊鏈節(jié)點(diǎn)之間交易信息的匿名性和隱蔽性,包括網(wǎng)絡(luò)數(shù)據(jù)隱藏技術(shù)和通道隔離技術(shù)等技術(shù)。為了防止攻擊,需要對(duì)區(qū)塊鏈的網(wǎng)絡(luò)層數(shù)據(jù)進(jìn)行隱藏。目前,有可信第三方轉(zhuǎn)發(fā)、混合網(wǎng)絡(luò)、洋蔥路由和大蒜路由等方式可以實(shí)現(xiàn)網(wǎng)絡(luò)層數(shù)據(jù)的匿名性和隱蔽性保護(hù)。
由于鐵路數(shù)據(jù)生命周期中存在大量安全風(fēng)險(xiǎn)問(wèn)題,根據(jù)需求分析和相關(guān)技術(shù)研究,本文結(jié)合現(xiàn)有鐵路數(shù)據(jù)服務(wù)平臺(tái)[15],從鐵路數(shù)據(jù)的安全性、系統(tǒng)性、兼容性、可用性等方面出發(fā),針對(duì)數(shù)據(jù)生命周期前后各階段,構(gòu)建鐵路數(shù)據(jù)安全與隱私保護(hù)技術(shù)體系,如圖1 所示,為進(jìn)一步保障鐵路敏感數(shù)據(jù)及公民隱私信息的數(shù)據(jù)安全提供技術(shù)支撐。

圖1 鐵路數(shù)據(jù)安全與隱私保護(hù)技術(shù)體系
在鐵路數(shù)據(jù)集成前,應(yīng)對(duì)業(yè)務(wù)數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、外部數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)等不同數(shù)據(jù)進(jìn)行分類分級(jí)劃分。數(shù)據(jù)分類根據(jù)使用用途、鐵路業(yè)務(wù)等進(jìn)行劃分。數(shù)據(jù)分級(jí)是在數(shù)據(jù)分類的基礎(chǔ)上,根據(jù)數(shù)據(jù)的價(jià)值、重要程度、內(nèi)容敏感程度不同將其劃分為高度敏感、一般敏感、開放/公開數(shù)據(jù)。根據(jù)鐵路現(xiàn)有網(wǎng)絡(luò)數(shù)據(jù)分類分級(jí)規(guī)則可以實(shí)現(xiàn)人工對(duì)采集到的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行分類分級(jí)劃分,也可使用K-Means、FP-Growth 等算法對(duì)敏感數(shù)據(jù)進(jìn)行機(jī)器劃分。
數(shù)據(jù)匿名技術(shù)可用于鐵路數(shù)據(jù)集成階段,通過(guò)刪除、替換、扭曲、泛化、聚合等手段改變數(shù)據(jù)標(biāo)識(shí)符,保護(hù)個(gè)人隱私數(shù)據(jù)。
數(shù)據(jù)匿名技術(shù)可以在數(shù)據(jù)收集階段實(shí)現(xiàn)對(duì)隱私數(shù)據(jù)的匿名化,降低個(gè)人信息被濫用、盜竊或誤用的風(fēng)險(xiǎn),極大程度上保護(hù)鐵路的隱私數(shù)據(jù)。此外,匿名化技術(shù)在保護(hù)隱私的前提下,盡可能保留數(shù)據(jù)的有用特征和統(tǒng)計(jì)信息,以便進(jìn)行后續(xù)鐵路數(shù)據(jù)分析、數(shù)據(jù)傳輸?shù)裙ぷ鳌?shù)據(jù)匿名技術(shù)有助于在保護(hù)個(gè)人隱私的同時(shí),對(duì)大規(guī)模數(shù)據(jù)的有效利用。
數(shù)據(jù)加密技術(shù)通常涉及鐵路數(shù)據(jù)存儲(chǔ)、處理、共享,以及對(duì)平臺(tái)的可信度要求等。同態(tài)加密、安全多方計(jì)算是常見的加密方法。
同態(tài)加密可以保護(hù)用戶的數(shù)據(jù)隱私,確保數(shù)據(jù)在進(jìn)行計(jì)算時(shí)仍然保持加密狀態(tài)。這對(duì)于鐵路中涉及運(yùn)輸組織、經(jīng)營(yíng)管理等敏感信息業(yè)務(wù)在鐵路數(shù)據(jù)服務(wù)平臺(tái)的存儲(chǔ)至關(guān)重要。同態(tài)加密允許數(shù)據(jù)擁有者控制其數(shù)據(jù),并只將加密結(jié)果共享給需要的人。通過(guò)使用同態(tài)加密技術(shù),可以在數(shù)據(jù)加密的狀態(tài)下進(jìn)行計(jì)算,不需要解密數(shù)據(jù),確保數(shù)據(jù)在存儲(chǔ)和處理過(guò)程中不被泄露或惡意使用。安全多方計(jì)算則可以實(shí)現(xiàn)多方之間的合作計(jì)算,保護(hù)各方輸入數(shù)據(jù)的隱私。參與分布式數(shù)據(jù)挖掘的各方對(duì)其數(shù)據(jù)進(jìn)行加密并發(fā)送給其他各方,這些加密數(shù)據(jù)用于計(jì)算屬于聯(lián)合數(shù)據(jù)集的聚合數(shù)據(jù)。促進(jìn)了數(shù)據(jù)共享與合作,在保護(hù)鐵路數(shù)據(jù)隱私的同時(shí)完成了計(jì)算任務(wù)。此外,在數(shù)據(jù)銷毀中可以使用數(shù)據(jù)加密技術(shù)對(duì)數(shù)據(jù)進(jìn)行加密后銷毀,保障數(shù)據(jù)銷毀后的安全性。
訪問(wèn)控制技術(shù)可以應(yīng)用于鐵路數(shù)據(jù)服務(wù)平臺(tái)各個(gè)階段的權(quán)限管理中,通過(guò)身份驗(yàn)證建立會(huì)話密鑰,限制隱私數(shù)據(jù)傳輸至真實(shí)節(jié)點(diǎn)以確保數(shù)據(jù)安全。
MAC 著重保護(hù)系統(tǒng)的機(jī)密性,該機(jī)制實(shí)現(xiàn)強(qiáng)制存取控制,以防止高安全級(jí)別的信息流入低安全級(jí)別的客體,可應(yīng)用于鐵路高度敏感數(shù)據(jù)的管理中;RBAC 可以應(yīng)用到鐵路各個(gè)系統(tǒng)的角色管理中;CoAC 可以根據(jù)不同場(chǎng)景下的設(shè)備、使用需求和策略自適應(yīng)地調(diào)整訪問(wèn)控制規(guī)則,以提供更有效的訪問(wèn)控制和資源管理。
訪問(wèn)控制技術(shù)在數(shù)據(jù)生命周期中起著重要的作用,保護(hù)數(shù)據(jù)的安全性、隱私性和完整性的同時(shí),確保只有經(jīng)過(guò)授權(quán)的人員或系統(tǒng)才能訪問(wèn)和處理數(shù)據(jù)。有助于提高鐵路數(shù)據(jù)服務(wù)平臺(tái)訪問(wèn)的可信度和可靠性,降低數(shù)據(jù)泄露和濫用的風(fēng)險(xiǎn)。
隱私計(jì)算技術(shù)可以用于鐵路數(shù)據(jù)分析等階段[16],保護(hù)個(gè)人隱私、數(shù)據(jù)計(jì)算過(guò)程與結(jié)果的隱私,對(duì)數(shù)據(jù)進(jìn)行脫敏。隱私計(jì)算技術(shù)方法在統(tǒng)計(jì)學(xué)中主要包括聯(lián)邦學(xué)習(xí)和差分隱私方法。
聯(lián)邦學(xué)習(xí)允許不同參與方共同訓(xùn)練模型,從而可以匯集多方的數(shù)據(jù),提升模型的泛化性能和預(yù)測(cè)準(zhǔn)確度,并保護(hù)各方數(shù)據(jù)的隱私,該方法主要運(yùn)用在數(shù)據(jù)分析階段;差分隱私方法通過(guò)在統(tǒng)計(jì)查詢結(jié)果中引入噪聲,保護(hù)個(gè)體數(shù)據(jù)的隱私,即使攻擊者可以獲取查詢結(jié)果,也很難對(duì)特定個(gè)體的數(shù)據(jù)進(jìn)行重建或推斷,即相鄰數(shù)據(jù)集經(jīng)處理后的輸出結(jié)果非常類似,攻擊者很難通過(guò)操作匯聚的結(jié)果推測(cè)單條輸入數(shù)據(jù),很大程度上保證了隱私安全,該方法可以應(yīng)用在數(shù)據(jù)收集、存儲(chǔ)、分析階段。
區(qū)塊鏈技術(shù)可用于數(shù)據(jù)生命周期各個(gè)階段,提高數(shù)據(jù)安全。
在數(shù)據(jù)集成鐵路身份數(shù)據(jù)時(shí),使用區(qū)塊鏈身份隱私保護(hù)技術(shù)可以確保使用者的身份信息不被篡改或泄露,防止攻擊者通過(guò)分析賬本中的事務(wù)數(shù)據(jù)推測(cè)出地址之間、地址與用戶身份之間,以及地址與事務(wù)隱私之間的關(guān)系。通過(guò)使用匿名化或偽匿名化技術(shù),可以保護(hù)身份隱私,增強(qiáng)鐵路數(shù)據(jù)隱私保護(hù)。在數(shù)據(jù)存儲(chǔ)過(guò)程中,采用加密技術(shù)對(duì)敏感數(shù)據(jù)進(jìn)行加密處理,只有獲得授權(quán)的參與者能夠解密和訪問(wèn)數(shù)據(jù),確保數(shù)據(jù)的機(jī)密性和完整性。此外,使用區(qū)塊鏈不可篡改的特性可以提高數(shù)據(jù)的可信度;采取網(wǎng)絡(luò)隱私保護(hù)措施,如訪問(wèn)控制、入侵檢測(cè)系統(tǒng)等,可以保護(hù)數(shù)據(jù)處理和分析過(guò)程中的網(wǎng)絡(luò)隱私安全。
鐵路數(shù)據(jù)安全與隱私保護(hù)技術(shù)體系可以應(yīng)用于鐵路數(shù)據(jù)服務(wù)平臺(tái)及數(shù)據(jù)流轉(zhuǎn)應(yīng)用全過(guò)程,對(duì)其中可能出現(xiàn)的安全風(fēng)險(xiǎn),可以采用相關(guān)技術(shù)進(jìn)行解決,以下列舉兩種常見的應(yīng)用場(chǎng)景。
旅客信息作為鐵路數(shù)據(jù)的重要組成部分,需要嚴(yán)格按照相關(guān)法律和鐵路數(shù)據(jù)安全規(guī)定對(duì)其進(jìn)行收集、處理和使用。采集和處理個(gè)人敏感信息時(shí),需要取得個(gè)人同意,因此應(yīng)在數(shù)據(jù)集成前,先對(duì)其進(jìn)行分類分級(jí)處理,再對(duì)之后的敏感數(shù)據(jù)進(jìn)行匿名處理,并對(duì)其加密存儲(chǔ),有效防止個(gè)人信息泄露。
由于鐵路業(yè)務(wù)系統(tǒng)眾多,各部門數(shù)據(jù)仍以數(shù)據(jù)孤島的形式分散在各個(gè)部門,部門間存在著難以打破的數(shù)據(jù)壁壘。構(gòu)建基于區(qū)塊鏈技術(shù)的鐵路數(shù)據(jù)傳輸共享平臺(tái),能夠保證數(shù)據(jù)操作的公開透明、不被篡改,在保證數(shù)據(jù)安全的前提下,促使調(diào)度、客票、動(dòng)車組等平臺(tái)的數(shù)據(jù)有效共享,促進(jìn)多方交流。
在鐵路信息化、數(shù)字化飛快發(fā)展的同時(shí),鐵路數(shù)據(jù)安全問(wèn)題得到了越來(lái)越多的重視,在不泄露敏感數(shù)據(jù)、保證鐵路業(yè)務(wù)運(yùn)營(yíng)安全的前提下,提高數(shù)據(jù)的利用率、降低數(shù)據(jù)安全風(fēng)險(xiǎn)是目前鐵路各數(shù)據(jù)平臺(tái)發(fā)展的關(guān)鍵。本文結(jié)合鐵路數(shù)據(jù)服務(wù)平臺(tái),構(gòu)建鐵路數(shù)據(jù)安全與隱私保護(hù)技術(shù)體系,從數(shù)據(jù)生命周期前后的各階段進(jìn)行管理,基于數(shù)據(jù)匿名、數(shù)據(jù)加密、訪問(wèn)控制、隱私計(jì)算、區(qū)塊鏈等技術(shù),解決平臺(tái)中出現(xiàn)的數(shù)據(jù)安全問(wèn)題。目前,我國(guó)鐵路行業(yè)數(shù)據(jù)安全和隱私保護(hù)的研究尚處于起步階段,還有待進(jìn)一步探索。