雷中杰,徐慶,孫暉,張欣,李飛
(中國移動通信集團湖北有限公司,湖北 武漢 430000)
運營商大數據安全領域的相關研究,目前主要體現在大數據基礎架構的安全技術方面以及隱私保護等方面,缺乏管理層面的運營商大數據對外共享管控機制的研究方案。因此本文深入分析大數據環境下,運營商對外數據共享面臨的問題,根據相關業務特點,針對外部合作單位監管的重要環節,提出了優化安全管控機制的相關建議,可供參考。
由于某些數據的特性決定了擁有者不愿意將自己掌握的數據分享出去,畢竟一些大型數據需要他們花費很多時間、金錢甚至動用整個團隊才搜集到的,數據成本非常大,而且若這些數據持有者在這部分領域占有絕對的優勢,很容易形成自身壟斷。比如阿里巴巴公司發起的相關健康項目,他們就可以利用專門的藥品電子監管網,掌握全國藥品零售企業的所有數據信息,他們甚至可以利用相關的數據服務壟斷整個醫藥行業。
由于數據可以變現,可以將其看作為一種資產,而且數據共享需要花時間與精力去維護,若撈不到什么好處,數據擁有者是不會主動共享數據的。隨著大數據的共享與融合,數據本身的價值也相應地降低,這樣一來數據持有者越多,數據本身的競爭優勢就會越來越低。所以通常情況下,數據擁有者很難主動共享數據。對于證券行業或風險投資等領域來說,數據分析的方式基本上都是在線實時處理,數據分析的結果越快出現,對應的收益就越大,否則就會承受巨額虧損,因此數據的時效性相當重要。相互聯系的不同主體因為各種原因,不能保證各主體間之間實時共享相關數據[1]。
數據持有者認為數據是自己獨有的財富,有了這些數據就相當于有了行業的競爭優勢。一旦數據共享后,自身優勢就會被削弱,利益可能會因此受到影響。再說了數據持有者還會擔心數據在共享過程中,個人隱私有可能被泄露,以及核心數據該不該共享等方面的問題。而接受數據的一方則會疑慮相關的數據資料是否安全可靠、完整有效等,各種懷疑之下,數據共享也就成了人們普遍都不愿意做的事情。畢竟他們不是擔心行業競爭就是認為得不到預期回報,以及沒有時間、金錢進行相關的數據管理等。人人都有這樣或那樣的顧慮,數據共享就成了“千金難買我愿意”的難題[2]。
雖然有些主體有數據共享方面的意向,但現實中存在各種限制條件,導致他們無法順利參與數據共享。比如他們的數據來源太過局限而且數據共享技術欠缺等導致數據共享過程中挫折不斷,受數據共享的相關政策及文化等方面的影響若大環境對數據共享并不熱衷,實踐中的數據共享活動也將裹足不前[3]。
想要實現數據共享,不僅要有相關的數據共享技術,還得有提供數據發布、維護以及系統配置等服務相關的各種數據共享平臺。確保該數據平臺能夠支持不同級別數據量的應用系統及傳輸運作,集成數據共享審核、交易等各方面業務,實現跨行業數據應用及共享。若缺乏統一的數據交換平臺,很容易造成重復投資等情況,不利于互連互通相關的數據資源。比如醫療行業,若能有效挖掘、分析相關的醫療數據,對疾病診治、健康干預等方面都有著非凡意義。但醫療數據在共享過程中,會涉及到醫院疾病預防控制、衛生管理、婦幼保健等部門的協調監管,在信息化建設中很容易出現各自為政,標準不統一,數據共享困難等方面問題。因此,只有搭建一個專門的醫療衛生數據集成共享平臺,才能確保信息共享渠道暢通。目前,該類統一標準的數據共享平臺比較稀缺,所以醫療大數據的利用率較低[4]。
由于大數據能夠高效洞察行業趨勢及相關主體的行為,同時也存在安全因素方面的困擾對于軍事、政治方面的保密型數據來說,數據共享無法實現絕對保密。對于一些涉及到個人隱私的數據,政府雖然能夠調用相關數據并采取相應措施,但個人卻無法獲悉信息會被傳播到什么地方,用來干什么,泄露個人信息會產生什么樣的后果等,數據一旦共享很難跟蹤細微數據,對于專業技術欠佳的人來說,根本無法維護自身信息的安全。因此,隱私保護范圍難以確定、侵犯隱私行為的判定以及隱私信息管理難度大等方面的安全問題一直阻礙著大數據共享[5]。
邊界安全:由于大數據安全環境復雜,邊界安全也是大數據安全管理體系的重點考慮因素之一。它包括網絡安全及身份認證。相關的防護對系統及數據/服務的訪問,通過身份認證確保用戶的真實/有效性。Hadoop及其相關系統中的組件都支持Kerberos驗證用戶的身份[6]。
訪問控制與授權:運營商通過對用戶的授權,達到對數據資源及相關服務的訪問管理及控制權限等方面的目的。
數據保護:運營商可以利用加密或脫敏等方式,在數據層面保護業內敏感信息不外泄。其中數據加密主要體現在數據傳輸及存儲兩個環節。在大數據環境下,數據脫敏法廣泛被使用,因為得到的海量數據需要相當開放地,共享給內部不同團隊以及外部的相關機構,數據的利用率越高,價值意義才最大。因此,脫敏法能夠保障部分敏感信息的安全。
審計與監控:實時監控與審計能夠有效管理數據安全取證、回溯及數據的安全合規等方面的性能。
基于以上的安全體系,根據大數據平臺特性,運營商在實踐大數據平臺安全化時,應具備更詳細的結構設計,以數據為中心,完善相關的管理制度,使大數據處理規范化,再從訪問控制與數據客戶層面入手,加強數據使用方面的安全防范力度。然后安全部署網絡與基礎層面的平臺加固,因此大數據安全架構應包含這5個核心模塊。
運營商應根據業務要求、數據敏感性/合規性以及關聯風險等方面,分類、分級管理相關數據,有利于對數據保護的安全管控做出合理決策。從大數據特性層面標記數據(如數據類型、分析方式等)了解數據是如何出現在大數據平臺的,它將被誰使用、如何使用等,有利于運營商對現有數據的訪問,制定可行性較強的相關控制策略。進而掌握敏感數據在大數據平臺的分布情況,并對其使用情況進行有效監控,達到全面保護數據安全的效果。
大數據系統幾乎都支持Kerberos驗證用戶身份,Kerberos能與運營商的LDAP結合,快速生成密鑰分發中心,用戶通過身份認證后,能夠獲取一定的大數據平臺訪問資格,并設置好用戶的訪問權限。在制定相關的訪問控制方案時,應符合相關要求結合敏感數據的相關保護策略等,針對不同業務需求制定不同的訪問控制規則,實現數據高效利用。
數據保護技術是針對整個大數據產業快速發展的有力保障,通過脫敏匿名化限制分布等相關技術處理之后,讓經過處理之后的數據達到安全交易、對外共享的目的。對企業內部來說,脫敏后的數據,無限設定復雜的訪問控制,能讓更多的數據分析應用得到高效實施,并通過開發出新的項目。在充分利用大數據的同時,應遵從行業數據監管隱私相關的法律法規。
運營商為了保證數據傳輸的安全性,各節點之間或客戶端與服務器之間的通信都應加密處理(比如Hadoop平臺支持RPC加密等)。除了加密設置網絡通信以外,化可以使用網關服務器將客戶端與大數據平臺的直接訪問進行有效隔離,以此提升網絡安全。
大數據平臺需要分析或識別一些安全事件,解決非法訪問或特權訪問等方面的問題,因此需要審計并監控大數據平臺的一切活動,使其生成相關的報警信息。即安全事故監控系統。利用SIEM系統能有效收集、監控分析以及生成各種安全報告,捕捉一切可能發生的安全事故,進行事后分析、追蹤根源。
總之,大數據時代,數據價值的潛力無限,為了更好地挖掘數據資源中的有效信息,使其在實踐中得到合理應用。必須同時考慮相關的數據成本及經濟效益。因此數據共享無疑是最好的途徑,在運營商大數據對外共享的同時,相應的阻礙問題也在接踵而至,所以必須深入分析數據共享存在的一系列問題,克服所有的共享困難,才能在實踐中進一步優化運營商大數據對外共享安全管控機制。