編者按:
數字經濟時代,一方面數據要素流動旺盛,一方面重視數據安全、加強個人隱私保護。如何平衡數據要素流動與個人信息保護的沖突,如何在確保數據安全的前提下,最大限度地挖掘大數據價值,是當前面臨的一大難題。中國電子正加快打造國家網信產業核心力量和組織平臺,在“數字中國”建設、數字經濟發展和數據要素市場化配置綜合改革領域開展理論研究和地方實踐,并取得了階段性成果。作為國內首個數據治理領域的學術期刊,《網絡安全與數據治理》正在成為相關領域理論研究和工程實踐的重要學術平臺,希望通過本次采訪能夠讓業界更廣泛的了解國內數據治理領域的發展方向和理論突破。
方濱興:數據已成為國家戰略資源和關鍵生產要素,隨著數字經濟時代的到來,建設安全可控的數據開放平臺,培育數據交易市場成為當務之急。為此,國家提出推進政府數據開放共享,加快推動各地區各部門間數據共享交換、公共數據開放和數據資源有效流動。但是,數據安全關乎國家安全、商業機密及個人隱私,需要處理好數據開放利用與隱私保護之間的關系。我們看到,國家相繼出臺了《數據安全法》《個人隱私保護法》等法規政策,要求在加快培育數據要素市場的同時,還要對數據進行分類分級的安全保護,實現數據安全與數據開放利用并重。
實現數據安全與數據開放利用并重,其實質是多目標優化的問題,用簡單的最優目標的求解方法很難達到,需要在數據要素流動和數據安全之間建立一種平衡。從數據流動和計算模式兩個技術維度可以形成四大類的解決方案:一是,在集中計算模式下實現“數據可用不可見”。典型技術如李鳳華教授提出的隱私計算,通過隱私泄露代價和概率的計算模型來求得所接受的計算方法與保護結果。二是,在協同計算模式下實現“數據可用不可見”。典型技術如姚期智院士提出的安全多方計算,允許多個數據所有者在互不信任的情況下進行協同計算,然后輸出計算結果。常見如混淆電路、不經意傳輸,同態加密等協同計算技術。三是,在協同計算模式下實現“數據不動程序動”。數據不流通的情況下需要算法程序流動,典型技術如楊強教授提出的聯邦學習,主要是采取聯邦學習框架,將集體學習算法程序分散到各數據擁有方,然后再將訓練參數傳回來以實現數據利用。四是,我們提出的在集中計算模式下實現“數據不動程序動”。其基本思想是要構造一個可信的執行環境,即通過構建“模型加工廠”為數據開放利用提供一種可用于加工模型的安全可控分析平臺,保留所有權釋放使用權,實現隱私保護與數據流動共存的最優目標。
方濱興:數據開放利用需要依賴與數據無關第三方,而且高度依賴數據管理部門(模型加工廠)的可信。比如政府部門擁有大量數據,但是因不具備計算平臺而無法實現數據挖掘利用,數據紅利遲遲無法釋放。將數據放到擁有計算能力的可信機構中,讓程序動起來成為必然選擇。
首先,核心方法——數據不動程序動。采用網絡靶場技術構建一個可信計算平臺(模型加工廠),使得外部程序可以在平臺上運行,隱私數據以只具有中間特征的裸數據的形式放在該平臺中。在通過數據沙箱完成程序調試后,由擺渡過來的外部程序對裸數據進行模型加工,程序所有者(客戶)與程序本身完全脫離,不再能通過操控程序來直接看到數據。
第二,關鍵手段——分享價值不分享數據。采取防水堡等信息過濾技術,確保外部程序在可信計算平臺中運算后,向外輸出只能是參數之類的宏觀信息,而非微觀的隱私數據,由此確保該可信計算平臺僅僅以模型加工廠的形式提供服務,而不會將隱私數據泄露出去。
第三,輔助模式——數據可用不可見。可信計算平臺在支持用戶數據調試期間,對外提供置換數據供使用者測試并調試。使用者根據所提供的經過變換的樣本數據進行潛在價值的挖掘分析,以便確定從平臺數據中能夠生成什么樣的模型,進而判斷是否要進入模型加工廠進行數據挖掘。
第四,擴展模式——保留所有權釋放使用權。可信計算平臺可提供遠程控制模式,讓數據的所有者來遠程決定可以向誰賦予數據使用權。例如,通過加密網關所有者可將提交的數據加密,所有者授權后才能自動解密讀出,以此達到數據所有者只交易使用權不交易所有權的目的。
至此,模型加工場形成了數據治理的4個核心要素:“數據不動程序動”“數據可用不可見”“只分享價值不分享數據”和“保留數據所有權,釋放使用權”。同時,通過設置數據授權管理機制等,實現“保留所有權、交易使用權”,讓平臺里的內部人員不會隨便把數據拿走,管理者也不能隨意動數據,實現對全量數據(裸數據)的安全加工。而且可信計算環境也包括人員可控,能夠通過技術手段落實責任制。
2021年,“中國網民網絡安全感滿意度調查”共獲得了兩百多萬份的調查信息,每份調查含有兩百多項數據,這些數據因涉及到個人信息而不能公開,但在這兩百多萬份的信息中隱藏著網民上網規律、對網絡社會的感知、對網絡狀態認可情況等有價值信息需要挖掘。我們基于鵬城云腦構建了AI靶場(模型加工場),將調查數據以可信方式托管到鵬城云腦上,來支持數據不動程序動的人工智能模型挖掘模式。通過組織“2021年數據挖掘和人工智能建模大賽”,基于模型加工場安全開放來自廣東省的全國網絡安全滿意度調查數據,共有127支隊伍報名參賽,最終挖掘出真實有價值的增進網民網絡安全滿意度的數據模型。同理,各個城市的數據治理也可以依托央企、國企、政府部門來示范構造自己的模型加工廠,吸引數據擁有者使用模型加工場,對外開放數據,促進數據要素流動和價值生成。
方濱興:網絡安全風險的解決路徑有兩種,一種是風險緩解,一種是風險轉移。企業在購買網絡安全產品時會自覺關注投資回報,即建設投入與預期收益要成比例,通常會選擇具有平均價格水平的產品來抵御基礎網絡安全風險,實現風險緩解。但當邊際收益開始降低時,企業面對殘余風險,即使意識到也很難有動力去投入增量建設成本。此時,可以選擇通過購買網絡安全保險的方式轉移殘余風險。
由于網絡勒索攻擊事件的頻發和歐盟《通用數據保護法案》(GDPR)等法律條例的正式生效,2020年以來,國際網絡安全保險市場規模呈明顯增長趨勢。隨著我國《網絡安全法》《數據安全法》《個人信息保護法》陸續出臺和實施,較完善的數據安全法律體系為在網絡安全領域引入保險機制,解決我國網絡安全風險問題,提高網絡安全風險治理能力打開了窗口期。2021年7月,工信部發布《網絡安全產業高質量發展三年行動計劃(2021-2023年)(征求意見稿)》提出,要“探索開展網絡安全保險。面向電信和互聯網、工業互聯網、車聯網等領域,開展網絡安全保險服務試點。加快網絡安全保險政策引導和標準制定,通過網絡安全保險服務監控風險敞口,鼓勵企業構建并完善自身網絡安全風險管理體系,強化網絡安全風險應對能力”。對數據開放利用與數據安全保護而言,網絡安全保險可作為可信計算平臺的有益補充,一方面可通過發展網絡安全保險,轉移數據安全風險;另一方面,建立交易數據使用權的可信計算平臺,保留數據所有權,釋放數據使用權。最終,共同助力構建新型網絡安全生態,賦能數字經濟的崛起與發展。