■ 安徽 劉揚
編者按:本文梳理了新時代大數據監管工作的工作標準——實時、精準、有效與安全,構建了基于數據校驗思想的大數據監管系統的概念架構,為大數據監管系統建設、網絡信息安全防護體系建立提出建議。
開展大數據監管系統建設,以大數據監管系統為技術基礎構建保護個人隱私的網絡信息安全防護體系成為監管部門大數據監管能力建設核心內容。
要實現上述目標,首先要有評價標準——大數據監管的工作標準。而這需要理清大數據系統的特點。
基于大數據的4V特征,結合已經發布的《信息技術大數據系統通用規范》國家標準,從數據的角度來看,大數據系統包含以下特點:
一是實時性強,延遲極低。二是準確性強,偏差極少。三是數據價值總量大,易受攻擊。
因此,工作標準可以概括為四項:實時、精準、有效和安全。
實時是大數據系統的共同特點,而大數據監管工作本身也要依托大數據監管系統開展,對被監管節點實時監測,實時糾正。
射頻治療疼痛的方法近年來也出現了一些新的變化,從以往的被動的神經治療,到今天的主動治療,針對神經受壓根源來進行根源性的治療,從而調整神經傳導,增加神經血流,產生保護的效果。經過這些年的治療,結果表明該方法是一種比較可行的疼痛緩解的方法,同時,該方法的副作用也比較少,不良反應的情況十分罕見,即使存在不良反應也可以在比較短時間內康復。
精準包含兩個層面的概念,一是精益,二是準確。精益指監管數據提取最小化,降低大數據監管系統內包含的數據價值。準確指在監管時直接定位到末梢,減少不必要環節。
有效是針對技術手段效果的評價。在用戶個人隱私保護實踐中,有效既可以是被監管節點運用匿名化技術防止數據還原,也可以是被監管節點通過加密傳輸防止數據被違規獲取等。
安全是大數據監管工作面臨的最大挑戰。被監管節點中所包含的數據價值越大,越容易成為被攻擊的目標,甚至大數據監管系統本身也存在被攻擊的可能性。
在建立了工作標準后,需要選取合適的技術手段進行組合搭配。在本研究中,將數據校驗思想作為選取原則。
數據校驗的概念,可以追溯到計算機通信領域的數據傳輸。其本質是為保證數據經過傳輸后的數據完整性而進行的一種驗證操作。
從數據校驗的相關研究來看,主要包括以下三方面:
一是提升數據傳輸的效率。例如通過低密度奇偶校驗碼的壓縮感知重構,在誤碼率不變的前提下實現低信噪比的高可靠性通信。
二是提升數據傳輸可靠性。以CRC直驅表法為例,在200Mbps的碼率下,可實現HOTLink總線接口下40米零誤碼可靠傳輸。
三是保證信息傳輸的完整性、發送者的身份認證和防止交易中的抵賴發生。楊占民等人提出一種基于MD5和數字水印的電子簽章文件校驗方案,實現了文檔的防篡改、文檔的合法性驗證。
其中,在網絡信息安全領域,數據校驗應用于MD5和數字簽名等,其思想實質是計算與比對哈希值,檢驗數據本身是否完整或被篡改。
基于數據校驗思想實質,本研究對大數據監管的監管對象——數據的概念做了進一步拓展。即在大數據監管系統中,數據由數據本體與附屬組成。
數據本體即通常意義上的數據,比如對被監管節點進行監測時提取到的用戶數據。

圖1 大數據監管系統中的數據概念
數據附屬則是提取數據的過程記錄,包括監管節點與被監管節點的節點標識、時間戳以及所提取數據的生成記錄、訪問記錄、修改記錄和哈希值等。如圖1所示。
采用數據校驗思想選取技術手段,主要有以下三方面的優點:
一是與當前網絡信息安全防護發展的總體趨勢保持一致。目前,網絡環境趨于復雜,攻擊手段不斷升級,呈現出從黑名單、白名單轉向關注行為的發展趨勢。將提取數據的過程轉化為數據的附屬結構,可以更及時有效的追溯可能出現的違規訪問、篡改數據等異常行為。
二是與監管部門自身監管能力建設的發展方向保持一致。隨著大數據監管系統的建設,監管系統本身的數據價值也會隨之增長,也存在成為被攻擊目標的可能性,因此需要在開展大數據監管工作的同時防止監管節點可能出現的各類異常監管行為。
三是基于數據校驗思想拓展的數據概念與區塊鏈基本組成單元區塊的結構相似。區塊由區塊頭和區塊體組成,區塊頭記錄區塊本身各項特征值,區塊體記錄數據。因此,區塊鏈的不可篡改、可溯源等特性可更方便的應用到基于數據校驗思想建設的大數據監管系統上。
基于數據校驗思想,大數據監管系統建設中需要的技術基礎大致有以下三類:
一是被監管節點配置的各項網絡信息安全技術。這些技術包括TLS/SSL協議、入侵防護技術、追蹤溯源技術、新型加密技術(混合加密、同態加密等)、數據匿名化技術、基于數據失真和加密的技術、訪問控制技術等。
二是檢測被監管節點已部署的網絡信息安全防護技術能力的監測技術。包括流量識別技術、安全審計技術、數據挖掘技術等。
三是記錄監管節點開展監測全過程的支撐技術,包括區塊鏈、邊緣計算等。區塊鏈具有不可篡改、可溯源等特點,目前在物聯網、隱私保護等領域廣泛應用。邊緣計算把計算、存儲、帶寬、應用等放在網絡的邊緣側,減小傳輸延遲和帶寬消耗。區塊鏈與邊緣計算的結合,可以有效減輕中心節點的壓力,便于監管節點的大規模部署。

圖2 基于數據校驗思想的大數據監管系統的概念架構
基于數據校驗思想,結合工作標準,可以明確數據校驗各環節的數據校驗重點與對監管節點的功能要求。
(1)在各環節中,監管節點都要達到實時監測、不收集與監管無關的數據、對于異常行為的防護與追溯的功能要求。
(2)在數據收集環節,數據本體與附屬均需校驗,在遇到異常時可精確定位到被監管節點的末級節點。
(3)在數據存儲環節,數據本體與附屬均需校驗,可對第三方存儲數據的完整性進行驗證。
(4)在數據處理環節,數據校驗重點是數據本體,可對隱私數據的不可還原性進行驗證。
(5)在數據使用環節,數據校驗重點是數據附屬,可對訪問行為有效記錄。
綜合大數據監管系統建設需要的技術基礎,基于數據校驗思想的大數據監管系統的概念架構如圖2所示。
構建保護個人隱私的網絡信息安全防護體系,大數據監管系統是技術基礎。在這一基礎上,建立起監管部門、用戶與企業通過系統平臺溝通、協作與聯動的監管機制。從而將技術手段無縫融入到網絡信息安全防護體系中,保障個人隱私安全。
本文梳理了新時代大數據監管工作的工作標準,構建了基于數據校驗思想的大數據監管系統的概念架構,為大數據監管系統建設、網絡信息安全防護體系建立提出建議。