景濤



摘要:本文研究構建多媒體大數據隱私保護和安全共享平臺,旨在保障多媒體大數據的安全性和隱私性,提高數據共享的效率和質量。以多媒體大數據應用的金融場景為例,構建如實還原金融機構生產場景的驗證環境,統籌解決多媒體數據分域或邏輯隔離存儲問題。本文的研究成果對于多媒體數據隱私保護和安全共享具有重要的意義。該平臺的提出不僅可以保護個人隱私,還能夠促進多媒體數據的有效利用和社會共享。同時,該研究也為相關領域的研究提供了新的思路和方法,有助于推動多媒體大數據技術的發展和應用。
關鍵詞:多媒體大數據;隱私查詢;隱私保護;安全共享
引言
隨著大數據和移動互聯網技術的快速發展和廣泛應用,多媒體大數據已經成為人們日常生活和工作中的重要信息來源,多媒體數據逐漸成為推動社會市場經濟發展的中堅力量,但在網絡安全層面,大數據技術卻成為個人隱私和企業隱私泄露的“隱患”,數據隱私保護和安全共享的問題也日益突出。因此,研究多媒體大數據隱私保護與安全共享平臺具有重要的現實意義和社會價值。如何在滿足數據安全和隱私保護的同時,實現數據的流動和價值的最大化、最優化,成為“數據控制者”或“數據處理者”的普遍訴求。
1. 研究背景
隨著大數據時代的到來,大數據技術已經被廣泛應用于金融、能源、醫療、交通等領域,在應用高速發展的同時,數據安全和隱私邊界也愈加重要。現有的隱私保護技術還不能完全滿足多媒體大數據的特點和需求,存在隱私泄露的風險。目前,多媒體大數據處理和分析技術還比較煩瑣和復雜,需要耗費大量的人力和時間成本。在大數據訪問控制中,涉及數據的采集、傳輸、存儲、處理等一系列行為,針對視頻、圖像、語音、文本等多媒體大數據的隱私保護差異化、隱私共享多級訪問控制、隱私保護加密算法等問題,本研究面向多媒體大數據的隱私保護與安全模型,建立多媒體大數據共享隱私動態保護機制。
2. 研究內容
為解決多媒體大數據處理過程中存在的隱私內容多樣化、隱私屬性動態量化難、多因素關聯的隱私內容價值與泄露風險動態評估手段缺乏、延伸控制弱化等問題,需要研發適用于多媒體大數據的隱私保護技術和安全共享機制,保障數據的安全性和隱私性。本文以金融行業數據安全管理為例,在多媒體大數據隱私內容檢測、分級保護和安全共享平臺研究方面,在金融保險機構示范應用并建設圖像、語音數據集。針對涉及多媒體應用的不同金融場景,搭建如實還原金融機構生產場景的測試環境,平臺架構如圖1所示。
系統架構:采用分層架構,分為基礎設施層、數據層、平臺層和應用層。其中,基礎設施層負責多媒體大數據的存儲和管理,數據層和平臺層負責數據的分析和處理,應用層負責提供用戶接口和服務支持。
功能模塊:包括數據處理、隱私保護、安全共享、數據檢索等功能模塊。其中,數據處理模塊負責對上傳的數據進行預處理和分析,隱私保護模塊負責對敏感數據進行加密和匿名化處理,安全共享模塊負責控制數據的訪問權限和共享范圍,數據檢索模塊負責根據用戶需求提供數據查詢和下載服務。
數據傳輸安全:采用加密技術和身份認證技術,確保數據在傳輸過程中的安全性和完整性。
2.1 可行性分析
多媒體數據容量大,格式復雜多樣,其加密算法設計需要考慮加密效率性和密文格式兼容性。為了提升加密效率,現有的多媒體數據加密算法大都選擇采用部分加密技術,通過加密壓縮數據中的部分關鍵信息,以減少加密操作來降低加密算法的時間開銷。現有的并行處理技術相對成熟,將大容量的多媒體數據進行分塊,然后用并行加密處理,可進一步提升大容量多媒體數據的加密速度。因此,輕量級的多媒體數據加密算法的設計與實現是具備可行性的。
針對多媒體隱私數據多源、多維、異構特性時表現出通用性、完備性、一致性差,信息泄露風險高等問題,根據研究基礎分別定量和定性構建安全評價標準。在定量安全評價標準中,通過特征處理技術對原始數據和加密數據進行多分辨率表示,并提取視覺和聲譜圖的特征,最后對提取特征進行相似性度量和加權融合,構建定量安全評價標準。同樣地,在定性安全評價標準中,以自主研發的數據處理算法為基礎,融合最先進的深度學習思想,分別從圖像和音頻兩方面對隱私數據安全性進行評估,并構建多媒體大數據安全綜合評價系統。
多媒體大數據加密存儲平臺采用全新的硬件構架和軟件算法,全方位地釋放NVME閃存顆粒的性能。在工程層面進行大量優化,包括在數據的讀取、加密、傳輸、計算、解密、存儲等各個階段實現優化,進而將整體性能提升到最優狀態,以滿足高吞吐、低時延,以及特定場景的實時性要求。
2.2 先進性分析
通過隱私保護與多媒體數據安全性技術,對多媒體隱私數據內容進行分析,從技術路線和理論基礎兩方面構建的多媒體大數據安全綜合評價系統均具有先進性。
多媒體大數據加密存儲平臺具備自主可信根,從可信根到硬件平臺,到操作系統,再到應用,在體系架構上實現自主可控的防御機制,保證平臺系統的數據存儲安全、傳輸安全和計算安全。在硬件加速層面,通過新的密碼學技術和算法協議,結合硬件加速技術和專有算法實現算力加速,提升平臺整體算力性能。平臺在結構化數據的加密存儲與隱私保護、傳輸過程去標識化、匿蹤查詢以及底層硬件的算力和安全性支撐方面已有相對成熟的方法論,具有較好的先進性。
3. 關鍵科學問題
多媒體大數據隱私保護與安全共享是信息社會的重要問題之一。在多媒體大數據的處理和共享過程中,涉及許多隱私和安全問題。本文以金融行業數據安全管理為例。
在金融數據安全管理方面,按照中國人民銀行發布的《金融數據安全 數據生命周期安全規范》(JR/T 0223-2021)金融行業標準要求,金融機構“應根據安全級別、重要性、量級、使用頻率等因素,將數據分域分級存儲”“脫敏后的數據應與用于還原數據的恢復文件隔離存儲,并留存相關審批及操作記錄”“3級數據的存儲應采取加密等技術措施保證數據存儲的保密性”“4級及以上數據應使用密碼算法加密存儲”[1]。
針對個人金融信息管理,中國人民銀行在遵循《個人信息保護法》基礎上,發布了《個人金融信息保護技術規范》(JR/T 0171—2020)金融行業標準,根據信息遭到未經授權的查看或未經授權的變更后所產生的影響和危害,將個人金融信息按敏感程度從高到低分為C3、C2、C1三個類別[2]。
針對C2、C3類別信息,標準規定:“金融機構應使用加密通道或數據加密的方式進行傳輸,保障個人金融信息傳輸過程的安全”“對于C3類別信息,通過受理終端、客戶端應用軟件、瀏覽器等方式收集時,應采取加密等技術措施保證數據的保密性,防止其被未授權的第三方獲取”“C3類別個人金融信息應采用加密措施確保數據存儲的保密性”“應將去標識化、匿名化后的數據與可用于恢復識別個人的信息采取邏輯隔離的方式進行存儲,確保去標識化、匿名化后的信息與個人金融信息不被混用”“除銀行卡有效期外,C3類別信息不應明文展示”。
金融機構的多媒體信息主要是指個人生物識別信息過程中產生的影像、圖片、聲紋等,其存儲方式大多是非結構化的,且按要求均應該使用密碼算法加密存儲,采用加密通道或數據加密方式傳輸,采取去標識化或匿名化手段展示,并與個人信息邏輯隔離存儲。金融保險業務場景多媒體大數據中的隱私內容精準高效檢測和分級保護,結合輕量化的多媒體數據加密算法,研究構建高效安全的分布式存儲應用系統,實現多級用戶的差異化隱私保護需求和數據安全共享。
3.1 身份照片核驗場景
隱私信息具體內容涉及身份證照片、活體檢測時隨機抓取照片。身份照片核驗如圖2所示,身份證照片會通過OCR抓取姓名、身份證號、有效期信息。因此有必要進行隱私脫敏處理的圖片既包括身份證和活體照片中的人臉圖片信息,又包括身份證號、姓名等個人信息。客戶再次購買保險產品時,會再次觸發活體認證環節,隨機抓取的圖片會與之前加密存儲的身份證照片、公安個人信息庫身份證照片做三方比對。
信息流方面,客戶手機端隨機抓取的照片,明文傳輸至保險公司業務系統(已進入公司信息管理安全域)。通過特征提取功能模塊對照片進行特征值提取后,與數據庫中加密存儲的存量身份證特征值庫進行檢索比對,最終反饋業務系統成功與否。
3.2 前端脫敏展示場景
金融保險業務場景,保險公司分支機構業務前臺和客戶手機需要展示客戶照片進行身份核實或展示等功能,有可能會出保險公司信息系統安全域,因此需要在人工可識別的前提下對照片進行脫敏處理,具體流程如圖3所示。
處理流程方面,邊緣端發起申請,通過匿蹤查詢技術從加密的圖片庫中進行匿蹤檢索,查得后,保險公司對加密的身份照片(可能是身份證或活體照片)進行快速解密,通過隱私計算技術進行脫敏化處理(去特征值化)后,在分支機構業務前臺系統或客戶手機進行脫敏展示。
4. 研究意義
多媒體大數據隱私保護關鍵技術集成平臺,支持海量多媒體隱私內容的精準高效檢測技術及綜合安全評價系統。通過平臺的金融場景的示范應用,將有助于補齊數字保護短板,提升我國大數據隱私保護水平。本項目探索搭建隱私內容檢測、分級保護和安全共享平臺,并在金融保險行業開展示范應用,一方面有利于保護數據存儲、傳輸、展示安全,補齊數字保護短板問題;另一方面能加快圖像、視頻等典型多媒體大數據保護技術落地,提升對金融保險用戶隱私數據的保護水平。同時以此為基礎,未來還可以在金融保險行業其他場景,以及智慧能源、智慧醫療、智慧政務、智慧交通等其他行業進行探索推廣,幫助提升我國大數據行業的隱私保護整體水平。
結語
多媒體大數據隱私安全綜合評價系統研究對于保護多媒體大數據隱私具有重大意義,防止因數據隱私泄露造成的經濟損失,為多媒體大數據安全隱私保駕護航,可以在多領域進行應用,有力推動信息化進程。該平臺可以有效地保護多媒體大數據的隱私性和安全性,同時可以提高數據共享的效率和質量。為聯合風控、聯合營銷、聯合建模等數據融合場景和金融機構的隱私計算應用提供數據安全保障,幫助組織構建安全、開放、共贏的數據生態,助力數據融合計算的健康發展和數據價值釋放。未來,我們將繼續深入研究多媒體大數據隱私保護與安全共享平臺的相關技術和服務,為用戶提供更加安全、高效、便捷的數據服務和支持。
參考文獻:
[1]中國人民銀行,全國金融標準化技術委員會.金融數據安全 數據生命周期安全規范:JR/T 0223-2021[S/OL].2021:5 [2023-9-10].https://www.cfstc.org/bzgk/detail/?id=0&bzId=1913.
[2]中國人民銀行,全國金融標準化技術委員會.個人金融信息保護技術規范:JR/T 0171-2020[S/OL].2020:12 [2023-9-10].https://www.cfstc.org/bzgk/detail/?id=0&bzId=1856.
作者簡介:景濤,碩士研究生,研究方向:IT基礎設施信創國產化。