周 洲 田有亮 楊 楠 郭 春 牛 坤
(1.貴州大學 計算機科學與技術學院,貴州 貴陽 550025;2.黔南民族師范學院,貴州 都勻 558000)
物聯網、人工智能、移動設備等的快速發展帶來了數據爆炸式增長,大數據蘊含的巨大價值得到了各行各業的青睞。 然而,我們社交、購物、辦公產生的數據卻在不經意間被搜集、被挖掘和分析,用戶個人數據因此變得“透明化”,一旦發生信息泄露,用戶個人信息將被暴露得一覽無余,隱私(如消費行為、位置記錄和網絡訪問軌跡等)遭到嚴重侵犯[1,2]。 因此,如何在充分利用大數據的同時不泄露用戶的隱私,是大數據技術發展的關鍵問題。 早在2014 年2 月27 日,中央網絡安全和信息化領導小組宣告成立,并提出“沒有網絡安全就沒有國家安全”,可見,數據安全早已上升到國家戰略層面。 如果隱私需求得不到保障,用戶將不愿意共享數據進行分析,因此,保障大數據安全已是一個迫在眉睫的問題,而保障數據安全最基本的方式就是利用密碼技術,對敏感數據進行隱私保護。
現代密碼學課程作為貴州大學信息安全專業本科、碩士研究生培養的核心專業課程,內容涵蓋流密碼、對稱密碼、公鑰密碼、密鑰管理、 消息認證、數字簽名、安全協議設計、密碼分析等內容,貫穿當前數據安全與隱私保護主流研究體系內容。 特別是在信息安全問題頻發,網絡空間安全上升為國家戰略、強調自主可控的網絡時代, 數據安全與隱私問題逐漸成為信息化發展的關鍵問題,區塊鏈、數據安全共享與交換、數據可信獲取與確權、人工智能安全等諸多重要而又棘手的前沿理論與技術研究更是離不開密碼學基礎。 本開放實驗旨在緊跟該專業“服務國家和大數據發展戰略”的定位、立足國家網絡安全頂層設計與國情、瞄準前沿方向,構建以鞏固密碼學理論知識、 解決數據安全實際問題為目標的開放實驗設計體系, 為突破大數據安全與隱私保護領域的重難點問題奠定堅實基礎。
一方面,大數據時代的安全保護也對密碼技術提出了新的要求: 一是密碼技術如何適應大數據的特性,使處理大數據具有良好的擴展性和效率;二是在保護數據安全的基礎上仍然能對數據進行分析和挖掘。 盡管學者們就上述問題提出了相關研究方案,但在準確率、 安全代價及效率等方面沒有達到最優,因此結合密文檢索、人工智能[3]等新型技術進行密碼實踐研究和探索成為必要。
另一方面,實踐教學是高校培養應用型人才的重要組成部分, 傳統的實驗教學大多屬驗證性實驗[4,5],以實驗指導書為參考,照搬式的實驗方式不僅無法讓學生體會理論、實驗、應用三者融合的方法,而且缺乏靈動性,無法激發學生的學習熱情,領會密碼學在解決信息安全問題的作用, 不利于學生思考和創新,提升科研能力[6]。
現代密碼學開放實驗課程擬補充教學實驗的不足,聚焦數據安全熱點,分析信息安全領域重點難點,從思想站位、理論應用、關鍵問題思考、方案設計、技術攻關等多角度出發,培養學生“融會貫通、學以致用”。
本設計針對加密云存儲的密文檢索問題和機器學習數據安全問題,重點考慮支持代理權更新的密文檢索技術和基于密碼技術的聯邦學習方法的探索和實踐,通過數學困難問題、安全多方計算等密碼學理論,解決云安全存儲的訪問控制和機器學習的用戶隱私保護難題。
2.1.1 實驗目的和要求
(1)掌握公鑰密碼體制、雙線性映射原理和相關性質。
(2)掌握密文檢索的安全模型和安全分析方法。
(3)理解安全協議構造關鍵點和步驟,明確系統建模思路。
(4)掌握密碼算法包的使用,熟練應用相關編程語言。
2.1.2 實驗原理
在云端存儲密文的同時,也存儲與之對應的搜索關鍵字形成的加密索引;用戶要查詢文檔,需獲得相應權限,并利用該權限和待搜索關鍵字生成查詢令牌發送到云端; 云端強大的計算能力足以快速查詢匹配,將滿足條件的密文集合反饋給查詢用戶。 基于問題導向,構造系統模型。 該系統由代理服務器P、云服務器S、數據擁有者、數據查詢者組成,文件基于倒排索引進行存儲。 數據擁有者抽取文件關鍵字產生索引,隨加密文檔上傳給代理服務器P。代理服務器P 由服務購買者或第三方提供,完成索引陷門的重加密和索引搜索標識,與服務器S 進行關聯,產生索引列表,并接受合法用戶的查詢請求;云服務器主要完成對密文的存放和接受代理服務器P 的查詢請求;任意具備訪問權限的用戶可生成查詢令牌向代理P 申請文件查詢。 其中,服務器S 和代理服務器P 是誠實而好奇的,它們會忠實執行協議, 但會分析已獲得數據進行挖掘分析,每個用戶既是數據擁有者,也可是數據查詢。
2.1.3 實驗內容
本題目的任務是根據安全目標構造訪問策略和安全模型,基于密碼算法設計一種滿足需求的可搜索加密方案并實現。 一個支持代理權更新的可搜索加密系統由4 個階段構成,分別為初始化設置、數據加密、查詢陷門生成和檢索及代理權限轉移。 其中,初始化階段包括系統參數設置、 用戶密鑰生成和訪問授權;數據加密階段由代理P 和服務器S 三者交互,完成索引生成、 文檔加密密鑰生成和文檔加密及安全存儲;在查詢陷門生成和檢索階段,查詢用戶生成搜索令牌向代理P 請求查詢,P 根據權限驗證結果確定是否進行密文返回;在代理權限轉移階段,當代理P 預將數據的代理權限轉移給Pi+1,則由P,Pi+1,S 執行權限轉移協議。
基于該任務,完成如下工作:
(1)綜述可搜索加密技術的研究的現狀,并進行分類總結。
(2)針對數據擁有者、數據訪問者和云數據庫服務器,討論密文檢索的安全訪問策略和模型,以此為基礎,基于雙線性映射和對稱密碼設計一種可行的密文檢索方案。
(3)從數據機密性、前后向安全性、搜索模式安全性等角度分析構建敵手模型,分析方案安全性。
(4)基于提出的理論模型和方案,設計和開發可搜索加密系統,并進行系統測試和性能分析。
2.2.1 實驗目的和要求
(1)掌握安全多方計算思想,熟練應用機器學習算法。
(2)掌握秘密分享思想及常用的密碼分享方案。
(3)理解聯邦學習提出背景和安全模型,了解聯邦學習常用方法。
(4)掌握密碼算法與機器學習算法融合的機理和實現方法。
2.2.2 實驗原理
針對傳統機器學習因數據收集困難、數據隱私需求的不斷提高而引發的受限發展問題,谷歌率先提出了聯邦學習框架,使雙方或多方的數據使用實體在合作當中數據不出本地也能共同使用,解決數據孤島問題和隱私安全問題。 在該模型中,各參與方保留本地數據訓練模型,將各自模型參數利用新型密碼技術傳輸給一聚合服務器,服務器完成參數聚合后返回新的參數至各參與方,如此迭代至收斂。 在聯邦機制下,各參與方身份和地位彼此相同, 保證數據不出本地、利用加密機制實現參數交換,建立虛擬共有模型,且虛擬模型同傳統模型下將數據聚合訓練出的最優模型一致。
一是將秘密分享與同態密碼體制結果, 構造一種門限數據聚合方案, 在支持用戶退出的同時能完成參數的安全聚合。 二是利用隨機生成器,結合簽密思想,構造一種支持用戶驗證聚合數據的聯邦學習框架,以解決數據被偽造等問題。 通過真實數據集完成安全的聯邦學習訓練和測試, 并與當前同類型方案從安全性、計算量、通信量等方面進行比較。 三是基于博弈論構造激勵機制,激勵理性用戶貢獻優質數據參與訓練。
2.2.3 實驗內容
當前聯邦學習仍面臨著推斷攻擊、 數據泄露、病毒攻擊等安全問題。 通過分析多應用場景的聯邦學習應用模式,設計系統模型和安全模型,綜合考慮數據隱私保護、門限聚合、可驗證等屬性,針對具體的機器學習算法提出聯邦學習框架,并完成模擬實驗。 可從如下幾個方面選其一進行研究。
(1)基于安全多方計算和同態加密的聯邦學習模型研究
針對應用場景數據特點, 選定一類機器學習算法, 利用安全多方計算完成共同用戶群體的確認;利用同態加密實現加密參數的聚合,實現多方共同參與訓練并安全有效地上傳模型參數。
(2)支持可驗證、滿足前后向安全的聯邦學習模型研究
根據相關隱私保護條例, 當參與用戶退出后,其提供的參數將不能繼續被使用,這就引發了聯邦學習前后向安全問題。 因而研究支持用戶退出的、滿足在線用戶驗證聚合參數的正確性的聯邦學習框架成為必然。
(3)基于博弈論的聯邦學習激勵機制研究
如何最大化地激勵參與方利用高質量的數據參與訓練,并且誠實地執行協議是聯邦學習順利進行的必要條件。 基于信譽值的高低選取模型參與者,引入區塊鏈進行信譽計算和管理,并利用激勵機制和博弈理論完成模型優化。
該開放實驗涉及知識面校廣,不僅要求學生具備完備的密碼知識體系, 而且對于算法分析與設計、機器學習及軟件開發具有較高的要求,適用于學生拔高練習和培養科研創新能力。 因此,該類開放實驗將以小組為單位、分工協作完成。 擬定研發周期為3 個月,包含前期調研、科學問題提煉、研究內容規劃、技術方案構思、安全分析與性能分析、應用實踐等環節,圍繞以下幾點進行實驗教學和指導,以推進學習進度:
(1)一是從網絡空間安全的重難點問題,概覽整體章節知識體系, 讓研究生沿著 “問題—應用建模與方案—理論知識點”的主線度清晰把控密碼學知識。
(2)帶領學生分析任務需求,從關鍵問題拋出科學問題,引導學生分工,就某個核心問題進行自主探究式學習,幫助小組從整體理解相關算法、協議的原理和構造思路,通過問題導向促進活學活用,培養其科研能力。
(3)以討研式教學貫穿整個設計過程,構建以學生為主體、教師為客體的探討式學習,一方面按知識結構劃分模塊、指定研究生調研并講解,另一方面由教師補充延伸。
本開放設計擺脫唯文檔的表面考核形式,通過任務驅動建立考評機制,重點考查研究生對知識點的全局把控情況、融會貫通與實踐應用程度,以及剖析問題和解決問題的能力,融合多元化考核方式,制定“研討活躍度+理論創新+應用性+答辯展示效果” 的考核機制。 其中,研討活躍度重點考查學生的學習積極性、主觀能力性,理論創新考查學生攻克問題和舉一反三的能力,應用性考查學生將理論成果進行實踐轉化的能力,最后學生將通過答辯展示匯報工作,以鍛煉表述能力和文檔寫作能力。
實踐應用能力和科研創新能力提升是高校培養學生的重要方向。 本文從當前實際教學情況出發,圍繞數據安全和隱私保護中的密文檢索和聯邦學習隱私保護問題,結合密碼學技術從科研探索的角度設計了開放實驗項目,并為實驗過程管控和多元化考核提供了思路, 以培養學生具備網絡空間安全大局觀,提升科研創新與應用能力。