劉靜

摘要:為解決科學數據共享時容易產生數據泄露和不可用的問題,文章設計了基于區塊鏈的圖書館科學數據安全共享機制。首先,在數據安全共享模型方面,設計了科學數據安全共享體系架構,包括數據源、從區塊鏈、主區塊鏈、數據存儲平臺、認證服務5個模塊,對主從區塊鏈、數據存儲平臺的關鍵技術進行了詳細設計,從技術層面保障了科學數據的安全性和不可篡改性;其次,在數據的安全共享機制方面,設計了安全便捷的數據共享機制,包括科研人員注冊、科學數據存儲、本圖書館科學數據共享、跨圖書館科學數據共享4個流程;最后,從數據使用方面對機制的性能進行了分析,驗證了該機制具有較高的安全性和便捷性。
關鍵詞:圖書館;科學數據;數據共享;數據安全;區塊鏈
中圖分類號:TN919.3文獻標志碼:A
0 引言
近年來,國家對創新發展越來越重視,科學技術研究成果的數量和質量得到快速提升。在科學研究過程中,科研人員產出大量研究成果的同時,也積累了大量的科學研究數據(以下簡稱“科學數據”)。科學數據對科研人員來說是研究的必要工具,對政府部門來說是制定科學決策的重要依據[1-2]。科學數據的重復使用和共享已成為學術界研究的重要內容[3]。只瑩瑩[4]從數據中臺的戰略思維出發,設計了基于數據中臺的圖書館數據共享架構。李洋等[5]對清華、北大等我國一流大學的科學數據共享平臺發展現狀進行了介紹。申雪倩[6]對圖書館數據共享中存在的問題進行了分析,并提出了針對性的發展策略。上述從理論視角對科學數據重復利用和共享問題進行了分析,并提出了針對性的策略[4-6]。但是,如何解決科學數據共享過程中的安全問題,并沒有給出較好的解決辦法。為解決此問題,牛勇等[7]和周耀[8]提出將區塊鏈技術應用到圖書館數據安全管理領域,并給出了應用發展策略。孫紅亮等[9]基于區塊鏈技術設計了科學數據共享的架構,并分析了該架構在資源利用和服務效率方面的性能。只瑩瑩[10]將5G技術與區塊鏈技術進行融合,提出了多種信息技術融合的圖書館服務平臺。張雪媛等[11]和張新鳳[12]分別從通用科學數據和醫學科學數據兩個維度,設計了圖書館數據共享平臺的建設和管理策略。
從文獻分析可知,區塊鏈技術已成為科學數據共享的一項關鍵技術,得到了學術界的一致認可[9-12]。但是,當前研究缺少對科學數據共享如何實現的具體機制的設計和分析,導致數據共享過程中數據泄露和共享難的問題不能被很好地解決。因此,本文設計了科學數據安全共享體系架構,基于該架構設計了安全、便捷的數據共享機制,并且通過具體的數據使用情況,驗證了該機制具有較高的安全性和便捷性。
1 科學數據安全共享體系架構
本文提出科學數據安全共享體系架構,如圖1所示。該體系架構主要包括數據源、從區塊鏈、主區塊鏈、數據存儲平臺、認證服務5個模塊。
數據源模塊由科研人員生成數據,并按照科學數據管理規范,對數據進行規范化處理,從而滿足科學數據訪問和共享的要求。從區塊鏈模塊由單個高校的圖書館進行創建和維護,主要工作是對本機構科研人員的身份進行認證、對科學數據進行安全管理,從區塊鏈中的節點由單個高校的科研人員節點構成。主區塊鏈模塊由多個高校的圖書館共同創建和維護,主要工作是對聯盟高校的圖書館數據進行安全共享。主區塊鏈中的節點由聯盟鏈中的高校圖書館關鍵節點構成。數據存儲平臺模塊采用分布式存儲技術,實現科學數據的安全存儲。認證服務模塊與從區塊證書服務器、主區塊證書服務器進行協作,完成從區塊鏈和主區塊鏈的身份認證服務。其中,從區塊鏈認證服務器主要完成單個圖書館內部科研人員數據的域內認證,主區塊鏈認證服務器主要完成多個圖書館之間數據共享時科研人員數據的域間共享。
2 數據安全共享機制
2.1 科研人員注冊
為實現科學數據的訪問和共享,科研人員在數據共享平臺上注冊是實現數據共享的第一步工作。科研人員在平臺上通過注冊后,就可以從平臺上獲取認證證書,用于后期數據訪問和數據共享的認證依據。科研人員注冊工作主要在單個圖書館的從區塊鏈節點上完成,為完成關鍵信息的加密,科研人員生成公鑰和私鑰密鑰對。
2.2 科學數據存儲
由于科學數據具有數據量大、數據安全要求高的特點,在科學數據存儲時,采用區塊鏈平臺與數據存儲平臺相互結合存儲的策略。在區塊鏈平臺,主要存儲數據的所有者屬性信息和數據指紋信息,用于唯一標志數據的所有者和數據自身屬性信息。在數據存儲平臺,按照數據管理規范對數據進行分布式存儲。
在區塊鏈平臺存儲數據屬性信息時,科研人員先要使用證書服務器發送的證書進行身份驗證。身份驗證通過后,科研人員將身份信息、數據指紋信息、數據加密密鑰、數據使用權限進行簽名,將數據信息和簽名信息保存到區塊鏈節點。在數據存儲平臺存儲數據信息時,科研人員使用公鑰對待存儲的數據進行加密,可以提升數據存儲的安全性。數據的編號為數據指紋信息,可以實現數據的全局唯一性。
2.3 本圖書館的科學數據共享
本圖書館的科學數據共享包括使用者身份認證、使用者權限判斷、獲取數據屬性、獲取數據4個步驟。
在使用者身份認證步驟中,使用者向認證服務器發送自身證書進行認證請求。認證服務器驗證使用者的證書后,要求使用者采用私鑰對認證服務器生成的隨機數進行簽名,從而驗證使用者身份的真實性,避免中間人攻擊事件的發生。在使用者權限判斷步驟中,身份管理合約根據使用者的身份,與權限管理合約協作,判斷使用者訪問數據的權限。權限管理合約是使用者對請求數據內容訪問權限的判斷合約,采用指定訪問者身份ID和身份權限屬性兩種策略。對于數據安全級別較高的科學數據,采用指定訪問者身份ID的策略;對于安全性級別低且通過共享數據獲得獎勵的數據,采用身份權限屬性策略進行管理。下面以身份權限屬性進行權限驗證為例進行說明。在獲取數據屬性步驟中,數據存儲合約根據數據描述從區塊鏈中查找數據的編號,并將數據描述信息發送使用者進行確認。當數據使用者確認數據存儲合約返回的數據為自身需求的數據,數據共享合約將為使用者返回數據的屬性數據,其中包含數據在數據存儲平臺中的位置和數據哈希值。在獲取數據步驟中,使用者根據數據位置和數據哈希值向數據存儲平臺請求數據。為保障數據的安全,數據存儲平臺與使用者進行交互時,采用使用者的公鑰對交互數據進行加密,從而保障數據的安全共享。
2.4 跨圖書館的科學數據共享
跨圖書館的科學數據共享主要用于滿足不同圖書館機構中科研人員的數據共享請求。相對于本圖書館的科學數據共享,跨圖書館的科學數據共享需要主區塊鏈中的節點和主區塊認證服務器互相配合,才能完成數據訪問權限的認證和數據獲取服務。跨圖書館的科學數據共享包括使用者身份跨館認證、使用者權限跨館判斷、跨館獲取數據屬性、跨館獲取數據4個步驟。
在使用者身份跨館認證步驟中,包括使用者身份本館內認證、使用者身份跨館認證兩個步驟。使用者身份本館內認證由從區塊證書服務器與認證服務器協作進行認證;使用者身份跨館認證需要主區塊證書服務器與認證服務器協作進行認證。在使用者權限跨館判斷步驟中,需要主區塊鏈中的節點互相配合完成,當使用者身份跨館認證通過后,使用者所在圖書館在主區塊鏈中的節點作為權限認證的發起者。發起者首先在主區塊鏈中查找被訪問數據所在的圖書館節點(以下稱為“提供者”),提供者調用權限管理合約,對發起者的權值進行判斷。在跨館獲取數據屬性步驟中,提供者按照本館數據屬性獲取步驟獲取數據屬性后,經主區塊鏈的發起者節點轉發給數據使用者。數據屬性信息由提供者調用數據存儲合約,將數據屬性信息提交給發起者,發起者再調用本館的數據存儲合約,將數據屬性信息轉發給數據使用者。在跨館獲取數據步驟中,數據使用者可以根據數據屬性信息中的數據位置和數據哈希值向數據存儲平臺請求數據。此步驟與本圖書館數據共享過程類似。
3 性能分析
為了解本文設計的數據共享機制的性能,下面從數據的采集、存儲、訪問、共享4個環節,分析數據共享過程中的安全性和便捷性。
在數據采集環節,科研人員根據數據管理規范對數據進行整理,在數據使用時可以提升數據的使用效率。由于科研人員需要經過注冊才能獲得身份認證證書,保障了數據的規范性和數據來源的安全性。在數據存儲環節,科研人員所在的區塊鏈節點會調用數據存儲管理合約,不需要科研人員進行繁雜的操作,就可以方便地對數據進行存儲。在數據存儲時,采用數據屬性信息和加密數據分開存儲的策略,保障了數據使用和數據共享的雙重安全認證。在數據存儲時,使用IPFS技術可以實現數據的安全、無冗余存儲,也節約了存儲空間的占用。在數據訪問和共享環節,將數據分為本圖書館數據和跨圖書館數據,并且提供了不同的數據共享機制。在圖書館數據共享時,采用權限判斷和數據共享激勵兩種策略,可以提高數據共享過程的效率。在跨圖書館數據共享時,采用主從區塊鏈中相關區塊節點共同參與認證,就可以實現跨圖書館數據的訪問。在數據共享的安全性方面,本圖書館和跨圖書館數據訪問時,都需要經過認證服務器認證才能訪問數據;訪問數據時,需要使用權限判斷合約和數據共享合約進行自動化權限判斷,提升數據共享的安全性。綜上所述,本文設計的機制在科學數據共享過程中,具有較高的安全性和便捷性。
4 結語
隨著創新型國家發展戰略的實施,科學數據的重復使用和共享得到越來越多的圖書館和研究學者的重視,科學數據的安全、高效共享已成為學術界研究的重要內容。通過對已有研究的分析可知,科學數據的共享已經取得了非常多的研究成果。但是,仍然缺少如何具體實現科學數據共享機制方面的研究成果,導致數據共享中的數據泄露和共享難的問題不能很好地解決。為此,本文設計了科學數據安全共享體系架構,基于該架構設計了安全便捷的數據共享機制,并且驗證了該機制具有較高的安全性和便捷性。
參考文獻
[1]陳薇.我國圖書館科學數據管理研究現狀與趨勢分析[J].圖書館工作與研究,2020(12):39-47.
[2]石晨.日本大學圖書館研究數據管理服務探析與啟示[J].新世紀圖書館,2022(6):83-90.
[3]袁先文,程結晶.圖書館用戶數據共享空間的構建及應用研究[J].圖書館理論與實踐,2021(4):113-120.
[4]只瑩瑩.中臺在國家圖書館的應用思考[J].圖書館論壇,2021(10):76-82.
[5]李洋,溫亮明.我國高校圖書館科學數據開發現狀調研與分析——以一流大學建設高校圖書館為例[J].圖書館工作與研究,2021(12):5-15.
[6]申雪倩.大數據視角下對圖書館網絡信息資源共建共享的研究[J].科技資訊,2022(11):205-207.
[7]牛勇,陳松青.區塊鏈與圖書館發展研究[J].圖書館學研究,2019(4):41-45.
[8]周耀.區塊鏈技術在智慧圖書館中的應用研究[J].現代情報,2019(4):94-102.
[9]孫紅亮,邵彥坤,潘瑩.區塊鏈技術驅動智慧圖書館智慧增值服務路徑研究[J].2021(10):99-102.
[10]只瑩瑩.5G+區塊鏈技術在圖書館智慧服務中的應用研究[J].圖書館工作與研究,2020(10):12-17.
[11]張雪媛,都平平,雷鐳.基于區塊鏈技術的科學實驗數據協同管理研究[J].情報雜志,2022(8):149-155.
[12]張新鳳.區塊鏈視域下醫學圖書館科學數據共享機制研究[J].圖書館工作與研究,2022(9):13-18,28.
(編輯 沈 強)