譚海軍


摘要:隨著信息時代的來臨,數據共享變得愈加重要。特別是在分布式產品信息的采集與可視化集成平臺中,異構數據表現形式更為復雜。由于異構環境下不同數據管理系統的差異,數據共享變得更加困難。為此,文章對當前異構環境下數據共享機制的研究現狀進行簡要梳理,首先介紹數據共享的原理及基本框架,其次介紹了幾種典型的數據共享機制,最后討論了異構環境下分布式數據共享機制在各領域的應用。此外,文章還探討了一種基于區塊鏈的數據共享交互模型并對未來的數據共享的研究方向提出了展望。
關鍵詞:異構環境;數據共享;數據匹配;信息交換
中圖分類號:TP392; TP14? 文獻標志碼:A
0 引言
異構環境指的是由不同硬件、操作系統、編程語言和數據存儲系統構成的分布式系統[1]。在這樣的環境下,數據共享面臨著諸多挑戰,如數據格式不兼容、數據安全性難以保障等問題。因此,數據共享的機制對于實現分布式系統的協同工作具有重要意義。為解決這些問題,研究者們提出許多數據共享機制,包括數據中介、數據整合、數據轉換等方法[2]。本文將分析和比較不同的數據共享機制,在此基礎上提出一種基于區塊鏈的數據共享模型,以期為解決異構環境下的數據共享問題提供幫助。
1 數據共享的簡介
1.1 數據共享
數據共享的過程從邏輯上由數據存儲中心、數據交換中心、數據管理中心和應用服務中心組成。
數據存儲中心包括多尺度基礎空間數據庫、基礎數據庫和專題數據庫等,其目的是為實現實時數據、歷史數據、基礎數據、空間數據等數據的統一存儲和管理。數據交換中心提供橫向與同級虛擬數據中心的數據共享交換接口以及縱向與上/下級虛擬數據中心的數據交換接口,由中間層與數據庫進行數據交換。數據管理中心負責數據庫的安全性、完整性、備份與恢復、并發控制、版本管理等功能,保障數據庫的穩定性和可靠性。應用服務中心是應用系統與數據存儲中心和其他中間件之間的接口,由中間件和方法構成的中間層,為應用系統提供服務和支持網絡分布計算。
1.2 數據共享存在的問題
數據安全和隱私問題。數據共享涉及數據的公開和共享,因此需要考慮數據安全和隱私問題。如何保證數據在共享過程中不會被泄露、篡改或丟失,是數據共享面臨的重要問題。
數據質量和可靠性問題。共享數據的質量和價值直接影響數據共享的效果。如果數據質量不高或者存在錯誤或遺漏,可能會導致數據共享的效果受到影響。
數據共享權限和管理問題。數據共享需要保證數據的保密性和權限管理,只有授權用戶才能訪問共享數據,否則會導致數據泄露和濫用。
數據共享協議和流程問題。數據共享需要制定合適的協議和流程,以確保數據的規范和高效共享。例如:制定數據共享的規則和標準,確定數據共享的時間表和流程等。
數據共享的應用場景和限制問題。數據共享的應用場景和限制需要考慮,例如:數據共享的時間、地域、類型、權限等。如何在有限的資源和條件下實現數據共享,是數據共享面臨的重要問題。
2 數據共享機制
2.1 數據虛擬化
數據虛擬化可以將異構環境中的各種數據存儲系統虛擬化,統一進行管理和存儲。數據虛擬化的原理是通過在中間層創建虛擬視圖(Virtual View)來訪問數據源。數據虛擬化的優點是將不同數據源中的數據整合成一個邏輯視圖,提高數據整合的靈活性和? 效率,并且減少物理數據復制帶來的數據不一致問題。此外,通過使用虛擬化技術,可以動態訪問數據源,更好地適應數據變化并支持大型數據管理任務的需求。
2.2 ETL工具
ETL工具可以將數據從異構的數據存儲系統中進行抽取、轉換和加載,使得數據能夠在不同的系統之間進行共享。ETL工具作為一種數據管理和處理工具,它的重要作用在于實現數據共享、保證數據質量和數據可用性以及提供便于查詢、分析和報告的數據分析種子。ETL工具可以解決數據集成、數據清洗、數據同步和數據加速等問題,幫助用戶高效地管理和利用數據。
2.3 參與式網格計算
基于大規模分布式系統的框架,提供異構環境下的資源共享和計算能力,支持多種應用。參與式網格計算的核心原理是將計算任務分割成多個小任務,再將這些小任務分散到Internet上的許多個人計算機上,然后通過特定的分布式計算模型,把這些小任務的結果聚集,最終得到結果。這種模式可以利用大量的閑散計算能力,從而實現較快和高效的計算。
3 分布式數據共享機制的應用
3.1 多云存儲
多個異構云存儲環境下,設計安全的數據共享解決方案已成為熱點研究話題。多云存儲是一個異構環境,不同的提供商或私有化云,數據存儲在不同的云平臺上。為實現數據的跨云存儲和分享,需要一種安全的分布式數據共享機制。余宇勁等[3]提出了一種BFT(拜占庭容錯)共識算法,該算法確保在多個云平臺上的數據共享時,不同云平臺之間可靠和安全地共享和存儲數據。
3.2 移動邊緣計算
移動邊緣計算是一種新型的計算模式,它所涉及的計算任務主要發生在網絡邊緣,而不是在傳統的數據中心內部。分布式數據共享機制是實現移動邊緣計算的重要技術之一。它可以將數據分散存儲在多個邊緣設備上,然后通過協調和共享機制,實現對數據的高效訪問和共享。王欣怡[4]提出一種基于區塊鏈技術的數據共享機制,旨在解決移動邊緣計算下數據共享存在的一些挑戰問題。該方案使用區塊鏈來存儲和管理數據,在區塊鏈上記錄每個數據塊的hash值,保證數據的完整性和可追溯性。同時,使用智能合約來實現訪問控制和共享策略的管理。
3.3 供應鏈管理
分布式數據共享機制可以應用于供應鏈管理中,使用該機制可以分散存儲大量數據并確保數據的安全性和隱私保護。此外,該機制還可以保證數據的一致性和可靠性,優化網絡帶寬和延遲,并使用協調和共享機制實現高效數據共享和協同管理。這能夠幫助企業實現高效的信息共享和協同管理,提高供應鏈管理效率。孫曉涵[5]提出了基于分布式數據共享架構的管理方案,這些方案將數據分散存儲在多個節點上,并使用區塊鏈技術來確保數據的安全性和不可篡改性。同時,使用智能合約來控制數據訪問和共享。
3.4 醫療保健
分布式數據共享機制可以應用在醫療保健領域,使用該機制可幫助醫療機構實現數據的共享、協同管理及Workflow的自動化。此外,還可以保護患者隱私,促進數據安全。這能夠提高醫療保健服務的效率和質量,促進患者的醫療保健體驗。拜亞萌等[6]提出了一種分布式數據共享框架,其中數據分散存儲在多個節點上,并使用分布式哈希表實現高效數據查詢和訪問,同時采用加密技術保護患者數據的隱私不受侵犯。該方案可以幫助醫療保健機構實現高效的數據共享,同時更好地保障患者的隱私。
4 基于區塊鏈的數據共享模型
區塊鏈技術的優勢在于其強大的災備能力和數據防篡改機制,這意味著數據不會丟失或被修改。共享數據的交易會被記錄在區塊鏈的側鏈上,而且共享數據存儲和交易的結構是不同的,因此上傳時不會出現上鏈錯誤。最終結果是,數據所有者存儲和管理數據,即誰的數據誰控制。數據只能被許可的訪問者訪問,其他任何第三方無法獲取數據。
本文介紹一種基于區塊鏈的數據共享交互模型,消除了第三方網絡服務器的參與,解決了數據信任問題。該模型通過透明記賬的方式,確保數據供需雙方能夠以靈活、可靠的方式進行交互。為方便數據管理,將數據提供者劃分為兩個角色:數據源和數據所有者,表1具體列出了這些角色的劃分。
基于區塊鏈的數據共享交互模型如圖1所示。
(1)將原始信息進行處理后,得到相關信息RT,RT由共享數據關鍵詞、完整數據的訪問路徑 DAP(可以是 URL、URI 或其他訪問路徑)、數據所有者的公鑰地址組成。
(2)數據所有者將RT在區塊鏈上發布,RT以Data的形式存儲。同時,ST被存儲在分布式哈希表中,ST由數據關鍵詞、數據訪問路徑的哈希值以及數據所有者的公鑰地址組成。
(3)數據請求者通過分布式哈希表檢索到所需的共享數據信息,并獲取到數據所有者的公鑰地址。
(4)數據請求者根據數據所有者的公鑰地址向區塊鏈網絡發送請求QT,QT由共享數據的哈希值以及數據所有者的地址組成。
(5)數據請求者通過身份驗證后,獲得Autho List(能夠對數據請求者進行身份驗證)的授權,可以訪問區塊鏈上的存儲信息Data。
(6)數據請求者使用解密后的Data中的路徑信息,訪問數據源,完成數據共享交互。
5 結語
總之,異構環境下的分布式數據共享機制可以幫助解決跨平臺、跨系統的數據共享問題。現有的異構環境下的分布式數據共享機制存在著許多不足,例如:數據格式不一致,跨平臺、跨系統的數據傳輸速度? 較慢,難以確保數據的安全性等。未來改進方向可以包括:數據格式標準化、改進數據傳輸協議以提高傳輸速度,推出更可靠和高效的數據加密技術以保障數據安全,使用智能合約和區塊鏈等技術實現數據共享和協議管理。
參考文獻
[1]YAO X, HAN X, DU X, et al. A Lightweight Multicast Authentication Mechanism for Small Scale IoT Applications[J]. IEEE Sensors Journal, 2013(10):3693-3701.
[2]ZHU H, LIN X, SHI M , et al. PPAB: A Privacy-Preserving Authentication and Billing Architecture for Metropolitan Area Sharing Networks[J]. IEEE Transactions on Vehicular Technology, 2009(5):2529-2543.
[3]余宇勁,凌捷.基于多云存儲的Android密鑰管理技術[J].計算機應用與軟件,2020(9):286-290.
[4]王欣怡.面向邊緣計算的智能電網數據安全共享研究[D].南昌:華東交通大學,2022.
[5]孫曉涵.基于數據共享模式的供應鏈成本管理研究[D].成都:西南財經大學,2022.
[6]拜亞萌,鄧小飛.融合區塊鏈和云存儲的醫療數據安全存儲和共享模型[J].焦作大學學報,2023(1):75-79.
(編輯 王永超)
Research on distributed data sharing mechanism in heterogeneous environments
Tan? Haijun
(Information Center of Yangtze Normal University, Chongqing 408100, China)
Abstract:? With the advent of the information age, data sharing has become increasingly important. In the integrated platform for collecting and visualizing distributed product information, heterogeneous data representation is more complex .However, due to the differences among different data management systems in a heterogeneous environment, data sharing becomes more difficult. Therefore, this paper briefly summarizes the current research status of data sharing mechanisms in heterogeneous environments, first introducing the principles and basic framework of data sharing mechanisms, then introducing several typical data sharing mechanisms, and finally focusing on the application of distributed data sharing mechanisms in various fields under heterogeneous environments. In addition, the paper also discusses the problems of distributed data sharing mechanisms in heterogeneous environments and proposes prospects for future research directions.
Key words: heterogeneous environment; data sharing; data matching; information exchange