徐福燕
隨著計算機系統規模越來越大,全球數據存儲量呈現爆炸式增長,企業及互聯網數據以每年50%的速率在增長。據Gartner 預測,到2025 年,全球數據量將達到175ZB,而中國的數據總量也將達到48.6ZB。數據爆發性增長給數據存儲技術方案帶來了前所未有的變革。
傳統的中心化集中存儲經常有數據丟失、網絡盜竊、個人隱私泄漏,甚至是運營關停等問題發生,而且集中存儲極大占用了骨干網網絡帶寬,而大規模擴容骨干網寬帶資源將消耗大量的投資,在中心化的存儲架構下,該問題難以有效地解決。
分布式存儲以其高性能、方便平滑擴容、較高的數據安全等優勢,已經成為當前存儲市場上主流的技術模式,受到了企業、政府及個人消費者的青睞。在分布式網絡中,需要存儲的用戶可以用更便宜的價格、更安全和透明地存儲數據,而且也大大縮短了數據查詢與調用的時延。
不管是集中存儲還是分布式存儲,主要的數據安全策略是進行RAID 備份,如RAID0+1、RAID5、RAID6 等。但RAID 機制仍有很大的局限性,如RAID6 方式,在同一集群內也僅允許同時壞掉2 塊硬盤。如果分布式存儲節點出現網絡故障、電源故障或存儲設備故障時,就有可能造成存儲的重要數據資料丟失。
2009 年1 月份比特幣上線后,世界各國對區塊鏈的研究與應用飛速發展,區塊鏈甚至被認為是繼蒸汽機、電氣化、計算機之后的第四次工業革命的重要成果。經過10 多年的技術沉淀,區塊鏈技術得到了長足發展,在全球領域內已實現金融、政務、醫療、保險、工業制造等多個領域不同程度的應用,社會對區塊鏈的價值和適用場景的認識不斷提高,區塊鏈的去中心化、加密、防篡改等優勢特性變得眾所周知。在區塊鏈時代的背景下,基于區塊鏈技術的分布式存儲應運而生,為分布式存儲提供了加密、防篡改、自動恢復、多副本備份等功能,讓重要數據安若磐石,滿足市場上行業客戶對存儲數據高安全性的要求。
分布式存儲采用兩級架構,管理運維功能集中部署在上層,數據節點分散下沉,對外提供數據存儲和業務訪問的能力,如圖1。分布式存儲采取集群建設模式,將寫入數據負載分擔到集群內所有節點做數據切片存儲處理,擁有高效的寫入效率,并通過 EC(Erasure Code)糾刪碼策略、RAID6 等數據安全等多重保護策略,支持數據重構,提高寫入數據的安全性。

圖1 分布式存儲架構
區塊鏈是一種去中心化的分布式電子記賬系統,是以區塊結構存儲數據、多方共同維護的、使用密碼技術保證傳輸和訪問的分布式數據存儲技術體系。在加密算法的配合下,交易信息按照發生的時間順序記錄在區塊鏈系統中,并附帶相應的時間戳。數字區塊必須通過所有參與交易的人一致同意才可以更新,因此不容易被攻擊者通過數據攔截、修改或刪除進行非法操作,具有去中心化、時序數據(即時間戳)、可追溯、防篡改、安全可信等特點。其主要核心技術是共識機制(PBFT、RBFT 等)、智能合約、多級密碼機制(數字簽名算法、安全哈希算法等)。
區塊鏈和分布式存儲技術相結合,充分利用了兩種技術的優勢特征,是分布式數據存儲、點對點傳輸、共識機制、加密算法等計算機技術的新型應用模式(圖2),解決了多點之間相互信任以及數據安全的問題,在智慧工地、醫療影像、電子病歷、法院卷宗、政務單據等方面都有廣闊的應用前景。

圖2
1)在云資源池上,部署區塊鏈業務平臺,客戶可通過互聯網或VPN 網絡,將重要數據文件上傳到區塊鏈業務平臺上。
2)在分布式存儲節點上,同時部署區塊鏈功能節點。為了避免將存儲數據直接暴露在公網中,區塊鏈各節點通過VPN 網絡與云資源平臺上的區塊鏈業務平臺主節點進行對接交互,提高數據安全性。
3)區塊鏈業務平臺根據客戶需求,分配需要的存儲空間大小,按最小化訪問策略限制其他公網IP 訪問的黑白名單,并配置所需要的副本存儲數量(N=3,5,7 等)。
4)客戶將重要數據文件上傳到區塊鏈業務平臺,平臺將文件信息進行MD5 加密上鏈,并根據用戶的多副本存儲需求,異步存放到各個存儲節點中,通過多副本異地存儲的方式,大大提高了數據存儲的安全性和可靠性。
5)上傳的文件信息存儲到區塊鏈各節點上,各區塊鏈節點共同維護有效地保證了存儲數據不被篡改。
6)系統可主動進行定期掃描,若某個存儲節點數據損壞或丟失,區塊鏈節點進行文件信息校驗,并從其他節點中重新獲取數據并進行修復。

圖3
在系統部署上,將區塊鏈存儲業務平臺劃分為能力層和業務接入層,業務接入層負責對接客戶側的互聯網或VPN 網絡接入,按公網、VPN 專網兩種方式分別設置接口機,能力層則將區塊鏈及存儲能力相關能力封裝為基礎核心能力,供接入層進行調用,以避免存儲節點和區塊鏈節點公網環境建設一套,VPN 環境再建設一套,達到節省建設投資并大大提高存儲資源利用率的效果。
在網絡安全上,系統訪問控制依據最小化按需訪問策略進行制定,主要通過防火墻限制訪問,通過協議和端口的限制,制定按需訪問控制策略。
1)智慧工地。在建筑工地上,建設工程往往涉及多家單位共同參與,設計、施工、監理、審核,以及物料搬運、存放等涉及多方人員交互(圖4),人多事雜,而且信息化程度不高,很多建筑工地的施工圖紙、合同等紙質材料成堆存放,待工程完工后裝運到總部歸檔,工期一久,存在字跡模糊不清、合同金額多次變動等諸多問題,無法得到及時有效監管。此外,文件材料成袋存放或裝運,有丟失或損壞風險,如工地坍塌、意外失火、大雨淋濕等情況下極易造成文件損毀。智慧工地借助區塊鏈技術,可以將設計圖紙、材料清單、合同等檔案材料及時上傳,加密上鏈保存,將文件以多副本形式存放在多個區塊鏈節點中,避免文件受損或被惡意篡改,及時得到有效的監管,同時,多副本區塊鏈存儲方式,也極大提高了文件的安全性。

圖4
2)智慧醫療。傳統醫療云存儲一般也是單文件存儲方式,醫療病歷、醫療影像相關數據安全可靠性達不到容災的要求。將存儲文件的MD5 信息加密上鏈,利用區塊鏈可信、防篡改等特點,保證醫療數據文件不被篡改和丟失,通過數字簽名實現了數據操作過程中的身份驗證,并對數據操作進行追蹤溯源。
3)法院卷宗。隨著信息化程度的不斷提高,與法院判決有效的電子記錄數量大規模增長,區塊鏈分布式存儲可以有效解決法院的電子記錄保存、更新方面長期存在的問題,如法院判決、法院禁令記錄、犯罪前科記錄等相關信息,實現電子信息的及時準確更新。此外,利用區塊鏈智能合約,可將對經濟案件合同中的條款添加到區塊鏈上,當違反合同約定條款等違約行為產生時,即可自動執行賠償措施。
如今,國家明確指出要將區塊鏈作為核心技術自主創新的重要突破口,加速推動區塊鏈技術和產業創新發展,區塊鏈存儲在當前人工智能、大數據、物聯網的時代背景下,必將迎來廣闊的發展前景。