趙錦園+陳小鳳+馬小鵬+邵勝敏



摘 要: 首先由ISI(Integral Satcom Initiative)提出的衛星通信系統架構引出分布式存儲在天地一體化網絡環境中的作用;然后通過對天地一體化網絡環境下的一體化綜合信息系統按三種資源進行了抽象,進一步說明統一存儲資源、數據管理和檢索相關服務對提高天基信息系統效能的重要性。通過對幾類典型的分布式存儲技術進行了對比,根據天地一體化網絡的特點提出無中心的分布式存儲架構。對云存儲系統的總體架構和服務模式進行了說明,針對天基信息系統特點提出構建天地一體化網絡環境下的云存儲系統的關鍵技術點。
關鍵詞: 一體化; 天基; 分布式; 云存儲
中圖分類號:TP393 文獻標志碼:A 文章編號:1006-8228(2016)12-13-04
Abstract: The function of distributed storage technology in space-ground integrated network is introduced in this paper, which is based on the satellite communication system architecture presented by ISI (Integral Satcom Initiative). The integrated information system in space-ground integrated network is abstracted into 3 resources in order to illustrate the importance of unified storage, data management and data retrieval services for enhancing the performance of space-based information system. A Non-central distributed storage architecture is proposed according to the characteristics of space-ground integrated network by comparing several typical distributed storage technologies. Then a general framework and service model of cloud storage system are described, and the key technologies of cloud storage system in space-ground integrated network are put forward according to the characteristics of space-based information system.
Key words: integration; space-based; distributed; cloud-storage
0 引言
“天地一體化網絡”是21世紀科學技術的重大課題之一。根據歐洲衛星通信領域ISI技術聯盟2008年提出的衛星通信系統構想,衛星通信系統由空中部分節點單元和地面部分節點單元構成。其中,空中部分節點單元包括靜止軌道衛星、同步軌道衛星、中/低軌衛星、高空平臺、無人機等,地面部分節點單元包括大容量的固定/可移動站、地面中繼和分布式天線系統等。這個系統中的各種不同的節點可實現非常豐富的功能集合,空中節點可以提供從簡單的透明轉發,到極端復雜的星上存儲轉發和星上數據處理能力,通過連接各個空中節點,也可提供數據中繼和分布式存儲能力[1]。
隨著數字技術和傳感器的發展,面對TB級和PB級的海量異構數據,要準確及時地找到用戶需要的數據和信息,對時空信息加工與處理的自動化、智能化和實時性提出了更高的要求。同時,為了適應空間網絡的時延大、誤碼高、鏈路頻繁通斷等特點,且為網絡動態重構提供支撐,對空間網絡環境下的分布式存儲提出了新的要求。
1 天地一體化網絡環境下的綜合信息系統
天地一體化網絡環境下的綜合信息系統示意圖如圖1所示。
每個節點單元對外提供三種資源,分別是傳感資源、計算資源和存儲資源(即數據資源),作為系統中一個資源節點,在系統的統一管理下工作[2]。通過資源發現、資源管理和資源重組為系統重構提供基礎支撐;智能搜索引擎基于大數據存儲與管理服務實現智能化的主動搜索和被動搜索,為業務層的信息交換、數據分析與挖掘提供高效手段。
2 分布式存儲系統
按適合存儲的數據類型,可將分布式存儲系統[3]分為四類:分布式數據庫、分布式鍵值系統、分布式表格系統和分布式文件系統。分布式數據庫(如Oracle RAC)適用于存儲結構化數據,采用二維表格組織數據,支持多表關聯和嵌入式查詢等復雜操作。分布式鍵值系統(如Taobao Tair)適用于存儲關聯關系簡單但檢索性能要求高的半結構化數據,通常只支持基于主鍵的操作,單存儲節點上的技術實現與傳統的哈希表類似。分布式表格系統(如Google Bigtable)以表格為單位組織數據,不僅支持基于主鍵的操作,還支持范圍查找。分布式文件系統(如MoooseFS,GlusterFS,LusterFS和HDFS)是物理存儲資源通過網絡連接的文件系統,特別適用于存儲視頻圖像等非結構化數據對象,同時也可作為分布式表格系統和分布式數據庫的底層存儲。
綜合考慮天地一體化網絡的特點以及天地一體化綜合信息系統應用需求,本文推薦天地一體化網絡環境下的底層存儲架構借鑒GlusterFS的設計思想。
3 自主可控的云存儲系統
云存儲技術以分布式存儲技術為基礎,一方面高效地整合和管理網絡存儲資源,另一方面為業務層提供友好的數據讀寫和檢索服務接口。主要功能有以下。
⑴ 提供基于海量數據的存儲管理能力,實現海量數據的多機并行存儲和管理。
⑵ 支持存儲虛擬化,能夠將多臺存儲設備的存儲空間整合為存儲資源池,實現存儲空間的動態劃分。
⑶ 系統采用Scale-Out架構,支持通過動態的增加設備單元,實現容量及性能的并行擴展。
⑷ 支持iSCSI、CIFS、NFS,多臺數據服務節點可組成集群并行提供存儲服務,單個數據服務節點故障時,其他節點可接替其服務。
⑸ 具備多種安全備份手段。支持磁盤鏡像、文件副本等冗余備份,單個設備故障時不影響系統使用。
⑹ 提供基于Web的云存儲服務,能夠對數據文件進行高效管理,支持數據文件快速查詢定位,支持RESTfull API接口。
⑺ 云存儲服務支持共享數據和用戶私有空間。
3.1 云存儲總體架構
自主可控的云存儲系統的總體技術架構框架如圖2所示。
自主可控云存儲平臺支持在不同規模的自主存儲陣列機群上的動態部署,并支持系統動態重構、存儲及數據資源的安全統一管理、自適應多級備份及恢復、按需安全存儲服務等。由安全云存儲服務、安全交換服務、海量數據管理、系統管理組成。其中:安全數據云存儲服務是滿足用戶多種需求的云存儲服務,關注的重點在于服務的安全、使用的方便和性能高效,提供對象存儲服務、文件存儲服務、基于塊的卷存儲服務三種服務內容;安全數據交換服務包括提供安全的手段提供支持異地多中心的數據訂閱和分發、高速數據遷移等功能,提供完成統一的消息接口以及消息訂閱分發機制,提供安全又高效的數據導入導出,提供異地多中心間的可靠的數據交互服務;海量數據管理實現海量異構數據(結構化、非結構化)的統一管理,支持數據的快速檢索、并行訪問,支持數據的快速加解密,支持數據的多機備份;系統管理提供包括用戶管理、空間管理、資源管理、密鑰管理在內的系統管理功能,實現強身份認證、用戶及資源隔離分配、多級權限管理等管理功能。
自主可控存儲陣列包括存儲操作系統軟件和存儲陣列硬件。自主存儲操作系統軟件基于面向存儲進行優化和定制的操作系統內核,集成自主可控的存儲功能軟件包括卷管理、存儲虛擬化、存儲接口、快照、存儲加密等軟件,提供統一存儲管理和安全的存儲服務。
安全防護及審計針對云存儲操作系統,提供防火墻、入侵監測、病毒查殺、審計日志、監控報警等功能,能夠針對外部攻擊、病毒攻擊,提供防護并提供監測報警手段。
安全機制通過針對云存儲系統的統一安全架構和策略,并將其貫穿整個云存儲平臺,將多安全級強制訪問控制、加密、審計等安全機制融入到平臺的相關存儲訪問、數據存儲、存儲備份各環節中。
3.2 云存儲服務
采用云存儲系統,可以使應用層不再需要關心數據放在哪里、怎么管理,以及如何進行數據安全防護,通過統一的云存儲服務接口為應用層用戶提供數據服務。
云存儲系統內部實現數據統一管理、數據備份、分布式集群管理、數據加密和安全防護。根據不用的應用需要可提供虛擬卷服務、結構化和非結構化數據管理服務、云盤服務,支持CIFS、NAS、iSCSI接口協議,支持基于HTTP協議的網盤讀寫,提供云存儲API(支持REST風格、JSON風格或定制化)。
4 天地一體化環境下的云存儲關鍵技術
與地面信息系統相比較,天基信息系統具有其特有的動態特征[5]。
由于衛星空間位置的時變性,使得資源網絡拓撲會隨衛星空間位置的變化而產生一定的時變性,資源的使用也具有時間窗口特性。
天基信息系統的建設是一個長期過程,系統資源的數量、性能和資源類型在不斷更新變化。還有就是從維護的角度看,一旦某個衛星資源失效或故障很難修復的,也會導致系統資源組成變化。
因不同用戶對天基信息系統應用服務需求差異較大且會發生變化,其系統資源動態變化將直接導致系統提供的應用服務在變化。
因此,需要采用一種具有高度動態開放性的體系架構來適應系統資源和應用服務的動態變化。構建天地一體化網絡環境下的云存儲系統,關鍵技術點有以下六點。
⑴ 數據分布:如何將數據的多個副本分布到多個節點,以及分布后如何實現跨節點的讀寫操作;
⑵ 數據一致性:在異常情況下,如何保證不同副本的數據一致性;
⑶ 容錯和動態自適應:如何檢測到節點故障,并自動將故障節點上的數據和服務遷移到網絡中的其他節點;
⑷ 負載均衡:系統運行過程和新增節點過程中如何實現自動負載均衡,數據遷移過程如何保證不影響服務正常運行;
⑸ 事務和并發控制:如何實現分布式事務和多用戶并發控制;
⑹ 高效能和低開銷:如何在高效能和低開銷間平衡,在空間有效資源環境下如何以低開銷保證綜合信息系統的高效能。
5 結束語
綜上所述,構建面向天地一體化網絡環境的自主可控云存儲系統是提高天地一體化綜合信息系統效能的基礎。鑒于天地一體化信息網絡的理論基礎、網絡組成、網絡拓撲結構、路由技術、網絡協議等都不同于地面因特網[4],雖然可以借鑒地面通用云存儲系統高性能高可靠可擴展的設計思想,但云存儲技術在天地一體化網絡環境下的應用還面臨眾多挑戰。
另外,天地一體化網絡數據安全的機密性、完整性、可用性十分重要,存儲系統如何實現自主可控,如自主可控軟硬件,甚至從芯片開始到操作系統、開發環境/工具、應用程序的國產化要求已是目前武器裝備對存儲系統的迫切要求。
參考文獻(References):
[1] 閔士權.天基綜合信息網構想[J].航天器工程,2013.22(5):
1-14
[2] 楊小牛,楊志邦,賴蘭劍等.下一代信號情報偵察體系架構:大
數據概念的應用[J].中國電子科學研究院學報,2013.8(1):1-7
[3] 楊傳輝.大規模分布式存儲系統原理解析與架構實踐[M].機
械工業出版社,2013.
[4] 胡源,姜會林等,天地一體化信息網絡國外發展現狀與趨勢[C].
“天地一體化信息網絡”高峰論壇論文集,2013.
[5] 趙陽.易先清.羅雪山等.一種動態開放性天基信息系統應用
體系研究[J].系統工程與電子技術,2008.30(6):5-9