王劍雄,宋昊楠,鄭 惠,王玉蘭,郝 娟
(1.河北建筑工程學院,河北張家口075000;2.清華大學,北京100084;3.唐山師范學院,河北唐山063000)
分布式電網中數據備份與恢復系統研究
王劍雄1,宋昊楠2,鄭 惠3,王玉蘭1,郝 娟1
(1.河北建筑工程學院,河北張家口075000;2.清華大學,北京100084;3.唐山師范學院,河北唐山063000)
相比于傳統電網,分布式電網存在著易受外界的影響,系統發電隨機性強、波動程度大等問題,因此對分布式電網運行狀態的監控和管理是保證分布式電網穩定運行的前提。而在分布式電網信息管理的過程中,數據的備份與恢復是技術的關鍵。根據分布式電網運行數據的基本特性,采用Moss(Microsoft Office SharePoint Server)構建了分布式數據備份平臺,并利用相關模型設計了存儲器負載均衡原則,可有效地提高系統的應用價值。
分布式電網;數據備份;數據恢復;負載均衡
電力系統當中運行的數據是錯綜復雜的,尤其對于分布式電網來說,發電的隨機性、負荷變化的復雜性都直接地反映到數據管理的難度上。目前,這些數據信息大多數是以大數據的形式存放在分布式電力調度的云存儲空間中,采用以集中為主,分布為輔的管理模式,但是這種方式給數據的管理也帶來了一定的風險。
隨著分布式電網的進一步發展,這種方式越來越不能適應數據管理的要求,尤其是集中為主的管理方式,對系統數據的備份和恢復產生不利的影響。因此,設計合理的云存儲系統實現對分布式電源大數據的有效管理是目前急需解決的問題。
一個完整的分布式電網的數據來源十分廣泛,主要有以下幾類:(1)分布式電網內部電氣信息采集網絡形成的設備運行數據集合;(2)與分布式電網相關的廣域測量系統所形成的數據集合,主要包括接口運行數據、地理信息、氣象信息等。而這些信息具有幾個明顯的特性,主要有數據規模大、數據類型豐富、數據產生具有高速性。但是在如此大量的數據中,卻有一部分數據具有很大的冗余性,因此,針對這些數據屬性,為云存儲空間構建合理的數據存儲、備份、恢復體系具有重要的意義。
Moss(Microsoft Office SharePoint Server)是微軟公司出品的一款以數據管理為核心的應用平臺,它以服務器的形式為企業構建相應的智能數據管理平臺,并提供分布式數據的協作管理及友好門戶的功能[1]。
Moss的數據存儲采取以樹形為主的拓撲結構,具有良好的節點拓展特性,其基本結構如圖1所示。
Moss可以處理多種形式的數據類型,而且能夠做到相互隔離,可靠性很高。作為數據存儲核心的場集合,是一組高性能的數據服務器,可以采取集中處理和放置的方式,也支持分散處理和放置的方式,為數據的多種處理要求供了良好的硬件基礎。

圖1 Moss數據存儲拓撲結構圖
基于Moss的數據存儲及備份體系主要由三大功能模塊組成:存儲服務器、管理服務器及Moss代理服務中心。存儲服務器是數據存儲及備份的核心部分,是底層數據存儲及介質服務器的邏輯管理部件。這樣的邏輯部件以節點的形式存在于Moss系統當中,成為數據管理的子系統。對于分布式電網而言,由于其數據形式多樣,有同構的、異構的、非結構化的、系統數據等,所以為了提高管理的效率,不同的存儲服務器節點針對一個種類的數據模型,當某種模式的數據量相對較大時,也可以由多個邏輯節點對這一模式進行分別管理。對于Moss而言,一個良好的存儲服務器應具有良好的數據存儲的平衡能力和實時并行備份的能力。
管理服務器是整個系統的控制核心,主要的功能是向存儲服務器下達數據備份的命令,該命令由工作人員按照相應的功能需求進行命令的設置和管理,因此,管理服務器具有很強的功能適應性。為了方便使用,管理服務器以B/S結構的方式向用戶提供服務,并以樹形結構的方式向用戶顯示整個數據備份系統的數據結構。管理服務器除了備份功能外,它還是恢復子系統的核心,功能是響應用戶的恢復需求,并調用存儲服務器的管理功能實現數據的恢復。
Moss代理服務中心是數據媒介存儲器與Moss系統之間的橋梁,它負責響應客戶需求,組織Moss數據源,形成管理結果。圖2為分布式電網Moss平臺結構。
在Moss的數據存儲及備份體系中,所有的數據都需要實現并發的存儲備份、恢復及訪問,而數據分布在不同的服務器中,又要形成一個統一對外的整體。為了提高數據服務的效率,就需要設計相應的負載均衡策略,以使每個服務器的性能都能保持相應的水準。

圖2 分布式電網Moss平臺結構
負載均衡策略的本質是按照某一原則來有效地分配相應的軟硬件資源,使整個系統的運行處于最佳狀態[2]。在Moss體系中,最重要的資源類型有五種,分別是處理器資源、內存資源、網絡帶寬資源、磁盤IO及作業重要程度。根據分布式電網運行的基本特點,本設計采取紅綠加權樹的分配原則來設計負載均衡策略。
所謂紅綠加權樹就是按照系統的設計原則,分別確定各種資源的緊急性原則。針對分布式電網運行的特點,本設計設計資源分配權值如表1所示。

表1 資源權值表
有了以上表中的數據,就可以構造出一棵基于當前作業及資源情況的加權樹,樹的基本結構如圖3所示。

圖3 系統權值樹
而各個節點的綜合負載按照以下公式計算:

式中:Effcpu、Effmem、Effnet、Effio為處理器、內存、網絡帶寬、磁盤IO的系統效率;IMPjob為作業的重要程度。
最后按照計算的結果,對各分支進行有效地標注,當資源綜合利用率已經超過80%的分支就標注為紅色分支,不再進行作業及任務的分配,而資源綜合利用率不足20%的,標注為綠色分支,優先進行作業分配,在20%至80%之間的按照綜合權配數由低至高進行依次輪詢。系統中生成權值樹的同時,也會生成一個綜合權值表,輔助權值樹進行資源管理。
本系統針對分布式電網的運行特點,構建了分布式電網數據備份與恢復系統。該系統采用Moss平臺,設計了相應的管理服務器、存儲服務器和Moss代理,并利用加權樹的方式構建了負載均衡算法,經實際測試,該算法可以有效提高分配效率,有利于整個系統整體性能的提高。
[1]葉云.基于分布式架構的數據備份與恢復系統的設計與實現[D].長春:吉林大學,2008:5-6.
[2]梁根.基于公平調度算法的分布式系統負載均衡研究[J].計算機工程與設計,2008(6):1362-1364.
Research on data backup and recovery system in distributed power network
WANG Jian-xiong1,SONG Hao-nan2,ZHENG Hui3,WANG Yu-lan1,HAO Juan1
(1.Hebei Institute of Architecture and Civil Engineering,Zhangjiakou Hebei 075000,China;2.Tsinghua University,Beijing 100084,China;3.Tangshan Normal University,Tangshan Hebei 063000,China)
Compared with the traditional power grid,the distributed power grid was with many question such as many influence by the outside world, random strong of power generation and the big fluctuation degree, and so on.Therefore, the monitoring and management of the operation status were the prerequisite for ensuring the stable operation of the distributed power grid.In the process of distributed grid information management,data backup and recovery were the key to technology. Based on the basic characteristics of distributed grid operation data, a distributed data backup platform with Moss(Microsoft Office SharePoint Server)was constructed,and the memory load balancing principle was designed by using the related model,which could effectively improve the application value of the system.
distributed power grid;data backup;data recovery;load balancing
TM 73
A
1002-087 X(2017)10-1490-02
2017-03-21
王劍雄(1975—),男,河北省人,碩士,副教授,主要研究方向為數據恢復及算法。