國能大渡河大崗山發電有限公司 楊娟 楊軍 何亞東
為了滿足水電站等能源產業向智慧型發展的需要,一些電站開始引入信息化技術,使其融入到電力生產的各個環節中,數據中心作為電站信息系統運行的核心組件,其承擔著對關鍵業務的計算、運營業務的承載以及數據存儲和備份的重要任務,隨著數據量日益增大,數據項越來越龐雜,電站對數據中心的依賴性越來越大,信息化系統最大的價值就是數據,保護好數據尤為重要,這些數據影響著電站運行的方方面面,因此需要對數據的傳輸和存儲加強管理,以確保水電站數據的安全。近幾年一些銀行和航空企業的數據系統故障帶來的社會影響,讓我們不得不引起重視,一旦發生意外,有可能直接造成核心業務癱瘓,帶來嚴重的后果。
通過梳理電站數據中心業務現狀,影響數據安全的主要有以下幾點問題:
(1)缺乏整體規劃。電站數據機房集成了多個業務系統,涉及軟硬件眾多,新系統缺乏長遠規劃,導致數據中心管理混亂,系統架構臃腫無序,計算、存儲的需求在各個服務器之間不均衡,大量的軟硬件資源被浪費。
(2)硬件故障隱患。數據中心前期搭建過程中,數據量及相應的訪問量并沒有達到過多,所以采用單服務器的模式運行,且數據存放于外置存儲,發生故障將導致數據不可用,業務宕機。同時業務軟件和硬件緊耦合,追加容量一般只追加磁盤,隨著容量變多后存儲性能容易成為瓶頸,無法實現容量和性能的線性平滑擴容。
(3)數據存儲隱患。隨著越來越多的業務系統上線,隨之而來的是相應的業務操作不熟練問題對數據產生巨大風險,因不規范的使用方法將會造成業務數據被誤操作、誤刪除,海量數據丟失的風險直線上升,且系統缺乏專門的數據管理制度和存儲備份恢復保護機制,一旦發生故障導致數據丟失無法恢復,將導致電站業務平臺癱瘓,造成重大經濟損失。
數據容災系統(如圖1 所示)采用軟件虛擬化技術對電站業務系統進行虛擬化,將計算、存儲、網絡、安全等資源虛擬融合到一臺服務器中,構建水電站超融合統一平臺架構,采用UXDB 作為數據庫支撐軟件,實現對數據操作和數據存儲方式的分離管理,結合電站業務實際,研究并制定可靠的數據備份策略,設計可視化數據庫管理界面,實現數據備份進度、數據備份質量、數據同步風險等信息展示,進一步提高運維效率和質量。

圖1 數據容災系統總體設計架構Fig.1 Overall design architecture of data disaster recovery system
超融合服務器作為數據存儲備份的硬件支撐,將傳統業務系統使用虛擬化技術進行支持,通過虛擬化網絡組件進行連接和網絡邏輯隔離,虛擬化存儲組件構建統一的虛擬存儲池,具備良好的擴容性,滿足業務系統對數據存儲量的要求和高速I/O 的讀寫需求,實現業務數據的增長和平臺橫向擴展性。超融合結構將整個系統的計算節點和存儲節點部署在同一位置,在提供存儲能力的同時具備計算能力,提高資源利用率[1]。
系統采用UXDB 作為數據庫支撐軟件,包括國產DB 數據處理引擎、國產DBDFS 分布式存儲、國產DB可選組件的部署,如圖2 所示。

圖2 數據庫系統架構Fig.2 Database system architecture
2.3.1 國產DB 數據處理引擎
數據庫引擎是用于存儲、處理和保護數據的核心服務。當訪問數據庫時,不是直接讀寫數據庫文件,而是通過數據庫引擎去訪問數據庫文件。當SQL 語句給數據庫引擎時,數據庫引擎會解釋SQL 語句,提取數據給調用者。對于國產DB 數據處理引擎是保證水電站數據容災機性能的核心部件。
數據庫引擎提供容災備份相關任務如下:
(1)創建電站多業務數據庫以保存系統所需的關系或XML 文檔。
(2)創建能夠滿足電站業務需要的數據庫,優化設計、創建和維護各個組件,確保數據庫的性能處于最佳狀態。
(3)提供有關如何有助于確保業務數據和日志文件安全的信息能力。
(4)提供日常數據備份管理支持,優化數據庫存儲、查詢性能。
(5)提供業務數據備份系統,數據存儲,查詢故障排除能力[2]。
2.3.2 國產DBDFS 分布式存儲
在分布式集群中增加數據服務的結點就可以無限的增加數據存儲的量,突破了本地磁盤和盤陣的容量存在存儲上限的瓶頸;分布式存儲將數據分散存儲在多臺獨立的設備上,突破了傳統的存儲系統因集中存放所有數據系統性能受限的瓶頸。
(1)分布式存儲打破數據庫數據的上限。傳統數據庫均采用本地文件系統或者磁盤陣列的方式進行數據存儲,理論上,這種存儲方式是有上限的,其上限取決于本地磁盤系統的容量或者磁盤陣列服務器的容量。而分布式存儲是沒有上限的,只要在分布式集群中增加數據服務的結點就可以無限的增加數據存儲的量。
(2)分布式存儲提升數據訪問性能。磁盤的I/O 一直是數據庫產品的軟肋,尤其當數據增加到TB 甚至PB級別之后,這種I/O 的延遲將變得更為明顯。采用分布式存儲就是為了解決數據增加到TB 甚至PB 級別之后的I/O 瓶頸問題。眾所周知,相對于網絡技術的發展,磁盤I/O 的發展要遠遠滯后,分布式系統將數據訪問分散在不同的數據服務節點上,其效果是多個硬盤的同時讀寫操作(并發處理),該方式將傳統數據庫的磁盤I/O 的壓力轉化為網絡I/O,從而提升整體性能。
(3)分布式存儲集群和容錯。UXDB 是將數據處理(數據庫引擎)和數據存儲(分布式存儲)分離的數據庫系統。當數據處理和數據存儲分離之后,數據庫引擎將不再參與數據的復制,該工作將由分布式存儲接管,UXDB 的分布式存儲系統支持:無復制、讀復制和讀寫復制。當啟動了復制功能后,同一份數據會分別存儲在不同的數據內容服務節點上,當集群中任何一臺數據內容服務結點失敗時,分布式存儲都將能夠提供完整的數據,這將不會影響數據庫引擎的正常工作。此外,分布式存儲還包括DIR-目錄服務器、元數據和復制服務器,這兩種服務器均支持Hot-Standby 的集群。
(4)數據庫引擎的Hot-Standby 集群。數據庫引擎支持Hot-Standby 集群方式,該方式是通過以流方式實時復制WAL(Write、Headlog)實現的。流復制傳遞日志的方式有兩種,一種是異步方式;另一種是同步方式。異步方式是事務提交后不必等日志傳遞到Standby 即可返回,所以Standby 數據庫通常比Primary 數據庫落后很少;同步方式在Primary 數據庫提交事務時,一定會等到WAL 日志傳遞到Standby 后才會返回,這樣當主備庫切換時可以做到零數據丟失。
根據電站需要,制定符合本電站生產及管理需要的數據容災機制。系統結合全量備份和增量備份,初建進行人工的全量備份,將歷史數據加工清洗,分類存儲到對應的備份倉中,實現數據操作和存儲的分離管理。針對各業務的實時數據采集的秒、小時、日、周、月級的需求,自主備份采用增量方式實現了實時備份,最小備份1周至最大30 日的備份間隔策略。系統備份數據范圍包括數據庫數據、生產PLC 程序、工作文件,除自主備份外的數據集合外,建成圖形化文件管理的即時操作功能。
系統提供可視化的數據中心備份管理、國產化數據庫可視化管理功能(如圖3 所示)。

圖3 可視化界面Fig.3 Visualization interface
設計可視化數據庫管理界面,實現數據備份進度、質量、同步風險等信息展示。
當業務發生故障,可通過超融合平臺故障檢測工具,快速定位網絡故障的節點。同時可以清晰展示虛擬機、虛擬網絡間流量,實時獲取數據中心業務狀態[3]。
通過搭建電站超融合數據中心,建立了數據容災備份系統,應用國產數據庫實現了電站關鍵系統的數據容災備份,并應用數據圖形化管理工具,實現電站重要數據如PLC 程序、設備資料等數據的統一存儲管理。基于國產化數據庫應用的超融合水電站數據容災機制研究及應用,可有效降低電站數據風險,保障站內設備安全穩定運行。按每年減少1 次數據事故預估,可減少故障處理工期10天,節約故障處理直接損失約80 萬元,減少數據維護成本50 萬/年。
當前國際態勢下,做好我國能源和數據安全的自主可控研究是個迫切的課題。關鍵發電企業的容災備份系統建設及研究有利于增加能源安全性,數據可靠性。本文對水電站國產數據庫容災備份體系做了多方面研究,結合實際問題和需求,做了容災體系建設標準探索及系統應用嘗試,形成了國產自主的電站數據庫雙向備份架構體系,并利用超融合架構與國產數據庫實現數據容災備份的一體化管理。
引用
[1] 馬曉明,張新博.面向達夢數據庫的應用系統移植研究與實現[J].電腦編程技巧與維護,2021(4):82-84.
[2] 周亞潔.數據庫國產化替代面臨的問題及對策研究[J].信息安全研究,2018,4(1):24-30.
[3] 張歡.某企業數據中心容災系統的設計與實現[D].北京:中國科學院大學(工程管理與信息技術學院),2015.