編者按:數據庫作為數據資產的最終載體和保存實體,其安全性和可靠性本身就是數據安全的基本要求和最終技術保證。數據安全除了管理制度的有效約束外,重要的技術手段也是一項基本能力。本文結合筆者工作的實踐體會,對數據的管理方法和技術方法進行了深入探討。
任何一個信息系統都涉及到多部門、多業務、多應用場景的使用和業務邏輯。因此,信息系統的數據管理牽扯到同級多部門之間的業務以及數據交互橫向協調,又牽扯到組織內部上下級之間的縱向管理和溝通,需要從多維度整合部門能力,從需求收集開始進行多部門上下級緊密合作。只有這樣,企業數據才可以被盤活并產生價值。
多系統間的數據共享第一可以產生統一的數據平面,第二可以產生以數據流推動的業務服務體系,實現以時間序列為流程的精確生產要素控制。信息系統數據管理需要形成一套以規范數據交互能力及接口為導向的扁平化的管理體系,使信息系統打破橫向數據共享壁壘,實現真正的業務數據平面,并為企業行業提供良好的決策以及經營管理手段。
各行業信息系統已經開始逐步的向信息系統的更深度整合和數據價值挖掘方向演進和探索。系統間數據流推動的業務組織和管理正在成為企業日常管理的有效方法和技術手段。以“淘寶”和“京東”為例,這些系統目前的數據流已經深度嵌入到了日常生產環境的各個角落,數據流推送的及時性和準確性已經開始對現實生產物流環節產生了重大影響。數據逐步形成了以各業務為類型的數據平面層。規劃和管理好這個邏輯上的數據平面層對企業行業的數據更深度共享和數據價值挖掘將起到重要的指導和規范化作用。我們可以將數據平面層定義為:多系統數據內容進行數據管理、共享或數據推送形成的邏輯平面層,其中主要負責數據共享接口的定義,數據表或者字段定義,業務系統中數據共享子功能的實現方式和技術方法,產生各系統數據平面拓撲圖。
(1)對各專業信息系統數據共享進行規劃和管理,組織協調不同專業數據共享需要進行的管理和技術對接,提出數據平面層需要的安全防護方法和技術,通過流程化管理方法完成數據平面層新需求的申請、開發、測試、應用、保存以及銷毀的全過程管理。
(2)定義數據共享需要的相關技術管理規范,從數據接口、共享方式、共享內容等各方面給出具體技術要求和技術方法。
(3)通過技術方法實現各專業信息系統共享數據流的形成,并逐步形成連續性數據流推送及共享,通過數據平面層產生的推導力整合和優化業務生產現場作業流程和作業過程。
(4)對數據類型進行分級,規范內容保存期限,定義數據生命周期,同時對數據安全保護、安全審計進行技術性規范化研究。
可以預見,隨著各專業系統間數據共享,數據流推動的業務組織和管理將更加成熟和重要,連續運行是云時代和信息互聯共享時代的核心訴求,由此形成的企業數據平面層將更加需要先進成熟的管理和技術支撐。這需要通過建立資源共享意識,強化業務系統互聯互通和信息共享的規范化管理來實現。管理規范的數據平面層既能消除人為操作的風險,又能降低運維的復雜度。由此來提高業務應用、數據資產、信息基礎設施資源利用效率,通過“數據價值挖掘”產生更多的企業數據資產附加值。
數據平面層的管理也需要通過自上而下的統一管理和協調來實現,通過對相應管理部門賦予職能從而使數據平面層管理具有明確的管理范圍和規范化流程,可以更好的協調各專業信息系統數據的互聯互通和共享。通過明確的管理文件和技術支撐標準,將數據平面層涉及的各項功能和需求通過具體技術進行實現并形成業務數據流驅動力。
企業行業信息系統中產生的數據本質上就是各企業行業業務及生產活動的體現和積累。在信息傳遞過程中,所有的應用需求最后都需要落實成硬件的性能消耗。數據庫管理系統(RDBMS)作為數據最后的記錄、修改、保存的重要軟件系統,其本身的安全性也需要強有力的技術保障支撐。我們需要按照實時性的訴求對數據庫架構進行簡單的分類并應用與生產系統中,一方面合理使用系統資源取得最大的性能和安全性保障,一方面取得良好的性價比。
該架構模型僅適用于無任何重要性可言的實驗或者生產系統中,并且無恢復實時性要求和數據完整性要求的場景和場所。目前該種架構多數已經淘汰。
主備模式數據庫體系架構,適用于高可用和高可靠環境中,主備機共同共享存儲設備,主機因為軟硬件故障后,備機可以及時接管響應并繼續對外提供業務服務能力。多數傳統數據庫HA機制均采用該架構,它提供了計算節點的冗余和備份機制,同時將數據存儲在了更加安全可靠的共享存儲中,由于共享存儲使用RAID10等技術,使得數據本身的安全性得到了極大提高。但因為該架構存在停機時間,并且數據庫本身受到計算節點計算能力的限制,無法實現更高的并發以及性能指標。
同時,數據庫盡管存放在共享存儲中,但從整體上來看數據并沒有真正的有效備份。依然存在物理上的單點故障風險。平均修復時間(MTTR)主要取決于HA軟件可靠性保證,共享存儲保證,并且不可控。
并行集群+災備模式數據庫體系架構,通過更高效的組織計算節點和存儲設備,適用于高可用、高可靠和高并發環境中,同時也可以通過備用數據庫的只讀屬性實現初級的用戶級讀寫分離,該結構中如果采用主備模式。
在主數據庫系統故障時通過激活災備數據庫即可完成數據庫的恢復操作。平均恢復時間(MTTR)主要來源于災備激活時間,由于主庫會不斷向災備系統推送實時更新日志,災備數據庫對自己進行全庫備份。災備庫中的全庫備份也可以用來對主庫進行數據庫或表的有效恢復,有效地保證了全庫備份的異地雙副本實現。
但該模式需要從新重建災備數據庫,隨著主庫數據量不斷增大,創建災備數據庫時間不可控。當處于無災備庫狀態時,主庫存在一定的安全隱患風險。將該結構升級為雙主模式后,災備庫切換即可實現主備隨意切換,不再需要重建災備庫過程,實現數據完全雙向同步機制。
雙活數據庫體系架構,適用于數據中心級高可用、高可靠、高并發無停機時間的全面的自動負載管理。該架構中除了網絡、計算節點、數據網絡的冗余之外,還前置了相應的數據庫負載均衡并行機制。以Oracle Database 12c為例,GDS/GSM是Oracle Database 12c特有的、新的可擴展性和可用性特性。
這是針對復制數據庫(使 用Active Data Guard、Oracle GoldenGate等復制技術)的全面的自動負載管理解決方案。客戶端可以通過Global Service可以連接到配置在GDS Catalog中的多個數據庫,這些數據庫可以是RAC或者單實例。它提高了系統利用率,并為復制數據庫上運行的應用程序負載提供更高的性能、可擴展性和可用性。
其主要特性包括:基于區域的負載路由,連接時負載平衡,為Oracle集成客戶端,提供運行時負載平衡建議,數據庫間服務故障切換,適用于Active Data Guard的基于復制延遲的負載路由以及適用于Active Data Guard的基于角色的全局服務、集中負載管理框架。通過該前置數據庫負載均衡并行機制Oracle完全實現了數據中心級數據全局服務管理。
數據庫架構的選型需要結合數據平面層定義中的相應重要程度和實時性需求,以保護企業數據平面層安全性為原則,選擇合適的數據庫架構滿足各專業業務系統的數據平面層應用需求。
企業業務數據流數據邏輯關系的連續性是數據平面層需要關注的重點內容,這種邏輯關系體現了各業務系統間的業務邏輯順序和數據共享依賴關系,因此可以通過數據平面層拓撲進行描述,便于直觀的發現數據平面層的重要節點和重要基礎設施,如圖所示。
借助數據平面層拓撲圖我們可以從空間維度對數據平面層進行整體管理并依據節點重要性進行相應的數據庫安全性保護。數據平面層可以作為網絡空間里數據關系的具體體現,使得更好的管理和保護網絡空間在數據視角中具有更強的可實物化管理和控制要素。
數據庫管理系統(RDBMS)軟硬件作為企業數據平面層最終的實物對象,也是具體的計算機軟硬件系統,我們可以按照關鍵基礎設施安全規范從操作系統用戶訪問授權、網絡層安全功能對其進行必要設置和防護。
比如,加裝本機防火墻,更改本機安全組策略或者在數據庫核心區域設置硬件防火墻進行網絡層端口及IP限制,防止非授權網絡用戶對數據庫管理系統的訪問。
同時,采用技術方法使其符合網絡安全等級保護安全規范要求,采用數據庫準入控制提高數據庫抗惡意網絡行為的能力。比如目前遠程管理經常使用的OpenSSH軟件組件已經棄用了一些已經不再安全的加密算法,同時進行了一些高安全風險的漏洞修補,這些需要進行系統級的補丁修補工作才能達到新的安全等級保護要求。
安全來自規范,風險來自無序。來自測試環境和生產環境的種種誤操作層出不窮,測試環境和生產環境應當嚴格的隔離必須要作為一項管理要求進行強調。尤其在數據中心環境中,DevOps運維自動化一體化工具的使用,更是帶來了很多新的安全隱患和風險。
基于數據安全的種種慘痛經歷,作為鐵路信息系統的更重要數據資源,我們強烈支持將測試環境和生產環境隔離,希望能由此規避人們無法杜絕的種種錯誤操作。更進一步,實現管理工具的區分和隔離,那就可以從另外的維度使數據操作更加規范化。

數據平面層拓撲圖
數據庫審計作為數據保護的通用技術手段,是各種數據庫系統提供的基本功能之一。這里需要強調的是,在數據平面層進行的數據庫審計更應該強調“責任分離”原則,避免審計內容本身被篡改或者丟失等問題的發生。數據平面層的技術性本質就是一個個數據庫節點通過數據鏈路或者其它方式產生數據互動。
因此,從系統性角度出發,每一個數據庫節點的審計都會成為整個數據平面層的重要組成部分。不斷細化每一個數據庫節點的安全就是自下而上的推動數據平面層的整體安全性要求和網絡空間要求。