石 晉,徐勝利,江 明
(中國石油遼河油田勘探開發研究院,遼寧 盤錦 124010)
遼河油田地質綜合研究云平臺系統自2016 年運行以來,作為面向全油田提供服務的一體化應用系統,實現了遠程開展基礎資料共享、地震解釋、地質建模等研究工作,用戶不用關心軟件的安裝及數據的存放,通過登錄云平臺共享使用云端部署的先進專業軟件系統,遠程調用靜態庫進行基礎資料的統計分析和各類地質圖件的繪制工作,大幅增強了地質研究的手段。地質綜合研究云平臺的特點是覆蓋面廣、數據量大、應用用戶多,要求能實現大量用戶并發訪問的同時,保障其系統的高可用性。還需要對應用權限、資源分配等問題進行一體化管控,形成有效的資源監控機制。加上企業對信息安全的重視程度不斷提升,系統安全防護已經成為共識[1]。基于此,本文從系統安全管理的角度出發,對地質綜合研究云平臺采用的安全機制進行總結,以便提升系統的安全性,保障勘探開發科研生產。
高可用性(High Availability)指的是在本地系統中單個組件發生故障的情況下,能夠繼續提供應用服務的能力,是評價一個系統好壞的重要標準之一[2-3]。在集群中服務器、節點發生故障時,運用高可用性技術,通過心跳機制發現未響應的服務器,尋找空閑服務器通過在線遷移來接管節點,保證在不間斷業務的情況下完成故障處理。保證業務連續性,使業務不會因為服務器崩潰等而中斷,當虛擬節點所在服務器因計劃內或者計劃外產生故障或停機現象時,通過虛擬機遷移技術可以迅速地將故障服務器上的計算節點遷移到集群內或集群外正常運行的物理機上,繼續對云平臺用戶業務訪問進行響應。針對單個計算節點故障時,首先通過克隆技術,將故障節點進行替換,隨后使用快照技術對節點進行故障修復,實現平臺資源池快速運維。
在集群系統中虛擬節點數量巨大,當某一個物理服務器上的虛擬節點過多時,會造成服務器負載較大,并導致整個服務器崩潰;若此時其他服務器上還有資源可以滿足虛擬節點的運行需求,就會出現資源閑置的情況,成為系統瓶頸。DRS(Distributed Resource Scheduler,動態資源調度)可以整合資源,使云平臺中的虛擬節點均衡分布到每個物理服務器上,使資源得到充分利用,更好滿足客戶的業務需求。動態資源調度會不斷檢測系統集群中各服務器資源如CPU、內存等使用情況,當服務器負載過大,超過系統設置的調度閾值時,就會選擇一個空閑較大、能夠承擔虛擬節點遷移后所需資源的服務器,進行在線遷移。
自主研發云平臺監控系統,針對云平臺資源層,編寫監控模塊。基于瀏覽器完成用戶資源、軟件資源、服務器資源的監控,實現云平臺的全方位管控。云平臺監控系統包括云平臺資源信息數據庫建設和云平臺監控軟件研發兩部分內容。建立云平臺資源信息數據庫,根據數據特點,創建云平臺計算節點性能監控數據、云平臺許可資源監控數據和云平臺實時統計報表數據三類數據表。這些數據表包括計算節點性能數據表、每天性能監控數據匯聚信息數據表、許可證管理節點數據表、云平臺軟件使用情況數據報表等共計9 張,字段名稱、代碼、數據類型、存取方式、索引約束等均在數據字典中進行了詳細說明。基于云平臺資源信息數據庫研發的平臺資源監控軟件,可實現對節點實時負載、實時平臺使用情況、實時軟件使用情況、歷史軟件使用情況、軟件許可證等信息進行監控及管理。該軟件需使用擁有管理權限的用戶登入,進入應用軟件監控頁面,實現對用戶使用平臺應用軟件連接信息的實時監控,并可進行打開、關閉的操作。點擊“許可證管理”進入許可監控模塊,可查看當前各個模塊使用情況,并可進行編輯、釋放等操作。點擊“監控信息”,可查看該條信息許可使用的詳細信息,并可對用戶占用許可證進行手動釋放。點擊“實時負載排名”,選擇數據類型中選擇需要監控的不同操作系統(Windows、Linux、Solaris 的計算機點),按照用戶、作業、CPU、內存、顯存選擇不同的排序方式。點擊“實時平臺使用情況”,即可查看當前用戶登錄信息、軟件使用情況等信息。點擊“實時軟件使用情況”,即可查看云平臺應用軟件使用情況等信息。
云平臺同樣設置了多重安全驗證機制,如圖1 所示。通過用戶綁定IP 地址,防火墻設置訪問規則、用戶安裝本地驗證證書、平臺用戶與軟件用戶建立映射關系,實現平臺用戶的集中認證和單點登錄,建立完整、高效的安全認證機制。
圖1 平臺應用用戶身份的統一安全認證
本文以云平臺技術為背景,研究了地質綜合研究云平臺信息安全機制中可能出現的問題,并針對性地提出相應的解決措施。在大數據時代下,信息安全事件頻繁發生,因此必須采取有效措施解決安全隱患,加強對云平臺軟硬件資源與應用用戶的控制。通過虛擬機遷移、動態資源調度、管理系統研發、多重驗證機制設置等手段,加強云平臺應用系統的自主防護能力,提高系統運行的穩定性和安全性,為遼河油田地質研究科研人員提供更強有力的基礎設施保障。