姜東參



摘要:隨著三峽通航信息化的高速發展,三峽通航在用和在建信息系統數量和規模不斷壯大,信息化應用的結構也越來越復雜。傳統運維模式將會消耗大量的人力和物力資源,根據Gartner網站上的調研結果顯示,在信息化系統費用中,大約有一半用于系統運營期的運維管理工作。因此,需要更合理的模式來保障信息化系統服務的靈活便捷和安全穩定。云計算技術的發展和應用,在一定程度上能夠解決信息系統建設和運維過程中出現的一些問題,文章介紹了云計算背景下的信息系統運維模式,對云計算環境下的運維體系和運維管理模式進行了分析,以供參考。
關鍵詞:信息化;運維;云計算
中圖分類號:TP393
文獻標志碼:A
0 引言
云計算(Cloud Computing)早期是分布式計算的一種模式,主要通過網絡“云”將大量的數據計算任務處分解成數個小程序,通過多臺服務器組成算力系統處理和分析,并將結果返回給用戶。現階段所說的云計算主要是分布式、效用計算、負載均衡、并行計算、網絡存儲、熱備份冗雜和虛擬化等計算機技術混合演進的成果。通過計算機網絡形成的計算能力極強的系統,可存儲、集合相關資源并可按需配置,向用戶提供個性化服務。隨著云計算技術的不斷發展,在信息系統運維管理中可以解決許多之前無法解決的實際問題,由于云技術背景下系統整體架構模式和運維模式與傳統運維模式存在較大的差異性,需要對運維模式進行轉型和升級[1]。云計算作為一種新型技術在信息系統的運行和維護中能有效提升整體運行效率,較大地降低信息系統運維的成本,發揮較大的經濟效益和社會價值。云計算技術的發展推動了信息系統資源的集約化、規模化,提高了系統建設的效率和彈性,對于信息系統運維業務的發展有著積極的意義。
1 云計算背景下服務器虛擬化架構
1.1 傳統架構
傳統架構由服務器、存儲設備、網絡組成。在服務器上安裝操作系統、中間件、數據庫等應用,然后再進行信息化系統的構建。傳統服務器架構在使用過程中,隨著信息化系統數量的逐步增長會存在一些問題:(1)隨著信息系統規模的逐步增大,系統之間的邏輯、系統部署方式就越復雜,系統性能的逐步提升導致軟硬件需求越來越多,考慮服務的高可用性,一些信息系統需要主備部署,所需要的硬件資源成倍增長。數據中心大量的服務器占很大的空間,造成軟硬件投資成本過高。(2)傳統服務器架構部署信息化系統往往需要至少一臺服務器,部分信息化系統對硬件資源要求不等,導致硬件利用率較低,造成硬件資源浪費。(3)大量的服務器造成機房功耗較大,導致運營成本上升。(4)服務器管理比較復雜,存在不同品牌不同型號的服務器,操作界面和使用習慣有較大差別,給運維人員帶來了極大的工作量。(5)新增服務器需要花費大量的硬件成本與時間成本。(6)服務器運行穩定性問題等[2]。
1.2 云計算背景下服務器虛擬化架構
1.2.1 裸金屬虛擬化架構
裸金屬虛擬化技術主要是在物理服務器上安裝虛擬機軟件,而無須先安裝操作系統的預裝模式,再在虛擬機上安裝其他操作系統(如Windows,Linux等)和應用。由于虛擬機是直接安裝在物理計算機上的,所以稱為裸金屬架構,如KVM,VMware ESXI,XEN等。它主要依賴虛擬層的內核和服務器的控制臺,對虛擬服務器進行管理,通過識別和捕獲以及響應虛擬機發出的CPU指令,負責調度整個虛擬機的運行。裸金屬虛擬化架構如圖1所示。
1.2.2 寄生架構
寄生虛擬化架構主要是指在物理資源和宿主操作系統上安裝和運行虛擬化程序,然后創建相應的虛擬機。所有的虛擬機共享底層服務器資源,利用這個虛擬機進行創建和部署信息化系統。寄生架構如圖2所示。
1.2.3 操作系統虛擬化架構
操作系統虛擬化架構主要是指在物理資源和宿主操作系統層面增加虛擬化服務器功能。它把單一的操作系統劃分為許多個虛擬容器,使用虛擬容器對虛擬機進行管理。宿主機操作系統負責在多個虛擬服務器之間分配和共享硬件資源,但是這些服務器彼此獨立,互不干擾。操作系統虛擬化架構如圖3所示。
1.3 服務器虛擬化架構特征
1.3.1 封裝
虛擬機創建以后,整個虛擬機以文件形式存在,虛擬機運行環境封裝在獨立環境中,包含磁盤、CPU、內存等信息,不受外界因素干擾。整個磁盤分區存儲為一個文件,易于備份、轉移和拷貝。
1.3.2 硬件獨立
虛擬機無需修改就可以運行在任何安裝同一個虛擬化軟件的物理機上。服務器虛擬化技術支持資源高可用、彈性資源調整,極大地提高了系統的可持續運行能力和綜合利用效率。
1.3.3 分區
使用虛擬化技術在一臺物理服務器上可以運行多個虛擬機操作系統,多個操作系統之間分區運行,可以實現單一物理機器上同時運行多個虛擬機。
1.3.4 隔離
物理硬件和虛擬機分別進行單獨封裝,同一臺物理機上多個虛擬機之間互相隔離,互不干擾。同時,橫向之間數據也不會在多個虛擬機間進行流通;一旦其中某臺虛擬機宕機或者文件損毀、木馬感染,也不會對其他虛擬機的運行造成影響,從硬件層面對不同系統進行了隔離,降低了系統的安全威脅[3]。
1.4 服務器虛擬化優勢
1.4.1 靈活的部署方式可以提高資源利用率
服務器虛擬化可支持實現物理資源的聚合,將一臺或者數臺物理資源形成資源池,進行動態分配部署。一臺主機上可以運行多個虛擬機,每個虛擬機相當于傳統的一臺服務器,不同虛擬機上運行不同的業務系統,按需分配資源,極大地提高了資源利用率。通過虛擬化可實現動態的資源部署和重配置,滿足不斷變化的業務需求。同時對于資源利用率較低的服務器,可以對其實現最小化資源分配。
1.4.2 降低管理成本
服務器虛擬化技術可減少運維管理的物理資源的數量,系統運行人員無須考慮每個服務器之間的網絡傳輸、存儲共享。通過將所有的硬件資源聚合形成資源池來統一調度分配,同時利用自動化部署工具或虛擬機模板進行虛擬機部署,提高了運維人員的效率。
1.4.3 提高安全性
服務器虛擬化可實現軟硬件之間的獨立和虛擬機之間的相互隔離,可以實現對虛擬機數據和服務的可控和安全訪問,極大地提高了系統間的安全性。
1.4.4 高可用和高擴展
服務器虛擬化技術可在不停機狀態下對硬件資源,如CPU、內存、硬盤等,進行擴充、刪除或者調整。根據不同的虛擬機的需求,資源可以以最小單元或者最大單元對虛擬機進行精確的資源配置,這些是傳統服務器模式不可能做到的。
1.4.5 合理的資源分配
服務器虛擬化可兼容各種接口、協議,支持不同品牌的硬件,并能夠以合理的調度方式進行資源分配。
2 云計算背景下的信息系統運維體系
2.1 運維模式
傳統信息系統通常采用“煙囪式”的建設方式,基于單個項目建設,每個信息系統都有一套硬件設備和運行環境、數據庫。不同系統之間不能共享資源,形成了資源孤島。而云計算的核心優勢在于資源聚合,統一分配。就是將所有資源進行統一化管理,形成資源池,然后針對用戶的實際使用需求進行動態分配,從而實現更靈活高效的資源分配模式,提高資源利用率。同時,運維對象由獨立的硬件設備轉變為資源池,各種監控管理工具也轉變為云平臺管理運維工具,傳統的運維技術及管理制度難以適用于新的運維對象,需要更新運維管理制度和模式,并對運維人員進行針對性培訓,這對運維人員的經驗提出了較高要求。
2.2 運維組織架構
云計算背景下信息系統組織方案的構建應包括3個領域:技術部門、運維責任部門和綜合職能部門。技術部門可以與第三方技術人員進行技術學習合作;運維責任部門包括系統運營和運營管理,以便建立運營維護團隊;綜合職能部門是對硬件、云平臺、信息系統的綜合管理。
2.3 運維特征
云平臺為智能運維的落地帶來了現實的物質基礎。依托云計算的分布式處理、分布式數據庫、云存儲和虛擬化技術可以對海量數據進行挖掘。海量數據在云平臺得到了統一的處理,并且以服務模塊的形式對外提供二次應用開發。依托龐大規模的集群,實現資源的統一管理。將資源調度、數據流轉、數據遷移等技術應用到實際運維工作中,進而實現7×24 h不間斷運維管理,促進系統的穩定運行。
3 云計算背景下的信息系統運維要點
隨著云計算時代的到來,云計算將會逐步淘汰傳統運維。云時代,運維工作發生了深刻的變革,傳統運維需要處理服務器、網絡、存儲等硬件設備,云時代則不需要接觸硬件設備,而是處理虛擬資源(虛擬化是云平臺的核心支撐技術,軟件定義計算、軟件定義存儲、軟件定義網絡)。云計算時代的運維,通過AI、大數據等技術,會節省更多的人力、物力成本,減輕運維人員的壓力。
3.1 云上的信息化運維管理工具
云的到來可以大量減少資金投入、人力建設運維管理平臺體系,只需購買基于云的軟件運維管理服務,就可以使用軟件服務廠商先進的運維管理工具和運維管理體系。而對于大量的私有云來說,云內存在大量專業化監測軟件,只能由原廠進行開發,如攝像頭狀態監控軟件、存儲服務器運行狀態信息等。因此,基于云的運維管理工具必須提供基于平臺服務模式的標準軟件接口,私有云用戶可以在平臺服務上添加或者開發自己個性化的運維功能模塊[4]。
3.2 自動化處理
隨著信息系統建設的硬件資源和算力節點的逐步擴大,云計算運維管理的難度與復雜度也日益大幅度增長,這對信息系統運維的自動化能力要求很高,系統運維人員需要自動化處理工具來實現運維管理。自動化管理已然成為當前云計算運維管理的一個發展趨勢,因此需要云平臺廠商提供負載均衡、動態伸縮、數據遷移等自動化處理方式的服務來滿足運維的復雜度和門檻。
3.3 安全管控
云計算虛擬化平臺針對不同用戶定義不同管理對象,不同的管理對象負責管理不同的區域,系統管理人員針對系統的文件以及用戶的文件使用情況等進行管理,主要包括:(1)網絡防護。在構建云管理平臺時,需要部署網絡防護機制,防止針對云管理平臺本身進行攻擊。(2)管理權限精細劃分以及特權行為動態管控。根據不同人員職責的不同,使用不同的權限訪問控制方式,對客戶端安全進行分級管理。當出現對云計算平臺中的服務器、網絡設備、虛擬機等設備進行操作時,管控系統應該攔截操作指令,并對其進行判別,防止惡意操作破壞云計算平臺。(3)安全管理模塊。在構建云管理平臺時,需要增加安全管理模塊,對云管理平臺所管理的基礎設施進行監控和防護。通過一系列的安全策略,來控制云服務可能出現的安全問題,保障云平臺平穩安全運行。
4 云計算背景下的信息系統運維面臨的挑戰
4.1 數據安全和隱私
云計算最大的問題是數據安全和隱私。隨著云計算不斷被采用,風險變得更大,用戶無法查看數據在哪里被處理或存儲。如果在云管理或實現過程中沒有正確處理,可能會發生數據盜竊、泄露、證書被破解、身份驗證被破解、賬戶劫持等風險。
4.2 云遷移和兼容問題
云遷移意味著將數據、服務、應用程序、系統和其他遷移到云。整個過程會消耗大量的時間和資源,當用戶從一個云提供商遷移到另一個云提供商時,不得不從頭再來,面臨的挑戰包括故障排除、速度、安全性、應用程序停機、復雜性、費用等。同時,將本地的服務部署轉移到云計算時,云計算服務和本地部署基礎設施之間,可能會出現不兼容性問題。
4.3 缺乏專業知識
云技術飛速發展,越來越多的服務和應用被發布,以滿足不同的需求。然而,很難找到熟練的專業人員來維護云系統。對于中小型企業來說,專門聘請云專家成本很高。云對許多人來說是一個概念,從事運維工作的人并非都熟悉云技術,這需要大量的培訓來學習如何有效地使用云技術。同時,運維人員不再直接操作實體資源,而是面對一堆API,問題查找的難度將大大增加。較大型系統涉及的資源(包括橫向擴展的彈性計算服務;PaaS平臺提供的第三方服務、負載均衡、數據同步等)大大膨脹,資源增長帶來的管理復雜度劇增。
4.4 不穩定性因素增加
云產品本身的版本升級或者故障停機帶來系統運行的宕機概率增大,當平臺進行維護或者故障停機時,用戶將面臨業務運營中斷。無法隨時訪問數據,業務被迫停止,將會帶來極大的負面影響。
5 云計算背景下的信息系統運維的應對
云計算背景下,信息系統運維必須要加強對人才隊伍的建設,培養信息系統運維人才。為了滿足新形勢下企業的信息運維需求,企業應該根據自身需求,合理地規劃人才需求計劃和招聘計劃。根據企業各崗位不同制定不同專業的培訓方式和授課方式。開展信息系統運維工作時,主要包括以下幾個方面:首先,需要從技術層面進行培訓和完善管理機制;其次,要積極參加和組織企業進行人才發展方面的培訓;另外,要加強新領域知識應用能力的培訓,培養這一塊的專業技術人才是關鍵;最后,要不斷加強業務知識學習,增強自身素質,提升能力素質及相關意識。
6 結語
云計算為現代化的運維管理體系帶來了新的理念,將傳統運維工作中的大量重復性、簡單的手工工作通過軟件實現,從而使運維人員能有更多精力、條件投入整個服務的生命周期中。當然,云計算也給日常運維工作帶來了更多的風險和挑戰,因此,應加強對云計算運維管理的要點以及相應改進措施的研究與探討,不斷提高云計算背景下信息系統的運維質量,實現高效的運維管理。
參考文獻
[1]周紅衛,劉娜.云計算基礎設施產品測評框架與測試方法研究[J].江蘇通信,2021(6):82-86.
[2]劉小都,蘇丁浩.基于云計算環境下的信息系統運維模式[J].通訊世界,2017(20):71-72.
[3]呂靜賢,吳剛.有關云計算環境下的信息系統智能運維模式探究[J].百科論壇電子雜志,2018(24):600.
[4]馮安超.云計算環境下的信息系統運維模式探究[J].智能城市應用,2021(3):88-90.
(編輯 沈 強)
Research on operation and maintenance of information system under the background of cloud computing
Jiang Dongshen
(Three Gorges N-avigation Administration, Yichang 443000, China)
Abstract: With the rapid development of navigation information in the Three Gorges, the number and scale of information systems in use and under construction in the Three Gorges Navigation are growing continuously, and the structure of information application is becoming more and more complex. The traditional operation and maintenance mode will consume a lot of human and material resources. According to the survey results on the Gartner website, about half of the information system costs are used for the operation and maintenance management of the system operation period. Therefore, more and more reasonable modes are needed to ensure that the information system services can be flexible, convenient, safe and stable, and continuously guaranteed. Cloud computing technology can solve the problems existing in the process of information system construction and operation and maintenance to a certain extent. This paper introduces the information system operation and maintenance mode in the background of cloud computing, and analyzes the operation and maintenance system and the operation and maintenance management mode in the cloud computing environment for reference.
Key words: informatization; operation and maintenance; cloud computing