文/李力強孟慶利
高校計算機機房中的問題及解決方法
文/李力強1孟慶利2
隨著信息技術的快速發展,計算機的應用越來越廣泛,高校計算機網絡的規模逐漸增大。高校計算機實驗室管理與維護是高校教學與科研得以保障的重要條件。本文提出了一種基于云計算數據中心的新型高校計算機機房管理與維護策略。為了確保云計算戰略的成功,云計算的運行和維護管理應從日常監控,安全管理和自動化處理等方面入手,涵蓋戰略、設計、運營和持續改進的各個階段。
云計算 管理維護 機房
隨著信息技術(IT)的不斷發展,計算機系統和計算機網絡已經深入到高校教育的各個領域,在日常的教學管理中計算機的使用已經必不可少。隨著高校辦學規模的日益擴大,面對計算機技術的迅猛發展,許多高校都已經建設了計算機公共機房。隨著網絡規模的逐漸增大,機房管理與維護工作也面臨著越來越大的壓力。
無論工作的細節如何,任何IT部門的主要目標,都是按照預先規定的服務質量水平提供IT服務。在服務量和服務質量都要求較小的情況下,即使沒有復雜信息系統,使用少量員工的也可以解決服務管理是這個簡單的問題。但是,在信息部門是一個計算機中心的情況下,這時計算機中心服務的對象是一個大單位(比如高校),而不是特定的科學實驗室。因此,計算機中心提供的服務范圍需要得到擴大,以盡可能廣泛地覆蓋用戶的需求。高校計算機機房服務的對象是大量的IT用戶,資源有限,特別是人力資源,不允許針對每個用戶使用單獨的方法,僅針對具有最高計算活動的頂級研究小組才有例外。
由于用戶需求非常廣泛的IT服務,計算機中心的硬件和軟件數量也很大。此外,硬件、技術和程序是非常多樣化的,基礎設施管理的普遍方法是很難找到的。除上述之外,大學計算機中心還擁有與信息系統和虛擬化相關的的基礎設施。考慮到大學計算機中心的所有活動,可以得出結論,其基礎設施中的IT組件數量非常多。所有這一切使基礎設施的控制變得非常困難,維護有關每個組件的最新信息并不是一個非常簡單的任務。困難在于使用強大的工業基礎設施虛擬化解決方案,IT部門被迫使用特殊的虛擬化管理系統,這也是控制服務器、網絡和存儲系統。一般來說,所有這些形成了一個緊密集成的硬件和軟件系統,其中每個組件影響許多其他組件,并且在許多情況下會隱含地相互影響。對服務支持維護中的問題和變化的影響的分析大大復雜化。
隨著大學計算機中心的發展,從僅向有限數量的研究小組到提供高性能計算機服務的單位,到集體使用中心,事件管理和問題管理的過程逐漸發展起來。然而,這些過程是孤立的,在獲得關于問題發生的基礎設施的組成部分的數據方面遇到了很多困難,幾乎沒有機會快速分析事件并找到“有罪”的IT組件。部分以網站的形式部分存在于部分以共享目錄中的文本文件形式存在的IT組件數據,其關系和設置部分存儲在多個數據庫中的部分文檔、部分內容僅供參考。即使在提供服務和服務支持過程中,許多IT部件缺乏信息也帶來了以下困難:
由于缺乏關于基礎設施的授權信息,不可能確定組件的狀態符合要求,并且未受到未經授權的更改的影響。此外,沒有關于IT組件的配置更改時間和時間的數據。
沒有關于基礎設施組成部分之間關系的信息,無法充分評估哪些組件,以及最終影響服務實施或修改的服務。
缺少導致他們的問題和組件的文檔關系,意味著沒有痕跡哪些組件導致已知錯誤以及受這些錯誤影響的組件和服務。這對計劃去除已知的錯誤是非常嚴重的傷害,特別是改變的優先級是非常困難的。
大多數事件與違反用于提供服務的組件的參考配置相關聯。在沒有統一數據庫的情況下,它存儲IT組件的授權參考配置的描述,尋找關于什么參考配置的信息需要相當長的時間。
由于缺乏對所有基礎架構組件的信息的統一存儲庫,因為需要從多個來源收集信息,因此創建匯總報告變得困難和耗時。在這種情況下,信息的有效性和相關性不總是可以保證。
某些組件可能是無文檔的,或者有關它們的信息已經丟失,這尤其需要恢復或重新創建描述的時間。
收集關于哪些組件被使用的信息,在數據存儲在多個數據庫中的情況下,在它們之間無關的情況下,哪些組件被使用多少以及在多大程度上依賴于其在規劃容量時的可靠性變得相當挑戰。
每位員工分別負責基礎設施部分的筆記;不同人士收集的資料可能有冗余或矛盾。解決需要花費時間和額外時間來創建冗余數據副本所需的矛盾。
本研究的目的可能如下:開發計算機中心的配置管理系統,并與其他信息系統集成,提供IT服務管理。有必要考慮大學計算機中心的以下具體屬性:
(1)使用虛擬化提供商業服務,以及提供運營服務;
(2)計算機中心提供的廣泛和多樣化的服務:高性能計算和教育;
(3)各種硬件用于提供服務;
(4)集體用途:用戶數數千人。
確保配置管理系統和變更管理之間最大程度的相互作用尤其重要,因為這些更改對數據的組成有直接影響,而數據的組成又用于執行更改。配置管理系統必須配備有與其他信息系統交互的界面。該接口必須具有足夠的可靠性,可以靈活地盡可能快地重新配置,以便在增長和發展過程中改變組成和通信系統。由于該界面更方便使用Web服務,除了靈活性之外,還能夠在某些條件下保持可靠性。此外,只配置管理信息系統不足以解決IT基礎設施的控制問題,配置管理過程包括起草過程的規則也需要構建。
數據中心運營平臺是確保計算機系統正常運行的重要組成部分,可以作為維護,管理和應用資源的分配運行平臺。云計算環境涵蓋了運維管理的范圍非常廣泛,包括了服務點播、基礎設施管理、物理設備、系統管理、數據管理、管理工具和人員管理等服務。為了實現上述目標的良好管理,必須實現云計算的日常監控、標準化操作維護管理和云自動處理維護。
監控云計算的日常運營管理應該從基礎設施建設、網絡環境、設備性能、事件管理、變更管理和應急預案管理等方面全方位進行。通過運行良好的云計算監控,可以實現各系統的統一管理服務,統一收集所有業務操作系統和應用信息,實現對不同層次信息的綜合分析、歸納和匯總。對系統進行有效的運行監控,可以向系統管理員發出預警,避免系統故障,使企業蒙受巨大的經濟和信譽損失。
安全管理是云計算運維管理中的關鍵問題。云計算安全重點領域有信息生命周期管理、風險管理、法規和審計、加密和密鑰管理等。規范云計算安全操作與管理,結合安全技術、級別保護、虛擬化、虛擬機、操作安全管理系統的安全管理策略,可以有效實現企業IT資產管理。
云計算系統需要實現按需服務,這使得自動化系統的運行是不可避免的。在云計算環境下,自動化場所的需求非常多; 主要是提供以客戶為導向的虛擬共享系統和資源優化系統。監控系統和自動運行機制完善將對提高生產力起決定性的作用。
為了促進云計算運營管理的優化和完善,有必要建立集成運營管理模式。以業務為導向,構建完善、成熟的IT運營服務體系。云計算運行維護管理的改進應從日常監控,安全管理,平臺維護,故障處理,配置管理,服務驗收等方面入手。利用自動化和維護工具可以實現物理資源和虛擬資源的統一管理。通過提供資源管理、統計、監控、調度和服務管理等端到端的管理功能,實現云數據中心高效、便捷、智能、統一和集成的運維管理。
云計算數據中心操作系統應建立統一的事件管理中心,以收集每個系統的故障和事件聚合,處理所有故障、過濾、轉發、自動響應和報警處理。事件管理中心連接各種系統故障和事件,完成事件級集成,完成應用程序事務監控級別的實現。同時,監控基礎架構和IT基礎架構的運行狀態,實現對失敗和異常的實時發現和通知; 收集和安排監測數據可為能力管理、事件管理、問題管理、合規管理分析提供依據,最終實現數據中心高可用性的目標。
信息技術基礎設施圖書館(ITIL)是由CCTA在20世紀80年代末開發的一套IT服務管理標準庫。ITIL為IT服務管理實踐提供了客觀、嚴格和定量的標準和規范。ITIL可以指導相關組織有效利用技術,使現有資源發揮更大的作用。
ITIL V3主要基于服務于生命周期管理的最佳實踐。通過構建全面統一的工作流管理子系統,可以通過過程自動化、自動調度工作流引擎和自動化流程實現人員、技術和流程的有機結合,從而方便操作人員完成,通過使用相關管理流程的日常運營,以提高IT質量服務和部門生產力的維護。
ITIL運維管理系統在云計算領域得到廣泛應用,在這種背景下,ITIL V3系統的實施策略可參考以下實施策略:服務策略、服務設計、服務轉換、服務運營和持續服務改進等。IT服務管理的實施是一個持續的服務改進過程。作為IT服務管理的國際標準,ITIL明確地嚴格界定了每個流程之間的邏輯關系,為我們提供了“最佳實踐”指導。
IT服務管理可以根據負載變化自動調整所需資源,為了應對及時性和節省成本的平衡:同時,計算能力規模越來越大,人為管理資源越來越不實用。這些新功能對IT自動化管理能力提出了更高的要求,企業往往希望在不失敗活動的前提下獲得更高的自動化程度。
云計算數據中心需要部署自動化管理平臺,然后集中管理虛擬化和云計算平臺,為自定義規則定制功能提供自動化解決方案,用戶通過使用事件觸發器,數據監控觸發方式自動管理,以節省 人力和提高響應速度。
以上對高校計算機機房的管理與維護策略做了了簡要分析。本文提出云計算數據中心的運營管理應著重從綜合監控運行管理,全方位的安全管理,自動化運行機制三個方面進行擴大,以有效實現提供服務的要求,基礎設施管理, 物理設備管理,系統和數據管理等方面的管理,云計算數據中心結合ITIL V3在云計算環境下形成運營管理實踐,最終得到IT資源管理,IT的全面有效的運營管理響應 業務管理,IT運營管理。目前,基于云計算技術的計算機機房管理和維護策略仍處于發展階段,需要繼續研究以便于技術實施。
[1]袁溪.計算機信息技術的應用探析[J].科研,2017(02):00193-00193.
[2]王強,何才輝,陳曉輝.高校計算機中心機房建設中應考慮的兩個問題[J].實驗技術與管理,2006,23(02):109-111.
[3]朱明.高校機房管理存在的問題與對策研究[J].青年時代,2016(09):197-197.
[4]廖仕東,湯敏.淺談高校計算機中心的建設與管理[J].重慶科技學院學報:自然科學版,2004,6(02):51-51.
[5]Degtyarev A,Bogdanov A,Gankevich I,et al.Virtual workspace as basis of supercomputer center[C]// International Conference Distributed Computing and Grid-Technology in Science and Education.2012.
[6]謝維平.高校計算中心設備配置的探討[J].實驗室研究與探索,1989(01):40-43.
[7]符旭東.基于虛擬化技術的某職業學院計算機機房數據中心設計與工程實踐[D].南華大學,2016.
[8]王美麗.云計算在高校機房中的應用[J].電子技術與軟件工程,2017(01):143-143.
[9]魏晉.基于ITIL的IT服務運營事件管理流程的研究與設計[J].中國科技論文在線,2011.
作者單位
1.山東農業大學信息學院 山東省泰安市271018
2.山東農業大學體育與藝術學院 山東省泰安市 271018