劉寒冰+羅丹

摘 要:高校的數據中心已經成了教育資源開發與應用以及教育管理信息系統的支撐基礎。由于虛擬化技術所具備的優勢以及帶來的效益,使其成了高校數據中心發展的必然趨勢。文章以傳統數據中心存在的問題為背景,介紹了虛擬化的概念及相關技術,重點分析了VMware技術的特點。然后以筆者所在單位數據中心為研究對象,對兩個經典的虛擬服務器故障進行了分析研究,針對性地提出了解決方案,取得了較好的效果。
關鍵詞:數據中心;虛擬化技術;VMware技術;虛擬服務器
1 傳統數據中心存在的問題
在信息技術迅猛發展的今天,數據中心作為高校教育信息基礎設施,已經成為教育資源開發與應用以及教育管理信息系統的支撐基礎。目前,大多數21世紀初期的數據中心主要是以大量的服務器、存儲設備通過網絡簡單互聯、集中部署的方式來建設的,動輒幾十上百臺獨立的服務器集中在同一個地點,但又各自提供不同的網絡應用服務。
綜合國內部分高校數據中心的調研結果可以發現,傳統數據中心普遍存在著下列問題:(1)較低的系統資源利用率;(2)系統資源不能動態調度;(3)數據資源共享度低;(4)結構復雜、擴展性差。
隨著高校信息化的進一步深化,傳統數據中心所存在的問題日益凸顯,如何整合現有的服務器硬件資源,提高服務器的使用效率,成了一個亟待解決的問題。
2 虛擬化概念及優勢
虛擬化技術的出現為新一代數據中心建設拓寬了方向。那么什么是虛擬化?虛擬化是一個技術用語,它指通過軟件系統虛擬出各種硬件設備,使得虛擬機在這些虛擬的硬件設備上運行。對于使用這些虛擬機的用戶來說,感覺不到正在使用的是虛擬機還是物理機。通過虛擬化軟件對一套硬件系統可以虛擬出許多的虛擬系統,可以充分發掘硬件資源的使用率。
虛擬化技術的常見類型主要可以分為以下3種:基礎設施虛擬化,系統虛擬化,軟件虛擬化。
目前,國內各高校正在著力開展數據中心建設工作,采用虛擬化技術構建數據中心已成為一個主要的發展方向。
簡單來說,虛擬化技術的主要優勢有以下幾點:
2.1 提升硬件資源利用率
在一個物理服務器上運行多個操作系統,使單個系統服務在獨立的操作系統上運行,同時把各個服務相互隔離開來,保證數據的穩定性的同時又保證安全性。
2.2 高可用性
虛擬化技術提高了服務的可靠性,服務中斷不會輕易發生,不論是服務器宕機還是軟件錯誤引系統崩潰,都不再會影響到對用戶提供服務,使得可用性得到了極大的提高。
2.3 管理效率提升
使用虛擬桌面架構,實現集中化運維管理,縮減運維管理員額,提高單人工作效率。
2.4 可擴展性(Scalability)
虛擬機通過虛擬化技術,實現在實體機上動態遷移,硬件擴展方便快捷,虛擬化技術對熱插拔功能的支持實現了,在不用關機的狀態下虛擬機可以直接進行硬件擴展。
2.5 環保節能
虛擬化技術可以幫助用戶有效地實現環保節能,幫助降低硬件設備能耗,以及降低附帶的制冷設備、照明供電、UPS設備的功率,節約了大量的運維成本。
3 服務器虛擬化及VMware技術
3.1 服務器虛擬化的概念
我們可以簡單把服務器虛擬化理解為把虛擬化技術應用于服務器。在一臺物理服務器上使用把物理資源抽象成邏輯資源的手段,劃分出許多臺相互隔離的虛擬機,讓硬件變成“資源池”實現動態管理,實時地以優先級為標準把資源按負載需求進行分配。最早從虛擬化技術中分離出來的就是服務器虛擬化技術,它是虛擬化技術當最熱門也最成熟的一個領域。
3.2 VMware技術
由于VMware技術應用的市場普及度非常高,使它的產品成了最受歡迎的虛擬機管理程序。VMware是一家專門研究虛擬化軟件的公司,很早就進入了虛擬化市場,技術一直處于領先狀態,尤其以管理技術為代表,在歐洲、北美占有很大的市場份額。VMware技術通過其主導的虛擬化中心管理控制臺(信息數據中心)、虛擬機移植工具(vmotion)、分布式資源調度解決方案(DSR)等虛擬化領域,稱霸了高端企業虛擬化的市場。
VMware虛擬化軟件可以給每個虛擬機模擬一套像普通計算機一樣的內存、硬盤、網卡等硬件資源。因此,一個實體機上不論裝有多少個虛擬機,從理論上來說也不會存在硬件上的沖突。虛擬化軟件技術的原理是在計算機的物理硬件和OS操作系統之間插入一個軟件層。該層主要就是Virtual Machine Monitor(VMM)虛擬機監視器,它通過動態和透明的工作方式來給各虛擬機劃分硬件資源。在單臺物理服務器上可以同時運行多個操作系統,各個虛擬機之間完全隔離和獨立但又共享物理硬件資源。
VMware的核心服務器虛擬化產品是VMware vSphere,它是一個云端操作系統,也是部署最廣泛的虛擬機管理程序。
VMware vSphere由以下幾個部分構成其組件層:基礎架構服務;應用程序服務;Vmware vCenter Server;客戶端用戶。
VMware vSphere的主要優勢體現在以下幾方面:
(1)實現了虛擬機和底層硬件設備的分離,使虛擬機的遷移不會影響到它所提供的應用,提高了服務的可靠性;(2)在單臺物理服務器上通過同時部署眾多虛擬服務器,實現了減少實體機數量,提高計算資源和存儲資源的利用率,降低能耗、節約成本;(3)利用虛擬機資源分布式調度、實時遷移和負載均衡等虛擬化高級技術,可以在不停機的情況下對硬件設備進行維護,提高服務的延續性;(4)擁有成熟有效的災難恢復機制;(5)支持虛擬服務器快速遷移和復制。
由vSphere構建的虛擬化數據中心拓撲結構如圖1所示。數據中心可以根據業務發展需要增加ESX主機的數量,從而不斷擴展數據中心的計算和存儲資源;同時,還可以通過虛擬化平臺的集群設置,對數據中心的資源進行動態調度和共享。
4 虛擬服務器常見故障及解決方法
雖然VMware vSphere是一個非常強大的虛擬機管理工具。但是在平時的使用中,還是會遇到一些無法通過常規手段來處理的問題,這里主要介紹在日常運維管理過程中會遇到的兩個經典故障的處理方法。
4.1 人為原因造成服務器的管理賬戶密碼丟失
因為虛擬機比較實體機更為穩定,可靠性更高,所以在平常的運維工作中,我們經常會遇到有個別用戶因較長時間沒有登錄虛擬服務器或期間管理人員更換而造成的操作系統登錄密碼丟失。當出現這種情況時,如果是普通的物理服務器,我們一般情況下可以選擇使用帶有Windows密碼破解工具的啟動盤來進行密碼破解。但是當服務器為虛擬機,并且不帶光驅的時候,這種情況下處理起來就不那么容易了。
(1)首先,我們需要將準備好的帶有Windows密碼破解工具的啟動盤鏡像文件上傳到vSphere所管理的存儲空間中去。選中存儲“HVS85T_LUN1”,然后點“瀏覽此數據存儲”,選擇“上載文件”,上傳鏡像文件即可。
(2)然后,我們對需要進行登錄密碼破解的虛擬服務器點擊右鍵選擇“編輯設置”,修改虛擬服務器光驅屬性配置。選擇“硬件”選項卡,選中“CD/DVD驅動器1”,然后勾選屬性對話框右側的“數據存儲ISO文件”選項。
點擊“瀏覽”,選中之前上傳到存儲空間中的ISO鏡像文件。選定ISO文件后,勾選“設備狀態”中的“打開電源時連接”復選框。然后打開“選項”選項卡,點擊“引導選項”,勾選“虛擬機下次引導時,強制進入BIOS設置屏幕”。
(3)完成以上設置后,虛擬服務器開機后就會自動進入BIOS界面,再修改開機啟動設備順序,使服務器開機從光驅啟動,然后就可以使用啟動盤中的Windows密碼破解工具來清除被遺忘的密碼。
4.2 虛擬機操作系統本身故障無法正常關機或重啟
這種故障在實體機中經常會出現,在虛擬服務器運維過程中并不會經常遇到,也許有的運維人員從來就沒碰到過這種情況,但是這種故障是確實存在并會小概率發生的。實體機出現這種故障,可以通過電源按鍵強制關機或重啟,但是虛擬服務器的電源管理是在vSphere平臺上操作的,一旦出現平臺上無法完成關機或重啟操作的情況,管理員往往束手無策。
虛擬服務器使用起來對于用戶來說跟普通的托管物理服務器并沒有太大的區別,但是從ESXi主機后臺來看,每個虛擬機都是一個后臺進程。如果找到故障虛擬服務器對應的后臺進程,然后將該進程終止,實際上也相當于是對虛擬服務器進行一個斷電的操作。
(1)首先,我們需要在vSphere上開啟故障服務器所在ESXi主機的SSH連接功能。這個功能開啟后,我們才可以登錄連接到ESXi主機后臺來進行相關操作。選中vSphere控制臺中ESXi主機的“配置”選項卡,然后選擇“安全配置文件”,分別修改“服務”和“防火墻”的屬性。
(2)點擊修改“服務”屬性,選中SSH標簽,發現進程已停止,然后點擊右下“選項”按鈕,手動啟動SSH守護進程。然后,點擊修改“防火墻”屬性,勾選“SSH服務器”選項前的復選框,點擊“確定”。
(3)SSH服務配置完成后,我們就可以使用相應工具來連接ESXi主機,這里我使用的是SecureCRT這款軟件,我們新建一個SSH2的連接,選擇默認配置,在“主機名”中輸入目標主機的IP地址,并在“用戶名”處填入正確的賬戶名稱。輸入正確的SSH連接密碼,登錄主機后臺。
登錄主機后,可以進行命令行操作,首先敲入命令:
#esxcli vm process list
即可瀏覽到該主機運行的所有虛擬機進程,找到需要處理的故障虛擬機的條目:
OA_2016_DServer2
World ID: 23561731
Process ID: 0
VMX Cartel ID: 23561730
這里需要我們記錄下來的是該虛擬機進程的world ID:23561731。該ID號是此進程在此操作系統中的唯一標識,可以作為函數調用的參數。
記錄下該world ID號后,便可以敲入命令:
#esxcli vm process kill --type=force --world-id=23561731
此時,“world-id=”后面需要輸入的就是之前我們記錄下來的ID數值,此命令的作用便是強制關閉該虛擬機電源,使其停止運行。
完成此操作后,我們可以再次輸入命令:#esxcli vm process list,查看該虛擬機進程是否還存在,如果進程消失,則此操作已成功,便可重新登錄vShpere平臺按正常操作重新啟動該虛擬機。
5 結語
基于虛擬化技術的數據中心是高校數據中心發展的趨勢,它所具備的優勢和帶來的效益決定了其在今后的高校信息化發展中將扮演更加重要的角色。本文以高校傳統數據中心存在的問題為背景,對服務器虛擬化及相關技術進行了研究。并以作者單位的數據中心為研究對象,對VMware虛擬服務器在日常運維管理中的兩個經典故障進行了分析和研究,同時提出了解決方案,取得了較好的效果。數據中心的建設和維護是一個長期的工作,在今后的運維管理工作中還將會遇到各種新故障、新需求,需要管理人員沉下心來及時掌握新技術、新動態,才能更好地解決各種新問題。