王芳芳

摘要:數(shù)據(jù)中心運(yùn)維管理是高校信息化建設(shè)工作中極為重要的一環(huán)。文章從分析高校數(shù)據(jù)中心的運(yùn)維管理體系和管理流程入手,剖析運(yùn)維管理工作中存在的困境和問(wèn)題,從政策和管理、人員、技術(shù)、日常運(yùn)維管理4個(gè)方面探討數(shù)據(jù)中心正常穩(wěn)定運(yùn)行的具體措施。
關(guān)鍵詞:數(shù)據(jù)中心;管理;運(yùn)維;網(wǎng)絡(luò)安全;數(shù)據(jù)安全
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2024)04-0084-03
0 引言
隨著信息技術(shù)的發(fā)展和應(yīng)用,高校的信息化程度也日益提高,信息化建設(shè)成為了現(xiàn)代教育事業(yè)的核心。數(shù)據(jù)中心作為高校信息化建設(shè)的核心和重要基礎(chǔ)設(shè)施[1],有著不可忽視的重要性,其運(yùn)維管理變得越來(lái)越重要。李鑫等[1]從高校數(shù)據(jù)中心的組成、運(yùn)維管理現(xiàn)狀和安全運(yùn)維管理的必要性三個(gè)方面入手,分析了高校數(shù)據(jù)中心面臨的運(yùn)行風(fēng)險(xiǎn),從安全角度探討了數(shù)據(jù)中心在運(yùn)維管理過(guò)程中采取的措施;艾飛等[2]從管理制度角度探索數(shù)據(jù)中心的運(yùn)維管理的措施;魏冠華[3]選定管理模式、建立管理制度、做好日常運(yùn)行維護(hù)等多個(gè)層面討論了高校數(shù)據(jù)中心機(jī)房的規(guī)范管理,同時(shí)還分析了機(jī)房管理方面的重點(diǎn)內(nèi)容;鄭富煌[4]從中心機(jī)房運(yùn)維管理流程優(yōu)化展開(kāi)研究,提升各類(lèi)用戶(hù)滿(mǎn)意度的目標(biāo);劉小云[5]利用運(yùn)維審計(jì)設(shè)備即堡壘機(jī)這個(gè)統(tǒng)一的運(yùn)維中樞,幫助運(yùn)維人員高效完成運(yùn)維工作。
本文將從分析高校數(shù)據(jù)中心的運(yùn)維管理體系和管理流程入手,接著剖析運(yùn)維管理工作中存在的困境和問(wèn)題,最后從政策和管理、人員、技術(shù)、日常運(yùn)維管理4個(gè)方面探討數(shù)據(jù)中心正常穩(wěn)定運(yùn)行的具體措施。
1 高校數(shù)據(jù)中心的運(yùn)維管理體系
高校的數(shù)據(jù)中心承擔(dān)著諸多重要的功能和任務(wù),如教學(xué)管理、人事管理、財(cái)務(wù)管理、科研管理、學(xué)工管理、資產(chǎn)管理等。它作為高校信息化建設(shè)的核心,要保障整個(gè)高校的信息流動(dòng)和安全。一個(gè)高效、穩(wěn)定的數(shù)據(jù)中心是高校信息化建設(shè)的基礎(chǔ)保障,也是高校走向信息時(shí)代的必備條件。因此,高校數(shù)據(jù)中心的運(yùn)維管理是保證信息化建設(shè)穩(wěn)步發(fā)展的關(guān)鍵環(huán)節(jié)。高校數(shù)據(jù)中心運(yùn)維管理體系,如圖1所示。
2 高校數(shù)據(jù)中心的管理流程
高校的數(shù)據(jù)中心管理流程包含了多個(gè)方面,而且需要不斷地去優(yōu)化和完善,以保證數(shù)據(jù)中心的正常、穩(wěn)定、高效地運(yùn)行。
2.1 預(yù)防性維護(hù)
預(yù)防性維護(hù)是保證數(shù)據(jù)中心正常運(yùn)行的關(guān)鍵環(huán)節(jié),其中包括以下幾個(gè)方面。
1) 設(shè)備安全:首先,進(jìn)行設(shè)備安全管理,防止設(shè)備受到物理?yè)p壞。其次,通過(guò)數(shù)據(jù)備份等手段,預(yù)防因?yàn)樵O(shè)備損壞引起的數(shù)據(jù)丟失問(wèn)題。
2) 設(shè)備性能監(jiān)控:定期檢查設(shè)備運(yùn)行情況,及時(shí)發(fā)現(xiàn)問(wèn)題并進(jìn)行修復(fù)。此外,通過(guò)適當(dāng)?shù)谋O(jiān)控軟件,可以查看設(shè)備的性能情況,及時(shí)預(yù)測(cè)設(shè)備過(guò)載的情況,并進(jìn)行調(diào)整。
3) 設(shè)備維護(hù):定期進(jìn)行專(zhuān)業(yè)的設(shè)備維護(hù),收集設(shè)備運(yùn)行的日志,記錄設(shè)備的使用情況,為后續(xù)分析、調(diào)整做好準(zhǔn)備。
2.2 運(yùn)行調(diào)查
對(duì)于數(shù)據(jù)中心中的每一項(xiàng)工作,都需要開(kāi)展運(yùn)行調(diào)查,了解工作的具體情況,以便及時(shí)發(fā)現(xiàn)問(wèn)題并進(jìn)行解決。包括以下幾個(gè)方面。
1) 合理分配資源:根據(jù)工作負(fù)載、硬件資源等因素,合理安排各項(xiàng)工作,避免資源的浪費(fèi)。
2) 工作流程優(yōu)化:對(duì)數(shù)據(jù)中心的各項(xiàng)工作,建立良好的流程,及時(shí)發(fā)現(xiàn)并及時(shí)解決問(wèn)題。
3) 一次定位:對(duì)數(shù)據(jù)中心運(yùn)行過(guò)程中出現(xiàn)的問(wèn)題,應(yīng)該及時(shí)進(jìn)行定位,降低故障修復(fù)時(shí)間和成本。
2.3 綜合監(jiān)管
綜合監(jiān)管旨在提升數(shù)據(jù)中心的管理水平和效率,及時(shí)發(fā)現(xiàn)潛在的安全隱患和性能問(wèn)題,調(diào)整服務(wù)策略,提高用戶(hù)的滿(mǎn)意度。綜合監(jiān)管包括以下幾個(gè)方面。
1) 合規(guī)性監(jiān)管:制定合理的安全措施和管理流程,防止數(shù)據(jù)泄露、損失、受損等風(fēng)險(xiǎn)。
2) 性能監(jiān)管:定期檢查各系統(tǒng)、組件的性能,對(duì)性能問(wèn)題及時(shí)做出反應(yīng)和調(diào)整,保障用戶(hù)的滿(mǎn)意度。
3) 資產(chǎn)管理:對(duì)無(wú)用、老化的設(shè)備進(jìn)行及時(shí)替換和淘汰,充分利用資源,避免資源浪費(fèi)。
2.4 故障應(yīng)對(duì)
數(shù)據(jù)中心可能會(huì)遇到多種故障,例如電力故障、硬件故障、網(wǎng)絡(luò)故障和溫度過(guò)高。電力故障可能會(huì)導(dǎo)致整個(gè)數(shù)據(jù)中心關(guān)機(jī),原因可能是停電、電源故障或電纜故障等;硬件故障可能會(huì)影響服務(wù)器和存儲(chǔ)設(shè)備,導(dǎo)致數(shù)據(jù)丟失或應(yīng)用停機(jī);網(wǎng)絡(luò)故障可能導(dǎo)致數(shù)據(jù)中心無(wú)法連接到互聯(lián)網(wǎng)或運(yùn)行應(yīng)用程序,甚至可能造成數(shù)據(jù)丟失;溫度過(guò)高可能會(huì)損壞數(shù)據(jù)中心的服務(wù)器和存儲(chǔ)設(shè)備,因此需要確保數(shù)據(jù)中心保持良好的散熱系統(tǒng)。這些故障對(duì)數(shù)據(jù)中心的影響很大,所以需要進(jìn)行預(yù)防和及時(shí)處理,以保證數(shù)據(jù)中心的穩(wěn)定性和可靠性。
1) 要提前建立各種故障的應(yīng)急預(yù)案,這樣在故障發(fā)生時(shí),不至于手足無(wú)措,而是有條不紊地進(jìn)行故障恢復(fù)操作或者切換到臨時(shí)方案,以保證業(yè)務(wù)的正常運(yùn)行。
2) 建立一個(gè)管理團(tuán)隊(duì),由經(jīng)驗(yàn)豐富的管理員和技術(shù)人員共同組成。有時(shí)數(shù)據(jù)中心的故障排查難度較大,需要多個(gè)崗位以及多個(gè)供應(yīng)商的人員共同合作才能解決。
3 高校數(shù)據(jù)中心運(yùn)維管理的困境和問(wèn)題
在高校數(shù)據(jù)中心運(yùn)維管理工作過(guò)程中,困境和問(wèn)題也較為突出:
1) 設(shè)備和軟件開(kāi)支。高校雖然已經(jīng)知曉數(shù)據(jù)中心的重要性,但是由于學(xué)校的經(jīng)費(fèi)有限,無(wú)法買(mǎi)到或買(mǎi)全心儀的產(chǎn)品和方案,此種類(lèi)型的財(cái)務(wù)負(fù)擔(dān)成為需要重點(diǎn)解決的問(wèn)題。
2) 招投標(biāo)體系和管理。數(shù)據(jù)中心從建設(shè)到正常運(yùn)行,會(huì)有很多招投標(biāo)過(guò)程。在這過(guò)程中,往往會(huì)出現(xiàn)低價(jià)沖標(biāo)的情況,最終提供的產(chǎn)品、方案、服務(wù)也差強(qiáng)人意。
3) 供電系統(tǒng)管理。一些數(shù)據(jù)中心沒(méi)有采取足夠的措施保證供電的穩(wěn)定性和可靠性。例如,供電設(shè)備可能出現(xiàn)故障,或高校附近施工導(dǎo)致的區(qū)域大面積斷電,導(dǎo)致數(shù)據(jù)中心供電中斷或不穩(wěn)定,影響到數(shù)據(jù)中心的正常運(yùn)行。
4) 系統(tǒng)平臺(tái)不穩(wěn)定。教學(xué)壓力大,系統(tǒng)上不穩(wěn)定,會(huì)給教學(xué)質(zhì)量帶來(lái)不利影響,并且如果系統(tǒng)故障,無(wú)法及時(shí)采取措施保護(hù)教育教學(xué)的正常開(kāi)展。
5) 師生信息安全問(wèn)題。由于信息化建設(shè)的應(yīng)用情況不同,信息和數(shù)據(jù)管理、分析、升級(jí)等過(guò)程中數(shù)據(jù)隱私和信息泄露問(wèn)題凸顯,使師生的信息安全受到威脅。
6) 網(wǎng)絡(luò)安全問(wèn)題。缺乏對(duì)網(wǎng)絡(luò)病毒和黑客攻擊的防范措施,就很難保證數(shù)據(jù)的安全性和完整性,這可能導(dǎo)致數(shù)據(jù)泄露或系統(tǒng)崩潰等安全問(wèn)題。
7) 缺乏專(zhuān)業(yè)的運(yùn)維管理人員。如果沒(méi)有專(zhuān)業(yè)的運(yùn)維管理人員,就很難保證數(shù)據(jù)中心的穩(wěn)定性和可靠性。
8) 缺乏專(zhuān)門(mén)的數(shù)據(jù)備份和恢復(fù)措施。這可能導(dǎo)致數(shù)據(jù)丟失或系統(tǒng)崩潰等嚴(yán)重后果。
4 數(shù)據(jù)中心運(yùn)維管理的措施
為了更好地實(shí)現(xiàn)高效穩(wěn)定的數(shù)據(jù)中心運(yùn)維管理,下面提出了一些具體措施。
4.1 政策和管理方面
1) 加強(qiáng)資金保障。數(shù)據(jù)中心的建設(shè)和運(yùn)營(yíng)需要大量且長(zhǎng)期的資金投入,主要用于數(shù)據(jù)中心的升級(jí)和維護(hù)、設(shè)備的折舊和管理、數(shù)據(jù)存儲(chǔ)和管理、網(wǎng)絡(luò)安全和升級(jí)、保持高可用性、進(jìn)行冗余設(shè)計(jì)、設(shè)備和產(chǎn)品的定期升級(jí)和改造等。如果資金無(wú)法到位,數(shù)據(jù)中心將無(wú)法提供穩(wěn)定、高效的服務(wù),進(jìn)而影響教學(xué)和科研等各方面的質(zhì)量。
2) 強(qiáng)化數(shù)據(jù)中心的監(jiān)管與管理。高校數(shù)據(jù)中心的監(jiān)管與管理至關(guān)重要。在數(shù)據(jù)中心運(yùn)維管理過(guò)程中,需要明確崗位職責(zé)和工作要求,并對(duì)數(shù)據(jù)中心的運(yùn)營(yíng)情況進(jìn)行動(dòng)態(tài)監(jiān)管。采取有效的管理流程,清晰劃定管理角色,及時(shí)了解數(shù)據(jù)中心的運(yùn)營(yíng)狀況,識(shí)別潛在的問(wèn)題、瓶頸和風(fēng)險(xiǎn),并采取針對(duì)性的管理措施,及時(shí)糾正并加強(qiáng)內(nèi)部監(jiān)督,提高整個(gè)管理體系的效率和精準(zhǔn)性,減少管理過(guò)程中的瑕疵和錯(cuò)誤,保證數(shù)據(jù)中心的高效穩(wěn)定運(yùn)行。
4.2 人員方面
1) 建立數(shù)據(jù)中心管理團(tuán)隊(duì)。高校數(shù)據(jù)中心的規(guī)模較大、復(fù)雜且重要,其中涉及的領(lǐng)域有很多,如基礎(chǔ)設(shè)施管理、系統(tǒng)管理、數(shù)據(jù)庫(kù)管理、網(wǎng)絡(luò)管理、安全管理等。因此,建立一個(gè)管理團(tuán)隊(duì),由經(jīng)驗(yàn)豐富的、擁有一定專(zhuān)業(yè)知識(shí)和技能的管理員和技術(shù)人員共同組成,協(xié)同工作、協(xié)同保障數(shù)據(jù)中心的正常運(yùn)行。團(tuán)隊(duì)需要嚴(yán)格遵守管理規(guī)范、安全規(guī)范、數(shù)據(jù)規(guī)范等方面的標(biāo)準(zhǔn),確保數(shù)據(jù)中心的管理流程和管理質(zhì)量。
2) 高效的溝通協(xié)作機(jī)制。高效運(yùn)維管理不是簡(jiǎn)單的流程和規(guī)則的制定,更關(guān)鍵的是管理人員在整個(gè)過(guò)程中的積極配合和有效溝通。數(shù)據(jù)中心涉及業(yè)務(wù)較多,不同團(tuán)隊(duì)的工作之間有許多交叉點(diǎn),在數(shù)據(jù)中心運(yùn)維管理中,管理人員和技術(shù)人員之間需要建立超越崗位和職責(zé)的優(yōu)秀協(xié)作關(guān)系,共同制定高質(zhì)量和可行的運(yùn)維管理方案,協(xié)同解決數(shù)據(jù)中心管理中的問(wèn)題和矛盾,共同推動(dòng)業(yè)務(wù)的優(yōu)化和提高。
此外,還需加強(qiáng)與其他部門(mén)的溝通和協(xié)調(diào),爭(zhēng)取更多的支持和資源,以便更好地進(jìn)行數(shù)據(jù)中心的管理和維護(hù)。
3) 學(xué)習(xí)與培訓(xùn)。隨著信息技術(shù)和管理技術(shù)不斷發(fā)展和完善,數(shù)據(jù)中心的運(yùn)維管理需要不斷學(xué)習(xí)新知識(shí)和新技能,以應(yīng)對(duì)日益增長(zhǎng)的需求。管理人員和技術(shù)人員需要定期參加培訓(xùn)和學(xué)習(xí),通過(guò)自學(xué)、培訓(xùn)、交流、實(shí)踐等方式,不斷提升自己的技能和知識(shí)水平,保障數(shù)據(jù)中心的高效穩(wěn)定運(yùn)行。
4.3 技術(shù)方面
1) 推廣新技術(shù)。隨著數(shù)據(jù)中心業(yè)務(wù)的不斷擴(kuò)展、技術(shù)水平的提升,需要持續(xù)推進(jìn)新技術(shù)與新思路的應(yīng)用,以適應(yīng)日益復(fù)雜的數(shù)據(jù)中心環(huán)境,為數(shù)據(jù)中心管理及優(yōu)化帶來(lái)新的機(jī)會(huì)與挑戰(zhàn)。
2) 不斷優(yōu)化數(shù)據(jù)中心架構(gòu)。隨著新技術(shù)的不斷涌現(xiàn)和業(yè)務(wù)設(shè)計(jì)的不斷完善,高校數(shù)據(jù)中心的架構(gòu)也需要不斷優(yōu)化和調(diào)整。
3) 實(shí)施自動(dòng)化運(yùn)維管理。隨著自動(dòng)化技術(shù)的不斷發(fā)展,數(shù)據(jù)中心運(yùn)維管理的自動(dòng)化成為了一種趨勢(shì)。通過(guò)引入自動(dòng)化技術(shù),可以大大減少數(shù)據(jù)中心運(yùn)維管理的工作量和出錯(cuò)率,并能夠提高數(shù)據(jù)中心管理的效率和便捷性。目前,很多自動(dòng)化技術(shù),如自動(dòng)化部署、自動(dòng)化監(jiān)控等技術(shù),在數(shù)據(jù)中心管理中得到了廣泛應(yīng)用。
4.4 日常運(yùn)維管理方面
1) 持續(xù)的監(jiān)控。原則上,對(duì)于整個(gè)數(shù)據(jù)中心里的所有設(shè)備和系統(tǒng),都應(yīng)設(shè)置監(jiān)控程序,保證其能夠及時(shí)對(duì)現(xiàn)場(chǎng)狀態(tài)進(jìn)行監(jiān)測(cè)。設(shè)備狀態(tài)、溫度、風(fēng)扇轉(zhuǎn)速、網(wǎng)絡(luò)傳輸能力等方面,直到細(xì)節(jié)都應(yīng)進(jìn)行監(jiān)控。可配備相關(guān)的警告機(jī)制,一旦某項(xiàng)參數(shù)發(fā)生問(wèn)題,管理員立即收到警報(bào),及時(shí)處理問(wèn)題。
2) 加強(qiáng)數(shù)據(jù)安全管理。數(shù)據(jù)安全對(duì)于高校數(shù)據(jù)中心來(lái)說(shuō)尤其關(guān)鍵。高校數(shù)據(jù)中心,經(jīng)常有大量的重要數(shù)據(jù)。這些數(shù)據(jù)可能是研究人員的科研成果,也可能是學(xué)校的招生數(shù)據(jù),或者是學(xué)生課程表、成績(jī)等個(gè)人信息。因此,應(yīng)加強(qiáng)數(shù)據(jù)安全管控與管理,完善數(shù)據(jù)備份的手段和機(jī)制,保證備份操作的可靠性和有效性,以應(yīng)對(duì)數(shù)據(jù)丟失和其他數(shù)據(jù)安全問(wèn)題。同時(shí),也應(yīng)該加強(qiáng)網(wǎng)絡(luò)安全防御措施,避免黑客攻擊、病毒入侵和其他網(wǎng)絡(luò)風(fēng)險(xiǎn),保證學(xué)校信息資產(chǎn)不受損失。
3) 強(qiáng)化故障應(yīng)對(duì)與恢復(fù)。在數(shù)據(jù)中心運(yùn)維管理過(guò)程中,難免會(huì)遇到各種故障和意外情況,如電力故障、服務(wù)器故障、網(wǎng)絡(luò)中斷等。為了保證數(shù)據(jù)中心的高效穩(wěn)定運(yùn)行,需要建立相應(yīng)的故障應(yīng)對(duì)和恢復(fù)機(jī)制,及時(shí)對(duì)故障進(jìn)行處置和恢復(fù),保證業(yè)務(wù)不受影響。同時(shí),也需要對(duì)每一次故障進(jìn)行分析和總結(jié),不斷完善故障應(yīng)對(duì)和恢復(fù)機(jī)制,提升數(shù)據(jù)中心運(yùn)維管理的水平和效率。
4) 提高設(shè)備的利用率。在設(shè)備管理方面,采取各種方法與策略,優(yōu)化和提高設(shè)備的使用效率。有效利用硬件資源,提前發(fā)現(xiàn)問(wèn)題,盡可能延長(zhǎng)設(shè)備的壽命。對(duì)于某些舊設(shè)備,可以通過(guò)固化其專(zhuān)屬的業(yè)務(wù)或?qū)⑵渥優(yōu)槿萜鞣?wù)器,轉(zhuǎn)化為新的應(yīng)用場(chǎng)景,提高設(shè)備的利用率。
5 結(jié)束語(yǔ)
數(shù)據(jù)中心運(yùn)維管理是高校信息化建設(shè)工作中極為重要的一環(huán)。高效穩(wěn)定地運(yùn)行數(shù)據(jù)中心,要依靠各方力量,只有通過(guò)不斷地優(yōu)化、改進(jìn)工作流程、加強(qiáng)管理、資金保障、提高運(yùn)維管理人員素質(zhì)等方面,才能真正保持?jǐn)?shù)據(jù)中心的順暢工作。在高校數(shù)據(jù)中心的運(yùn)維管理過(guò)程中,需要高度重視問(wèn)題和挑戰(zhàn),并及時(shí)采取有力措施,持續(xù)不斷地提升數(shù)據(jù)中心的管理水平和運(yùn)行效率。只有在實(shí)際工作中不斷探索和實(shí)踐,不斷提高管理水平和技術(shù)能力,才能更好地應(yīng)對(duì)數(shù)據(jù)中心運(yùn)維管理的各種挑戰(zhàn),為高校的教學(xué)和科研事業(yè)提供更好的技術(shù)支持和保障,促進(jìn)學(xué)校信息化建設(shè)的整體發(fā)展。
參考文獻(xiàn):
[1] 李鑫,張琴.高校數(shù)據(jù)中心安全運(yùn)維實(shí)踐研究[J].山西大同大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,38(4):33-37.
[2] 艾飛,黃建波,蘇宣瑞,等.華南理工大學(xué)數(shù)據(jù)中心管理之道[J].中國(guó)教育網(wǎng)絡(luò),2022(8):63-65.
[3] 魏冠華.高校圖書(shū)館數(shù)據(jù)中心機(jī)房管理研究[J].科技資訊,2020,18(18):199-200.
[4] 鄭富煌.數(shù)據(jù)中心機(jī)房硬件設(shè)備運(yùn)維管理研究[J].網(wǎng)絡(luò)安全和信息化,2023(8):59-61.
[5] 劉小云.淺談高校關(guān)于數(shù)據(jù)中心安全運(yùn)維的方法[J].電腦知識(shí)與技術(shù),2021,17(22):44-45,52.
【通聯(lián)編輯:聞翔軍】