孔昭煜,齊釩宇,賈麗瓊,高學正,蘇志強,李海龍
(1.中國地質調查局發展研究中心,北京 100037;2.全國地質資料館,北京 100037)
在物聯網、大數據、云計算等新興信息技術不斷發展的當下,地質調查工作從傳統工作方式已向全業務信息化轉變。同時,在20世紀90年代后隨著信息化技術的普及和在地質調查行業中的推廣和應用,其產生的地質調查成果數據爆發式增長。這些地質調查成果數據不僅具有資料、檔案和科研價值,還具有重復開展、成本投入高和人力投入大等特點,同時開展這些地質調查工作的經費,絕大多數為國家財政投入的經費,根據要求須向國家、相關行業和社會公眾提供基礎地質調查成果數據社會化服務[1-2]。
全國地質資料館依據國務院頒布的《地質資料管理條例》中有關要求,對已接收的地質調查成果進行社會化服務。近年來隨著信息技術的發展,原有的到館服務存在著諸如服務效率低、利用率低等問題,制約了社會公眾對地質調查成果的開發和利用。因此,建設數字地質資料館是地質資料工作在新時代的轉型,也是在新時代下推動地質資料工作全面信息化轉變的契機。數字地質資料館平臺實現了為社會公眾提供即時、有效、專業、準確和權威的地質調查成果數據服務,同時有效地提高了地質調查成果數據的利用率和信息產品服務質量[3]。
全國地質資料館匯聚了多種應用平臺的核心功能,開展并完成了數字地質資料館建設。同時為保障數字地質資料館平臺高效穩定運行,通過現有技術和軟件產品,參照ITIL國際標準,對智能運維體系進行了探索。本文通過對數字地質資料館智能運維體系研究和實踐的經驗進行總結,以相關國內外標準為依據,利用成熟的商業軟件平臺,結合實際業務需求,以最低的成本投入,構建數字地質資料館平臺智能運維體系,并提出完整有效的指導建議,切實帶動和提高地質資料信息化建設管理支撐能力[3-4]。
從數字地質資料館平臺來看,智慧運維體系是根據需求提供規范的信息系統服務平臺,對與數字資料館平臺相關的各項信息系統進行系統地組織、計劃、監控、管理和維護,是綜合信息系統平臺運行維護管理工作的總稱。智慧運維體系是數字資料館各平臺的生命周期的最后環節,是展現系統建設所取得的經濟價值中最重要的環節,也是存在時間最長的階段。在該階段智慧運維體系主要依托數字地質資料館平臺交付的基礎設施軟件、硬件環境,開展規范、科學的運維管理,保障數字地質資料館的安全、高效、穩定的可持續服務,滿足地質資料數據通過社會化服務展現經濟價值。智慧運維體系的核心目標就是規范的利用好、管理好已投入使用的數字地質資料館平臺,其建設過程中需要遵循的原則主要包括規范性、合理性、先進性和經濟性四個方面[5]。
1) 規范性。智慧運維管理過程中須嚴格遵守相關法律、法規、國家標準、行業標準和技術規范等。在進行運維管理體系的總體架構設計與執行過程中,須依據有關文件的要求進行架構設計,在執行全部過程中須嚴格依據標準進行操作,同時建立規范化的操作記錄機制,通過開展智慧運維體系規范的管理體系建設,實現智慧運維體系達到國際一流水平。
2) 合理性。智慧運維管理的核心目標是保障數字地質資料館平臺的各功能組件的運行能力,在滿足安全、穩定運行的基礎上,達到系統平臺設計的既定運行能力。在智慧運維管理過程中需精準的掌握相關系統平臺的功能模塊,熟悉該功能模塊的運行能力,結合其特點合理的規范設計各功能組件的性能監控指標,主動的進行性能監控和分析,最大程度保障數字地質資料館各平臺的安全、穩定、高效運行。
3) 先進性。智慧運維體系需要高效便捷的對數字資料館各平臺開展運行監控和維護工作,從技術層面需要利用最新的成熟技術開展運維管理和監控,從管理層面需要參考國際ITIL標準和有關國家標準執行。以先進技術和先進管理理念,建設完備的監控、管理和服務的流程,實現高效、精準、便捷的運維管理工作。
4) 經濟性。智慧運維體系作為輔助管理平臺,在其建設時期需要嚴格制定預期效果和人力、財力、物力的投入目標,同時作為數字地質資料館的建設管理的延續,需要建立穩定的運行維護工作經費保障機制。在建設過程中所需設施選型須遵循成熟穩定產品優選選擇,避免單獨開發,有效減少建設經費的投入。同時,在規范的運維記錄數據分析下,進一步合理規劃設施增加和更新所需的經費投入,從而更加合理的進行數字地質資料館建設與運維費用的分攤,實現成本與使用管理相對平衡[3]。
數字地質資料館平臺在建設過程中,投入了大量的人力和物力,同時開展并完成了大規模的IT基礎設施軟、硬件環境建設。利用這些基礎設施有效的保障了地質調查成果資料的社會化服務,切實為國家經濟建設和科研學術研究提供了專業、權威、真實、精準的地學信息服務產品。通過開展智慧運維體系探索和實踐,利用現有的技術手段進行自動化的基礎環境運行性能、IT基礎設施運行狀態和各系統平臺服務的運行狀態監控,開展監控和運行數據自動采集,實現對數字地質資料館各平臺的運行進行全方位監控,為其升級、更新和改造提供精準的基礎運行數據支撐,同時自動報警和自動修復實現對IT基礎設施進行全方位保障。
通過開展數字地質資料館智慧運維體系的探索和實踐,在利用成熟的監控軟件對基礎硬件、基礎軟件、服務支撐系統平臺等不同層級的運維管理,所采集的數據對軟件、硬件廠商在地質資料行業研發過程中,根據其特點開展具有一定針對性的改進、完善和優化。在運維過程中產生的標準和規范,有助于行業內相關單位開展類似建設工作時提供一定的參考和借鑒,同時也培養和帶動了地質資料信息化建設隊伍的能力建設,有效推動從業人員的實際工作經驗積累和技術儲備[5-7]。
物理環境實時監測是智能運維體系中對基礎物理環境進行運行監控,主要為保障數字地質資料館各平臺所使用的全部IT基礎設施的正常運行,利用信息技術重點開展空間、電力資源、環境溫度和消防等基礎環境資源的監控。這部分設備需要納入到智慧運維管理體系之中。由于傳統數運維體系主要依靠人工,進行基礎環境中的風火水電人工巡檢和監控,因此為提升整體基礎環境運維能力,特建立智能自動巡檢、監控架構實現自動化運維監控,提高基礎設施環境整體的運維能力。物理環境實施監控部分的主要監控內容如下:供電系統運維、空調系統運維、安防系統運維和消防系統運維[7-8]。
IT基礎設施運行性能監控系統,一方面可以對基礎支撐的服務器及其應用系統進行實時監控,另一方面也可以為系統管理人員提供完善的監測和報警平臺。據相關要求服務器及其應用能7×24 h持續正常、穩定的運行,根據客戶需求的不同,提供5×8 h、7×12 h的分級服務。IT基礎設施運維體系主要涵蓋兩類三方面,兩類即硬件類和軟件類;三方面即基礎底層硬件運行方面、基礎系統運行方面和應用系統運行方面[2-3]。
網絡環境作為數字地質資料館各平臺重要的基礎設施資源,在運維管理過程中需制定相關流程予以控制。網絡環境運維建設主要包括以下內容:網絡拓撲結構運維、網絡的訪問管理、網絡系統日常維護流程、維護網絡IP地址表和網絡系統巡檢[3]。
數字地質資料館核心的組成部分之一就是存儲系統,核心數據和服務數據是數字地質資料館的核心內容,因此存儲子系統的運行壓力尤為重要。存儲系統和備份系統運維的主要對象是物理環境、供電和線路、硬件設備維護等方面。
存儲系統維護包括:供電巡檢、設備巡檢、定期查看存儲系統和存儲系統用戶信息維護等[8,10]。
備份系統運維包括:空白介質與有數據介質保存方式的規定、應制定統一的介質編號、建立介質管理員制度、數據介質控制、定期對帶庫設備進行除塵處理等[8-11]。
安全智能管控的運維對象是系統與數據,系統主要包括操作系統、數據庫、中間件、應用程序等系統資源;數據包括核心數據、配置文件、日志等各類數據資源。這類管理對象雖然不像傳統管理對象那樣“看得見、摸得著”,但卻是IT服務的邏輯載體。安全智能管控運維體系主要分成2個方面進行。其中,系統安全管理主要由安全監測、安全防護和安全審計組成,結合運維管理平臺實現將技術、流程和人三者有機結合;防病安全管理主要包括防病毒軟件運維管理和病毒資訊告知機制[11-13]。
數字地質資料館平臺智慧運維體系探索與實踐,是地質資料信息化工作者的長期面臨的運行壓力和重點工作之一,同時也是為建設國家地質資料數據中心奠定準確權威的建設規劃參考依據。在新時代下新興的信息技術不斷更新和發展,在此基礎上開發了各類的應用系統和平臺,實現即時、全面、準確、高效的為社會公眾提供準確、權威的地學信息服務產品。這不僅滿足了科研使用,也是重要的國家基礎數據資源。因此,地質資料信息化工作需要面臨的不僅僅是如何更高效、安全、穩定可信的提供社會化服務所需的業務平臺,更重要的是如何通過信息技術運行和維護好已投入使用的各類服務業務系統平臺。既要滿足服務業務平臺安全、穩定、高效的同時,更需要保障其性能始終達到高效、安全和穩定,同時能夠為更新系統平臺提供必要的基礎運行數據支撐。通過智能運維體系的探索和實踐不斷的開展運行和完善,切實保障現有業務平臺運行安全穩定可靠的基礎上,積累豐富的運行維護經驗和系統架構規劃基礎理論數據,為地質資料信息化長遠發展奠定必備的基礎運行數據積累,更精準的開展相關規劃和建設[13-14]。
在智慧運維體系探索與實踐的過程中,完善和規范了地質資料信息化的運行維護操作規程,對基礎環境、IT基礎設施、網絡環境、存儲備份體系和安全管控體系等工作積累了豐富的實際運行維護經驗,也是對軟件、硬件廠商提供了真實準確的運行數據收集,便于精準的對現有系統和硬件設備升級和完善。智慧運維體系是數字地質資料館運行的重要基本保障工作,也是地質資料信息化工作者的核心職責之一,更是依法對全民所有的基礎地質信息數據接收、保管、服務等工作的重要技術保障[12-16]。