黃晉 何景 劉權 彭振
(1.湖北省交通運輸廳通信信息中心,湖北 武漢 430056;2.湖北省交通科學研究所,湖北 武漢 430056)
隨著信息技術的不斷發展,人類已經迎來了大數據時代,數據交互不斷加強的生態鏈發展正不斷加速,大量資源需要保障,其中數據中心機房作為載體更是整體生態鏈中需要保障的重點對象[1]。尤其是近年來,云計算、區塊鏈、元宇宙等概念不斷發展和完善,數據中心機房需要存儲的數據與日俱增,承受的壓力越來越大,因此也對設備及環境管理提出了更高要求。特別是銀行、郵政、國家電網、交通運輸等需要實時交換數據的單位,機房管理更為重要,一旦出現系統故障,造成的損失是不可估量的[2]。而傳統機房管理必須配備專職管理人員7x24小時值班,巡查設備運行情況,檢查環控數據是否正常(如供配電系統、電力系統、空調系統、消防系統、動環監控系統等),系統是否正常運行,數據是否出現異常。這種方式不僅排除故障效率低,而且會導致機房管理人員長期處于精神高度集中狀態[3]。
由于多學科建模與仿真技術的飛速發展,數字孿生技術研究成為熱點,目前在數字孿生工業、衛星、智慧能源、智慧工廠、交通、醫療健康等諸多領域得到廣泛運用[4]。為滿足實時、高效、安全的機房管理需求,建設機房數字化智能管理系統是必然的選擇,數字孿生借助多種傳感器獲取數據,采用數字化的表達方式,建立與機房物理實體相似的虛擬化模型,并利用實際測量、仿真計算等方法,實時分析當前物理實體的狀態,實現了模型信息同步,很好地解決了目前數據中心機房管理中存在的問題,實時動態呈現設備告警信息及設備參數,快速定位故障設備,迅速排除故障,長期進行跟蹤預防。
基于數字孿生的機房數字化智能管理系統架構采用“集中化、一體化、智能化”的設計模式,分層設計,實現功能總集成、流程總調度、資源全監控,系統總架構如圖1所示。

圖1 系統架構圖
基于數字孿生機房數字化智能管理系統架構由數據采集層、本地監控層和集中管理層組成。
數據采集層由各類型傳感器、智能監控模塊等組成,負責采集現場環境、動力設備、安防情況等數據。現場各類型傳感器將監控信號接入到本地監控層的站端監控主機,由本地監控主機分析、處理和存儲數據。
數據監控管理層由多臺站點監控主機或服務器組成,可為數據采集層提供RS485/232、SNMP、DI/DO等數據通訊接口,負責分析、處理本地機房采集到的各種動力設備、環境參數和安防信息等監控數據,可實現本地報警管理、記錄存儲等功能。通過網絡,可將處理后的數據上傳至集中管理層。
中心管理層由1臺集中管理服務器構成,與本地監控層的站端監控主機通過網絡連接,負責收集與集中處理由各站端發送上來的數據。集中管理服務器可監控管理站端機房的各種動力設備、環境參數和安防信息,將采集的數據和處理后的結果、報警信息等上傳至交互展示層,并通過遠程IE訪問,提供友好的人機界面,滿足用戶個性化需求,具有數據采集、數據處理、聯動控制、報警管理、記錄存儲等功能。
系統可根據時間調整的光照變化及光影移動,調整天氣效果渲染、雨、雪、霾;系統支持多源異構數據形成“數據底座”,包括GIS、BIM、CAD等;場景支持多源異構數據的整合及加載,支持BIM數據服務,導入模型數據實時加載渲染。
準確還原機房三維實景,包含標識,通道、橋架、線纜鏈路等;還原機房設備與設施,精準呈現模型與現實世界對比圖,與機房現場實景沒有模型出入;支持燈光效果渲染,能夠匹配不同照明度實景。
三維實景與環控監測系統對接,實時顯示監控數據,整合2D組態與3D仿真形態呈現。通過匹配智能傳感器,可視化動態監測整個機房內UPS、配電、蓄電池等動力設備,以及環境變量、安防設施。通過跨平臺的數據協議,將獨立分散的數據庫或有價值的數據提取至圖撲軟件3D機房可視化系統當中,并以7x24小時無間斷監測形式,實現多業務處理、管理決策和數據共享。

圖2 動環監控效果
打造“全方位、全業務、全天候”動環監控管理的實時在線平臺,及時發現隱患,提前處置可能產生的故障,保障機房穩定持久運行,減輕運維人員負擔,實現機房無人值守或少人值守的目的。
1.溫濕度監控
采用高精度數字溫度傳感器,實現對機房環境溫濕度的全方位監測。
2.配電柜監控
系統配電柜監控包括對市電配電柜、UPS輸入配電柜、UPS輸出配電柜、列頭柜等設備的監控,以及監控三相電流、電壓、頻率、功率、頻率等各種配電柜工作參數。
3.UPS監控
系統需要有效監控機房UPS各部件的運行狀態,例如監控UPS的各開關、整流器、電池狀態、氫氣含量、逆變器、旁路及輸出等各部分的狀態,可設定報警值,實時報警。
4.空調監控
監控精密空調實時運行參數。系統需要監控機房空調各部件的運行狀態和運行參數,例如壓縮機、濾網、風機、加熱器、加濕器、去濕器、通風裝置等部件運行或停止的狀況,管理員可以通過網絡實時查看空調運行參數。
空調區域的漏水檢測,每臺空調配備3m~5m漏水感應繩。檢測范圍為漏水感應繩范圍內;探測密度為全線程,圓柱形;漏水檢測繩可通過RS485接口或干接點信號接口與監控系統進行通信。
5.報警系統
系統具備界面彈窗、短信通知、電話語音、郵件通知、現場聲光、桌面語音等多種告警方式,支持發送告警產生及告警恢復通知。
6.組態功能
系統具備組態配置功能,可提供在各應用場景下的靈活配置能力,便于運維人員個性化配置系統,支持分層分級創建設備模板,可根據實際的設備情況創建運行拓撲圖,并通過組態方式配置大屏可視化頁面,具備豐富靈活的操作方式。
7.界面展示
系統界面可直觀顯示各機房、設備的主要運行數據及狀態,實現人性化的系統管理;可實現返回、模糊搜索等快捷便利的操作功能。設備頁面可展示設備運行拓撲、運行參數及運行狀態,并通過數據曲線或圖表查看相關信息。
資產模塊能夠展示機柜內IT設備數量、設備資產詳情,如空調、機柜、發電機、配電柜、UPS、主機、網絡設備、服務器、存儲等。在三維實景中點擊機柜,可模擬打開機柜,顯示機柜內部設備分布情況、基礎狀態等。
將2D面板與數據綁定,同步顯示設備的業務IP、設備廠商、設備高度、起始U位、結束U位、維護人、CPU溫度、設備功耗等關鍵信息的動態數據,以簡潔的表現形式,為用戶呈現多角度、細致、全面、直觀的關鍵性數據,挖掘數據背后的價值。

圖3 機柜可視化頁面
1.端口可視化
點擊機架前板或后板即可打開機架,點選任意資產設備,近距離觀看設備面板圖,真實反映該設備前后面板及所關聯設備端口(端到端)鏈路的布線情況,顯示每一個端口設備固定資產編號、網口信息、所屬機架編號等。
2.容量可視化
機房資源的容量管理始終都是個棘手的難題,往往需要兼顧空間、配電、硬件資源等多方面因素。
3.機柜U位可視化
針對機柜U位、電力、承重等情況,則以機架為單位,應用U位柱狀容量可視化效果,動態統計U高、電力、承重三個維度的綜合空間,直觀展示機房內容量使用情況,幫助運維人員更有效地管理機房容量資源,讓基礎資源使用情況可以一目了然。
4.承重可視化
支持對接底層數據接口,可視化監測機柜承重指標、目前承重狀況、剩余容量,實時透視每一個機柜的承重負荷情況,同時反映地板的承重分布情況。
采用WebRTC后端渲染模式,最大程度降低前端訪問機器性能要求,支持非獨立顯卡硬件環境運行;具備完善的平臺管理能力、支持使用日志,服務管理,使用性能分析等運維能力;具有完善的系統后臺管理平臺,支持權限控制、遠程更新、預熱加載、硬件檢測、集群部署、訪問策略配置及資源負載均衡等功能。
機房數字化智能管理系統首先通過對機房設備、管線的精確定位,精細感知機房環境,從而以三維實景的形式展現機房(數據中心)的運行情況,實現可視化管理;以三維實景實現對IDC機房主機房、支持區和輔助房間的直接瀏覽,全角度觀察設備安裝部署情況及動力環境等附屬設施,系統實現界面如圖4所示。

圖4 系統實現界面
同時機房數字化智能管理系統可以通過配線可視化管理功能模塊以三維實景形式直觀呈現鏈路連接,實現對端口級連接線纜的管理,可極大提高連接線纜故障檢查和排除效率。
通過采用數字孿生技術建立機房數字化智能管理體系和管理平臺,能夠提升機房內設備安全、提升機房管理效率,及時發現問題并追溯故障原因,杜絕人為原因導致的事故發生,做到防患于未然。因此,機房管理數字化轉型勢在必行。