薛俊偉,劉雨濛
(1.中通服咨詢設計研究院有限公司,江蘇 南京 210019;2.暨南大學,廣東 廣州 510632)
數據中心(Internet Data Center,IDC)機房已經成為信息化時代的基礎設施,為國民經濟和社會生活中流通的海量信息提供重要保障。目前,隨著物聯網、邊緣計算、第五代移動通信新空口技術(5G New Radio,5G NR)等新興技術和方案的逐漸落地,更多的媒體、應用、網站、內容提供商和企業等在滿足社會需求的同時,產生的數據量以指數級倍數激增。這依賴于IDC提供的大規模、高質量的數據存儲和流通能力。調查顯示,我國在2018年共產生數據量7.5 ZB,預計2025年,該數字將增長到48.7 ZB。作為信息交換和處理最集中的地方,數據中心機房的安全可靠運轉,需要極為嚴格的運維管理標準和規范。由運維水平的高低決定的服務能力,直接關系到客戶服務器托管、服務器租用、網絡批發帶寬、虛擬專網以及網絡應用服務商等業務需求的保障。顯然,高質量的服務能力將成為未來IDC行業高度競爭環境下供方保持持續發展和不斷優化的關鍵。通過使用雙目視覺仿生智能機器人,可以實現無人值守的自動化三維巡檢和故障預警,縮短故障發現時間,并對大數據分析下人工難以預料的隱性故障做跟蹤定位和預警標記,改善人工巡查低效率、易出錯的弊端,通過技術手段實現早發現、早預防和早處理。
數據機房運維最基本的要求是保障設備正常穩定運行,確保機房環境衛生條件、處理機房設備故障修復和性能優化。考慮到IDC機房的重要性,通常要采用專人值守的7×24 h不間斷巡查,并按照一定的時間間隔核查分析基礎運行數據[1]。這種方式在很大程度上受維護人員的專業技術水平、工作經驗和工作狀態影響。這種耗時費力的工作,也會在巡檢中出現因為主觀原因發生的漏檢和誤判情況。
要確保一個擁有數萬甚至數十萬臺服務器的數據中心安全可靠運行,制定一套完善的機房設備管理制度十分必要。
(1)保證配套的基礎設施良好運轉,是應對當前規模不斷擴大的數據中心機房運維的基礎。IDC機房的配電系統、不間斷電源供電系統和柴油發電機系統,為機房所有設施提供動力保障。照明系統、空調設備和新風系統為IT設備運行提供合適的溫濕度環境,是保證設備壽命和性能的關鍵[2]。因此,應該安排專人負責運維,確保配套設施子系統的巡檢、修復以及日志記錄。
(2)機房環境衛生要嚴格達標。機房需要專職人員定時進行日常巡檢,工作中嚴格按照防塵規范操作穿著專用服裝,同時機房做防塵處理。在機房巡檢和保潔過程中,要注意杜絕食物等易引起鼠患的物品進入,注意及時關閉門窗,做到防潮(溫差導致冷凝)、防蟲和防曬。此外,要定期評估機房的環境衛生,排除隱患。
在電力機房領域,智能機器人巡檢系統的使用國內外均有較早且成熟的案例。而數據中心機房的智能巡檢系統近幾年發展較快,其中IBM提供的軌道式智能機器人和輪式智能機器人巡檢系統在國外應用廣泛。國內,浙江移動網管中心在2017年啟用機房巡檢機器人,效益良好;華南理工大學在雙目視覺機器人研究上起步較早,并研發出應用于手術導航的高精度機器人和可應用于多個領域的雙目視覺自動巡檢機器人。
(1)功能上,智能機器人巡檢的自動化程度更高,巡檢結果更客觀和全面。與傳統的人工巡檢相比,機器人巡檢具有智能識別儀器儀表數據、智能感知空間環境參數、與模塊化機房門禁系統聯動、智能巡檢路線規劃、數據遠程實時上報以及24 h不間斷巡檢等功能。
(2)效率上,IDC巡檢機器人能實現無人值守的全自主智能巡檢,對機房內機柜、動力電源、蓄電池及空調等設備實現數據聯動監測。運維人員通過后臺可以實現遠程可視化三維巡檢,并可操控機器人完成目標任務,大大提升了工作效率。此外,機器人巡檢實現了人員和設備的物理隔離,具有高安全性。
基于5G NR網絡的輪式雙目視覺巡檢機器人,主要包含四驅底盤、供電單元、主控單元、融合通信模塊和操作系統等。其中,主控單元通過私有協議,與運動控制單元、雙目視覺單元、環境傳感系統和人機交互接口連接,監測數據和控制命令通過5G/WiFi/NBIoT網關模塊回傳至監控中心。設計使用的通信模塊包含RG500Q 5G NR模塊、ESP8266-12F WiFi模塊和BC28 NB-IoT無線模塊。操作人員在系統后臺通過分析數據和查看影像做出判斷,并發送指令控制機器人工作[3]。巡檢機器人主要實現的功能如圖1所示,樣機如圖2所示。

圖1 雙目視覺巡檢機器人功能圖
傳輸控制命令和監測數據需要考慮系統工作的實時性、穩定性和傳輸帶寬。實際中,使用內嵌高通X55 5G調制解調器的RG500Q模組在Sub-6 GHz頻段,能實現LTE Cat.12及以上的高速網絡連接,內置于機器人主體內,用于視頻數據的回傳。它的封裝尺寸小,同時自帶全球導航衛星系統(Global Navigation Satellite System,GNSS)和嵌入式SIM卡(Embedded-SIM,eSIM)功能,方便集成。

圖2 樣機示意圖
ESP8266-12F WiFi嵌入式串口轉無線網模塊內置TCP/IP協議,支持802.11 b/g/n/ac協議,可以編程設置為AP/Station/混合模式,使巡檢機器人在運營商NR網絡不穩定時輕松切換到IDC機房內局域網的數據互通。它使用通過了運營商入庫認證的BC28 NB-IoT無線通信模塊,實現了機器人的低功耗物聯網接入能力,滿足巡檢數據特別是儀表參數、環境數據以及告警信號等的低時延連接和傳輸服務。
機器人雙目視覺的實現,主要使用同時定位與建圖算法(Simultaneous Localization and Mapping,SLAM),依賴深度像機采集到的實時影像,經過自身定位導航和構建增量地圖實現自主導航和探索[4],主要實現定位(Localization)、建圖(Mapping)以及隨后的路徑規劃等。實際設計中,附加了InvenSense公司的九軸陀螺儀以實現慣性導航-視覺SLAM融合算法。
常用的空間姿態解算方法有:通過有限次的三方向旋轉達到三維空間物體姿態解算的歐拉角姿態解算,采用復數二維空間內的四元數(Quaternions)解決三維空間姿態運算的四元數姿態解算方法。這里將陀螺儀四元數姿態解算和RTAB-MAP開源算法相融合,依靠相機構建三維場景計算機器人的位置姿態,結合陀螺儀慣導系統,修正隨著時間漂移引起的誤差,實現實時性更高的慣性導航-視覺SLAM巡檢機器人[5]。
5G NR在智能巡檢中的應用前景明朗,其高帶寬和低時延的性能特別適合實時監測機房狀況,保證運維人員實時動態掌控機房內的情況,并可遠程操控機器人提供簡單的故障修復。通過長期積累數據實現AI深度學習算法,每臺巡檢機器人可以滿足700~1 300 m2機房全天候巡檢需求,并提供詳細的機房數據分析報告和智能化的優化建議。人工巡檢受到人員業務素養的影響較大,執行巡檢標準化流程的質量無法保證。其他功能上,如果配合目前先進的7自由度機械臂,機器人還能實現高精度的故障分析預警和診斷定位,并修復機房設備故障。運行在5G網絡下的雙目視覺智能巡檢機器人,融合WiFi模組、NB-IoT模組和NR模組以滿足多場景下的低時延、高穩定數據傳輸,驗證表明系統的精確性、穩定性和可擴展性符合預期。此外,智能機器人實時監測機房狀況并傳輸數據,方便運維給出更加科學準確的判斷,避免人工漏巡、錯看、誤記等可能,降低了人力成本,提升了巡檢質量和效率。