曽 驥 韓 巍 翁 芳
(浙江大學濱海產業技術研究院,天津300380)
機房是信息管理、業務處理和通訊網絡的數據中心,隨著我國大數據、物聯網和網絡通信技術的高速發展,機房建設將不斷上升。目前機房安全與運維管理主要通過人工巡檢和在線軟件診斷,人工介入巡檢方式基本包括人工巡檢、人工抄表、人工模擬故障法檢測、人工核對傳感器數值,并依據人機工程學的理論開展工作。在人機合作系統中,人類適合負責需要創新性、靈活性、開放性的工作,而機器適合于需要簡單重復、高計算量、高精度的工作。人工巡檢、人工抄表等大量簡單重復的工作方式,并不是人機合作的最佳工作方式。因此,人工巡檢方式雖然緩解了事件發現時間滯后、誤報、漏報等問題,但也不可避免地引入了其他問題,例如人手不足、數據精度有限、可靠性不高、人員水平、責任心參差不齊等諸多不利因素。[1]
在線軟件診斷存在檢測覆蓋范圍小、響應慢和易干擾等問題,隨著機房建設逐漸偏遠化和社會老齡化的趨勢,機房智能化安全管理和運維將成為必然趨勢。本研究通過深度學習的巡檢運維機器人系統和相關技術的示范應用,幫助傳統IT 運維服務商向智能無人化運維服務發展, 同時推動智能移動機器人和視覺感知技術的發展及其相關產品的研發。
為適應機房機柜高度 (1.8-2m) 和標準機房通道寬度(0.9-1.2m) 的實際應用情況。機器人底盤采用雙輪差速驅動,實現原定轉彎,同時通過底盤防滑防抖懸架的設計,保障機器人在機房通道不平坦地面的穩定移動和執行巡檢任務; 同時設置上方視覺檢測模塊的可升降設計, 滿足機器人在近距離檢測機柜內高低層次擺放服務器的檢測視角高度可調; 機器人還設置動環傳感器,實時感知機房環境內的動環信息。
自主移動與作業控制算法:
首要任務完成機器人在機房環境下的自主移動功能,通過激光SLAM技術,即同時定位與地圖構建(Simultaneous Localization And Mapping,簡稱SLAM),通常是指在機器人或者其他載體上,通過對各種傳感器數據進行采集和計算, 生成對其自身位置姿態的定位和場景地圖信息的系統。[2]SLAM技術對于機器人或其他智能體的行動和交互能力至為關鍵, 因為它代表了這種能力的基礎:知道自己在哪里,知道周圍環境如何,進而知道下一步該如何自主行動。
通過機器人本體前方安裝2D 激光雷達實時快速呈扇形發射和接收的激光紅外線采集的點云圖, 來構建機房實時場景的地圖,并保存到機器人本體和上傳到后端服務器,同步在地圖上通過數據處理優化激光雷達構建的離線地圖, 并在巡檢目標及目標地點進行標記, 最后通過自身IMU 及機器人本體尺寸及驅動方式來運算機器人運動模型, 使其在構建的離線地圖上完成自主移動; 另外通過2D 激光雷達實時檢測動態障礙物的功能,結合機器人運動控制學,實現遇障安全停障功能,包括在有條件的通道環境內進行自主規劃新的繞障路線, 實現機器人自主規劃路線能力。其次要完成機器人連續精準對機房服務器的設備掃描和信息采集,包括如下步驟:巡檢機器人在待巡檢區域內行走,獲取離線數據信息,完成預作業;正式作業,巡檢機器人從起始點出發到達離線最佳巡檢點的過程中, 根據巡檢機器人與待檢機房服務器的動態位置關系, 實時調整巡檢機器人上云臺攝像機位姿, 通過攝像機鎖定待檢機房服務器不斷拍照并識別;識別成功后,機器人向下一巡檢點運動;若識別失敗,則巡檢機器人在離線最佳巡檢點停駐識別。通過構建巡檢機器人與待機房服務器的動態幾何關系, 可使攝像機迅速鎖定并識別待服務器, 提升了巡檢機器人圖像鎖定及識別的效率和準確率。視覺檢測算法開發:本文采用基于深度學習的端到端網口檢測方法,如圖3 所示,包括:(1)獲取機房不同背景、不同機柜的交換機網口圖像;(2)對交換機網口圖像進行分類;標注每個圖像,制作數據標簽;(3)使用數據增強技術,制作交換機網口圖像數據集;(4)訓練深度網絡YOLO v3 模型,保存模型結果。本文通過從智能巡檢機器人攝像頭獲取網口圖像, 通過算法處理得到圖像中網口的位置和類別,進而做到現場實時部署,能夠提高機房內交換機網口檢測的準確率, 從而提高智能巡檢機器人部署時的效率。
本文通過機房無人化、智能化巡檢實際業務需求(一個數據中心機房需要 每2~3 h 進行一次粗略巡視,以覆蓋整個機房的角度大體巡視機房設備。每4~6 h 就需要進行一次細 致巡視,巡視內容包含查抄所有表計、指示燈等讀數和狀態。[3]),設計規劃機房智能巡檢機器人業務流程和功能模塊如下:
視覺感知功能:

移動巡檢功能:

可視化資產管理功能:

目前巡檢運維機器人已在多個領域中有廣泛應用,尤其國家電網始終是巡檢機器人最大以及最早期的用戶。早在1999 年,國家電網山東電力公司就投入使用了智能巡檢機器人, 讓電力工人告別在高溫雨雪等惡劣天氣中巡檢的“折磨”,標志著電力巡檢逐步邁入智能化時代。但除了變電站、高壓線路等國家電網應用場景, 應用面更廣的智能機房運維機器人也有很大的市場和應用前景。
機房智能運維服務器機器人雖然是個垂直的細分市場,但是其體量并沒有想象的那么小。以一個機房為例,要達到24 小時有人的狀態,至少需要五個人,五班三倒。2015 年的數據顯示,國家電網總共有500 個面積在100-400 平米的機房, 至少需要的人力是2500 人,這非常不現實。相比之下,用機器人替代人力進行巡檢, 一個100-400 平米機房最多只需要一臺高配兩臺低配機器人,“運一備二”,400-1000 平米的機房需要“運二備二”,即可實現24 小時實時巡檢。市場容量來講僅國家電網省級服務器機房共497 個,對機器人的需求在1500-2000 臺,整體的市場容量可達10-20 億。而隨著能源互聯網的發展以及能源數據的不斷增加,機房運維機器人的市場容量必然會相應增加。
智能巡檢機器人的運用極大提升了機房巡檢維護作業的效率和準確性, 本文上述機房智能巡檢機器人系統及關鍵技術的研究,滿足目前機房無人化、智能化巡檢運維的需求,解決機房人工巡檢運維效率低、成本高的問題,大幅提升機房巡檢運維的效率和自動化、智能化水平;借助移動機器人、多模態感知、機器學習和深度學習等技術,極大推進機房巡檢運維的產業升級。