趙俊清,邊 原,劉 寅,王冬明
(中鐵電氣化局集團有限公司 設計研究院,北京 100166)
BIM(Building Information Modeling)技術應用于工程設計、建造和管理,可以為工程技術人員對各種建筑信息作出正確理解和高效應對,進而可以提高生產效率、節約成本和縮短工程建設工期。
雖然BIM 技術具有上述優點,但是BIM 運維管理具有工作量大、步驟繁多等特點,圖像識別技術可以從海量圖片或視頻中快速提取出學習過的物體或人物,因而將該技術應用在BIM 運維管理中。圖像識別技術在計算機視覺領域如今十分普遍,有很多識別圖像的算法,如SLAM,YOLO[1]等。目前,鐵路系統的運維管理較為傳統,單個系統間獨立運行,信息不能得到及時的更新和維護,在BIM 運維管理的信息化系統中引入圖像識別技術,可以很好地實現設備模型的狀態更新管理。
YOLO(You Only Look Once)是單階經典檢測器,能夠實時快速地對目標進行檢測,并且能夠達到比較高的準確率。YOLO 的提出者把檢測目標的任務變成對目標區域預測及對類別預測的回歸問題,該方法利用單個神經網絡直接預測物品邊界和類別概率,從而實現端到端的物品檢測。此方法的檢測速度很快,基礎版的速度可以達到實時45 幀/s,Fast YOLO(輕量級YOLO 版本,使用9 個卷積層,并且卷積層中使用更少的卷積核)可以達到155 幀/s。YOLO 分 為YOLO V1、YOLO V2 和YOLO V3[2]算法,此外鞠默然等人[3]根據YOLO V3 算法的改進,檢測小目標物體。李星辰等人[4]提出了融合YOLO V3 的多目標檢測和跟蹤算法。
YOLO V1 產生于2015 年,采用一階結構完成物體的檢測,包括物體的類別和位置。其具體算法為采用卷積神經網絡對特征進行提取,缺點主要是對小物體、比例不常見物體以及邊框檢測效果不準確,對物體的定位不精確。
YOLO V2 產生于2016 年,對網絡結構、先驗框的設計和訓練技巧進行了改進,比YOLO V1 版本更加準確、快速,范圍更廣識別物體類別更廣。
(1)在網絡結構方面,YOLO V2 提出全新的網絡結構DarkNet,提高識別精度,加快速度;
(2)在先驗框的設計方面,YOLO V2 設置了一定數量的預選框,使模型不用直接預測物體的尺度和物體坐標,只需要預測先驗框距離真實物體的偏移,進一步降低預測難度;
(3)在訓練技巧方面,YOLO V2 可以做到對不同尺度的圖片進行訓練,對多階段訓練過程進行優化,使訓練出的模型能夠適應多種不同場景的要求。
YOLO V3 產生于2018 年,對網絡結構、網絡特征和后續計算3 個地方進行了改進,提高對小物體的檢測能力。在網絡結構方面,YOLO V3 提出了基于V2 的改進版網絡結構DarkNet-53,如圖1 所示。采用殘差思想,使模型更易收斂;設置多層特征圖,有利于多尺度和小物體檢測;取消池化層。在網絡特征方面采用多尺度預測,有利于檢測不同大小的物體。在后續計算方面,YOLO V3 使用Logistic 函數替代Softmax 函數。進一步做到多類別預測。
YOLO V3 的優點是速度快、通用性強、背景誤檢率低;缺點是位置的準確性和召回率低。
DarkNet-53 包含53 個卷積層,由5 個殘差塊構成[2]。每個殘差塊由多個殘差單元組成,通過輸入與2 個數碼累積造型(DBL)單元進行殘差操作,構件殘差單元。其中,DBL 單元包含卷積、批歸一化和leaky ReLU 激活函數。通過引入殘差單元增大網絡深度,避免梯度消失。
YOLO V3 對輸入圖片進行了5 次降采樣,分別在最后3 次降采樣中對目標進行預測。最后3 次降采樣中包含了3 個尺度目標檢測的特征圖。小特征圖提供深層次的語義信息,大特征圖則提供目標的位置信息,小特征圖經過上述采樣后與大特征圖融合,因此,該模型既可以檢測大目標,也可以檢測小目標。
BIM 按照生產階段劃分可以大致分為4 個階段:設計,生產制造,施工,運維。其中,運維階段工作內容繁多且數據信息量大,很多工作如果用人工處理則工作量大并且成本高,圖像識別技術在BIM運維領域可以節省很大的人工工作量,節約工作時間,提高工作效率,典型的應用場景有異物入侵、設備更新等。
鐵路接觸網、列車軌道、火車隧道內經常會有垃圾袋、鳥類、風箏等異物入侵,導致列車無法正常運行,出現進行停車、暫停運行、晚點等不良后果。如果在接觸網桿上、軌道旁、隧道內安裝攝像頭,通過運行圖像識別程序自動監控、識別異物并報警,維護人員可以及時了解到異物出現的時間和地點,馬上進行處理。這樣可以在很大程度上避免列車出現事故,同時免除了巡檢人員長時間、長距離在軌道旁行走檢查。
在鐵路線路運維期間,需要經常對設備進行維護和更新。通過攝像頭對設備進行監控、掃描和識別就可進行設備更新的線上管理,可以減輕工作人員手工錄入的繁多的工作量。系統對設備實時監控,當檢測到設備更新時,便可自動掃描并對設備圖片進行識別,將新的設備圖片和位置錄入系統。
當發生火情時通過圖像識別技術對火情發生地點進行定位,控制中心可及時查詢相應周圍環境和設備情況,為及時疏散人群和處理災情提供重要信息。此外,圖像識別技術也可用于建筑施工安全風險預警,包括機械傷害事故以及未佩戴安全帽的情況[5-7]。
圖像識別技術如果應用到地鐵或車站的視頻中可以對實時人流量進行估計。通過統計某一時刻或一段時間內鏡頭下人的數量可以估算出此時的人數,從而為車站交通疏導、周邊服務工作做出指引。
通過圖像識別技術的人臉識別,還可以搜索逃犯等特定人物,輔助公安工作。查找保安位置,在消防報警時,在BIM 上快速定位所在位置,并查看周邊疏散通道和重要設備等。
圖像識別技術同樣可以用于施工進度管理[8],通過識別施工現場照片反應施工進度,再通過Revit 和Access 對識別結果進行管理,即可實現對施工進度的實時動態管理。
圖像識別技術的輸入有2 種數據源:通過采集攝像頭得到的影像數據包括視頻數據和圖片數據;通過標注視像數據得到的訓練數據生成的設備設施特征庫。利用圖像識別技術,將這2 種數據處理后導入鐵路BIM 綜合運維管理系統,在系統中可以得到設備的狀態信息,即有位置變化的數據,從而實現對運維BIM 的位置狀態信息的監測。鐵路BIM 綜合運維管理系統可以在此基礎上對BIM 進行更新,完成后續運維操作,如圖2 所示。

圖2 基于圖像識別技術的鐵路BIM 運維模型維護
YOLO V3 技術的具體應用包括4 個步驟:環境配置、圖片標注、訓練數據、測試圖片,流程圖如圖3 所示。

圖3 總體流程
在使用YOLO 之前需要配置darknet 環境,若電腦有獨立顯示器,需要安裝darknet 的GPU 版本,否則安裝CPU 版本。安裝GPU 版本的步驟為:
(1)安裝CUDA 及CUDNN;(2)安裝Microsoft VS 2015;(3)安裝Open CV 3.4.0;(4)下載darknet源碼并解壓縮,運行生成darknet.exe 文件當生成darknet.exe 文件后環境就配置成功了。
在配置好環境之后,可以對圖片進行標注學習操作。
(1)收集相關圖片
針對想要更新的設備或物體,通過篩選攝像頭對其拍攝的圖片,得到相關的影像數據,如圖4 所示。將圖片放到2 個文件夾中,是train_images,用于訓練使用,一個是val_images,用于驗證使用。

圖4 圖片收集
(2)使用LableImg 制作標簽
使用LableImg 軟件對所有采集到的圖片進行標注,用長方形框出目標物體,便于系統訓練數據使用,如圖5 所示。
在開始訓練數據之前,還有一些文件需要準備,包括以下內容。
(1)train.txt 和val.txt
train.txt 文件包含train_images 中所有圖片的路徑,每個圖片一行,val.txt 文件包含val_images 中所有圖片的路徑,每個圖片一行。
(2)XX.names
將所有物品的類名放到這個文件中。
(3)XX.data
放入物品類別數量和參考文件路徑。
(4)YOLOV3-KD.cfg_train
通過復制builddarknetx64cfgYOLOV3.cfg 文件得到,并做相應修改。
(5)下載預訓練權重darknet53.conv.74
訓練數據的命令為:
darknet.exe detector train data/XX.data cfg/YOLOV3-XX.cfg_train darknet53.conv.74
在訓練時需要觀察顯示框中出現的loss 值,當avg loss 在多個迭代中沒有下降時可以停止訓練。當樣本集為3 個類別、70 張圖片時,訓練時間大概為15 min。
測試圖片的命令為:
darknet.exe detector test data/KD.data cfg/YOLOV3-KD.cfg_test backup/KD_YOLOV3_2000.weights data/test1.jpg -thresh 0.5
將文件名改為相應的名稱后,可以對圖片進行測試,以下為對車站座椅和滅火器箱的檢測結果,如圖6 所示。
經過多次實驗表明,圖片識別的正確率為100%。可能由于目前實驗數據較少且圖片清晰,所以圖像正確識別率較高,但該算法在鐵路BIM 綜合運維管理系統中應用于特定設備設施的識別是可行的。
本文介紹YOLO 算法,對圖像識別技術在BIM運維管理中的應用進行詳細闡述,最后介紹了如何使用YOLO 方法應用于鐵路BIM 綜合運維管理系統。若在鐵路BIM 綜合運維管理系統中引入空間定位技術,結合目前的圖像識別技術,即可實現鐵路設備設施BIM 位置的實時更新,保持與現實一致,從而為實現數字孿生和智慧化運維管理打下基礎。