余漢偉,張志峰,李立光
(安徽送變電工程有限公司,合肥 230601)
安全生產是電力企業(yè)的永恒主題,安全工器具的好壞將直接影響生產過程中人身和設備的安全與否。安全工器具全壽命周期管理過程中,由于種類、規(guī)格和數量繁多,在實際操作中甚為煩瑣[1-2]。當前,安全工器具的管理方式還比較落后,安全工器具的日常檢查及進出倉庫都需要人工的手寫、紙筆進行記錄,工作強度大,且在統(tǒng)計過程中出錯的風險比較大;其次現場多采用在工器具上張貼紙質標簽、二維碼等方式進行出庫、入庫及追溯管理,而工器具在服務于現場施工過程中,常暴露于風吹、日曬和雨淋的惡劣環(huán)境之中,使得張貼于工器具設備上的標簽存在磨損、刮花、污損及脫落的現象,這對后續(xù)入庫、出庫及追溯管理提出了新的挑戰(zhàn)[3-4]。
OCR(光學字符識別),能夠高效地毫秒級識別圖片中的文字信息,已經迅速地應用到各行各業(yè)中,極大地提高了人工校核的效率,然而目前通用的OCR技術,在垂直領域,如電力行業(yè)、工業(yè)生產等表現不佳,這需要專門針對垂直領域進行模型定制化研發(fā)和優(yōu)化,才能達到應用級水平[5-6]。
為提質增效,更好地進行安全工器具全壽命周期管理,提出了基于OCR智能識別技術的安全工器具跟蹤技術方案,可提高工器具在出入庫、收發(fā)、維保和檢驗試驗等環(huán)節(jié)的效率,實現安全工器具全生命、全過程周期的跟蹤管理。
相對于通用的文字識別,電力設備編碼識別具有以下難點。
(1)設備磨損、刮花和黃土覆蓋嚴重,導致大部分編碼不能被正常地檢測和識別。
(2)編碼數字之間的相似性大,一旦出現磨損,數字被誤識其他數字的可能性增大。
(3)電力設備多為金屬質地,金屬表面的反光特性使得掃描識別過程中存在干擾的風險因素。
(4)識別檢測過程中,拍攝角度的隨意性,會加大模型的檢測和識別難度。
(5)以視頻的形式進行文字識別和檢測,要求模型需具備毫秒級推理能力。一般模型越大,模型推理速度越慢,因此需要在滿足推理速度同時,讓模型識別率達到最優(yōu)狀態(tài),增加了模型開發(fā)難度。
針對以上5個難點,研發(fā)了一套新的OCR技術方案,總體技術路線如圖1所示。

圖1 技術路線圖
整體的技術流程包括:數據預處理、方向分類器、設備編碼檢測、設備編碼識別、模型推理速度優(yōu)化和移動端模型開發(fā)與部署6大步驟,接下來針對6大步驟進行詳細說明。
1.3.1 數據預處理
數據預處理是整個技術方案的第一步,需要對手機拍攝的照片進行預先處理。包含設備區(qū)域檢測、模糊圖片去除和數據增強方案。
首先對圖片進行區(qū)域定位,將圖片中具有編碼區(qū)域的子圖片切割出來,對區(qū)域的設備進行切分處理,有利于排除不利干擾,采用分割任務(dskj_device_seg)算法完成。
此外,針對拍攝模糊的照片,通過dskj_remove_vague算法,篩選清晰的圖片進行識別,減輕模型的推理壓力,提高模型的推理速度。為豐富樣本庫、增加程序訓練量,將采集的原始圖片運用隨機旋轉、加噪等方式進行數據增強。
1.3.2 方向分類器
方向分類器包含方向分類器數據標注、方向分類器算法開發(fā)。在實際進行推理和應用階段,采取逐張拍攝的方式進行檢測和識別,由于相機在拍照過程中,實際攝入圖片的方向具有不確定性,因此需要對照片方向進行分類判斷。為此通過對現場采集源照片及對采集的源照片運用隨機旋轉、加噪等方式處理,累計標記和增強了超2萬張照片作為方向分類算法的數據集,同時研發(fā)了1套dskj_director_cls算法進行方向分類,通過將輸入的圖片壓縮成指定大小,來進行圖片分類,具體算法流程如圖2所示。

圖2 算法流程圖
1.3.3 設備編碼檢測
設備編碼檢測需要將照片中的設備編碼區(qū)域檢測出來,供后續(xù)的識別模型進一步識別。如圖3所示。

圖3 設備編碼截圖
為避免檢測時因調整拍攝角度而消耗太多時間,研發(fā)了支持任意角度的檢測算法,有效減少了拍攝角度調整的時間,具體算法流程如圖4所示。

圖4 算法流程圖
1.3.4 設備編碼識別
設備編碼經過了檢測后,通過識別模型進行字符識別。為準確識別各種模糊、劃痕及反光等不清晰設備的編碼,針對性地研發(fā)了一種專用識別模型算法,如圖5所示。

圖5 識別模型流程圖
1.3.5 模型推理速度優(yōu)化
為有效提升模型的推理速度,分別研發(fā)了dskj_pact和dskj_quant算法進行模型剪枝及輕量化處理,保留了2個版本的模型,分別是服務端模型和移動端模型,其中移動端模型大小壓縮到17 M左右,在ARM8的芯片上每張圖片的推理速度達到100 ms。
1.3.6 模型開發(fā)與部署
為了便于現場使用,本模型采用服務端和移動端2套模式部署,移動端模型為主,服務端模型為輔助的策略。基于ARM8架構的手機移動端CPU(中央處理器)上,對整體推理模型使用了C++進行重構,最終有效提升了模型的推理效率。
將該程序集成于一款手機軟件上,打開軟件即可進行掃描識別與檢測。為檢測該方案的實用效果,在倉庫中隨機選取了100套刻有編碼的工器具進行掃描識別。試驗結果:總用時469 s,平均每套用時4.69 s,準確識別個數91套,識別準確率91%。對清晰、角度端正的圖片,文字檢測率達到97%;對有輕度破損、劃痕和灰塵覆蓋的圖片,文字檢測率達到94%;對重度劃痕、重度模糊及重度破損的圖片凡通過人眼能夠辨識的,文字檢測率達到82%。
(1)該方案的成功應用有效解決了工器具出入庫管理繁瑣及追溯管理困難的問題,提高了工器具出庫、入庫的效率,降低了人工成本,提高了準確率。
(2)目前整體技術方案能滿足電力行業(yè)各類數字編碼識別,在精度和召回上都達到業(yè)界最優(yōu),而且便于快速應用到其他不同類型的設備編碼識別上。
(3)在檢測方案上進行了大量的優(yōu)化和改進,共計迭代了數十個版本的模型,解決了因拍攝角度不同而影響識別速率與準確率的問題,且針對設備上數字存在缺損現象,對數字進行了專門的模型設計,有效降低了數字的誤識率。
(4)由于目前采集的數據量不夠完善,大部分數據依靠增強方案來實現,計劃后期通過系統(tǒng),源源不斷地進行真實數據的采集及回流,隨著系統(tǒng)數據不斷增加,模型效果也會進一步的提升。