童軍心,童 超,吳宇睿,王金明,單松興
(1.國網江西省電力有限公司電力科學研究院,江西 南昌 330096;2.南昌工程學院,江西 南昌 330096;3.國網江西省電力有限公司超高壓分公司,江西 南昌 330096;4.國網江西省電力有限公司樟樹市供電分公司,江西 宜春 336000)
為了準確了解電力系統輸變電設備的運行狀態,需要對系統進行安全評估,對可能存在的風險進行預警,需要對輸變電設備進行大量檢測試驗,而大量儀器儀表的數據需要被記錄便于進行數據挖掘和分析。在復雜的檢測場景下,一些檢測儀器無通訊接口,只能通過紙筆抄錄完成報告后再輸入系統中,效率低下且容錯率低。為了給變電檢測現場過程提質增效,運用圖像識別技術對儀器數據進行定位識別,再將識別結果自動返回報告中[1-3]。
儀表的數字識別過程由區域定位、字符分割、字符識別三部分組成。其中,儀表區域定位是數字識別的前提,起著關鍵性作用?;赟IFT、SURF 的定位算法廣泛應用于電力系統中目標檢測與研究中。文獻[4]針對SIFT 算法中特征向量的維數過高問題,提出了一種雙向SIFT 匹配的方法,降低了特征向量維數,提高了匹配精度,較好地應用在電力設備識別中。SURF 算法借鑒了SIFT 簡化近似思想,將DOH 中的高階、二階微分模板進行了近似簡化,可以采用積分圖像計算,實驗證明SURF 算法綜合性能優于SIFT算法[5-8]。
傳統圖像文字識別技術大多采用傳統光學字符識別,該技術需輸入圖像背景干凈,字體簡單且排布整齊,才能達到很高的識別水平,對復雜儀表圖像幾乎無法識別。與純文字的圖片不同,復雜環境下的儀表信息識別則面臨著圖像背景復雜、拍攝角度和光線強弱等眾多因素造成的分辨率低、對比度和亮度不均勻等問題。
基于此,文中提出基于SURF+OCR 對變電檢測儀器數據定位[9]識別方法,根據尺度不變特征變換實現儀器面板特征匹配、關鍵數據位置定位與截取,實現對儀器面板重要信息的獲取,獲取后的圖片經過預處理后放入Tesseract-OCR[10-11]引擎中識別,繼而得到精確的識別結果。
SURF算法的實現主要有以下5個步驟:
1)構造比例空間:利用高斯模糊形成不同尺度的圖像,構成高斯金字塔。為確保圖片中的要素與比例無關,通過高斯函數計算出不受尺度和旋轉影響的極值點。
2)關鍵點本地化:對極值點進行擬合三維二次函數運算,去除影響SURF 算法的邊緣響應點,同時確定極值點的尺度和位置,進而確定合適的特征成為關鍵點。
3)方向分配:提取圖像在某個特定小區域內的梯度值的最大值,并作為該關鍵點的方向特征值,確保關鍵點角度不變。
4)關鍵點描述符:在關鍵點領域內,計算出選定區域的梯度大小,并用該梯度值表征圖像在局部區別內光照、形狀變化,為每個關鍵點分配獨特的指紋。
5)圖像匹配:運用漢明距離、歐氏距離等方法對兩幅圖像關鍵點特征向量進行相似運算,之后通過單應性矩陣對圖片進行調整。
為了提高識別的準確率,在對數字儀表的重要信息識別前,對圖像進行預處理。
1)中值濾波
結合圖像背景考慮,文中采用中值濾波對圖像進行圖像平滑處理。中值濾波是一種非線性的平滑技術,對于胡椒噪聲和鹽噪聲有非常顯著的影響。中值濾波取當前像素點和它周圍的臨近奇數個像素點的像素值,將像素值排序,取中間位置的像素值作為當前像素點像素值。中值濾波原理用式(1)表示為:

式中:Xi,j表示像素點在坐標為(i,j)時的像素值;A為濾波窗口;Med 為中值濾波函數;Yi,j為濾波窗口內的中間像素值。
2)圖像形態學操作
為簡化圖像,對圖像采用形態學處理,以提高數字儀表圖像的質量,減少字碼中斷帶來的影響。膨脹和腐蝕處理是形態學運算的基礎。設兩幅圖像X、B,若X是被處理對象,B是用來處理X的,那么則把B稱為結構元素。
其中膨脹處理和腐蝕處理分別如式(2)、式(3)所示:

式中:B表示結構元素;X表示為原始圖像。D為X和B的邏輯異或操作的值,B的黑色和X的黑色有一個對應就讓該個點為黑色;E為X和B的邏輯與操作的值,B的黑色和X的黑色完全對應,就讓該個點為黑色。
3)圖像二值化
為提高識別的準確率,在對數字儀表識別前,對圖像進行二值化處理。對此,文中采用Otsu 算法,以減少光照和對比度給二值化帶來的不利影響。假設連通區域S,其像素的灰度范圍表示為[0,255],其中灰度級x的概率用p(x)表示。Otsu 就是求式(4)得到最大灰度級m值。

而上述值則為最佳的分割閾值。
Tesseract 是HP 實驗室開發由Google 維護的OCR 引擎,Tesseract-OCR[12]運行過程:首先將經過預處理的二值化圖片傳入OCR 引擎中進行分析,通過識別引擎獲取目標區域,采用自適應分類器定位文本行、分割字。通過兩次字符分析識別使OCR 引擎對圖片中的模糊區域進行改進,校驗字符是否正確后將圖片識別輸出文本。Tesseract-OCR 架構圖如圖1所示。

圖1 Tesseract-OCR架構圖
如圖2 為變壓器鐵芯接地電流測試儀面板,面板中有操作按鈕和顯示屏2 個區域。面板中間部位的電流值和頻率值是測量的結果數據,即該儀器關鍵信息、數據特征為數值型,面板下部為操作按鈕區。拍照時應滿足拍攝規范,如拍攝角度不得過大,被測儀器盡量清晰并且大部分處于圖片中。

圖2 變壓器鐵芯接地電流測試儀面板
利用尺度不變特征變換對儀器面板進行重要數據定位,需要對變壓器鐵芯接地電流測試儀面板建立標準化模板圖片,如圖3所示。該模板含有足夠的不變特征,將重要信息區域(電流值、頻率值)用純白色背景替換,減少了干擾特征。

圖3 儀器面板模板圖
對按要求拍攝情況下變壓器鐵芯接地電流測試儀圖像進行尺度旋轉不變特征檢測并匹配模板照片,其特征點匹配的效果如圖4所示,特征點匹配直線圖表明,該算法能實現模板的完整匹配。在此基礎上依據定位流程算法,依次通過優質關鍵點篩選、求解單應性矩陣、計算映射四邊形、圖片旋轉擺正、定位截取數據等步驟,實現對電流值和頻率值的提取,如圖5所示。

圖4 角度不同的特征點匹配圖

圖5 電流值和頻率值的定位提取圖
對圖片進行預處理后,Tesseract-OCR 對圖片識別的效果更佳。因此對于本次實驗所用儀器樣本,分析由定位算法所得圖片,經過各種方法的驗證,得到最佳的處理效果,處理步驟如圖6所示。

圖6 定位圖片預處理步驟
定位圖片處理結果如圖7所示。

圖7 定位圖片處理結果圖
本例圖片是規則的數字,根據Tesseract-OCR 引擎自帶的“chi_sim”字庫對這個字符具有較高的識別率,識別結果如表1所示。

表1 定位圖片識別結果
通過上述方法的試驗效果可知(見表2):

表2 不同角度獲得的圖片定位及識別結果
1)對圖片拍攝角度發生變化時,圖片定位成功率較高,在0°~30°之間高達100%,在45°時達90%。該定位算法實時性好、匹配點多,有較多準確的匹配點,400 張隨機拍攝的樣本整體定位成功比例高于97.5%,證明該算法穩定性好,具有一定的魯棒性。
2)通過對比定位圖片前后的識別率,處理后的圖片識別率遠高于處理前的,高達95%以上,證明圖片經過預處理后形成的二值化圖片更適合放在Tesseract-OCR引擎中識別。
在變電檢測現場中,為了有效減輕檢測人員儀器讀數工作強度,避免人工讀數誤差,用相機對試驗儀器進行圖像獲取,文中提出基于SURF+OCR對變電檢測儀器數據定位識別的方法,設計了在變電檢測現場可能出現的情況,對400 張受拍攝角度影響的情況下的隨機樣本圖片進行SURF 定位算法測試,樣本整體定位成功率高于97.5%。對定位的樣本圖片進一步預處理,利用Tesseract-OCR 引擎對定位樣本圖片進行識別,識別率高達95%以上。在特定場景下的儀器圖片,經預處理后識別效果仍不佳,可以訓練該類儀器專屬的字符庫,以提高識別率。因此,文中所提出的方法具有一定的工程實踐價值。