

摘""要:為了降低核設(shè)施儀表改造成本和核安全風(fēng)險,需采用非接觸式的方式對儀表數(shù)據(jù)進行采集,應(yīng)用圖像處理技術(shù)對數(shù)字儀表自動識別進行研究和應(yīng)用。首先,利用開源計算機視覺庫(Open"Source"Computer"Vision"Library,OpenCV)實現(xiàn)圖像裁剪、變換、色階調(diào)整、灰度處理、閾值處理等預(yù)處理;在閾值處理方面,針對最大類間方差(OTSU)、自適應(yīng)和基于區(qū)域生長3種閾值算法進行對比實驗,確認了OTSU閾值算法為最優(yōu)算法;其次,通過Tesseract方法和穿線法分別對不同類型的儀表圖像進行字符識別;最后,在岷江試驗堆上選取不同工藝設(shè)備的數(shù)字儀表進行應(yīng)用。結(jié)果表明,針對數(shù)碼管式的字體識別正確率達到92%以上,印刷體數(shù)字的識別正確率達96%以上,能夠滿足核設(shè)施儀表參數(shù)的自動采集需求。
關(guān)鍵詞:核設(shè)施儀表"""圖像處理技術(shù)"""OpenCV"OTSU"""閾值算法"""穿線法
中圖分類號:TM623
Research"and"Application"of"Nuclear"Facility"Instrument"Recognition"Based"on"Image"Processing
ZHANG"Mingxing*""GAN"Yanglin""XIE"Chao
Nuclear"Power"Institute"of"China,"Chengdu,"Sichuan"Province,"610213"China
Abstract:"In"order"to"reducenbsp;the"cost"of"instrument"renovation"and"nuclear"safety"risks"in"nuclear"facilities,"non-contact"methods"need"to"be"used"to"collect"instrument"data,"and"image"processing"technology"should"be"applied"to"study"and"apply"digital"instrument"automatic"recognition."Firstly,"utilizing"the"Open"Source"Computer"Vision"Library(OpenCV)"technology"to"implement"pre-processing"such"as"image"cropping,"transformation,"color"grading"adjustment,"grayscale"processing,"threshold"processing,nbsp;etc;"In"terms"of"threshold"processing,"comparative"experiments"were"conducted"on"three"algorithms:"OTSU,"threshold"algorithm,"adaptive"threshold"algorithm,"and"region"growing"threshold"algorithm,"and"it"was"confirmed"that"OTSU"threshold"algorithm"is"the"optimal"algorithm."Secondly,"character"recognition"is"performed"on"different"types"of"instrument"images"using"Tesseract"method"and"threading"method"respectively;"Finally,"digital"instruments"with"different"process"equipment"were"selected"for"application"on"the"Minjiang"experimental"reactor."The"results"show"that"the"recognition"accuracy"of"digital"tube"style"fonts"is"over"92%,"and"the"recognition"accuracy"of"printed"numbers"is"over"96%,"which"can"meet"the"automatic"acquisition"requirements"of"nuclear"facility"instrument"parameters.
Key"Words:"Nuclear"facility"instrumentation;"Image"processing"technology;"OpenCV;"OTSU;"Tthreshold"algorithm;"Threading"method
岷江試驗堆是中國核動力研究設(shè)計院運營的一座研究堆,設(shè)計建造于20世紀90年代,主要任務(wù)是進行核科學(xué)研究和技術(shù)開發(fā)。岷江試驗堆的設(shè)施設(shè)備運行參數(shù)為模擬信號,傳輸?shù)綑C柜進行模數(shù)轉(zhuǎn)換,以數(shù)字式儀表進行顯示,字體是印刷體或數(shù)碼管式。反應(yīng)堆運行期間,運行值班人員每2"h需要到各個工藝設(shè)備間手動抄錄儀表上的運行數(shù)據(jù)。在此過程中,不斷重復(fù)且頻繁的人工抄錄難以避免出錯的風(fēng)險,同時數(shù)據(jù)的實時性也無法保證。特別是在核應(yīng)急情況下,及時獲取反應(yīng)堆工況數(shù)據(jù)以供決策成為基本要求。基于反應(yīng)堆運行數(shù)據(jù)及時性和準確性的監(jiān)管要求,需要對岷江試驗堆儀表數(shù)據(jù)的采集途徑進行技術(shù)改造。在當前核安全監(jiān)管日趨嚴格的形勢下,針對核設(shè)施的技術(shù)改造須取得上級監(jiān)督部門核準,并且不能對原有的系統(tǒng)造成影響。因此,本文提出了一種非接觸的數(shù)據(jù)采集方案,利用數(shù)字圖像處理技術(shù)實現(xiàn)反應(yīng)堆數(shù)字式儀表數(shù)據(jù)的自動識別。
1""研究思路
OpenCV是近年流行的一種計算機視覺軟件庫,為數(shù)字圖像處理提供了豐富的算法和工具,能夠?qū)崿F(xiàn)諸如圖像獲取、灰度處理、特征提取等功能,被廣泛應(yīng)用于數(shù)字圖像處理[1]。數(shù)字圖像識別技術(shù)是人工智能和計算機視覺領(lǐng)域的一個重要分支,它涉及使用計算機程序來識別和理解圖像內(nèi)容。每種算法都有其優(yōu)缺點,選擇哪種算法通常取決于具體的應(yīng)用場景、數(shù)據(jù)的特性以及所需的性能。
本文提出的方案需要完成反應(yīng)堆數(shù)字式儀表圖像的采集、處理和識別,采用數(shù)字圖像處理技術(shù),將圖像進行數(shù)字化處理[2]。重點研究數(shù)字式儀表的圖像處理方法,并選擇適宜的數(shù)字圖像識別算法,包含3個方面的內(nèi)容:(1)數(shù)字圖像的獲取方法;(2)數(shù)字圖像的預(yù)處理方法;(3)數(shù)字圖像的識別方法。
設(shè)置取幀時長對攝像頭視頻取幀抓圖,對抓取的圖片采用OpenCV技術(shù)進行預(yù)處理,再根據(jù)儀表數(shù)字類型,若屬于七段數(shù)碼管調(diào)用穿線法進行數(shù)據(jù)識別,否則直接調(diào)用光學(xué)字符識別(Optical"Character"Recognition,OCR)庫的tesseract方法進行字符識別,輸出識別結(jié)果并存儲結(jié)果。
2""圖像獲取及預(yù)處理
2.1""圖像獲取
圖像質(zhì)量直接影響圖像識別的準確率,獲取清晰度高的圖像是首要考慮因素。本文采用視頻攝像系統(tǒng)獲取數(shù)字圖像,影響圖像清晰度的設(shè)備是視頻攝像頭和網(wǎng)絡(luò)視頻錄像機(Network"Video"Recorder,NVR),經(jīng)現(xiàn)場測量視頻攝像頭與儀表的距離,結(jié)合儀表數(shù)據(jù)樣式確定視頻攝像頭像素應(yīng)在800萬以上,NVR與視頻攝像頭最高像素保持一致即可。本文選用基于OpenCV庫函數(shù)的cv.VideoCapture從攝像頭捕獲視頻。
2.2""圖像預(yù)處理
本文采用OpenCV技術(shù)實現(xiàn)對數(shù)字圖像的裁剪、幾何變換、色階調(diào)整、灰度化等預(yù)處理。
在OpenCV技術(shù)中,圖像結(jié)構(gòu)以Numpy數(shù)組的形式表示的,數(shù)組的維度取決于圖像的顏色通道數(shù),Numpy是Python的一種開源數(shù)字計算擴展,支持大量的維度數(shù)組和矩陣運算,使用Numpy數(shù)組的切片功能可實現(xiàn)圖像的裁剪,函數(shù)原型為。
圖像幾何變換包括平移、縮放、旋轉(zhuǎn)、透視等形式以實現(xiàn)圖像校正的目的。本文為固定攝像頭拍攝的圖像,僅需對圖像進行透視變換處理即可。
透視變換是指在一個三維坐標中,利用透視變換矩陣將圖像投影到一個新的視平面上。該方法是在原始圖像上確定4個不共線的點,根據(jù)這4個點在圖像中的位置確定投影變換關(guān)系[3],函數(shù)原型為:
cv.warpPerspective(src,M,dsize[,dst,flags,borderMode,borderValue])
圖像色階調(diào)整可通過調(diào)整圖像的陰影、中間調(diào)和高光的強度級別,校正圖像的色調(diào)范圍和色彩平衡,達到增強圖像顯示效果的目的。色階調(diào)整分為輸入色階調(diào)整和輸出色階調(diào)整。輸入色階調(diào)整有3個調(diào)節(jié)參數(shù):黑場閾值、白場閾值和灰場調(diào)節(jié)值。輸出色階有2個調(diào)節(jié)參數(shù):黑場閾值和白場閾值,用于設(shè)置輸出圖像像素值的最小值和最大值。本文采用手動調(diào)整色階技術(shù),手動調(diào)整色階是圖像處理中常用的技術(shù),用于改善圖像的視覺效果,增強圖像的對比度,其算法基本步驟如下。
(1)確定黑場和白場閾值。
(2)線性拉伸:使用黑場和白場閾值對圖像的灰度值進行線性變換,使得圖像的灰度動態(tài)范圍被拉伸,從而覆蓋整個可能的灰度范圍(通常是0~255)。
(3)伽馬變換:根據(jù)灰場調(diào)節(jié)值進行伽馬變換,校正曝光強度。
(4)輸出線性拉伸:根據(jù)輸出閾值范圍,對圖像進行最后的線性變換,這一步確保了圖像在最終輸出時具有最佳的視覺表現(xiàn),需要反復(fù)試驗不同的參數(shù)值,直到獲得滿意的圖像效果。
腐蝕和膨脹是圖像灰度處理的基本操作,由于圖像形態(tài)學(xué)處理是基于黑色像素的集合,對象是黑色背景的二值圖像,因此腐蝕和膨脹都是針對白色部分而言的。
圖像閾值處理是將圖像處理為明顯黑白效果的圖像。基本原理為當原圖中的像素灰度值大于閾值時,就將該像素點的灰度值改為255(變白);否則就將該像素點的灰度值改為0(變黑)。閾值處理的方法有多種,本文對OTSU閾值算法、自適應(yīng)閾值處理算法和基于區(qū)域生長算法進行研究和處理對比分析。
(1)OTSU閾值算法。OTSU算法又稱大津算法,其原理是基于圖像灰度直方圖的計算,得到每個灰度級出現(xiàn)的概率[4]。然后選擇一個閾值將圖像分為前景和背景兩部分,然后計算前、后景的類間方差,類間方差最大的即為最優(yōu)分離的最優(yōu)閾值。
(2)自適應(yīng)閾值處理。自適應(yīng)閾值處理又叫可變閾值處理,其原理是根據(jù)圖像的局部特性對該區(qū)域的閾值進行調(diào)整。對圖像中的每個像素點,根據(jù)其鄰域的性質(zhì)計算閾值,若該像素點大于其對應(yīng)的閾值,則認為是前景,否則為背景(設(shè)置為0),從而得到更準確的二值化處理結(jié)果。
(3)基于區(qū)域生長算法。區(qū)域生長算法以區(qū)域為處理對象,選取一個種子點后,將與種子點具有相似性質(zhì)的鄰域像素合并到種子區(qū)域中,再將新像素作為新的種子不斷重復(fù)迭代,直到?jīng)]有滿足的像素為止,包括區(qū)域分離和區(qū)域聚合兩個操作。
本文選取印刷體和數(shù)碼管式的2種典型儀表數(shù)字圖片,分別通過3種閾值算法進行處理,結(jié)果如圖2所示。(1)為經(jīng)灰度處理后的原圖;(2)為(1)的直方圖(統(tǒng)計圖像灰度值的密度);(3)為使用OTSU算法對(1)進行閾值處理的結(jié)果;(4)為自適應(yīng)閾值處理的結(jié)果;(5)為基于區(qū)域生長算法獲得的結(jié)果。
從圖2對比處理結(jié)果可以看出,由于噪聲和強度的不均勻,導(dǎo)致在利用區(qū)域生長算法進行圖像分割時發(fā)生了過度分割的情況,基于本文的應(yīng)用需求和圖像特性,選取OUTS閾值算法進行圖像閾值處理。
3"數(shù)字圖像識別
在數(shù)字圖像識別方面,可以通過各種機器學(xué)習(xí)算法對圖像的特征進行學(xué)習(xí)和識別,但機器學(xué)習(xí)需要通過大量的數(shù)據(jù)訓(xùn)練來不斷提升識別能力。本文結(jié)合應(yīng)用場景實施的成本、效率等因素,對印刷體式儀表采用OCR開源庫進行識別,對數(shù)碼管式儀表采用穿線法進行識別。
OCR技術(shù)可以通過掃描圖像準確識別出圖像字符,其中Tesseract是目前公認的最精確的開源文本識別OCR系統(tǒng)之一[5],通過安裝對應(yīng)識別語言的訓(xùn)練數(shù)據(jù)庫即可用于檢測和識別圖像中的字符,適用于印刷體文字的識別。本文選用OCR庫pytesseract進行字符識別,函數(shù)原型為:
pytesseract.image_to_string(image,"lang='eng')
穿線法是一種對數(shù)碼管進行逐段檢測的方法,根據(jù)數(shù)碼管的點亮狀態(tài)來確定顯示的數(shù)字,該方法適合展現(xiàn)形式為數(shù)碼管的儀表。其原理為:對a、b、c、d、e、f、g這7個區(qū)域依次穿線,并依次統(tǒng)計7段數(shù)碼管上的像素為255的點數(shù)目[6],如果點數(shù)大于閾值則表示該區(qū)域高亮,如果點數(shù)小于閾值則表示該區(qū)域不亮;最后結(jié)合7個區(qū)域的高亮信息構(gòu)建一個狀態(tài)碼,將這個狀態(tài)碼與預(yù)定義的狀態(tài)碼表進行匹配,即可判斷出具體數(shù)字。
4""應(yīng)用結(jié)果
本文提出識別方法基于Python語言實現(xiàn),圖像采集工具為視頻攝像頭,選取了岷江試驗堆不同工藝設(shè)備的數(shù)字式儀表,包括巡檢儀、數(shù)顯調(diào)節(jié)儀器、采集器、數(shù)顯記錄儀等儀表,數(shù)字顯示格式為印刷體和7段數(shù)碼管形式,采用本文提出的方法識別結(jié)果如表1所示。
通過表1可知,本文提出的方法針對數(shù)顯巡檢儀的識別正確率為92%,對數(shù)顯調(diào)節(jié)儀的識別正確率為94.1%,對數(shù)顯儀的識別正確率為99.9%,對采集器的識別率為96.6%。針對數(shù)碼管式儀表數(shù)字的識別正確率能夠達到92%以上,印刷體儀表數(shù)字的識別正確率達96%以上,能夠滿足岷江試驗堆儀表參數(shù)的自動采集的應(yīng)用需求。
5""結(jié)語
本文的研究成果和應(yīng)用實踐效果可直接應(yīng)用到其他核設(shè)施儀表數(shù)據(jù)采集,特別是針對老舊的難以進行數(shù)字化改造的核設(shè)施,有助于反應(yīng)堆運行工況數(shù)據(jù)的實時獲取,提升反應(yīng)堆運維效率,有較好的參考價值。此外,通過在岷江試驗堆上的應(yīng)用,有效驗證了機器視覺和圖像處理技術(shù)在核設(shè)施儀表識別、自動化檢測、安防等領(lǐng)域應(yīng)用的可行性,有助于提升核設(shè)施關(guān)鍵系統(tǒng)和設(shè)備的自動運行監(jiān)控能力,提高系統(tǒng)、設(shè)備的可靠性,具有較高的實用價值。
參考文獻
[1]李越.OpenCV應(yīng)用現(xiàn)狀綜述[J].工業(yè)控制計算機,2017,30(7):123-124,126.
[2]高琦.大數(shù)據(jù)時代下數(shù)字圖像識別技術(shù)研究[J].中國新通信,2021,23(2):59-60.
[3]郭彩霞.復(fù)雜背景下電子吊秤數(shù)字的定位識別方法[J].現(xiàn)代電子技術(shù),2023,46(17):48-52.
[4]楊翊麟.局部自適應(yīng)閾值法改進Canny算子的圖像邊緣提取[J].信息與電腦(理論版),2023,35(14):78-80.
[5]曾悅."基于Tesseract文字識別系統(tǒng)的研究與實現(xiàn)[D].南京:南京郵電大學(xué),2022.
[6]劉祎爽,黃理瑞,魏敏捷.基于改進穿線法和KNN的數(shù)碼管字符識別研究[J].電子設(shè)計工程,2024,32(4):12-16.