










摘要:文章針對(duì)光學(xué)字符識(shí)別(OCR) 方法在復(fù)雜電氣作業(yè)環(huán)境下實(shí)時(shí)識(shí)別精度低的問(wèn)題,提出一種基于圖像內(nèi)容二次定位的字符識(shí)別方法。該方法首先利用顏色定位從復(fù)雜背景中分離出線纜線號(hào)標(biāo)識(shí),降低背景干擾;然后結(jié)合文字定位和仿射變換矯正線號(hào)標(biāo)識(shí)的傾斜,確保文字處于水平狀態(tài);最后使用Tesseract OCR引擎進(jìn)行字符識(shí)別。實(shí)驗(yàn)結(jié)果表明,該方法能夠有效提升電氣作業(yè)環(huán)境下線纜線號(hào)的識(shí)別精度,為復(fù)雜場(chǎng)景下的OCR應(yīng)用提供參考。
關(guān)鍵詞:光學(xué)字符識(shí)別;二次定位;圖像預(yù)處理;增強(qiáng)現(xiàn)實(shí);線號(hào)識(shí)別;電氣作業(yè)
中圖分類(lèi)號(hào):TP391" " " 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2025)24-0114-05
開(kāi)放科學(xué)(資源服務(wù)) 標(biāo)識(shí)碼(OSID)
0 引言
隨著電力系統(tǒng)的日益龐雜,電氣作業(yè)對(duì)線纜標(biāo)識(shí)的準(zhǔn)確識(shí)別提出了更高的要求。傳統(tǒng)方式基于紙質(zhì)圖紙的人工識(shí)別方法效率低,易出錯(cuò)且存在安全隱患。光學(xué)字符識(shí)別(Optical Character Recognition,OCR) [1]技術(shù)能夠識(shí)別圖像中的字符信息,為線纜標(biāo)識(shí)自動(dòng)化識(shí)別提供了可能,但現(xiàn)有OCR方法在復(fù)雜電氣作業(yè)環(huán)境下,尤其是小型線纜標(biāo)識(shí)的實(shí)施進(jìn)度仍有待提高。近年來(lái),研究人員針對(duì)OCR技術(shù)開(kāi)展了大量研究。Liao等人[2]提出改進(jìn)的Textbox++網(wǎng)絡(luò),以提升豎直和傾斜文本的檢測(cè)效果;唐善成等人[3]研究了漢字特征提取方法;呂永庭等人[4]將OCR應(yīng)用于電表缺陷檢測(cè);Yan等人[5]提出原始表示學(xué)習(xí)網(wǎng)絡(luò)(PREN)結(jié)合圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)以提升識(shí)別準(zhǔn)確率。此外,開(kāi)源OCR庫(kù)如Tesseract OCR庫(kù)[6-7]也得到廣泛應(yīng)用,Mersedeh B等人[8]利用Tesseract實(shí)現(xiàn)了拍照定位、分割及識(shí)別;曾悅[9],章安[10]等人利用Tesseract實(shí)現(xiàn)了文字識(shí)別;馮玉田等人[11]提出了基于輪廓和顏色的定位算法實(shí)現(xiàn)了燃?xì)獗碜詣?dòng)識(shí)別。
然而,現(xiàn)有研究大多針對(duì)普通圖像,對(duì)于電氣作業(yè)環(huán)境下復(fù)雜場(chǎng)景、多變環(huán)境、小型線號(hào)標(biāo)簽的實(shí)時(shí)識(shí)別研究較少。因此,本文基于Tesseract引擎,以線纜線號(hào)為例,提出了一種基于圖像內(nèi)容二次定位的字符識(shí)別方法,旨在提高復(fù)雜電氣作業(yè)環(huán)境下線纜線號(hào)的識(shí)別精度和效率。
1 方法設(shè)計(jì)
針對(duì)電氣作業(yè)環(huán)境復(fù)雜多變、線纜種類(lèi)及數(shù)目繁多、線纜線號(hào)標(biāo)識(shí)小等特點(diǎn),本文設(shè)計(jì)了一種基于圖像內(nèi)容二次定位的字符識(shí)別方法。該方法包括圖像采集、圖像預(yù)處理、圖像內(nèi)容二次定位、字符識(shí)別及字符信息實(shí)時(shí)傳輸。如圖1所示,圖像采集模塊使用Hololens眼鏡采集現(xiàn)場(chǎng)圖像并上傳至服務(wù)器;圖像預(yù)處理模塊對(duì)圖像進(jìn)行灰度化、二值化、形態(tài)學(xué)處理和邊緣檢測(cè)等預(yù)處理操作,增強(qiáng)圖像特征;圖像內(nèi)容二次定位模塊利用顏色和文字信息進(jìn)行兩次定位,消除背景干擾并提取完整的文字信息;字符識(shí)別模塊使用Tesseract引擎進(jìn)行識(shí)別;最后,字符信息實(shí)時(shí)傳輸模塊將識(shí)別結(jié)果返回至Hololens端。
2 圖像處理
2.1 圖像預(yù)處理
圖像預(yù)處理主要是對(duì)圖像存在的問(wèn)題進(jìn)行修正以及對(duì)圖像內(nèi)部所需信息進(jìn)行突出顯示,如降低噪聲、凸顯輪廓等。目前圖像預(yù)處理主要包括二值化、灰度化、幾何變換、圖像增強(qiáng)、膨脹腐蝕等形態(tài)學(xué)操作及邊緣檢測(cè)等[12]。
灰度化[13]是指將彩色圖像轉(zhuǎn)換為灰度圖像的過(guò)程[14-15],即使彩色圖像的R、G、B三個(gè)顏色分量相等,實(shí)現(xiàn)R=G=B即可實(shí)現(xiàn)灰度化。目前灰度化處理算法有最大值灰度處理、平均灰度處理、加權(quán)平均處理等多種處理算法[15],其中加權(quán)平均灰度處理更為準(zhǔn)確,根據(jù)敏感度對(duì)R、G、B三個(gè)分量設(shè)置不同的權(quán)重。因?yàn)槿搜蹖?duì)綠色的靈敏度最高,對(duì)紅色的靈敏度次之,對(duì)藍(lán)色的靈敏度最低,實(shí)驗(yàn)和理論推導(dǎo)證明,當(dāng)紅色權(quán)重為0.3,綠色權(quán)重為0.59,藍(lán)色權(quán)重為0.11時(shí)可以得到最佳的灰度[15],具體公式見(jiàn)式1。
[ [Gary=R*0.3+G*0.59+B*0.11] (1) ]
其中Gary為圖像灰度化后的灰度值,R、G、B分別為紅色、綠色及藍(lán)色的顏色分量值,取值范圍[0-255]。
二值化[16]在灰度的基礎(chǔ)上,將圖像像素點(diǎn)轉(zhuǎn)換為0或255的二值圖像,僅呈現(xiàn)黑或白,選擇適當(dāng)閾值可減少圖像數(shù)據(jù)量,凸顯所需目標(biāo)輪廓。二值化主要有全局閾值及局部閾值,現(xiàn)階段根據(jù)圖像各部分的灰度值進(jìn)行局部閾值的效果更好,具有更強(qiáng)的適應(yīng)能力,更有效地分割出前景。
形態(tài)學(xué)處理是指利用膨脹及腐蝕操作連接相鄰元素或分離獨(dú)立元素,消除圖像孔洞或小區(qū)域。本質(zhì)上講膨脹及腐蝕就是利用結(jié)構(gòu)元(核) 在圖像上進(jìn)行卷積的過(guò)程,而膨脹腐蝕就是利用結(jié)構(gòu)元在圖像局部求解像素最大值或最小值。膨脹是求解局部最大值的過(guò)程,具體見(jiàn)圖2。
在圖2中A為初始的像素集合,B為結(jié)構(gòu)元,膨脹腐蝕是指將結(jié)構(gòu)元B在像素集合A上進(jìn)行平移卷積的過(guò)程,膨脹過(guò)程計(jì)算結(jié)構(gòu)元B覆蓋區(qū)域的像素點(diǎn)最大值,并將最大值賦值給指定像素,使與物體接觸的背景合并到物體中,并將目標(biāo)物體增大,填補(bǔ)目標(biāo)中的孔洞,過(guò)程見(jiàn)圖3。
圖3(a) 為膨脹過(guò)程,結(jié)構(gòu)體B在A上移動(dòng)對(duì)區(qū)域元素進(jìn)行卷積計(jì)算;(b) 為腐蝕過(guò)程,腐蝕操作需要結(jié)構(gòu)元B包含在像素集合A中,而膨脹操作需B與A的合集不為空。膨脹腐蝕后的結(jié)果見(jiàn)圖4。
圖4(a) 圖為膨脹結(jié)果,其中藍(lán)色和紅色都代表被結(jié)構(gòu)元B處理后符合膨脹的位置,紅色代表被膨脹后多出來(lái)的位置,藍(lán)色代表原來(lái)集合A的位置,相當(dāng)于被膨脹后的集合A邊界外擴(kuò)了一圈,對(duì)應(yīng)圖像操作中能夠連接相對(duì)靠近孤立的點(diǎn),起到連通域的作用。(b) 圖為腐蝕結(jié)果,其中白色代表被結(jié)構(gòu)元B處理后不滿足腐蝕結(jié)果的位置,紅色代表滿足腐蝕處理后的位置。相當(dāng)于被腐蝕后的集合A邊界小了一圈,對(duì)應(yīng)于圖像操作中能夠去除孤立的點(diǎn)。
邊緣檢測(cè)為了將突出顯示的圖像特征檢測(cè)并保存,標(biāo)識(shí)出圖像中亮度變化顯著的點(diǎn),進(jìn)一步在形態(tài)學(xué)處理的基礎(chǔ)上剔除不相關(guān)的信息,保留圖像的結(jié)構(gòu)屬性。目前邊緣檢測(cè)算子有Canny[17-18]、sobel、Roberts、Laplacian等,Canny算子在邊緣檢測(cè)方面相較于其他算子,適應(yīng)噪聲的能力更為突出,圖像的連續(xù)信息保留得更為完整。
Canny邊緣檢測(cè)算子是一種多級(jí)邊緣檢測(cè)算法,以最優(yōu)檢測(cè)、定位準(zhǔn)則和邊緣信息響應(yīng)作為衡量邊緣檢測(cè)效果的指標(biāo)[19]。其檢測(cè)原理如下:
1) 高斯模糊
為了生成更好的圖像質(zhì)量,降低偽邊緣的識(shí)別,引入二維高斯函數(shù)G(x,y) 對(duì)圖像進(jìn)行濾波消除噪聲,降低噪聲的影響,保留邊緣細(xì)節(jié)。
2) 圖像梯度
在圖像中,邊緣是像素值快速變化的地方,因此計(jì)算圖像梯度能夠捕捉到這些變化,為邊緣檢測(cè)提供關(guān)鍵信息,有利于細(xì)化邊緣,提升邊緣檢測(cè)的精度。目前一般采用sobel算子求解圖像梯度幅值G及梯度方向[θ]。sobel算子分為垂直方向和水平方向兩個(gè)模板,模板如圖5所示,其中X方向?yàn)樗椒较颍琘方向?yàn)榇怪狈较颉?/p>
3) 非極大值抑制(Non-maximum suppression)
非極大值抑制的目的在于將模糊的邊界變清晰,即保留圖像梯度變化的極大值點(diǎn),從而細(xì)化邊緣,去除由噪聲和顏色變化引起的雜散響應(yīng)。若目標(biāo)像素點(diǎn)的梯度幅值小于沿邊緣方向上的相鄰像素點(diǎn)的梯度幅值,則認(rèn)為此點(diǎn)為非邊緣點(diǎn),此點(diǎn)的邊緣強(qiáng)度置為0(刪除) 。
4) 雙閾值邊界跟蹤
雙閾值邊界跟蹤是指利用雙閾值去除部分點(diǎn)區(qū)域或孤立點(diǎn),進(jìn)一步消除偽邊緣并連接邊緣,解決由于噪聲和顏色變化引起的邊緣雜散響應(yīng)。雙閾值邊界跟蹤的原理:通過(guò)設(shè)置閾值上界Tmax和閾值下界Tmin,其次將像素位置的梯度幅值與閾值上下界進(jìn)行對(duì)比,判斷當(dāng)前像素點(diǎn)是否屬于邊緣像素,其原理如圖6所示。
2.2 圖像內(nèi)容二次定位
由于電氣作業(yè)環(huán)境復(fù)雜多變,而線纜的線號(hào)標(biāo)記過(guò)小,且實(shí)時(shí)操作人員在布線或接線時(shí)難以保證拍攝圖片中線號(hào)標(biāo)記位置固定,易出現(xiàn)圖片位置不固定、文字傾斜、線號(hào)標(biāo)記過(guò)小導(dǎo)致無(wú)法識(shí)別的情況。為此需要對(duì)Hololens實(shí)時(shí)獲取的圖像進(jìn)行進(jìn)一步處理,對(duì)圖像中的文字進(jìn)行精確截取和修正,確保文字識(shí)別過(guò)程的精度及穩(wěn)定性。
現(xiàn)階段,大多數(shù)研究利用圖像分割的方式對(duì)圖像文字進(jìn)行分割定位,以便獲得更優(yōu)的文字信息。但是分割后的文字信息易出現(xiàn)重疊、分裂等情況,且由于電氣作業(yè)環(huán)境復(fù)雜,線號(hào)標(biāo)記的文字信息過(guò)小,導(dǎo)致傳統(tǒng)圖像分割定位方法難以從復(fù)雜的背景中分理處過(guò)小的文字信息,使得后續(xù)文字識(shí)別的精準(zhǔn)度下降。
針對(duì)上述問(wèn)題,本文結(jié)合電工作業(yè)環(huán)境及線號(hào)標(biāo)記的特點(diǎn),提出基于圖像內(nèi)容二次定位的文字識(shí)別方法,即通過(guò)兩次的文字信息檢測(cè)疊加,將過(guò)小的線號(hào)從復(fù)雜的背景中分離出來(lái),在經(jīng)過(guò)矯正、裁剪、增強(qiáng)等手段作為文字識(shí)別的輸入,該方法的原理流程如圖7所示。
如圖7所示,二次定位首先根據(jù)前后景的顏色不同利用顏色識(shí)別算法獲取到線號(hào)標(biāo)識(shí)在圖像中的大致位置,其次位置獲取到限號(hào)標(biāo)識(shí)的輪廓及角點(diǎn),再次根據(jù)角點(diǎn)位置信息對(duì)自動(dòng)裁剪圖像,將前景從復(fù)雜背景中剝離;然后利用文字檢測(cè)確定文字的具體位置,進(jìn)行單個(gè)字符分割,最后利用仿射變換[20]將圖片中的文字旋轉(zhuǎn)至水平狀態(tài),提升識(shí)別效率。
現(xiàn)階段色彩空間包括RGB、HIS、YCrCb、HSV(色調(diào)、飽和度、亮度) 等,其中HSV空間能夠直觀表達(dá)色彩的明暗,色調(diào)及鮮艷程度,方便進(jìn)行顏色之間的對(duì)比,為此采用HSV空間進(jìn)行顏色識(shí)別。
HSV空間的模型對(duì)應(yīng)于圓柱坐標(biāo)系中的一個(gè)圓錐形子集,圓錐的頂面V=1。它包含RGB模型中的R=1,G=1,B=1三個(gè)面,所代表的顏色較亮。色彩H由繞V軸的旋轉(zhuǎn)角給定。紅色對(duì)應(yīng)于角度0°,綠色對(duì)應(yīng)于角度120°,藍(lán)色對(duì)應(yīng)于角度240°。在HSV顏色模型中,每一種顏色和它的補(bǔ)色相差180°。飽和度S取值從0到1,故圓錐頂面的半徑為1。HSV顏色模型所代表的顏色域是CIE色度圖的一個(gè)子集,這個(gè)模型中飽和度為百分之百的顏色,其純度一般小于百分之百。在圓錐的頂點(diǎn)(即原點(diǎn))處,V=0,H和S無(wú)定義,代表黑色。圓錐的頂面中心處S=0,V=1,H無(wú)定義,代表白色。從該點(diǎn)到原點(diǎn)代表亮度漸暗的灰色,即具有不同灰度的灰色。對(duì)于這些點(diǎn),S=0,H的值無(wú)定義。可以說(shuō),HSV模型中的V軸對(duì)應(yīng)于RGB顏色空間中的主對(duì)角線。在圓錐頂面的圓周上的顏色,V=1,S=1,這種顏色是純色。HSV顏色空間的空間模型和各顏色閾值范圍如圖8、圖9所示,利用HSV空間進(jìn)行顏色定位的效果如圖10所示。
為了預(yù)防線號(hào)標(biāo)記顏色不一、背景中出現(xiàn)與線號(hào)標(biāo)記顏色相同等問(wèn)題,本文將顏色色域設(shè)置為用戶可自主選擇的范圍,使用戶自行調(diào)整所需剝離的顏色標(biāo)記。并且在顏色定位中融入面積篩選的思想,對(duì)同色區(qū)域進(jìn)行識(shí)別并計(jì)算當(dāng)前所有輪廓的面積,根據(jù)面積大小將背景中面積較小的區(qū)域過(guò)濾,消除部分細(xì)小區(qū)域的影響,輪廓面積過(guò)濾的原理如公式(2) 所示。
[F=Y,若Slt;SthresholdN,若S≥Sthreshold] (2)
圖片經(jīng)過(guò)顏色定位處理后,雖大致確定了文字的位置,但難以確保裁剪后圖像中文字水平,傾斜的文字易導(dǎo)致后續(xù)識(shí)別失敗。因此,利用文字檢測(cè)及分割將文字單股隔離出來(lái),計(jì)算各自傾斜角度,然后利用仿射變換(Affine Transformation)將圖片中的文字矯正,提升后續(xù)識(shí)別精度。
仿射變換是指在向量空間中進(jìn)行線性變換和一次平移,變換到另一個(gè)向量空間的過(guò)程,有利于保持圖像的“平直性”(straightness)和“平行性”(parallelness)[20]。以圖11中的三角形為例,查找三角形的三個(gè)頂點(diǎn)進(jìn)行映射,利用仿射變換還原正三角形,具體所圖11所示。
由圖可知,仿射變換的關(guān)鍵在于獲取一個(gè)變換矩陣T,變換前的每個(gè)點(diǎn)(x,y) 通過(guò)變換矩陣得到變換后的點(diǎn)(x’,y’) 。仿射變換包括平移、旋轉(zhuǎn)、縮放、剪切等,具體變換原理如公式(3) 所示。
[ [仿射變換x'y'1=10-x001-y0001xy1" " "平移x'y'=cosαsinα-sinαcosαxy旋轉(zhuǎn)x'y'=sxsysxsyxy" " " " " " " "縮放x'y'=1a0b01xy" " " " " " " 剪切 ] (3) ]
將公式(3) 的仿射變換進(jìn)行組合即可得到隨機(jī)仿射變換矩陣T,仿射變換矩陣T如公式(4) 及(5) 所示。
[ [T=10-x001-y0001cosαsinα-sinαcosαsxsysxsy1a0b01 ] (4) ]
對(duì)公式(4) 進(jìn)行計(jì)算可得公式(5) 。
[ [T=sxcosαsysinα+a0-x0-sxsinα+b0sycosα-y0001 ] (5) ]
上式(3) (4) (5) 中[sx],[sy]為縮放系數(shù),[α]為旋轉(zhuǎn)角度,[x0],[y0]為平移量,[a0],[b0]為剪切系數(shù),由式(8) 可知仿射變換矩陣T中包含6個(gè)參數(shù),如需求解,即在平面中需要3個(gè)點(diǎn)。仿射變換的效果如圖12所示。
3 實(shí)驗(yàn)及結(jié)果分析
3.1 實(shí)驗(yàn)概述
基于上述提出的圖像處理方法,本文以Hololens為終端設(shè)備,電腦操作系統(tǒng)為Windows11,CPU:i7-11700K,顯卡:RTX 3070,內(nèi)存:32G,使用編程軟件PyCharm 2021.2.4,基于pytorch 2.0框架實(shí)現(xiàn)。中車(chē)軌道車(chē)輛電氣系統(tǒng)標(biāo)準(zhǔn)化培訓(xùn)臺(tái)綜合了布線、接線、連接器制作等模塊,是中車(chē)乃至電氣作業(yè)領(lǐng)域的工作的高度集成,是培訓(xùn)新員工的最佳實(shí)驗(yàn)平臺(tái),為此選用中車(chē)某型號(hào)軌道車(chē)輛電氣系統(tǒng)標(biāo)準(zhǔn)化培訓(xùn)臺(tái)為實(shí)驗(yàn)儀器展開(kāi)針對(duì)電氣作業(yè)環(huán)境下的字符識(shí)別實(shí)驗(yàn)。
本文將實(shí)驗(yàn)劃分為兩組,基礎(chǔ)組與對(duì)照組,其中基礎(chǔ)組在不做任何處理的前提下對(duì)Hololens采集的線號(hào)標(biāo)識(shí)原圖基于Tesseract進(jìn)行識(shí)別,對(duì)照組采用本文提出的方法識(shí)別Hololens采集的線號(hào)圖像,按照本文方法進(jìn)行圖像預(yù)處理、顏色定位、文字定位及仿射變換,最終統(tǒng)計(jì)、分析兩種方法的識(shí)別結(jié)果。實(shí)驗(yàn)的流程如圖13所示,利用Hololens采集培訓(xùn)臺(tái)線號(hào)標(biāo)識(shí),將線號(hào)圖像分別傳輸至Tesseract和本文提出方法進(jìn)行識(shí)別處理,再將識(shí)別結(jié)果返回值Hololens協(xié)助工人完成后續(xù)布線、接線等操作,并統(tǒng)計(jì)兩種方法的正確次數(shù)。
按照?qǐng)D13的實(shí)驗(yàn)流程進(jìn)行100次實(shí)驗(yàn),即Tesseract方法和本文方法各自進(jìn)行100次實(shí)驗(yàn),并統(tǒng)計(jì)正確次數(shù),計(jì)算正確率。
3.2 實(shí)驗(yàn)結(jié)果
為驗(yàn)證本文方法的可行性及有效性,按照上述實(shí)驗(yàn)流程展開(kāi)實(shí)驗(yàn),并記錄各自的實(shí)驗(yàn)結(jié)果,實(shí)驗(yàn)對(duì)比結(jié)果如表1所示。
由表1可知,相比僅利用Tesseract識(shí)別,本文提出的基于圖像內(nèi)容二次定位的字符識(shí)別方法正確率達(dá)到90%以上,準(zhǔn)確率提升了近30%,錯(cuò)誤次數(shù)和未識(shí)別次數(shù)僅為9次,使誤判率和未識(shí)別率在10%以下,降低了近30%,為電氣作業(yè)提供了有力保障,具體如圖14所示。
結(jié)果證明,本文提出的基于圖像內(nèi)容二次定位的字符識(shí)別方法通過(guò)圖像預(yù)處理、顏色識(shí)別將線號(hào)標(biāo)識(shí)從復(fù)雜背景中剝離,在基于文字檢測(cè)加仿射變換將拍攝的線號(hào)矯正,能夠更加有效地在復(fù)雜電氣作業(yè)環(huán)境下完成線號(hào)識(shí)別任務(wù),提升識(shí)別的效率及精度。
4 結(jié)論
本文針對(duì)現(xiàn)有字符識(shí)別方法在復(fù)雜電氣作業(yè)環(huán)境下實(shí)時(shí)識(shí)別精度低的問(wèn)題,提出了基于圖像內(nèi)容二次定位的文字識(shí)別方法,利用顏色定位的方式消除了電氣作業(yè)環(huán)境復(fù)雜背景對(duì)于待識(shí)別線號(hào)的影響,基于文字檢測(cè)+仿射變換方法解決了由文字傾斜導(dǎo)致識(shí)別精度下降的隱患,通過(guò)圖像內(nèi)容二次定位消除了復(fù)雜背景、文字傾斜導(dǎo)致的識(shí)別精度下降的問(wèn)題,并基于中車(chē)培訓(xùn)臺(tái)進(jìn)行算法實(shí)地驗(yàn)證。結(jié)果證明,本文方法能夠有效提升在電氣作業(yè)環(huán)境下的線號(hào)識(shí)別準(zhǔn)確率,對(duì)于推動(dòng)電氣作業(yè)智能化、自動(dòng)化有重要意義,在電氣作業(yè)中的應(yīng)用前景廣泛。
本文字符識(shí)別的局限在于裁剪圖像后圖像的清晰度會(huì)下降,為此,未來(lái)如何實(shí)現(xiàn)圖像無(wú)損前后景分割是后續(xù)研究的重點(diǎn)。
參考文獻(xiàn):
[1] LIN H,YANG P,ZHANG F L.Review of scene text detection and recognition[J].Archives of Computational Methods in Engineering,2020,27(2):433-454.
[2] LIAO M H,SHI B G,BAI X.TextBoxes:a single-shot oriented scene text detector[J].IEEE Transactions on Image Processing,2018,27(8):3676-3690.
[3] 唐善成,梁少君,戴風(fēng)華,等.漢字識(shí)別中圖特征提取方法[J].科學(xué)技術(shù)與工程,2024,24(2):658-664.
[4] 呂永庭,張濤.基于OCR的智能電表缺陷檢測(cè)系統(tǒng)[J].儀表技術(shù)與傳感器,2023(9):35-40.
[5] Yan R, Peng L, Xiao S, et al. Primitive representation learning for scene text recognition[C]Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Los Alamitos: IEEE Computer Society Press, 2021:284-293. Doi: 10.48550/arXiv.2105.04286.
[6] 邱治涵,王嘉豪,李文煒,等.基于OCR文字識(shí)別技術(shù)應(yīng)用軟件的設(shè)計(jì)與實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù),2021,17(26):47-49.
[7] 張斌和.基于tesseract.js Web圖片文字搜索定位瀏覽器擴(kuò)展[J].電腦知識(shí)與技術(shù),2023,19(28):60-62,86.
[8] BAHR-HOSSEINI M,NAEL K,IACOBONI M,et al.Transcranial electrical stimulation in stroke EaRly after onset clinical trial (TESSERACT)[J].Brain Stimulation,2023,16(1):236.
[9] 曾悅,馬明棟.基于Tesseract_OCR文字識(shí)別的研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2021,31(11):76-80.
[10] 章安,馬明棟.基于Tesseract文字識(shí)別的預(yù)處理研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2021,31(1):73-76,174.
[11] 馮玉田,侯玖廷,顧樂(lè)易.基于Tesseract-OCR的燃?xì)獗碜詣?dòng)識(shí)別研究[J].電子測(cè)量技術(shù),2019,42(21):82-86.
[12] 張婷婷,馬明棟,王得玉.OCR文字識(shí)別技術(shù)的研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2020,30(4):85-88.
[13] 曹長(zhǎng)玉,鄭佳春,黃一琦.多模版匹配的特殊符號(hào)識(shí)別定位算法研究[J].計(jì)算機(jī)應(yīng)用與軟件,2021,38(3):175-180,209.
[14] 李兵,傅衛(wèi)平,王雯,等.一種基于EIH的裝配機(jī)器人標(biāo)定方法[J].機(jī)械工程學(xué)報(bào),2018,54(7):38-44.
[15] 凌雙明.智能視覺(jué)機(jī)器人圖像灰度化處理方法研究[J].山西電子技術(shù),2023(2):88-91.
[16] LI J,WAN H Y,SHANG S H.Comparison of interpolation methods for mapping layered soil particle-size fractions and texture in an arid oasis[J].CATENA,2020,190:104514.
[17] FENG Y G,HAN B,WANG X C,et al.Self-supervised transformers for unsupervised SAR complex interference detection using canny edge detector[J].Remote Sensing,2024,16(2):306.
[18] SONG Y,LI C,XIAO S,et al.A parallel Canny edge detection algorithm based on OpenCL acceleration[J].PLoS One,2024,19(1):e0292345.
[19] 王巖,胡睿甫,陳代鑫,等.基于自適應(yīng)閾值分割改進(jìn)Canny算子的管道邊緣檢測(cè)方法研究[J].光電子·激光,2024,35(2):164-170.
[20] 姜文濤, 陳霖霖, 張晟翀.正態(tài)隨機(jī)仿射變換的圖像數(shù)據(jù)增強(qiáng)方法[J].計(jì)算機(jī)工程與應(yīng)用,2024,60(26):176-186.
【通聯(lián)編輯:李雅琪】