999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學(xué)習(xí)的水表示數(shù)檢測與識別

2023-05-29 09:24:26孫躍文李修治鮑喜榮
電子技術(shù)與軟件工程 2023年7期
關(guān)鍵詞:文本檢測模型

孫躍文 李修治 鮑喜榮

(東北大學(xué) 計算機(jī)科學(xué)與工程學(xué)院 遼寧省沈陽市 110169)

機(jī)械水表字輪區(qū)域的信息識別主要可分為字輪區(qū)域文本檢測和文本識別兩個任務(wù)。文本檢測指在水表圖片中消除背景干擾準(zhǔn)確定位字輪框;文本識別指將文本行旋轉(zhuǎn)矯正并識別出文本字符。現(xiàn)有的水表圖像識別方法一般采用特征提取的方式進(jìn)行字輪框的檢測定位,然后采用模板匹配、特征分類等方法對文本行進(jìn)行文本識別。現(xiàn)有方法對背景簡單呈水平排列的檢測場景具備一定的適用性,但也易受環(huán)境干擾出現(xiàn)較大面積的背景殘留,影響后續(xù)的文本識別工作。

深度學(xué)習(xí)的文本檢測算法主要分為基于回歸的文本檢測算法和基于分割的文本檢測算法兩類。基于回歸的文本檢測算法是直接面對整張圖像進(jìn)行預(yù)測,可以提取到更深層次的特征信息,在檢測速度上存在較大優(yōu)勢,但是這類方法由于預(yù)設(shè)了文本框形狀,所以無法對彎曲文本和不規(guī)則文本進(jìn)行檢測。基于分割的文本檢測算法對圖像的像素進(jìn)行分類判別像素點是否屬于文本目標(biāo),計算出文本概率圖后通過復(fù)雜的后處理操作得到文本框,此類算法解決了彎曲文本和不規(guī)則文本的檢測問題,但是復(fù)雜的后處理操作也大大的增加了計算開銷。

水表字輪區(qū)域的形狀一般為矩形,不存在彎曲文本和不規(guī)則文本的情況,這一特點降低了識別的難度。然而自然場景下采集的水表圖像存在其特殊性,往往背景復(fù)雜、旋轉(zhuǎn)角度不一。綜上,本文使用輕量化的YOLOv5 模型完成水表字輪區(qū)的文本檢測,結(jié)合YOLOv5 可以同時完成目標(biāo)檢測與分類的優(yōu)勢,改變了常規(guī)的目標(biāo)檢測策略,提出了一種基于角點定位的檢測方法。文本識別模型采用CRNN+CTC 的網(wǎng)絡(luò)結(jié)構(gòu),可以處理檢測到的文本行,完成文本識別任務(wù)。

1 基于深度學(xué)習(xí)的水表示數(shù)檢測與識別模型

本文所提出的水表示數(shù)檢測與識別模型包括字輪檢測和文本識別兩個部分。首先采用合適的目標(biāo)檢測模型對字輪區(qū)域進(jìn)行定位,將字輪圖像進(jìn)行裁剪,經(jīng)過旋轉(zhuǎn)校正后作為文本識別模型的輸入進(jìn)行文本識別,最終輸出水表示數(shù),整個過程如圖1。

圖1:模型整體流程

1.1 基于YOLOv5的水表字輪檢測模型

1.1.1 YOLOv5 網(wǎng)絡(luò)結(jié)構(gòu)

YOLO(You Only Look Once)[1]是一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測模型,模型的優(yōu)點是擁有更快的檢測速度,并且降低了背景誤檢率,YOLOv5 常用的模型結(jié)構(gòu)有s,m,l,x 四種,本文使用的是YOLOv5s(下文統(tǒng)一簡稱“YOLOv5”)。

YOLOv5[2-3]的輸入端采用馬賽克數(shù)據(jù)增強(qiáng)將四張圖進(jìn)行隨機(jī)拼接。同時,輸入端采用了自適應(yīng)縮放,可以將輸入圖像統(tǒng)一到網(wǎng)絡(luò)需要的尺寸。并且自適應(yīng)錨框計算可以在預(yù)設(shè)的錨框基礎(chǔ)上輸出預(yù)測框并與真實框?qū)Ρ龋嬎悴钪翟俜聪虻戮W(wǎng)絡(luò)參數(shù)。如圖2 所示。

圖2:Mosaic 數(shù)據(jù)增強(qiáng)

YOLOv5 的損失函數(shù)由三部分組成,分別是分類損失(Classes loss),置信度損失(Objectness loss)以及定位損失(Location loss),如公式(1)。

式中λ1,λ2,λ3為平衡系數(shù)。

1.1.2 字輪框直接定位算法

直接定位是直接將水表字輪框作為目標(biāo)進(jìn)行檢測,由于在自然場景下拍攝的圖像存在較大的旋轉(zhuǎn)角度,模型檢測的區(qū)域往往有較大面積的背景殘留。對文本識別模型造成干擾,導(dǎo)致文本識別準(zhǔn)確率大大降低。如圖3所示。

圖3:直接定位檢測結(jié)果

1.1.3 改進(jìn)的YOLOv5 目標(biāo)檢測模型

結(jié)合YOLO 算法在多類別檢測時準(zhǔn)確效果優(yōu)于單類別這一特點,設(shè)計將定位字輪框轉(zhuǎn)變?yōu)槎ㄎ痪匦慰蚪屈c,并將以順時針順序?qū)⒆笊稀⒂疑稀⒂蚁隆⒆笙陆屈c分別設(shè)置為類別0、1、2、3,對這四個類別進(jìn)行檢測和模型訓(xùn)練。如圖4 所示。

圖4:檢測字輪框角點

對于能夠檢測出全部角點的情況可以直接計算中心點坐標(biāo),用于字輪框的定位與裁剪。對于只能檢測出三個角點的情況,可以根據(jù)三點坐標(biāo)計算出第四個角點的坐標(biāo)。

式中Point0[x]表示類別“0”的x 軸坐標(biāo)。

對于只檢測出兩個點的情況,一般是圖片表面存在水霧或污點,可以根據(jù)缺失點的類別分情況對原始圖片進(jìn)行旋轉(zhuǎn),再次進(jìn)行檢測得到最終結(jié)果。首先在檢測出的兩點中確定一個點為中心點,以x 軸正方向為起始方向,另一點以逆時針作為基本旋轉(zhuǎn)方向,實際情況中旋轉(zhuǎn)角度范圍為[-90°,90°]。

當(dāng)“0”點和“1”點已知時,分為圖5 所示兩種情況。

圖5:角點的旋轉(zhuǎn)情況

將“1”點作為中心點,坐標(biāo)設(shè)為(xo,yo),“0”點坐標(biāo)設(shè)為(xr,yr),根據(jù)公式(4)計算逆時針旋轉(zhuǎn)角度。對于另外三種情況,分別以2 點、1 點和0 點作為中心點,分析過程相同。對于檢測出0 個或1 個角點的情況,此類圖像存在較大面積“灰霧”或字輪框被嚴(yán)重遮擋。

1.2 基于CRNN的文本識別模型

1.2.1 CRNN 網(wǎng)絡(luò)結(jié)構(gòu)

CRNN 是一種集特征提取、序列建模和轉(zhuǎn)錄于一體的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[4],包括卷積層(Convolutional Layers)、循環(huán)層(Recurrent Layers)、轉(zhuǎn)錄層(Transcription Layer)。

卷積層CNN 用于提取特征圖、輸出特征序列。首先將輸入水表圖像轉(zhuǎn)變?yōu)榛叶葓D并縮放處理,將所有圖像縮放到固定高度,本文選擇默認(rèn)高度32。縮放后圖像的寬度可以是任意值,文中選取寬度為100。接著卷積層進(jìn)行一系列卷積、最大池化、批量歸一化操作,最后得到512 個特征圖,高度變?yōu)樵瓉淼?/32,寬度變?yōu)樵瓉淼?/4,輸出特征圖像尺寸為(512,1,25)。

循環(huán)層由一個深度雙向LSTM[5]循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)成,為特征序列X=x1,…,xT中的每一特征向量xt預(yù)測其標(biāo)簽分布yt。將兩個相向的LSTM 組合成一個雙向長期短記憶網(wǎng)絡(luò)(Bi-LSTM),同時將多個雙向LSTM 堆疊形成深度雙向LSTM 網(wǎng)絡(luò)。在 LSTM 中一個時間序列就傳入一個特征向量進(jìn)行分類,本文中卷積層每張圖像會生成25 個特征向量,即時間序列長度T 為25。每輸入一個特征向量xt進(jìn)入循環(huán)從都會輸出其標(biāo)簽分布yt,所以循環(huán)層的輸出為25 個長度為字符類別數(shù)的向量yt構(gòu)成的概率矩陣。

轉(zhuǎn)錄層使用了聯(lián)結(jié)時間分類器(CTC)將Bi-LSTM生成的特征序列標(biāo)簽分布重新整合轉(zhuǎn)換成標(biāo)簽序列進(jìn)行輸出。

2 實驗過程

2.1 YOLOv5模型

2.1.1 數(shù)據(jù)集

本文研究所用到的數(shù)據(jù)集來源于中國計算機(jī)學(xué)會所創(chuàng)辦的CCF 大數(shù)據(jù)與計算智能大賽,共計1500 張水表圖像。

數(shù)據(jù)集標(biāo)簽按照[index, cx, cy, w, h]的格式進(jìn)行標(biāo)注。其中index 為類別索引,下標(biāo)從0 開始,每個水表圖像的字輪區(qū)均有4 個角點,共4 種類別。

2.1.2 數(shù)據(jù)擴(kuò)充

為了提高模型的文本檢測效果,對訓(xùn)練集進(jìn)一步擴(kuò)充以增加不同情況的圖像數(shù)據(jù)。選擇角度旋轉(zhuǎn)作為數(shù)據(jù)擴(kuò)充方法。設(shè)旋轉(zhuǎn)角度為[5, 30, 60, 90],同時改變labels 中的標(biāo)注的數(shù)據(jù)集坐標(biāo)信息,經(jīng)過角度旋轉(zhuǎn)后訓(xùn)練集擴(kuò)增了5 倍,共計5000 張圖像,按照4:1 的比例劃分為訓(xùn)練集與驗證集。如圖6 所示。

圖6:數(shù)據(jù)擴(kuò)充——圖像旋轉(zhuǎn)

2.1.3 模型訓(xùn)練

YOLOv5 模型訓(xùn)練樣本的batch_size 設(shè)置為4,訓(xùn)練迭代次數(shù)epoch 設(shè)定為100。YOLOv5 采用warm-up的方式調(diào)整學(xué)習(xí)率,初始學(xué)習(xí)率設(shè)置為0.001。模型訓(xùn)練過程中損失值變化曲線如圖7 所示。

圖7:YOLOv5 模型的損失曲線

由圖7 可知,隨著訓(xùn)練迭代次數(shù)增加,各類損失函數(shù)均在訓(xùn)練的過程中不斷減小并最終收斂到較小的值,雖然驗證集的損失曲線幅度波動較大,但隨著迭代次數(shù)增加最終也趨于收斂,說明YOLOv5 模型在訓(xùn)練集和驗證集中的檢測效果趨于穩(wěn)定。

2.2 CRNN模型

2.2.1 數(shù)據(jù)集

對原始數(shù)據(jù)集經(jīng)過裁剪、透射變換后,獲得一套具有1500 張字輪區(qū)域圖像的數(shù)據(jù)集。同時在訓(xùn)練集中增加著名的SCUT-WMN 的數(shù)據(jù)集[6]中的簡單樣本進(jìn)行擴(kuò)容,增加訓(xùn)練集至2000 張圖像,其中每張圖像包含5個字符。如圖8 所示。

圖8:文本識別模型數(shù)據(jù)集

對于半字符的情況,使用大寫英文字母表示。投入CRNN 網(wǎng)絡(luò)中進(jìn)行識別后再轉(zhuǎn)換為兩個半字符中數(shù)字較大的輸出。

2.2.2 模型訓(xùn)練

在訓(xùn)練過程,設(shè)置最大迭代次數(shù)max_epoch 為200,初始學(xué)習(xí)率為1.0,在第50 個和80 個epoch 訓(xùn)練時降低學(xué)習(xí)率,訓(xùn)練樣本的batch_size 設(shè)置為16。

由圖9 可知,隨著訓(xùn)練迭代次數(shù)增加,損失曲線呈下降趨勢,在第120 個step 時CRNN 模型的損失值已收斂到0.005 左右,表明模型趨于穩(wěn)定。

圖9:CRNN 模型的訓(xùn)練損失曲線

3 實驗結(jié)果及分析

3.1 評價指標(biāo)

常用的目標(biāo)檢測評價指標(biāo)包括平均召回率(mean Recalls)、平均準(zhǔn)確率(mean Precision)以及均值平均精度(mAP),這三個評價標(biāo)準(zhǔn)建立在TP、FP、FN,TN 上。TP 表示正類數(shù)據(jù)被模型預(yù)測為正類的數(shù)量,TN 表示負(fù)類數(shù)據(jù)被模型預(yù)測為負(fù)類的數(shù)量,F(xiàn)P 表示負(fù)類數(shù)據(jù)被模型預(yù)測為正類的數(shù)量,F(xiàn)N 表示正類數(shù)據(jù)被模型預(yù)測為負(fù)類的數(shù)量。

召回率(Recalls)表示正類數(shù)據(jù)判定為正類的數(shù)量占實際該類全部數(shù)量的比例,見公式(5)。

準(zhǔn)確率(Precision)表示正類數(shù)據(jù)判定為正類的數(shù)量占模型預(yù)測為正類的數(shù)量的比例,見公式(6)。

均值平均精度則建立在準(zhǔn)確率和召回率上,見公式(7)。

其中p 表示準(zhǔn)確率,r 表示召回率,平均精度p(r)表示當(dāng)前的P-R 曲線。

3.2 YOLOv5算法實驗結(jié)果

將未進(jìn)行數(shù)據(jù)擴(kuò)充訓(xùn)練的YOLOv5 模型記作YOLOv5 ①,經(jīng)過數(shù)據(jù)擴(kuò)充后重新訓(xùn)練的YOLOv5 模型記作YOLOv5 ②,現(xiàn)將兩個模型的檢測結(jié)果進(jìn)行對比。

如圖10 所示, 經(jīng)過100 個epoch 迭代后,YOLOv5 ②的準(zhǔn)確率和召回率變化曲線的波動幅度均小于YOLOv5 ①。隨著迭代次數(shù)增加,準(zhǔn)確率和召回率呈上升趨勢,且YOLOv ②數(shù)值始終大于YOLOv5 ②,變化曲線更快趨于收斂,說明數(shù)據(jù)集擴(kuò)充后訓(xùn)練得到的YOLOv5 模型訓(xùn)練效果更好。

圖10:準(zhǔn)確率(上)與召回率(下)變化曲線

通過表1 可知,訓(xùn)練100 個epoch 后,YOLOv5 ②的平均精度優(yōu)于YOLOv5 ①,“0”、“1”、“2”、“3”四個類別的AP0.5 分別比YOLOv5 ①高3%、3%、3.1%、1.8%,均值平均精度比YOLOv5 ①高2.7%,說明經(jīng)過數(shù)據(jù)集擴(kuò)充后,指標(biāo)mAP0.5 得到較大提升,模型預(yù)測定位更加準(zhǔn)確。

表1:mAP0.5 結(jié)果對比

在測試集上檢測模型性能,對于測試集中只能檢測出0 個、1 個或2 個角點的圖像將按照1.1.3 的方法進(jìn)行圖像旋轉(zhuǎn)后再次進(jìn)行檢測,檢測結(jié)果如表2 所示。

表2:測試集檢測結(jié)果

對于檢測到3 個和4 個角點的圖像可認(rèn)為模型檢測正確,正確率為97.4%;其他情況則需要按照1.1.3 方法圖像旋轉(zhuǎn)校正后進(jìn)行二次檢測。經(jīng)過二次檢測后,各個角點類別的檢測準(zhǔn)確率均有所提升,檢測正確率由97.4%提高到99.0%,檢測精度提高了1.6%。

將測試集水表圖像字輪區(qū)域裁剪并進(jìn)行透射變換后生成文本框切片,輸入CRNN 網(wǎng)絡(luò)進(jìn)行文本識別。在500 張圖像共計2500 個字符中,2462 個字符正確識別,38 個字符未正確識別,單字符識別準(zhǔn)確率達(dá)到98.48%,共計26 張圖像未正確識別,完整字輪區(qū)文本行識別準(zhǔn)確率達(dá)到94.80%,基本實現(xiàn)了對機(jī)械式水表圖像的檢測識別。

4 結(jié)束語

本文提出了基于YOLOv5 與CRNN 模型的水表讀數(shù)識別算法,設(shè)計了一種字輪區(qū)角點定位方法,獲取角點位置后即可裁剪出字輪區(qū)域,同時采用圖像旋轉(zhuǎn)擴(kuò)充數(shù)據(jù)集提高模型魯棒性,改進(jìn)的文本檢測模型的準(zhǔn)確率、召回率和mAP 值分別達(dá)到98.50%、97.68%和98.00%,各項指標(biāo)均得到明顯提升,克服了自然場景下水表圖像識別難題。文本識別模型中添加SCUT-WMN數(shù)據(jù)集進(jìn)行訓(xùn)練后,在測試集上單字符識別準(zhǔn)確率未98.48%,文本行識別準(zhǔn)確率達(dá)到94.80%,滿足水表讀數(shù)檢測識別需求。

猜你喜歡
文本檢測模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
3D打印中的模型分割與打包
小波變換在PCB缺陷檢測中的應(yīng)用
主站蜘蛛池模板: 中国黄色一级视频| 午夜啪啪网| 自慰网址在线观看| 亚洲国产精品一区二区高清无码久久| 成色7777精品在线| 日本91在线| 亚洲天堂网视频| 女人18毛片水真多国产| 国产精品无码AⅤ在线观看播放| 欧美日韩免费在线视频| 青青网在线国产| 国产爽妇精品| 日韩福利视频导航| 免费在线一区| 久久精品丝袜| 在线色国产| 99成人在线观看| 精品伊人久久大香线蕉网站| 青青草原国产免费av观看| 国产精品va| 香蕉色综合| 国产国产人成免费视频77777| 日本免费高清一区| 97青青青国产在线播放| 97亚洲色综久久精品| 另类综合视频| 国产一级小视频| a级毛片毛片免费观看久潮| 五月天久久婷婷| 亚洲欧洲综合| 午夜啪啪福利| AV网站中文| 国产高清自拍视频| 一级做a爰片久久毛片毛片| 亚洲第一极品精品无码| 超清无码熟妇人妻AV在线绿巨人| 国产日韩久久久久无码精品| 丁香婷婷在线视频| 亚洲综合狠狠| 国产欧美性爱网| 欧美精品在线看| 中文国产成人久久精品小说| 亚洲成人网在线观看| 久久精品中文字幕少妇| 亚洲免费成人网| 亚洲国产成人无码AV在线影院L| 国产成人av一区二区三区| 黄片在线永久| 粗大猛烈进出高潮视频无码| 丁香五月激情图片| 欧美一区二区三区欧美日韩亚洲| 欧美日韩亚洲综合在线观看| 天堂中文在线资源| 粉嫩国产白浆在线观看| 亚洲国产欧洲精品路线久久| 久久精品人人做人人爽电影蜜月 | 无码免费视频| 天天色天天综合网| 日韩一区精品视频一区二区| 国产日韩欧美在线视频免费观看| 在线观看免费黄色网址| AV无码无在线观看免费| 国产成人在线无码免费视频| 在线精品亚洲国产| 国产欧美在线| AV天堂资源福利在线观看| 国产精品免费电影| 精品一区二区三区中文字幕| 欧美激情福利| 91丨九色丨首页在线播放| 国产女人爽到高潮的免费视频| 亚洲精品国偷自产在线91正片| 999国内精品久久免费视频| 亚州AV秘 一区二区三区| 亚洲第一国产综合| 在线国产你懂的| 午夜三级在线| 欧洲一区二区三区无码| 精品天海翼一区二区| 国产麻豆精品在线观看| 国产成人精彩在线视频50| av尤物免费在线观看|