999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于先驗知識的香煙防偽數字串識別

2019-12-12 07:06:46
計算機應用與軟件 2019年12期
關鍵詞:分類實驗

彭 召 丁 曉 劉 哲 陳 衡 劉 凱

1(西安交大通大學軟件學院 陜西 西安 710048)2(陜西師范大學計算機科學學院 陜西 西安 710062)

0 引 言

數字串識別是字符識別領域一個重要的分支,已經廣泛應用于票據表單系統[1]、儀表識別系統[2]、運動員號碼牌識別系統[3],銀行卡號識別系統[4]。本文研究的是煙草防偽數字串識別。本文的識別方法對于煙草公司調研市場煙草偽品率具有重要意義。

目前,對于字符串識別一般有整體識別和分割識別兩種思路[5-6]。整體識別法適合于有具體含義的詞匯或有一定關聯的詞匯間的識別。例如停車牌“Stop”、火警標識“119”等。本文中的防偽數字是由沒有關聯的數字組成,每個數字間不能組成具有某種意義的詞匯,因此整體識別不適合本文中防偽數字的識別。目前主流的分割識別方法有結構特征法和結合識別法[6-7]兩種。結構特征法基于對投影、輪廓等特征的分析,通過分析結構的特征進行分割。結構特征法對于分割點的依賴嚴重,由于本文中部分防偽碼數字圖片具有背景復雜的特點,這對于依靠投影和輪廓提取分割點具有極大的干擾。故這種方法不適合本文防偽數字串識別。結合識別法,根據識別的結果,輔助分析分割結果,對每種結果做置信度排名,選取置信度高分割的作為分割結果。但這種方法對于數字關聯性不強沒有聯系的防偽碼數字串識別效果不佳。

鑒于本文中防偽數字串的子串沒有具體含義,因此本文采用分割識別的識別方法。由于分割識別方法中兩種傳統方法對于本文中防偽數字識別均不合適,故本文針對香煙防偽數字串實際情況提出一種全新的分割識別方法。

目前很多數字串識別方法將數字規定在一個方格再做分割識別。這種方法雖然一定程度上提高了分割質量,但是增加了人的手工參與,比較繁瑣,并且脫離了實際社會需求。本文提供的分割方法,不需要人工干預,輸入圖片在一定范圍探測得到最終結果。當只用深度學習算法識別時,對于背景復雜圖片,識別往往不理想。本文采用了深度學習算法并充分結合了先驗知識,有利于排除很多識別錯誤的情況。本文先使用定位算法定位數字大概位置,然后在一定范圍內進行探測,這種方法比單純整張圖片識別更能排除背景干擾。實驗表明,本文在香煙防偽碼數據集上取得了良好的效果,能很好地應用于香煙數字的識別。

1 算法設計

本文先將圖片送入Faster RCNN網絡[8]定位,估計出數字串所在區域的最小外接矩形。然后將矩形進行2×16的均等分割,將分割得到的圖片送入分類網絡分類,得到32幅圖片的分類結果。然后根據32個數字對應位置組合應該滿足的先驗條件判斷在此處位置進行分割得到數字是否正確。如果滿足先驗條件,則把這32幅圖片識別結果作為最終結果。如果不滿足則在一定范圍內調整外接矩形的左上角坐標和分割得到的小矩形的長寬,得到新的外接矩形。然后重復分割和識別的過程,直到找到滿足先驗條件要求的外接矩形和識別結果,并把識別結果作為最終結果。具體流程圖如圖1所示。

圖1 系統流程圖

1.1 數字串所在區域定位

目標檢測算法旨在識別出圖片中物體所屬的類別,并把某個類別所在的區域用最小外接矩形表示出來。經過多年發展,深度學習為基礎的目標檢測算法經歷了RCNN[9]、SPP-net[10]、Fast RCNN[11]、Faster RCNN等算法。Faster RCNN算法從前幾種算法發展而來,具有單張圖片測試時間短、模型訓練時間短、計算量小、定位精度高等優點。因此本文選取Faster RCNN算法作為本文的目標檢測定位算法。具體的網絡結構如圖2所示(基礎網絡以VGG16網絡[12]為例)。

圖2 Faster RCNN網絡結構圖

Faster RCNN算法主要由四個模塊組成:

1) 基礎網絡:本部分網絡目的是提取特征,為后續的RPN網絡和ROI pooling層做準備。這部分網絡一般為VGG16網絡或者ZF網絡,可以根據自己實際需求更換基礎網絡。本文使用VGG16網絡作為基礎網絡。基礎網絡得到的特征圖將被送入RPN網絡和ROI pooling層共享。

2) RPN網絡:基礎網絡輸出的特征圖被送入RPN層并在特征圖上建立多個窗口,每個窗口生成若干個候選框anchor。Anchor有1∶1、1∶2、2∶1三種不同的比例。特征圖中每個像素點對應一個anchor中心。將窗口對應的低維向量送到不同的網絡分別做分類和回歸。本文中邊框回歸判斷的是候選框是否屬于香煙防偽數字串區域,輸出是一個概率值。本文將閾值設置為0.7,將概率大于0.7的候選框留下認為是防偽數字串所在區域,小于0.7的舍棄。RPN網絡邊框回歸計算公式如下:

(1)

式中:xa、ya、wa、ha表示anchor框的中心點坐標和框的寬、高;(x,y)表示預測框中心點坐標;w和h為預測框的寬和高;(x*,y*)表示真實區域框的坐標;t表示回歸框做變換的預測值;t*表示框做變換的真實值。

RPN網絡整體損失函數為:

(2)

式中:pi是第i個候選框是防偽數字串的概率。式(2)前半部分表示分類,后半部分表示回歸。

3) ROI pooling層:本層將RPN層的輸出和特征提取的特征圖同時輸入,并在RPN候選框和特征圖上做一個映射,將尺寸統一以方便后續全連接網絡。

4) 回歸與分類:ROI pooling層的特征圖送入全連接層完成回歸和分類。其中,分類的損失函數為:

(3)

回歸損失函數為:

(4)

式中:R表示Smooth L1函數。

1.2 數字串分割

本文防偽數字串由0~9之間的數字組成,共兩行,每行16個數字。數字間距相同,長寬比為2.70。如圖3所示。在上節中,我們通過目標檢測算法Faster RCNN算法已經估計出了防偽數字串所在區域的最小外接矩形,即:根據最小外接矩形的四個頂點,將矩形所在區域劃分成2×16的32個矩形區域,每個矩形區域長寬相同。

圖3 圖片示例

1.3 單個數字識別

圖像分類技術經過多年發展,由開始的傳統圖像分類到支持向量機,再到卷積神經網絡,已經日趨成熟。目前卷積神經網絡、殘差網絡等網絡在圖像分類上效果較好,因此,本文對比了現在的諸多網絡,最終選取更適合本文樣本的分類網絡。

考慮到本文圖片數量較少并為了得到良好的分類器,本文在分類網絡中加入了空間變換網絡[13],對圖片進行一個空間變換,有效地提高了分類的精度。一般情況,卷積神經網絡雖然可以有很好的分類效果,但是當圖片具有空間多樣性的時候,分類效果往往不太理想。空間變換網絡不需要額外的標注,可以插入到任意卷積的后面,且可以根據分類任務對圖片進行空間變換。當圖片模糊,有傾斜角度或者其他空間不變性問題時候,可以有效提高分類效果。

1.4 調整矩形參數

本文中的32個數字滿足下面的先驗條件。第一行中第1位表示年份,本文中圖片是同一年的,第2、3位表示月份,第4、5位表示日期,第6到14位是隨機數字。第15、16兩位是1到50間的編號。第二排第1到4位表示香煙編號。5到16位表示隨機數字。因此先驗條件規則為:第一行中第1個數字是7,第2~3位數字組成的兩位數在1~12之間。第4~5位數字組成的兩位數在1~30之間。第15~16位組成的數字在1~50之間;第二行前四位數字,是某種煙固定的數字標識,固定為某四位數,例如本文中即1100或者1101。

本文以當前矩形框為基準,將當前矩形框左上角坐標和矩形框分割后得到的小矩形框的寬度在一定范圍內調整,小矩形框的長度可以通過寬度和高寬比計算得到。將得到的矩形框均分為2×16份,送入分類網絡識別這32幅圖片,探測滿足以上規則的矩形。將探測得到的滿足以上規則的矩形框作為最終識別結果。當以上規則均滿足后把探測得到的結果作為最終定位結果。由于在一定范圍探測矩形框的左上角坐標和分割的小矩形的長寬,范圍太小可能不包含滿足要求的矩形,范圍太大計算量也隨之增大。為了選取出合適的范圍,本文對樣本的groundtruth和Faster RCNN算法實際檢測出來的框的長寬和左上角坐標位置進行了統計,最終選出了合適的范圍。當在一定范圍調整矩形長寬和矩形框左上角坐標時候,可以逐個像素調整,也可以每隔幾個像素調整。逐個像素調整效果更好,但是計算量太大。每跳躍幾個像素調整計算量小,效果較差。本文對于跳躍幾個像素檢測更合適在時間和準確率上進行權衡,最終選擇了適合本文的跳躍像素個數。

由于Faster RCNN算法畫出來的框大體和groundtruth框位置和形狀相差不大,只有少部分圖片效果不佳,相差較大。因此每次探測時候以算法定位到的框開始,將坐標先變大幾個像素,如果不滿足要求,再調小相同的像素。對于長寬也是類似的處理。這種調整方法可以一定程度降低探測的時間。

2 實驗結果分析

2.1 定位和圖像分類數據集與實驗設定

本文第一階段Faster RCNN網絡的基礎網絡使用VGG16,第三階段的分類網絡也使用VGG16網絡,這兩處VGG16網絡的初始權重均來自ImageNet。本文所涉及的所有實驗均使用gpu,且型號為GTX 1080。本文實驗代碼均基于keras框架。實驗環境Python 2.7.13,keras 2.0.9,tensorflow1.4.10,Ubantu 14.04。本文圖片由煙草公司從市場批量采集香煙樣本拍攝而成。圖片大小均為1 280×960。圖片水平分辨率和豎直分辨率均為96 dpi。原始圖片均未加噪聲。

在第一階段Faster RCNN定位中,為了獲得良好的模型,本文使用320幅圖片,并對圖片進行了四種增強方式:椒鹽噪聲、高斯噪聲、變暗、變亮。得到320×4=1 280幅圖片,再對這1 280幅圖片做放大縮小操作,分別讓圖片長寬同時變為以前0.8、0.9、1.1、1.2倍。因此共有1 280×5=6 400幅圖片參與訓練驗證。最終得到模型。本文中將6 400幅圖片按照train:test=7∶3的比例進行訓練與驗證。

對于第三階段單幅數字圖片分類,為了獲得良好的分類模型,本文從數據集中挑選出約162幅原始圖片通過手動截屏方式標注,從圖片中截取每幅圖上的數字。每幅圖片上截取32個單個數字圖片,共截取出162×32=5 184幅單個數字圖片,除去截圖過程中發現的明顯不符合要求的數字圖片,剩余5 063幅。由于每個數字在圖片中出現的頻率不同,因此截取到的數字數量存在很大的差異。例如截取數量最多的是數字0,有1 158幅。最少的是數字9,只有225幅。由于數據之間存在分布不均勻的情況,如果某類數字訓練樣本過多,可能導致最后學習到此類數字特征過多,而其他類別數字特征過少。因此訓練數據最好數量差別不要太大。因此本文對最少數字9進行了挑選,將205幅作為最后的數據。按照跟205幅差別不太多的原則,從每類別數字中挑選一定數量的數字作為樣本。然后按照大概8∶2的比例隨機分配訓練集和驗證集。最終訓練數據1 696幅,驗證數據424幅。總共數據集 2 120幅。本文使用VGG16作為分類網絡,訓練時候學習率設定為0.000 1。另選22幅原始圖片作為測試集,人工截取每個數字所在區域,由此得到22×32=704幅圖片作為測試集。

2.2 定位與圖像分類效果

本文另選取22幅原始圖片進行第一階段定位的測試,定位得到的效果圖和groundtruth的對比圖如圖4所示。定位精度越高,則定位得到的矩形框的左上角坐標和矩形長寬與groundtruth差別越小,因此可以在更小的范圍內調整這些參數,減少了計算量。定位精度大小用目標檢測領域通用評價指標IOU表示,IOU表示定位框與groundtruth框的交集和并集的比值。本文測量22幅圖片IOU,得到其平均IOU為0.872。

圖4 定位效果

在第三階段分類中,經過實驗挑選網絡,最終使用VGG16作為分類網絡,具體挑選網絡實驗在下節中敘述。本文采用VGG16作為分類網絡,學習率為0.000 1,沒有數據增強時候訓練得到模型。此模型驗證集上的圖片最佳識別率為0.918 2時,測試集為0.842 3。

2.3 圖像分類的參數的影響

2.3.1分類網絡

現存分類網絡很多,同一分類網絡可能在某一數據集效果理想而在另外數據集上效果較差。因此為了找出適合本文的分類網絡,本文在Resnet50[14]、VGG16、VGG19[15]、InceptionV3[16]等分類網絡上進行了實驗。最終選擇出VGG16作為本文第三階段的分類網絡。這四種網絡所使用的初始權重均來自ImageNet項目,且均把圖片數據尺寸統一到224×224然后送到多個網絡進行分類。分類結果如表1所示。

表1 分類網絡效果對比

實驗結果表明,不同的分類網絡對本文單個數字圖片的分類效果不同。其中:InceptionV3網絡在驗證集和測試集上的表現最差,VGG16網絡在驗證集和測試集上表現最好。這說明VGG16網絡是對本文數據集最合適的分類識別網絡。因此本文選擇VGG16網絡作為最終分類識別網絡。

2.3.2數據增強

對于第二階段圖像分類,由于本文數據較少,因此考慮數據增強來提高精度。在VGG16網絡上進行實驗,結果表明數據增強能提高一定的精度。首先本文由于圖片尺寸最終都統一到224×224,因此放大縮小數據增強對本文沒有作用,實驗結果也驗證了這一猜想。本文對圖片同時做了隨機上下翻轉,發現驗證集數據精度反而下降了0.16,因為6和9上下翻轉后將無法識別,因此本文沒有采用上下翻轉的數據增強方式。由于本文中數字多為水平,傾斜角度較少,因此暫不考慮使用旋轉的數據增強方式。本文僅采用了隨機水平翻轉的數據增強方式。實驗結果表明水平翻轉數據增強對實驗結果有一定提高。實驗結果如表2所示。

表2 數據增強與空間變換對比

實驗結果表明通過水平翻轉的數據增強后,VGG16的在驗證集和測試集上的分類效果均有0.01左右的提高。這說明隨機水平翻轉的數據增強方式能提升圖片分類效果,因此本文采用隨機水平翻轉的數據增強方式。

2.3.3空間變換網絡(STN)

在第二階段圖像分類中,本文在VGG16最后一個池化層后加入了空間變換網絡。由于最后一個池化層輸出的feature map大小為7×7,通過空間變換網絡后,輸出的feature map大小也設定為7×7,然后送到VGG16接下來的層繼續學習。實驗結果表明,加入空間變換網絡分類效果有較好提高。實驗結果如表2所示。

實驗結果表明,在VGG16網絡后加入STN后,驗證集和測試集上的結果均有大概0.03的提高,說明本文的圖像數據在有模糊、變形等其他空間問題時加入空間變換網絡對實驗結果有一定提升。因此本文加入空間變換網絡來提升分類效果。本文將2.3.2節中的數據增強和2.3.3節的空間變換網絡綜合起來,使得驗證集和測試集上的效果提升了0.5左右。

2.3.4學習率的影響

在第二階段圖像分類中,為了取得更好的效果,本文對網絡學習率進行了調節,以上實驗中學習率均為0.000 1,每次擴大或者縮小10倍以確定最好的學習率。本文基于VGG16,做水平隨機翻轉并加入空間變換網絡,調整學習率,在驗證集上的精度如下所示。實驗結果如表3所示。

表3 學習率對分類效果的影響

學習率過大容易使得損失值爆炸,使得梯度值在最小值附近來回震蕩,無法達到最低點;學習率過小收斂過程非常緩慢并且容易過擬合。因此本文挑選合適的學習率對本文圖像分類效果具有重大意義。實驗表明,學習率為0.000 01時,測試集的精度最高達到0.890 6。因此,本文采用0.000 01作為本文學習率。

基于上述實驗結果,本文分類網絡采用VGG16網絡,同時對數據做了水平翻轉的數據增強,并加入了空間變換網絡,將學習率調整到0.000 01,最終驗證集上最佳精度達到0.978 0,此時測試集精度為0.890 6。此結果只是22幅圖片按照groundtruth分割得到的識別率,并不代表最終實驗識別率。用groundtruth分割的示意圖如圖5所示。

(b) 分割示意圖5 groundtruth分割示意圖

2.4 探測方法與最終結果

本文先使用22幅待測試圖片,通過目標檢測算法Faster RCNN算法定位,把定位得到的框直接分割然后送入VGG16網絡識別,此時的識別率為0.15。說明不使用先驗知識,直接定位分割的效果較差。本文對22幅圖片進行統計,發現數字串所在區域圖片框的數字串左上角坐標(x1,y1)與groundtruth圖片框左上角坐標(x1gt,y1gt)之間有一定偏差,通過統計發現|x1-x1gt|<20、|y1-y1gt|<20。每個小矩形寬度偏差|width-widthgt|<2。在一定范圍內對圖片進行探測,本文設置探測的x1、y1均相隔多個像素探測一次,width相隔1個像素探測一次。通過實驗,為了在探測識別時間和識別率結果上達到一個妥協,本文發現左上角坐標4個像素為一個探測單位,寬度1個像素更適合本文。固定外接矩形框左上角坐標x、y,逐像素改變外接矩形分割得到的小矩形的寬度,結果如表4所示。表中:坐標移動像素數代表探測時候外接矩形框左上角坐標x、y移動的像素數單位,比如3代表調整外接矩形框時,調整矩形框左上角坐標x、y時每隔3個像素調整一次。先驗知識探測對結果的影響如表5所示(此時的先驗知識使用的調整像素幅度為4)。

表4 像素調整對比表

表5 先驗知識探測對結果的影響

實驗結果表明,調整步幅增大,探測時間減少,精度總體有下降的趨勢。為了在時間和精度上做一個權衡,本文最終選擇每4個像素調整一次,此時22幅測試圖片的最佳識別率為0.80,在速度和精度上都可以很好滿足香煙防偽驗證的需求。在不使用先驗知識探測時候初始識別率僅為0.15,通過加入先驗知識在一定范圍內探測識別,識別效果有較大提升。

本文將此算法用于香煙企業偽品鑒定,將識別出來的結果送入香煙企業防偽碼數據庫比對判斷香煙真偽。將識別出來有問題的香煙通過人工識別最終確定,大大減少了人工工作量,具有良好的實用價值。

3 結 語

本文結合香煙防偽數字串的實際情況,充分利用了防偽數字串的先驗知識,提出了一種新的數字串識別方法。首先定位出數字串大概位置;然后分割識別,通過先驗知識判斷是否滿足條件,如果不滿足則繼續調整矩形長寬和左上角坐標;最終找到滿足要求的外接矩形,并把此時識別結果作為本文鑒定方法的最終結果。實驗表明,本文提出的方法對于香煙防偽數字串具有良好的識別效果,很好地滿足了防偽數字串識別的要求,具有良好的實用價值。本文算法為商品條碼數字識別、儀表數字串識別等類似識別問題提供了良好的新思路。

猜你喜歡
分類實驗
記一次有趣的實驗
微型實驗里看“燃燒”
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
做個怪怪長實驗
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
主站蜘蛛池模板: 55夜色66夜色国产精品视频| 色欲色欲久久综合网| 一级看片免费视频| 亚洲成人黄色网址| 在线精品欧美日韩| 风韵丰满熟妇啪啪区老熟熟女| 亚州AV秘 一区二区三区| 亚洲性一区| 激情午夜婷婷| 中文字幕永久视频| 激情乱人伦| 女高中生自慰污污网站| 国产成人精品男人的天堂| 久久婷婷五月综合97色| 亚洲 欧美 偷自乱 图片| 熟妇无码人妻| 久久久久人妻一区精品| 伊人成人在线视频| 中国精品自拍| 久久精品丝袜| 久久99国产综合精品1| 久久窝窝国产精品午夜看片| 国产av色站网站| 亚洲精品不卡午夜精品| 色婷婷综合在线| 亚洲制服丝袜第一页| 国产特级毛片aaaaaaa高清| 亚洲精品成人片在线播放| 重口调教一区二区视频| 日韩小视频在线观看| 久久久久夜色精品波多野结衣| 又猛又黄又爽无遮挡的视频网站| 国产成人一级| 男女性午夜福利网站| 丁香婷婷激情网| 国产区在线看| 亚洲视频无码| 亚洲国产清纯| 四虎国产精品永久一区| 欧美成人二区| 亚洲伦理一区二区| 在线欧美国产| a级毛片免费在线观看| 在线网站18禁| 久久无码免费束人妻| 性欧美久久| 成年人免费国产视频| 九九九精品成人免费视频7| 久久夜色精品| AV无码一区二区三区四区| jizz亚洲高清在线观看| 亚洲精品在线观看91| 日日拍夜夜嗷嗷叫国产| 伊人久热这里只有精品视频99| 欧美色视频日本| 手机在线免费毛片| 五月天福利视频| 亚洲第一成年网| 九色视频在线免费观看| 国产99视频在线| 久操中文在线| 伊人久久婷婷| 国产精品成人AⅤ在线一二三四 | 国产99在线| 国产日韩欧美视频| 亚洲美女一区| 最新日韩AV网址在线观看| 精品少妇三级亚洲| 国产视频你懂得| 天天摸天天操免费播放小视频| 伊人久久婷婷五月综合97色| 美女亚洲一区| 夜夜操国产| 另类欧美日韩| 国产成人亚洲综合A∨在线播放| 国产swag在线观看| 国产又粗又猛又爽视频| 五月婷婷综合色| 国产麻豆另类AV| 一级毛片免费播放视频| 亚洲欧美一区二区三区蜜芽| 国产精品极品美女自在线看免费一区二区|