999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的場景數字檢出

2019-03-28 09:09:54
制造業自動化 2019年3期
關鍵詞:文本檢測

(青島大學 自動化與電氣工程學院,青島 266071)

0 引言

隨著網絡技術的發展,信息量劇增,現已進入到大數據時代。網絡每天會產生龐大的信息量,面臨的一個巨大難題就是從海量的信息中提取出對我們有用的信息。網上的圖片、視頻都包含大量的文本信息,這些信息稱為場景文本信息。場景文字檢出的研究早在21世紀初就開始了,目的是識別圖片、視頻中的文字。傳統的方法有基于數字特征(連通域)的方法[1],支持向量機( Support Vector Machines)[2],BP神經網絡[3]等,傳統的檢出思路大致分為兩步,先檢測定位文本,再進行識別[4]。現階段一些算法將兩步并作一步,定位與檢測同步進行,稱為端對端檢測,本文采用的YOLO(You Only Look Once)算法,便可以實現端對端檢測。許多新型應用都需要提取某些場景中的數字信息,例如:車牌號的識別;拍照翻譯、搜題;馬拉松過程中對運動員的實時監測;集裝箱箱號的識別等,這已經成為計算機視覺的熱門研究方向,該研究具有廣闊的應用前景。

1 傳統檢出方法

傳統的文字檢出,大多是基于字符[5],即先檢測字符,再對其進行組合,比如利用SVM和ANN實現的字符識別[6]。傳統的檢出方法一般分兩步,首先要確定文本的位置。常見的方法,是假設文本之間是連通的,通過對圖像進行二值化,膨脹,腐蝕等處理,將待檢測文本真正連通起來,從而確定待檢出文本的位置。但是如果圖像質量不高,背景復雜,處理起來會很麻煩。第二步,要檢測文本,需要先分割圖像,將一串字符分割成單個字符,然后再逐步對單個字符進行檢測,最后將檢測結果輸出。

這種方法的缺點就是在于只適合場景簡單的圖像,對于復雜場景下的文本,定位與檢測都有難度。需要對圖像做細致的處理,大大增加了工作量。通常現實場景都是很復雜的,所以這種方法在實際應用上會有很大局限。

2 基于深度學習的方法

近幾年,深度學習越來越成熟,出現了很多新算法,在許多領域都取得了不錯的成就[7]。本文將圖像分類問題用目標檢測算法來解決,目標檢測算法主要分為兩類:One-Stage和Two-Stage檢測算法。Two-Stage檢測算法是先產生候選區域,再對候選區域分類,代表算法有R-CNN、Fast-R-CNN和Faster-R-CNN算法。One-Stage算法不需要產生候選區域,直接進行分類,代表算法有SSD和YOLO算法[8]。兩者都是基于深度學習的卷積神經網絡,但是設計思路有些方面有所不同,各有優勢。R-CNN系列算法檢測的精準度比較高,速度略遜一籌,YOLO算法檢測速度較快,但是在精度上不及R-CNN[9]。因為本文是用于檢測數字,檢測對象只是0~9十個數字,YOLO算法的精度完全可以滿足,并且速度更快,所以選擇YOLO算法。

2.1 檢測思路

區別于傳統方法,基于深度學習的文字檢出,將定位與判斷并作一步,同時進行,實現端對端的數字檢測。

R-CNN算法,采用的是滑動窗口技術,即對于一張圖像,用一個小窗口按照規定的步長在圖像上滑動,每滑動一步,做一次圖像分類,這樣便做到對整張圖像的檢測。但是,對于不同的檢測對象,滑動窗口大小的選擇也是問題,而且選擇不同大小的窗口,產生的候選區域太多,運算量太大,從而檢測速度會降低[10]。Fast-RCNN就此做出了改進,用卷積層代替原來的全鏈接層,改進后運算量減小,檢測速度便大大提高。

區別R-CNN,YOLO算法采用了一種新穎的思路,沒有采用滑動窗口,而是直接將圖像分割成若干個格子,再通過卷積得到每個單元格的特征圖,然后每個單元格各自負責預測中心點落在自己區域內的目標。這樣就消除了復雜的滑動窗口的計算量,所以在檢測速度上要快一些。每個單元格會預測幾個邊界框和它們的置信度,邊界框的置信度包括兩個方面,包含檢測目標的可能性和邊界框的準確度。每個邊界框的預測值包括五個元素:(x,y,w,h,c),(x,y)是邊界框的中心坐標,(w,h)是邊界框的寬和高,c為置信度。

邊界框類別置信度計算公式:

Pr表示邊界框包含目標的可能性;IOU表示邊界框的準確度,即預測框跟實際框的并集;Pr(classi|object)表示這個單元格負責預測的目標屬于各個類別的概率,即各個邊界框置信度下的條件概率。每個單元格需要預測B×5+C個值,B表示邊界框的數量,C表示類別數。

2.2 神經網絡的結構

YOLO從誕生以來,不斷更新完善,網絡結構也越來越復雜。YOLOv1由24個卷基層和2個全連接層組成,卷基層負責獲取特征,全連接層負責預測,卷積層和全連接層采Leaky-ReLU激活函數[11]。

YOLOv2采用高分辨率分類器,并且在每個卷積層后面添加了Batch Normalization層,Batch Normalization可以提高模型的收斂速度。YOLOv1是用全連接層直接對邊界框進行預測,根據邊界框預測的4個offsets tx,ty,tw,th,用下面的公式計算邊界框的實際位置和大小:

其中(cx,cy)為cell左上角坐標,pw和ph是先驗框的寬度和長度。

邊界框相對整張圖片的位置和大小:

其中(W,H)是特征圖的大小。

YOLOv2采用卷積層和anchor boxes來代替原來全連接層進行預測。YOLOv2的特征提取器,采用一種新的模型,由19個卷基層和5個maxpooling層構成。YOLOv2的輸入圖片大小要求為416×416,經過5個maxpooling層后,大小變為13×13的特征圖。

YOLOv3采用殘差網絡和FPN架構,它的特征提取器是一個殘差模型,包含了53個卷積層,網絡構建更深,可以多尺度預測[12]。此外,基礎分類網絡和分類器也得到升級,Softmax不適用多標簽分類,所以使用多個獨立的Logistic分類器替代Softmax。

YOLOv3的網絡結構如圖1所示。

圖1 OLOv3網絡結構圖

場景文字的檢出,文字背景對檢出干擾很大。相對來說YOLOv3的檢測速度更快,可以進行實時檢測,而且背景誤檢率低,所以采用最新的YOLOv3模型。

3 實驗過程

3.1 樣本采集

本文使用自己制作的數據集,訓練樣本10000張,測試樣本200張。訓練數據包含圖片和標簽兩個部分,標簽部分使用標注工具YOLO-mark來制作,標簽以文本文件形式保存。樣本圖片的場景包括運動員的號碼牌、車牌、超市物價牌和廣告牌等,各類場景樣本數量大致相同。此外,YOLO自帶圖像增強功能,實際上訓練時會基于角度、飽和度、曝光和色調產生更多的訓練樣本。

3.2 樣本訓練

本文的訓練是在Ubuntu16.04系統下進行,在該系統下配置了基于YOLO的開源神經網絡框架-Darknet,用來訓練和測試,訓練過程的部分參數如表1所示。Region Avg IOU代表預測的矩形框和真實目標的交集與并集之比,IOU值越高說明預測框位置越準確;Class表示標注目標分類的準確率;Obj指標的值期望越接近1越好;No Obj指標的值期望越接近0越好,但不為0。隨著迭代次數的增加,各項指標均有改善,在迭代了大約15000次后,各項指標趨于穩定,模型訓練時長約為70小時。

表1 訓練過程部分參數

3.3 樣本測試

利用迭代20000次后生成的模型,分別選取不同場景下的圖片進行進行測試,部分測試結果如圖2所示。

圖2 部分測試結果圖

圖2中圖片的的具體檢測結果如表2所示。

表2 測試結果

測試結果表明YOLO算法可以實現場景中的數字檢出任務。檢測速度較快,平均在0.07秒左右即可完成一張圖片的檢出。準確率較高,幾乎達到百分百檢出,但當圖像中的數字較小,很模糊的情況下,會出現漏檢或者誤檢的情況,漏檢的概率高于誤檢概率。針對這個問題,可以通過增加訓練樣本量加以改善。

4 結束語

針對傳統方法在場景數字檢測上,弊端較多。其中圖像預處理在傳統方法中工作量占比很大,本文采用深度學習方法進行場景數字檢測,避免了圖像預處理的工作,直接檢測給定圖像,減少了工程的工作量。采用深度學習方法進行場景數字檢出,將定位文本與識別并作一步,實現了端對端的檢測。實驗結果表明該方法檢測速度快,準確率高,具有較高的應用價值。該實驗采用的YOLOv3的神經網絡結構,但是其神經網絡結構對于數字檢出來說過于復雜,下一階段研究要在YOLOv3的神經網絡結構基礎上進行改進,精簡其結構,搭建出一種更適合場景數字檢出的神經網絡結構,進一步提升檢測速度和準確率。

猜你喜歡
文本檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
小波變換在PCB缺陷檢測中的應用
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 亚洲成a人片在线观看88| 亚洲91在线精品| 国产高颜值露脸在线观看| 午夜一区二区三区| 亚洲中文无码h在线观看| 精品一区二区三区自慰喷水| 亚洲日本中文综合在线| 国产欧美日韩在线一区| 欧美一区二区福利视频| 亚洲天堂2014| 999国内精品视频免费| 欧美日韩成人| 99无码中文字幕视频| 久久久久亚洲Av片无码观看| 成人精品免费视频| 亚洲午夜天堂| 久久综合亚洲鲁鲁九月天| 欧美另类视频一区二区三区| 爱色欧美亚洲综合图区| 在线播放精品一区二区啪视频| 99久久国产自偷自偷免费一区| 婷婷99视频精品全部在线观看| 夜夜操天天摸| 婷婷99视频精品全部在线观看| 中文字幕免费在线视频| 精品国产欧美精品v| 午夜成人在线视频| 茄子视频毛片免费观看| 欧美成人精品在线| 久久精品日日躁夜夜躁欧美| 亚洲成人黄色在线| 欧美国产日韩在线| 91在线播放国产| 欧美成人午夜视频免看| 日韩精品一区二区深田咏美 | 91在线视频福利| 999精品免费视频| 午夜国产精品视频| 1级黄色毛片| 成人无码一区二区三区视频在线观看| 亚洲视频无码| 在线观看国产黄色| 美女一区二区在线观看| 99精品久久精品| 高清不卡毛片| 精品久久人人爽人人玩人人妻| 国产在线自揄拍揄视频网站| 日本国产在线| 亚洲av日韩综合一区尤物| 欧美成人国产| 网久久综合| 五月天久久综合| 亚洲二区视频| 国产啪在线| 97se亚洲| 亚洲美女一区二区三区| 亚洲天堂高清| h网站在线播放| 国产在线视频欧美亚综合| 久久免费观看视频| 男女男精品视频| 日日碰狠狠添天天爽| 久久国产乱子| 亚洲成肉网| 亚洲人成网站日本片| 中文字幕av一区二区三区欲色| jizz在线观看| 人妻中文久热无码丝袜| 老司机午夜精品网站在线观看| 91麻豆精品国产91久久久久| 亚洲一区二区三区国产精品| 久操中文在线| www.精品国产| 欧美a级在线| a级毛片毛片免费观看久潮| 国内视频精品| 国产欧美日韩另类| 国产日韩欧美精品区性色| 欧美激情视频二区| 精品亚洲麻豆1区2区3区| 国产18在线播放| 亚洲精品国产日韩无码AV永久免费网|