999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于埃爾米特插值的任意形狀文字檢測技術

2022-04-12 04:09:50張高明仝明磊
科技與創新 2022年7期
關鍵詞:區域檢測方法

張高明,仝明磊

(上海電力大學電子與信息工程學院,上海 201306)

文字檢測的任務是定位圖像中的文字區域,與傳統的對印刷文檔進行文字檢測不同,印刷文檔中的文字往往排列整齊、背景簡單,文字與非文字區域存在明顯差異,而自然場景圖像中的文字常表現為多樣的形式,如傾斜、彎曲排列,字間距較大,寬高比存在顯著差異等,且自然場景圖像中背景復雜,極易對文字的檢測產生干擾,這些因素均給自然場景文字檢測帶來了巨大的挑戰。

盡管當前對自然場景中水平或傾斜文字進行檢測的研究已經取得了極大的突破,不斷出現新的算法在水平和傾斜文字檢測數據集上刷新記錄,但由于自然場景中的文本常表現為多種形式,如大寬高比、彎曲排列等,精確地檢測自然場景中任意形式的文字仍然是一個挑戰。目前,針對自然場景中任意形狀文字檢測問題的方法主要分為自底向上和自頂向下2種。

自底向上方法。自底向上方法將自然場景中任意形狀文字檢測問題轉換為語義分割問題,如TextSnak[1]、PSENet[2]等,通過對特征圖進行像素級的分類得到圖片中的文字區域。基于自底向上方法的模型通常擁有較簡單的網絡結構,具有速度較快等優點,但也存在以下問題:①由于自然場景中許多文字字段排列緊湊、間隔較小,僅通過語義分割檢測文字區域難以將緊鄰的不同文本實例分割開;②與印刷文檔中簡單的背景區域不同,自然場景的背景中常充斥著許多復雜的紋理,直接對圖片進行文字、非文字的分類極易出現錯誤,準確率較低。

自頂向下方法。與自底向上方法不同,自頂向下方法將任意形狀文字檢測問題轉換為實例分割問題,如SPCNet[3]、ABCNet[4]等,通過首先不考慮文字形狀,確定候選矩形區域得到圖片中文字的粗略位置,再對得到的候選區域分別進行語義分割,判斷其中每個元素是否屬于文字區域,最后得到文字實例的精確位置。自頂向下方法通過先后進行2輪檢測,既解決了自底向上方法難以將緊湊的文字實例分隔開的問題,又達到了提高文字檢測準確率的目的。但同樣存在下述問題:①由于自頂向下方法常基于Faster RCNN、Mask RCNN[5]等二階段目標檢測模型,不僅計算量大,速度較慢,不能滿足實時應用的要求,并且由于其檢測結果與候選區域的設置緊密相關,若沒有合理尺寸的候選區域,則文字檢測準確率也將顯著降低;②上述基于自底向上方法與自頂向下方法的模型最終均輸出圖像分割結果,基于圖像分割的目標檢測方法在模型完成預測之后,往往還需進行復雜的圖像后處理以得到最終結果,導致速度進一步降低。以TextSnake為例,模型輸出圖像分割結果后,還要通過將一系列不同半徑的圓盤覆蓋在文字區域內,刪除過小區域,連接圓盤區域,以得到最終文字檢測結果。

針對以上問題,本文提出一種基于埃爾米特曲線的任意形狀文字檢測方法,在自頂向下方法基礎上直接預測文字區域4個角點坐標以及對應位置處的斜率,即可根據埃爾米特曲線方程進行插值,準確表示圖像中文字的位置信息。

1 任意形狀文字檢測網絡

埃爾米特曲線文字檢測模型在常規目標檢測網絡FCOS[6]的基礎上,實現了anchor free的一階段的自頂向下文字檢測方法,達到了簡化網絡結構、減少模型超參數的目的。

1.1 埃爾米特曲線

本文提出基于埃爾米特曲線檢測任意形狀文字的方法,對于任一線段,只需知道2個端點處坐標B0、B1及對應斜率K0、K1,即可根據埃爾米特曲線方程得到該曲線的參數化表示,如圖1所示。

圖1 埃爾米特曲線

C(t)的定義如下:

其中,B0、K0對應t=0,B1、K1對應t=1,代入C(t)及其導數,可求得參數a、b、c、d。通過對t在[0,1]內均勻取k個點即可畫出該曲線,如圖1所示。

本文提出的埃爾米特曲線網絡將基于自頂向下方法中文字檢測結果由分割結果更改為回歸結果,不僅省略了過去自頂向下方法得到檢測結果后,還需對分割圖進行復雜的后處理才可得到文字區域的過程,加快文字檢測速度,并且對于每一個文字實例,僅用4個坐標點處的信息(xi,yi,ki)即可準確表示任意形狀的文字,解決了過去為應對任意形狀文字檢測問題大幅增加輸出維度導致收斂困難的問題。使用k個點繪制長邊得到的文字檢測結果如圖2所示。

圖2 使用k個插值擬合長邊得到的文字檢測結果

1.2 多任務損失函數

模型輸出包含2個分類任務,其中一個分類任務部分得到文本、非文本分類結果,另一分類任務部分得到該像素點為質心的概率,考慮到樣本中正例遠小于負例,為應對類別不均衡的分類問題,本文對分類任務采用Focal Loss作為損失函數,定義如下:

2 實驗

為驗證本文方法的有效性,實驗采用了SynthText、CTW-1500這2個自然場景文字檢測常用數據集。SynthText是一個包含80萬張圖像約有800萬個文字實例的大型數據集,其中每幅圖像都是通過在自然圖像中插入不定量隨機大小、顏色、形狀的文字組成,在本實驗中用于模型的預訓練;CTW-1500中有1 500張圖像,數據集中包含大量彎曲形狀的文字。

實驗操作過程中的程序版本為Python3.6.7,TensorFlow使用版本為1.13,使用容量為12 GB的顯卡在CentOS系統中進行訓練以及在CTW-1500數據集中進行測試。測試結果如表1所示。

表1 CTW-1500數據集結果對比

本文方法在CTW-1500數據集上進行測試,F-measure分別為80.6,超越了表1中近2年大多數文字檢測算法,取得了較好的結果。相較于CENet、ATTR等自底向上方法,本文采用自頂向下的思想,在不同數據集中都達到了較高的精確率。

3 結論

本文提出一種基于埃爾米特曲線的任意形狀文字檢測網絡,在自頂向下思想的基礎上改變輸出形式,通過預測每個文字實例4個角點的坐標和斜率,再聯合埃爾米特曲線直接得到文字的位置信息,避免了傳統自頂向下方法得到圖像分割結果后還需進行復雜后處理的過程,有效簡化了模型結構。經過數據對比,本文提出的方法在CTW-1500等包含任意形狀文字實例的數據集中均取得了較好的實驗效果,驗證了方法的可行性和有效性。

猜你喜歡
區域檢測方法
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
小波變換在PCB缺陷檢測中的應用
關于四色猜想
分區域
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
基于嚴重區域的多PCC點暫降頻次估計
電測與儀表(2015年5期)2015-04-09 11:30:52
主站蜘蛛池模板: 午夜不卡福利| 综合人妻久久一区二区精品 | 亚洲男人天堂2020| 久久美女精品| 97国产精品视频人人做人人爱| 亚洲五月激情网| 人人妻人人澡人人爽欧美一区| 国产欧美高清| 国产精品尹人在线观看| 91精品久久久无码中文字幕vr| 亚洲欧美日韩中文字幕一区二区三区| 尤物特级无码毛片免费| 2020最新国产精品视频| 无码AV日韩一二三区| 免费不卡视频| 国产精品真实对白精彩久久| 精品久久高清| 精品久久久久久久久久久| 九色在线观看视频| 毛片免费试看| 国产白浆一区二区三区视频在线| 伊人久久婷婷五月综合97色| 欧美性爱精品一区二区三区 | 中文字幕无线码一区| 国产福利观看| 色老头综合网| 操国产美女| 亚洲国产亚洲综合在线尤物| 日本道综合一本久久久88| 欧美在线伊人| 特级做a爰片毛片免费69| 午夜免费视频网站| 影音先锋丝袜制服| 免费看一级毛片波多结衣| 日韩在线第三页| 久久一本日韩精品中文字幕屁孩| 国产精品香蕉在线| 久久国产V一级毛多内射| 超碰91免费人妻| vvvv98国产成人综合青青| 在线看免费无码av天堂的| 亚洲欧美不卡视频| 中国成人在线视频| 夜夜拍夜夜爽| 1769国产精品免费视频| 成年A级毛片| 亚洲精品国产乱码不卡| 好吊色国产欧美日韩免费观看| 亚洲国产精品日韩av专区| 欧美日韩一区二区三区在线视频| 中文字幕欧美日韩高清| 国产菊爆视频在线观看| 99热在线只有精品| 国产在线视频欧美亚综合| 国产在线观看精品| 九九久久99精品| 欧美在线伊人| 亚亚洲乱码一二三四区| 国产精品美女自慰喷水| 亚洲第一综合天堂另类专| 国产迷奸在线看| 在线欧美日韩国产| 亚洲黄色激情网站| 国产v精品成人免费视频71pao| 精品国产成人av免费| 91精品免费久久久| 在线看免费无码av天堂的| 亚洲欧美色中文字幕| 亚洲国产在一区二区三区| 亚洲欧美色中文字幕| 热热久久狠狠偷偷色男同| 午夜啪啪福利| 熟女视频91| 国产一级二级在线观看| 成人午夜天| 综合久久五月天| 国产爽爽视频| 人妻91无码色偷偷色噜噜噜| 欧洲成人免费视频| AⅤ色综合久久天堂AV色综合| 日韩在线永久免费播放| 中文字幕调教一区二区视频|