殷昌山,楊林楠,胡海洋
(1. 云南農業大學大數據學院,昆明市,650201; 2. 云南省農業大數據工程技術研究中心,昆明市,650201;3. 綠色農產品大數據智能信息處理工程研究中心,昆明市,650201)
農資標簽是印刷于農資包裝上的文字,主要包括有效成分含量、產品名稱、登記證號、生產許可證號、產品標準號等用于描述該產品相關信息的內容。農民根據該信息查詢并判斷該產品是否符合自身需求,農資監督機構根據該信息進行農資安全相關的檢測和分析,國外購買者依據該信息對出口農資進行識別。作為農資標簽識別的必要步驟,農資標簽的文本檢測對于農資安全監督和識別出口農資非常重要。
目前,基于深度學習的文本檢測方法主要分為基于區域建議和基于分割這兩類。基于區域建議的算法根據文本獨有的特點,在目標檢測通用算法模型的框架下對其進行改進。Tian等[1]借助了Faster RCNN中anchor回歸機制,提出了CTPN網絡框架來獲得圖像中的文本行,對水平方向文本檢測效果良好。Shi等[2]借助一階段檢測框架SSD,提出了Seglink算法,該算法讓模型學習文本框的旋轉角度,對水平方向和多方向的文本檢測有較好的魯棒性,但對任意形狀的文本不能準確定位。而基于分割的方法則是受到經典語義分割算法的啟發,在像素級上對每個點進行分類,經后處理輸出文本區域。Li等[3]提出了PSENet,該網絡使用漸進式擴張算法,有助于緊密文本區域的分離,能夠精確地定位任意形狀的文本實例。……