在最近被ECCV2020接收的論文AutoSTR中,第四范式的研究人員提出了使用網絡結構搜索技術來自動化設計文本識別網絡中的特征序列提取器,以提升文本識別任務的性能。由于文本的多樣性和場景的復雜性,通過對圖像預處理模塊(如校正和去模糊)或特征序列翻譯模塊的改進,提高文本識別網絡的性能越來越受到各方關注。
研究團隊提出以AutoSTR來搜索數據相關的主干網絡。他們為STR設計了一個特定領域的搜索空間,既包含了操作上的選擇,也包含了對下采樣路徑的約束。通過一個兩步搜索算法將操作和下采樣路徑分離,以在給定的空間內進行有效的搜索。實驗表明,通過搜索數據相關的主干網絡,AutoSTR可以在標準基準測試中優于其他SOTA方法。