近日,為了簡化計算機識別圖像的過程,來自Facebook人工智能研究實驗室(FAIR)的六名成員利用Transformer神經網絡架構創建了端到端的圖像檢測AI工具“DETR”。FAIR 稱,DETR是第一個成功將Transformer架構集成為圖像對象檢測核心的工具。Transformer架構可以像近年來對自然語言進行處理一樣,徹底改變計算機視覺,或者縮小自然語言處理與計算機視覺之間的差距。研究員稱,通過將通用的CNN與Transformer架構相結合,DETR可以直接(并行)預測最終的檢測結果,與許多其他現代檢測工具不同,新模型在概念上很簡單,不需要專門的數據庫。