
摘 要 行人重識別是指利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術。隨著生成對抗網絡的發展,行人重識別技術也得到了突破。本文根據生成對抗網絡對數據集擴充的角度,對現有行人重識別文獻進行詳細的總結和分析。
關鍵詞 行人重識別;深度學習;生成對抗網絡;計算機視覺
行人重新識別是指給定目標行人圖像,從其他的攝像機捕獲的圖像中重新識別目標行人的過程。行人重識別可以彌補當前固定攝像機的視覺限制,可以與行人檢測、姿態估計方向相互配合,用于視頻監控、智能安全等領域。
生成對抗網絡[1]在近幾年得到了蓬勃的發展,其中一個重要應用就是圖片生成。深度學習方法需要依賴大量訓練數據,目前行人重識別的數據集總體來說規模還是比較小。為此生成對抗網絡在重識別系統[2]中得到廣泛應用,接下來將從擴大標簽圖片方面總結行人重識別的發展趨勢。
1DG-net網絡行人重識別算法
基于生成對抗網絡的行人重識別系統中,絕大部分將數據生成模塊與重識別模塊相分開。先依靠生成對抗網絡擴充數據集,然后依靠重識別系統返回目標行人的圖片。DG-net網絡將數據生成和重識別統一到同一個框架中,實現端到端的行人重識別。生成模型會將行人編碼成外觀代碼和結構代碼,通過交換外觀代碼和結構代碼,生成高質量交叉ID的混合圖像。通過將外觀代碼在線反饋判別器模型,來改進判別器,實現數據生成與重識別間相互關聯。與傳統方法相比,DG-net網絡可控性強,完全利用訓練數據集信息,不需要增加任何額外的數據。DG-net網絡實驗結果如圖1所示。
圖1? DG-Net實驗效果圖
2基于漸進姿態遷移網絡行人重識別
為了盡可能模擬自然狀態下,行人姿態的多樣性,可以依賴生成對抗網絡實現姿態遷移。采用生成對抗生成方法的漸進式姿態遷移方法,通過一系列中間姿態,將目標姿態遷移到原始圖像上去。
根據輸入的兩張圖片分別提取出當前姿態和目標姿態。在網絡中含有多個姿勢注意模塊,引導網絡將圖片中人物的不同的部分按照目標姿態進行漸進式像素塊遷移。通過不斷生成與目標姿勢日趨相近的圖片,使生成圖片逐步向目標姿態靠近。通過使用這種新穎的方法增廣樣本數據,使生成圖片的質量得到很大提高。
3基于風格遷移的行人重識別
現有的行人重識別數據集都是在監控視頻片段的基礎上,通過剪裁得到目標行人的圖片。在實際生活的測試中,攝像機處于戶外環境,行人重識別會受到不同攝像頭拍攝的圖片風格變化的影響。因為圖片風格差異,造成同ID行人在不同攝像頭下的特征出現差異。
為了淡化不同相機間的風格差異,CamStyle提出依靠生成對抗網絡進行數據增強的方法來消除相機樣式的差異。不同攝像機的風格被視為不同的領域,利用CycleGAN產生新的數據樣本:將已經標記過的訓練圖片風格遷移至每個攝像機,與原始訓練樣本混合在一起擴充訓練集。通過這種方式,訓練集是原始訓練圖像和風格轉換圖像的組合。進行風格遷移圖片可以直接沿用原有圖片的標簽。
該訓練集兼顧不同攝像機所處風格,很大程度上減弱了自然環境對于重識別系統的影響,為行人重識別走向實際應用邁出了重要的一步。
4未來展望
依據近年來行人重識別的發展方向分析,在未來的一段時間內行人重識別問題研究很大程度仍會集中關注于行人特征,因此依靠生成對抗網絡是目前解決重識別有效方法之一。為了將行人重識別系統更好的應用于實踐,行人檢測與行人重識別結合是必要的。單單憑借行人重識別模型無法獲取標準的數據圖片,引入行人檢測模型具有很大的現實意義與研究價值。
5結束語
隨著深度學習的不斷發展,行人重識別的性能日趨完善,但行人重識別模型主要依靠現有的標準數據集進行訓練測試,泛化能力仍有不足。在面對實際生活場景中,數據圖片的復雜性遠非標準數據集可比。生成對抗網絡雖能擴充行人數據的信息量,也不能完全克服這些挑戰。為此在日后的研究中,應更加針對考慮到現實環境下行人的多態性。
參考文獻
[1] 徐一峰. 生成對抗網絡理論模型和應用綜述[J]. 金華職業技術學院學報,2017,17(3):81-88.
[2] 戴臣超,王洪元,倪彤光,等. 基于深度卷積生成對抗網絡和拓展近鄰重排序的行人重識別[J]. 計算機研究與發展,2019,56(8):1632-1641.
作者簡介
田宇,男,遼寧省盤錦市興隆臺區人;現就讀學校:沈陽理工大學,在讀研究生,研究方向:復雜系統綜合自動化技術。