張仕遠,丁學(xué)明
(上海理工大學(xué) 光電信息與計算機工程學(xué)院,上海200093)
近年來計算機視覺領(lǐng)域中的行人重識別(Person Re-identification)的關(guān)注度逐漸升高。其作為圖像檢索問題的分支,目的是通過深度學(xué)習(xí),檢索出數(shù)據(jù)集中存在特定身份的行人[1]。隨著人工智能科技的飛速發(fā)展,該技術(shù)在社區(qū)安防、刑事追蹤、智能機器人等領(lǐng)域都得到初步的應(yīng)用。但由于圖像中行人的動作和光照強度都會存在的差異,且不同的圖像之間存在遮擋物、分辨率低等問題,會造成的類內(nèi)與類間的差異變化,故行人重識別到目前仍然存在一些具有挑戰(zhàn)性的難點。
隨著深度學(xué)習(xí)的飛速發(fā)展以及高性能的計算硬件的不斷升級,深度學(xué)習(xí)方法已成為行人重識別任務(wù)的主流方法。其通過組合不同網(wǎng)絡(luò)結(jié)構(gòu),形成多層卷積神經(jīng)網(wǎng)絡(luò)的非線性深度學(xué)習(xí)模型;對數(shù)據(jù)集中訓(xùn)練集進行訓(xùn)練;再通過計算歐式距離等方法來比較樣本間的相似度;進而獲得較高的性能指標。當(dāng)前,基于深度卷積神經(jīng)網(wǎng)絡(luò)的行人重識別,普遍使用的骨干網(wǎng)絡(luò)有ResNet[2]、VGGNet[3]等。因其在識別任務(wù)中能自動提取具有較強魯棒性行人圖像的特征,從而完成端到端的學(xué)習(xí)。隨著行人重識別的關(guān)注度逐年遞增,基于深度卷積神經(jīng)網(wǎng)絡(luò)的許多具有優(yōu)異性能的行人重識別算法被不斷提出。如:文獻[4]中提出的三元組損失函數(shù),其優(yōu)化目標是使與目標樣本行人屬于不同類行人之間的距離,要比屬于同類行人之間的距離大,從而增強模型的辨別能力。……