王良聰,吳曉紅,陳洪剛,何小海,潘 建,趙 威
(1四川大學 電子信息學院,成都610065;2中國民航局第二研究所,成都610041)
利用現代信息技術及創新成果,打造宜居、安全、便利、智能的生活環境,是社會良性發展的普遍追求。近年來,大量人口選擇匯集在城市工作、安家,城市單位面積內的人口密度越來越大,因此帶來了一系列的問題,這些問題是高效、有序的社會管理面臨的巨大挑戰。如2020年1月7日,伊朗高級將領蘇來曼尼遭遇美方突襲不幸身亡,伊朗民眾紛紛為其送葬,但送葬的過程中發生了意外,百萬民眾送別時發生踩踏事件,至少造成了56人死亡、213人受傷。因此,提前對人群信息進行快速統計,避免嚴重的公共安全責任事故發生是必要的。人群密度估計,需要重點關注人群的分布信息,然而實際場景中往往面臨著相似物體(如樹葉,車輛)的干擾,很難從局部小區域得出判定;在此情況下,人類的做法是觀察更久,同時結合其它的周圍信息進行判斷。受此啟發,本文設計了雙注意力模塊來解決這樣的問題。由于攝像機拍攝視角的多樣性和人群位置的復雜分布,圖像中的人頭尺度是變化多樣的,為了應對視角劇烈變換問題,設計了一個多尺度特征融合模塊,來增強網絡的多尺度特征提取能力,并融合多尺度信息。本文提出的基于多尺度及雙注意力機制(Multi-Scale and Dual Attention,MSDA)的小尺寸人群計數網絡,實現端到端的人群計數。即輸入單幅圖像,就可以通過對生成的密度圖進行積分,得到圖像中的人群數量?!?br>