葉張帆,黃立勤
(福州大學物理與信息工程學院,福建 福州 350116)
人群計數是計算機視覺研究領域最基本但最具挑戰性的任務之一,這是具有許多實際應用的課題,有著廣泛的實際應用前景。人群計數,尤其是動態場景下不同密度人群的高精度人數統計,可以監測和報警,減少公共災難,也可用于商業為商家提供消費人流量參考等。人群計數所使用的技術,目前主要分為兩類:直接檢測法和間接估計法。直接的方法,主要通過檢測場景中的每一個個體,實現人群的統計。這種方法,在低密度人群情況下的計數模型,具有構建成本低和檢測速度快等優點。在近年的研究中,有使用人頭檢測的模型[1],或者頭和肩膀檢測模型[2-4],提升檢測的精確度。但當密度增大時,由于遮擋等問題,人體的表達特征受到破壞,行人不能得到很好的檢測分割,只能采用間接估計的方法進行統計。間接估計法多采用構建場景中特征和人數的關系,實現人群數量的回歸計算[5-6],可以實現高密度和超高密度的場景下的人數統計,但當人群密度變化,在低密度時使用間接法,相較于直接法,有著不必要的復雜度和高成本。近年來,深度學習在圖像檢測和識別領域不斷取得突破,在行人檢測領域,準確度大幅度提高[7-8]。為此,本文結合直接檢測和回歸方法的特點,將深度學習檢測結果和迪里赫雷特混合模型[6,9]聚類相結合,以使人群能夠有效從圖片中被檢測,然后采用……