陸欣嬈

摘要:步態識別相比于人臉識別、指紋識別、虹膜識別等生物特征識別技術,更有技術難度,且容易感知,不易偽裝,應用更加廣泛,所以重點在步態識別技術。研究了步態識別的三大步驟,步態檢測、步態表征和步態識別。在此基礎上完成步態識別的商業應用研究。
關鍵詞:步態識別;結構化特征;算法
中圖分類號:TB文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2019.10.085
1步態識別概述
步態識別是生物特征識別領域一項新興的技術,相比于人臉識別、指紋識別、虹膜識別等其他生物特征識別,它具有容易感知,非接觸性,難于隱藏和偽裝等優點?;诖?,步態識別有非常廣泛的應用,現已有大量綜述文章。
步態分析不光是計算機視覺領域的課題,它是結合醫學、心理學方面的課題。而步態識別就是分析包含人體運動的圖像序列,通過人們走路的姿態進行身份識別,通常包括步態檢測、步態表征和步態識別3個過程,其框架圖如圖1所示。
一般步驟是:首先通過攝像頭去采集步態信息,然后通過背景估計等算法進行步態檢測,接著對步態序列輪廓區域作特征提取,對比步態數據庫,作最終的步態識別。
2步態檢測
步態檢測是從視頻中將背景信息過濾,只提取目標物體——步態序列,從而截取步態信息,將人體步態輪廓區域從背景圖像中提取出來,其中包括背景估計、目標檢測和形態學后處理等。有效分割步態輪廓區域是后期特征提取、目標分類等處理的基礎。視頻序列中運動檢測不同于靜態信息識別,它更加復雜,包含的信息更多,現如今主要有4類方法去處理,而步態檢測也同樣適用:
(1)基于特征的方法。首先觀察人體結構學特征,將人體結構學特征的變化與圖像序列中的變化建立一定的關系,并計算物體結構學變化的運動參數。例如主動輪廓法、采用邊緣和拐角作為特征去研究目標物體的方法。
(2)幀間差分法。就是結合連續的圖像序列之間的亮度變化來提取運動目標。現在有很多的研究是在傳統的幀間差分法基礎上,結合形態學和人體結構特征來提取步態信息。這種方法簡單易于實現,但只能檢測目標邊緣,無法檢出整個物體。
(3)背景減除法。用當前幀圖像去對比背景圖像,將區別小的區域定為背景區域,區別大的區域定為運動區域,從而將背景減除,只提取運動信息。該方法有一定的局限性,其對外界擾動引起的場景變化特別敏感,一般要求背景靜止。
(4)光流法。是一種基于灰度梯度基本不變的假設的目標檢測算法,但其算法較為復雜,而且其基本假設在大多數步態識別中并不成立,抗噪性能差。
在以前的步態檢測算法中,因為存儲的大多數是靜態圖片,所以背景減除法應用較廣。但近年來,隨著研究偏向復雜背景和動態信息,我們往往要結合幀間差分法和光流法這一類更適合做運動物體檢測的方法。應用這些方法時,往往要結合人體步態基本特征做具體檢測,結合基于特征的方法。
3步態表征
步態表征就是步態特征提取,這些特征包括結構化特征、非結構化特征和融合特征。特征工程是計算機視覺領域的一個研究重點,步態識別也不例外。
3.1結構化特征方法
結構化特征方法是通過建立一個2D或3D模型來模擬人在步態行走時的結構化模型。一種基礎的模型是基于腿部內鏈接鐘擺模型,將小腿基于大腿的運動模擬為鐘擺運動,且符合一定的角度變化。在此基礎上又有人研發了動態耦合鐘擺模型,將大腿的運動也模擬為鐘擺模型,把小腿的運動模擬為以大腿的末端為頂點的鐘擺模型,且其運動具有一定的周期性,各個人的運動符合一定的模式,正是這樣才可以做結構化特征提取。
另一種方法則是從另一種角度出發,結合解剖學知識,在人體側影中提取出頭、脖頸、肩、胸、骨盆、膝蓋和腳踝等各部位的位置參數,并計算各個位置的運動學特征,最終構建出2D人體桿狀模型。將多個靜態情況下的桿狀模型連接起來后,形成一個能識別的步態模式。此方法彌補了鐘擺模型沒有描述上肢運動的缺點,后期應用較廣,但對設備要求較高。
還有一種方法也是利用是將人體側影圖像,將人體劃分成7個區域,每個區域用一個橢圓來表達,用每個橢圓的質心、長短軸之比、長軸的方向合家整個身體的質心高度等29個特征參數來描述人體側影圖像,再和模板匹配進行步態識別。和桿狀模型相比模糊了人體著裝對側影圖像的影響,但又因此損失了對人體上肢運動的描述。
鑒于上述2D模型的局限性,有人采用了分層結構模型對人體運動進行分析;還有人則通過2D人體數據擬合3D人體運動模型,從而獲取,分析運動參數。
結構化特征方法通過建立模型,描述人在運動時整個身體各個部位的運動,更易于捕捉變化的信息,因為運動的序列性、規律性,還能根據之前的運動估算后面的運動。但該類方法對步態序列的清晰度的要求度高,而且對動態信息的計算量較大。
3.2非結構化特征方法
非結構化特征方法是從步態序列中提取基于人體輪廓、形狀所產生的各種統計時空模式特征。鑒于結構化特征方法處理動態步態信息時的計算量大,較耗時的特點,它旨在通過提取人體輪廓,處理靜態信息從而分析步態信息,它的特點是計算量小、便于實時計算,但對于背景和光照信號比較敏感,而且一旦場景中出現遮擋現象,識別率便會下降。最常用的一種方法是采集人體輪廓,用組成輪廓的點到中心之間的連線的信息變化來表達步態特征;又有人基于這種一維步態信號上應用小波包變換來提取步態特征,增強魯棒性;有人嘗試僅用輪廓的寬度描述人體形狀特征,但因人的步態是動態信息,僅用輪廓信息太少,對步態信息描述不充分,步態提取的過程中會丟失一部分有用的信息,所以他們經實驗發現,要將輪廓信息和整個側影圖像結合起來提取步態特征,才能取得比較好的效果。
最近,又出現了一些新的非結構表征算法。通過兩個不同人體運動圖片相對位置的變動,把圖片轉化成自相似圖,能量圖,步態流圖等,再算兩個圖之間的差。這個方法沒有結構化特征準確,但勝在計算量小,且比直接用兩個圖片計算更準確。
3.3融合特征方法
融合特征方法是將人類多種特征融合起來進行識別,一般有將不同的步態特征進行融合和將步態特征和其他生物特征進行融合兩種。
在不同的特征融合中,有多種靜態特征和動態特征相結合的方法,在特征結合間有不同的權重,給判斷兩步態相似度貢獻率更大的賦更高的權重,貢獻率低的賦低的權重,最后通過實驗找到最優的特征融合方法。融合之后的步態特征比任何單一步態特征的識別率更高,但效率可能會降低。
4步態識別
4.1KNN分類算法
kNN分類算法(k-Nearest Neighbor),或稱K最近鄰分類算法,是一種監督學習算法,是基于實例的學習方法中最基本、最簡單的方法之一。K最近鄰,顧名思義就是k個距離最近的鄰居的意思。其算法大致為:已知一些訓練數據,當一個新數據進入的時候,就跟訓練數據里的每個點求距離,找到k個和這個點距離最近的數據,如果這個實例的K個最相似的實例(即特征空間中距離最近的點)中的大多數屬于某一個類別,則這個實例也屬于這個類別。
KNN算法簡單,易于實現,只需輸入數據而無需訓練,結果依據k個對象得出而不是單一對象,這些都是它的優勢,它多被應用于多分類問題。然而KNN算法需要存儲大量訓練數據,在存儲效率上是低效的,且它的準確性很大程度上依賴于k值的選取,不同的k值對結果有很大影響,想要選取一個較為合適的k值只有前期反復試驗調整。而且圖像的明暗度、圖像上的遮擋等都會使得距離計算出現很大的偏差從而導致錯誤的判斷,這些都是KNN算法的缺陷。
4.2線性分類算法
鑒于KNN算法存儲效率低及計算時間長等缺陷,我們需要另一種算法——線性分類算法。線性分類器由評分函數和損失函數組成,它通過特征的線性組合來進行分類,在優化過程中,將通過不斷變更評分函數的參數,從而使損失函數值達到最小。評分函數是一種簡單的線性映射,通常表達為:
f(xi,W,b)=Wxi+b
其中f為函數,x為變量,W,b是函數的參數,W通常叫作權重,b通常叫作偏差。
我們的目的是通過學習輸入的訓練數據,得到合適的參數W,b,使得每個訓練數據計算出來的分類情況和訓練集中圖像數據的真實值相符。
損失函數計算的是通過給定參數的評分函數計算得到的分數與數據真實值不相符的程度,以此來定量表現當前參數的好壞,當損失函數值高的時候不相符程度大,此時需要根據不相符程度適當調整參數值,從而通過不斷調整參數權重W和偏差b來找到最好的參數。
與KNN算法相比,線性分類器在得到參數后只需保留參數即可,不再需要存儲訓練數據,大大節省了空間和效率,所以線性分類算法也可算作是KNN算法的高效應用。
4.3CNN算法
卷積神經網絡(Convolutional Neural Networks),又稱CNN算法,是一類包含卷積或相關計算且具有深度結構的前饋神經網絡模型,是計算機深度學習的重要代表算法之一。卷積神經網絡仿造生物的視知覺機制構建,局部感知,類似于生物在看東西時會將目光聚集在很小的一塊區域,在卷積神經網絡中,每個節點只連接到符合卷積核的圖像像素點上,使全連接變成局部連接,相比于普通的多層感知器的節點連接到一個圖像的每個像素點上,大大減少需要訓練的權值參數數量。
權值共享網絡結構能夠進一步減少權值參數數量,當不同的圖像或者同一張圖像出現相同的特征時可以共用一個卷積核,減少重復的卷積核,從而進一步減少權值參數,加快運算速度。
卷積神經網絡具有傳統神經網絡的較好容錯性、自適應性和較強自學習能力等優點,同時又具有可以自動提取特征、具有良好的容錯能力、可處理高維數據等優勢,是一種較為良好的算法,現已大量應用于計算機視覺領域。
4.4步態識別的商業應用
近年來步態識別被逐漸投入商業應用。2017年中國科學院自動化所對外介紹了對步態識別的商業應用,50米內,只需要被測試者走兩步路,幾秒鐘的時間,無需被測試者特意配合即可識別出被測試者的身份。北京的初創團隊銀河水滴推出了全球首款步態識別成熟產品——步態檢索智能一體機“水滴神鑒”,為公安部門偵查破案、鎖定追蹤嫌疑人提供了巨大幫助。另外,步態識別也在被逐步應用于生物醫學康復領域,將步態識別系統加入截肢病人的假肢中,使之與人類的健康腿的功能、相似度進一步提高,形成真正的智能化假肢。目前各類科創團隊正在致力于將硬件和軟件結合,將技術融入產業,步態識別技術商用化正在逐漸落實。
5總結
步態識別算法包括KNN算法、線性分類算法和基于卷積神經網絡的深度學習算法,目前商用效果最好的是將這些算法相融合。步態識別有很大的應用前景,也有很大的商業市場,但同時也面臨很大的挑戰,例如如何在人群密集出解決人群遮擋問題、在季節著裝變化大時如何準確識別以及智能傳感設備對步態識別的影響,這些都需要我們進一步探索和改進。
參考文獻
[1]王修暉,嚴珂.基于連續密度隱馬爾可夫模型的人體步態識別[J].模式識別與人工智能,2016,29(08):709-716.
[2]余杰.基于視頻的人體目標跟蹤與識別技術研究[D].成都:電子科技大學,2016.
[3]盧官明,衣美佳.步態識別關鍵技術研究[J].計算機技術與發展,2015,25(07):100-106.
[4]王欣,唐俊,王年.基于雙層卷積神經網絡的步態識別算法[J].安徽大學學報(自然科學版),2015,39(01):32-36.
[5]馬玉良,馬云鵬,張啟忠,羅志增,楊家強.GA-BP神經網絡在下肢運動步態識別中的應用研究[J].傳感技術學報,2013,26(09):1183-1187.
[6]柴艷妹,夏天,韓文英,李海峰.步態識別研究進展[J].計算機科學,2012,39(06):10-15+46.
[7]余濤,鄒建華.基于Bayes規則與HMM相結合的步態識別方法研究[J].計算機學報,2012,35(02):2386-2396.
[8]王科俊,劉麗麗,賁晛燁,陳薇.基于步態能量圖像和2維主成分分析的步態識別方法[J].中國圖像圖形學報,2009,14(12):2503-2509.
[9]薛召軍,靳靜娜,明東,萬柏坤.步態識別研究現狀與進展[J].生物醫學工程學雜志,2008,(05):1217-1221.
[10]王科俊,侯本博.步態識別綜述[J].中國圖像圖形學報,2007,(07):1152-1160.
[11]趙黎麗,侯正信.步態識別問題的特點及研究現狀[J].中國圖像圖形學報,2006,(02):151-161.