徐偉,穆小旭,郭威
(中國人民公安大學研究生院,北京102623)
在傳統足跡分析中關于行走姿勢只有通過觀察然后用語言敘述的形式對行走姿勢進行分類,例如:軀干前傾、正常或后仰;頭部的抬頭、平視和低頭等[1]。此類描述要求人們具有豐富的經驗和相關的專業知識,而對于沒有從事相關研究或專業的人在描述行走姿勢時,對行走姿勢的描述差別很大。因此,如果能對行走姿勢進行量化表示,通過數據的形式對不同的行走姿勢進行分類,再結合經驗對量化后的行走姿勢分類標準進行調整,制定出一個統一的分類標準,就能使大部分人對不同行走姿勢的分辨更加準確,讓傳統足跡的研究更加科學。目前對行走姿勢進行量化分類的研究很少,借助計算機技術對傳統足跡學進行研究,不僅豐富了相關的研究方法而且讓研究內容更加科學。
K-means聚類算法是聚類算法中的一種,將離散的數據點通過k個質心進行聚類,分成k簇相似性較小的數據點的集合[2]。采用歐氏距離作為相似性的評價指標,即兩個樣本之間距離越近其相似性就越大。K-means算法的具體步驟:預先設定k值并且將每個類的數據的中心作為初始質心;根據初始質心對所有數據點進行距離計算逐個歸類,將數據點歸為離它最近的聚類點,歸入新的數據點后更新此類的均值;通過劃分后的均值進行數次迭代達到最優分類效果[3-4]。
從生理學上來看,人體行走姿勢是在大腦中樞的調節下,調動身體各部位肌肉群相互配合,通過從年幼到成年的長期行走鍛煉,形成個體特有的行走習慣,這些行走習慣一旦形成就會很難改變,最終形成運動動力定型。所以人體行走時,身體各部位形成的行走姿勢具有一定的穩定性[5-6]。因此對具有相似行走姿勢的不同人,對相似姿勢所采集的人體角度數據會分布在相近范圍內,通過對角度數據進行分類,就會得到不同行走姿勢的分類標準。而K-means聚類算法的聚類核心就是通過對研究對象進行相似度計算,把性質相近的對象進行分類。因此使用K-means聚類算法對角度數據進行分類可以達到較好的數據分類效果。
借助海康威視的視頻采集儀對公安大學年齡段在18~20歲之間的共317名學生進行正常情況下側面和正面的行走姿勢進行錄制。側面錄制攝像頭和行走方向垂直即與圖像成90°,正面錄制攝像頭和行走方向在同一直線上。側面和正面的視頻同時對一趟行走視頻進行錄制。視頻錄制結束后,使用MATLAB對錄制的視頻進行分幀處理。
行走姿勢主要部分涉及身體軀干、頭部和兩臂。對于分幀后的側面圖片選取位于鏡頭視野中部,且左腿或右腿垂直支撐階段的一幀圖片,正面圖像則選取視頻中視野適中雙臂張開最大時的一幀圖片作為實驗數據圖片。
所選圖片用Photoshop軟件進行處理。側面照片用于生成頭部數據和軀干數據。身體軀干為人體側面髖關節到肩關節。由于實驗條件限制,所拍攝的視頻中人物衣物寬松,無法確定髖關節的位置。因此,選取人行走時的垂直支撐階段即支撐腿和軀干成一條直線的狀態為軀干,此時取水平線與腳跟到肩關節連線的夾角α作為軀干姿勢的數據。人體頭部側面取耳朵最高點與眼睛的連線與地面垂線的夾角β作為頭部姿勢的數據。人體行走正面圖取頭頂最高點垂線與最高點與其中一個手臂的夾角γ作為手臂姿勢數據。收集到軀干角度、頭部角度和兩臂角度數據。見圖1。

圖1
(1)采集317名學生的軀干、頭部和兩臂角度數據。
(2)選擇歐氏距離進行樣本數據計算得出距離矩陣進行聚類。距離公式
(3)通過觀察數據的散點圖,分析數據分布情況,并且用層次聚類來確定初始類別數。
(4)畫出聚類圖,展示分類效果。
(5)頭部數據、兩臂數據處理過程同步驟(1)-(4)。
做出角度數據的散點圖和層次聚類圖。散點圖的縱軸表示學生序號,橫軸表示角度數據,見圖2。層次聚類樹,見圖3。
在確定初始分類k值時,一種方法可以通過傳統足跡里對軀干、頭部和兩臂的分類來確定k值;另一種方法通過層次聚類法來確定初始k值。層次聚類通過相似度計算,即使用歐氏距離計算出樣本之間的距離矩陣,再用平均值算法計算出系統聚類樹[7-8]。層次聚類一般有兩種聚類方式,自下而上和自上而下。本文采用自下而上的方式進行。

表1 傳統足跡行走姿勢分類
傳統足跡分類中對軀干、頭部和兩臂的分類多種多樣,在此采用多數資料中統一采用的行走姿勢分類即軀干、頭部和兩臂的分類數均為3,見表1。使用層次聚類時,x軸表示樣本編號,縱軸表示層次樹高度,由于編號太多x軸上不予全部顯示。做與x軸平行的水平線,從上到下平移,與聚類樹相交,有幾個交點表明可以將數據分為幾類。由于類別可以有很多種選擇,因此可以根據自己需要選擇合適分類個數。由圖3可以看出可以將軀干分為3類,頭部分為2類或4類,兩臂分為3類較為合適。綜合以上兩種方法,將軀干初始設置為3,頭部設置為2或3,兩臂設置為3。其中通過多次實驗將頭部在初始k值設置為3時,可以達到很好分類效果,因此頭部聚類結果選取類別為3時作為展示。

圖2
經過K-means聚類運算,得出軀干、頭部和兩臂中三類各自的聚類結果以及聚類后的質心數據,見圖4。

圖3

表2 分類后質心角度數
通過對數據的分類結果分別確定軀干、頭部和兩臂的角度分類標準。見表3,表4,表5。

表3 軀干角度分類標準

表4 頭部角度分類標準

表5 兩臂角度分類標準
(1)軀干、頭部和兩臂的分類標準見表5。
(2)自然行走狀態下軀干正常時質心值為90.5°,此數值符合人體正常行走時軀干與地面垂直的行走狀態,軀干正常的角度分布范圍在88.4°≤α≤92.4°之間,在于正常行走狀態下身體不可避免的略微向前或向后擺動,符合人體行走正常狀態下的容差范圍。頭部平視時質心值為 87.1°,角度分布范圍為 78.4°≤β≤94.5°。正常情況下,平視時眼睛水平線應與地面成90°角。但是實際行走過程中,我們會注意前行路況,因此實驗質心值小于90°。雙臂前后擺動時質心值為8.1°,角度分布范圍為4.9°≤γ≤10.8°,質心值與范圍起點相差較大因為采集數據的學生來源為警校生,長期的訓練使他們在行走時雙臂自然向體前收縮,因此測量出的正常行走雙臂角度數據偏向體前擺動。
(3)對分類后所在類別的人數進行統計,得出自然行走狀態下軀干正常的人數為216人,頭部平視人數196人,兩臂前后擺動人數231人。數據顯示在317名
青年人中大部分人行走姿勢正常。前傾中有3人前傾程度大于正常值,一方面原因在于行走速度過快,另一方面由于自身身體習慣性佝背導致的測量數據異常。頭部仰頭和低頭數據未有大偏差。兩臂角度數據中有2人行走過程中顯示未擺臂,原因在于這兩名實驗對象日常行走兩臂擺動幅度較小,在運用Photoshop進行角度標注時,不能對小幅度擺動進行精確的角度測量。
(4)在運用Photoshop對圖像進行角度數據測量時,人工標點連線時存在選取點不準,同時角度數據特別敏感,容易造成大的測量誤差,影響分類標準的范圍確定。此類誤差可以通過對相同對象圖像進行多次的角度測量取其平均值來減小誤差。

圖4
本文通過對自然行走狀態下的人體各部位進行劃分,利用Photoshop軟件對各部位角度進行數據收集,使用傳統足跡中行走姿勢分類標準和層次聚類的方法確定初始k值,最后通過K-means聚類算法對角度數據進行聚類,得到了一種通過角度數據對行走姿勢進行分類的標準。此標準有助于我們將來對行走姿勢下包含的各類因素進行深入研究。由于實驗條件限制,采集實驗樣本人數小,年齡段集中在18~20歲之間,角度測量工具誤差大,且采集數據過程中實驗對象在視頻錄制下難以保持正常行走狀態,實驗結果無法適應所有年齡段行走姿勢分類標準,但是在對青年人行走姿勢研究方面還是具有相關參考價值。本文下一步將就從身高、性別、胖瘦和擴大樣本采集量等方面進行深入研究,并且優化聚類算法同時使用其他算法進行數據處理,以便得到更加科學的分類標準。
參考文獻:
[1]史力民.足跡學[M].中國人民公安大學出版社,2007.
[2]Hartigan JA,WongM A.Algorithm AS 136:AK-Means Clustering Algorithm[J].Applied Statistics,1979,28(1):100-108.
[3]李飛,薛彬,黃亞樓.初始中心優化的K-Means聚類算法[J].計算機科學,2002,29(7):94-96.
[4]Selim SZ,IsmailM A.K-Means-Type Algorithms:AGeneralized Convergence Theorem and Characterization of Local Optimality[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,1984,6(1):81-7.
[5]錢競光,宋雅偉,葉強,等.步行動作的生物力學原理及其步態分析[J].南京體育學院學報(自然科學版),2006,5(4):1-7.
[6]喬曉曉.人體行走運動與行走姿態的影響[J].產業與科技論壇,2016,15(5):63-64.
[7]吳帆,李石君.一種高效的層次聚類分析算法[J].計算機工程,2004,30(9):70-71.
[8]胡學鋼,王東波,吳共慶.一種基于層次樹的高效密度聚類算法[J].合肥工業大學學報:自然科學版,2008,31(2):187-190.