姬瑞軍++王明月
摘 要:研究不同性別人群足底壓力分布對性別進行分析識別,利用足底壓力步態分析系統對20名男性和20名女性正常行走的足底壓力分布數據進行測量,提取足底各區壓強峰值特征,使用支持向量機對不同性別人群的足底壓強峰值進行訓練并進行驗證。結果表明:利用支持向量機對左足、右足及左右足的足底壓強峰值特征建立的數學模型對性別具有較好的分析識別能力,識別正確率在80%以上,為利用犯罪嫌疑人足跡所反映的步態特征分析性別提供了實驗依據。
關鍵詞:支持向量機 性別 足底壓強 識別
中圖分類號:TB391.4 文獻標識碼:A 文章編號:1672-3791(2017)08(c)-0248-03
足跡作為犯罪現場出現率較高的一類痕跡物證,在分析犯罪嫌疑人人身特點中發揮了重要作用。由于不同性別人群在身體結構和運動機能方面的差異從而導致其足跡中反映的步態特征具有各自的特點,從而為利用足跡分析犯罪嫌疑人性別提供了依據[1]。當前科研工作者除了利用傳統的足跡學理論對不同性別人群的步態特征進行了研究外,還使用大量足底壓力測量系統對不同性別人群行走留下的足底壓力分布進行了測量研究,并發現了不同性別人群行走留下足底壓力分布差異[2-5]。本文基于不同性別人群在身體結構、運動機能方面的差異,通過Footscan足底壓力步態分析系統采集不同性別人群的足底壓力分布數據,利用支持向量機進行訓練,并使用交叉驗證的方法對不同性別人群的足底壓力分布數據進行分析識別,為利用足跡分析性別提供實驗依據,豐富足跡學的理論基礎,為刑事案件偵查提供強有力的線索。
1 支持向量機的原理
支持向量機簡稱SVM,是90年代中期發展起來的基于統計學理論的一種機器學習方法,通過尋求結構化風險最小來提高學習機泛化能力,實現經驗風險和置信范圍的最小化,從而達到在統計樣本量較少的情況下,亦能獲得良好統計規律的目的。
支持向量機分為線性可分支持向量機、線性不可分支持向量機和非線性支持向量機。在不同性別人群足底壓力的分析識別中,足底壓力特征與性別之間存在比較復雜的非線性映射關系,在此本文主要詳細介紹非線性支持向量機的問題。對于線性不可分情況,SVM的主要思想是將輸入向量映射到一個高維的特征向量空間,并在該特征空間中構造最優分類超平面。
假設有訓練樣本集(xi,yi),(i =1,2,…,l),x∈Rn,y∈{ ±1}是類別標號,超平面方程為:
g(x) =ωxi+b =0 (1)
在約束條件上加入一個非負的松弛變量ξi,這時最大間隔超平面成為廣義最優分類超平面,對應的優化問題轉變為:
min1/2(ω·ω) +C∑ξi
s.t yi(ω·xi +b) ≥1 -ξi,其中ξi ≥0,i =1,…,n (2)
式中,ω∈Rn是超平面的法向量,b是閾值,ξi是引入的松弛變量,C>0是懲罰因子。采用拉格朗日乘子方法和技巧,進而求得優化問題(2)的對偶規劃為:
max∑ai1/2∑∑aiajyiyjK(xixj)
s.t∑aiyi=0,0≤ai≤C,i=1,…,n (3)
式中,ai是拉格朗日乘子,K(xi,xj)是滿足Mercer條件的核函數。SVM的決策函數可以表示為:
f(x)=sgn[aiK(xi,xj)+b]
式中,sgn表示二值函數,值為{-1,+1}。
2 應用實例
2.1 實驗對象
選取體態勻稱,年齡在22~26歲,無足部疾病史,行走運動正常的受試對象40名,其中男性20名、女性20名。
2.2 實驗方法
本實驗儀器采用比利時RSscan公司研發的Footscan足底壓力步態分析系統,在受試對象完全熟悉實驗環境和實驗過程后,讓受試對象赤足正常行走狀態下走過足底壓力步態分析系統2m長,0.4m寬的測試平板,從而獲得至少一個左足一個右足的足底壓力圖像和相關足底壓力分布數據,以此讓每名受試對象重復行走3次有效數據并記錄性別。
2.3 數據處理
為了對不同性別人的足底壓力進行分析識別,利用Footscan足底壓力步態分析系統對采集的足底壓力分布圖像進行自動分區,將足底分為第1趾區(T1)、第2-5趾區(T2-5)、第1跖區(M1)、第2跖區(M2)、第3跖區(M3)、第4跖區(M4)、第5跖區(M5)、足弓區(MF)、跟內側區(HM)、跟外側區(HL)等10個區域(見圖1),并將每個人3次的左右足底各區峰值壓強數據導出求平均后輸入到SPSS Modeler 15.0軟件中建立左足、右足和左右足的SVM模型并驗證。
2.4 構建和驗證SVM模型
將Footscan足底壓力步態分析系統對采集的足底壓強數據導出并將其導入SPSS Modeler15.0軟件,選擇“字段選項”選項卡中的“類型”節點,設定性別為目標變量,其他變量為輸入變量,然后利用“字段”選項卡中的“分區”節點將數據集按照7∶3的比例分為訓練集和測試集,最后將“模型”選項卡中的SVM節點放置到流編輯區域,并進行參數設定。設定停止標準為10-5,懲罰因子為8,松弛變量ε為0.1,核函數選擇RBF核函數,在構建并驗證左足和右足SVM模型時設置RBF伽馬為0.4,在構建并驗證左右足SVM模型時設置RBF伽馬為0.2,最終構建并驗證左足、右足及左右足的SVM模型。
2.5 結果與分析
表1是將左足足底10個區域足底壓強峰值組成10維特征向量,性別作為分類變量輸入SPSS Modeler軟件進行建模分析識別的結果。由表1可知,左足訓練集識別正確的百分比為90%,測試集識別正確的百分比為80%,綜合訓練集與測試集識別正確的百分比為87.5%。可見左足足底各區壓強峰值組成的10維的特征向量所建立的SVM模型具有較好的分析識別能力,可以為利用左足足底壓強峰值分析識別性別提供參考。endprint
表2是將右足足底10個區域足底壓強峰值組成10維特征向量,性別作為分析變量輸入SPSS Modeler軟件進行建模分析識別的結果。由表2可知,右足訓練集識別正確的百分比為83.3%,測試集識別正確的百分比為80%,綜合訓練集與測試集識別正確的百分比為82.5%。可見右足足底各區壓強峰值組成的10維的特征向量所建立的SVM模型的分析識別能力與左足一樣,識別正確的百分比均較高,可以為利用右足足底壓強峰值分析識別性別提供參考。
表3是將左足和右足足底20個區域足底壓強峰值組成20維特征向量,性別作為分析變量輸入SPSS Modeler15.0軟件進行建模分析識別的結果。由表3可知,左足和右足組成的訓練集識別正確的百分比為93.3%,測試集識別正確的百分比為80%,綜合訓練集和測試集識別正確的百分比為90%。可見左足和右足足底各區壓強峰值組成的20維的特征向量所建立的SVM模型對性別的分析識別能力得到明顯的提高,說明左足與右足足底壓強峰值的組合特征更加體現了不同性別群體在足底壓強峰值方面的差異。
3 結論
本文通過Footscan足底壓力步態分析系統采集20名男性和20名女性足底壓力分布數據,使用SPSS Modeler軟件應用支持向量機對40名受試對象的足底壓強峰值進行建模并對性別進行分析識別,經過實例可知,支持向量機可以應用于不同性別人群的分析識別,并且在利用單足、雙足足底壓強峰值識別不同性別人群時,均具有較好的識別正確率,識別正確率均可達到80%以上。支持向量機在不同性別人群足底壓力分析識別中的應用為利用犯罪嫌疑人足跡所反映的步態特征分析性別提供了實驗依據,也從側面論證了利用犯罪嫌疑人足跡所反映的步態特征分析性別的科學性。同時,更加有價值的論證有待增大實驗樣本進行進一步的實驗研究,進而提高分析識別性別的正確率,為利用足跡分析性別提供更有力的理論支持。
參考文獻
[1] 史力民.足跡學[M].北京:中國人民公安大學出版社, 2007.
[2] 張思亮.中國正常成人足底壓力參數值范圍、分布特點及其影響因素的探討[D].廣州:中山大學,2008.
[3] 趙麗.性別與BMI對中學生足底壓力的影響[J].廊坊師范學院學報,2016,16(4):87-90.
[4] 袁剛.正常人足底壓力分布及其影響因素分析[J].中華物理醫學與康復雜志,2004,26(3):156-159.
[5] 張騰丹.青年大學生行走步態足底區域壓力特征變化的研究[J].遼寧警察學院學報,2016(1):85-91.
[6] 張莉.支持向量機在高考成績預測分析中的應用[J].中國科學技術大學學報,2017,47(1):1-9.
[7] 郝文寧.數據分析與數據挖掘實驗指導書[M].北京:國防工業出版社,2016.endprint