杜明坤 王茜儀 朱瑞



摘要:為減少利用足跡人工計算身高的誤差,提高身高分析的效率和準確性,探索利用赤足跡多個長寬特征和BP神經網絡自動分析身高的新方法。通過測量赤足跡獲得多個長寬測量值,將多個測量值及其不同組合作為特征向量,以人的身高作為訓練樣本和測試樣本的標簽,并利用BP神經網絡進行訓練和分類,實現對身高的自動分析。實驗結果表明,該方法可以有效對身高進行自動分析,比傳統方法具有更高的準確率,為利用完整赤足跡甚至殘缺赤足跡分析身高提供了新思路。
關鍵詞:赤足跡;BP神經網絡;長寬特征;身高;自動分析
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2019)31-0203-03
1引言
在實際工作中,通常根據現場勘查提取的足跡推算身高,以提供偵查線索,縮小偵查范圍,對案件的偵破具有重要作用。傳統分析身高的公式是“身高=赤足跡長×7”,其操作簡單易于計算,然而其推算身高的誤差較大,且赤足跡全長的系數過大,在測量其長度時,稍有誤差就可能導致推測的身高與實際身高相差較大。本文對赤足跡各長寬特征進行研究,對其進行測量獲得多個長寬測量值,將相應的測量值組合成不同的特征向量,再根據設置的誤差值將身高等分為多個區間,對每個區間進行賦值作為不同類別的標識,利用BP神級網絡對訓練樣本特征向量和其相應的類別標識進行訓練,得到身高分類器,通過分類器對測試樣本特征向量進行分類,推算其相應的身高,并比較不同特征向量在設置不同誤差值時的準確率,為利用完整赤足跡甚至殘缺赤足跡分析身高提供了更有效的新方法。
2特征提取
根據赤足跡的形態結構特點,本文主要利用赤足跡的多個長寬值來進行特征提取,獲得不同的特征向量,并用測量人的身高作為相應特征向量的初始標簽。測量的身高值由頭頂部與地板的垂直距離確定(在弗蘭克福水平面上頭的最高點),同時用于測量的赤足跡樣本通過油墨捺印獲取,即讓占有油墨的赤足通過行走將赤足跡遺留在紙張上。
2.1測量長寬值
在測量多個長寬值之前,需要先標記出赤足跡的多個特征點:跖內緣最突點;跖外緣最突點;跟內緣最突點;跟外緣最突點;跟后緣最突點;最長趾前緣最突點;第二趾中心點。在此基礎上確定足跡中心線,然后測量相應的長寬值。
如圖1所示,A點為跖內緣最突點,B點為跖外緣最突點,c點為跟內緣最突點,D點為跟外緣最突點,E點為跟后緣最突點,F點為最長趾前緣最突點,G點為第二趾中心點,H點為過F點作EG延長線的垂線的交點,I點為EG延長線與第二趾前緣的交點,J點為EG與足趾前緣的交點,其中足跡中心線為E和G兩點的連線。每個赤足跡的長寬特征需要測量以下4個值:AB
3BP神經網絡
BP(Back Propagation)神經網絡是Rumelhart、Williams、Hin-ton和McCelland等人的科學小組于1986年提出的概念,是一種按照誤差反向傳播算法訓練的多層前饋神級網絡,是一種有監督的導師指導的學習方法。BP神經網絡模型主要由三層組成,分別為輸入層、隱含層和輸出層,隱含層可為一層或者多層,每層網絡都由多個能夠進行并行計算的神經元構成,其網絡結構如圖2所示。
BP神級網絡的學習過程由信號的正向傳播和誤差的反向傳播兩個過程組成M,如圖2所示,實線表示信號的正向傳播,虛線表示誤差的反向傳播。
其中Ei為第i個訓練樣本的誤差,tji為第i個樣本的第j個輸出層神經元的的期望輸出。在正向傳播過程中,預設e為期望誤差精度,當符合全局誤差E≤e時,則終止當前運算,否則進行誤差反向傳播過程。
誤差反向傳播誤差是指通過正向傳播得到的實際輸出與期望輸出之間的差值由輸出層輸入,經過隱含層變換,最后傳到輸入層,在這一過程中,網絡的連接權值不斷被調節修正。為使誤差逐漸縮小,需要沿連接權值的負梯度方向進行修正,隱含層和輸出層的連接權值修正量△Mjt與誤差的負梯度方向成正比,如公式(4)所示。
BP神經網絡算法也可以說是對誤差函數求極小值的算法,在正反兩個過程反復運算中,不斷調整修正每層的連接權值和閾值,并比較全局誤差E與期望誤差精度e的大小,當滿足全局誤差E≤e時,則訓練完成,并保存相應的權值和閾值,否則繼續進行迭代訓練。
4基于赤足跡長寬特征的身高自動分析方法
在身高自動分析方法中,本文有效利用赤足跡的多個長寬特征信息,提取樣本不同的特征向量,再通過預設的誤差值將身高等分為多個區間,對每個區間進行賦值作為不同類別的標簽,根據每個樣本的身高所對應的身高區間為其賦值新的類別標簽數據,最后結合BP神經網絡算法對樣本進行訓練和分類,以提高身高分析準確率。
對于w個樣本(xi,yi),將其按照一定的比例劃分成訓練樣本集P和測試樣本集Q,分別記為(pxi,Pyi)和(Qxi,Qyi)。利用BP神經網絡在訓練樣本集P上進行訓練,獲得分類器,再將分類器在測試樣本集Q上進行分類測試,獲得身高分析的識別結果,具體步驟如下:
(1)構建初始網絡,將各個連接權值、閾值、期望誤差精度和學習率進行初始化,并對訓練樣本集進行歸一化處理,使其轉化為直接用于計算的訓練樣本數據和期望輸出。
(2)將標準化后的訓練樣本輸入BP神經網絡,通過各層神經元進行正向傳播運算,得到網絡的實際輸出。
(3)根據網絡運算的實際輸出與給定的期望輸出計算得到網絡誤差,然后對網絡誤差是否滿足期望誤差精度的要求進行判斷,如果滿足要求執行(5);否則執行(4)。
(4)進行反向傳播運算,計算出每層各個神經元的連接權值修正量和每層神經元的閾值修正量,然后對相應的連接權值和閾值進行修正,再返回(2)。
(5)訓練完成,得到分類器。
(6)對測試樣本集進行歸一化處理,利用分類器對其進行測試,得到輸出結果,再對輸出結果進行反歸一化,得到身高分析結果。
5實驗結果與分析
為檢驗本方法的有效性,將不同特征向量結合BP神經網絡算法與傳統分析身高方法“身高=赤足跡長×7”在身高誤差=1△1=1分析身高-實際身高1≤ri時分別進行比對分析。按照訓練樣本數量與測試樣本數量比值為8:1的原則,在樣本集中隨機選取訓練樣本和測試樣本,進行多次實驗取均值作為實驗結果。
由表1可以看出,用特征向量結合BP神經網絡的方法均比傳統方法分析身高精確度更高。在身高誤差小于1cm時,利用赤足長(X1)+BP神經網絡分析身高的準確率最高(33.4%),傳統方法僅為8.3%。在身高誤差小于2cm時,利用赤足長和足跖寬(X6)+BP神經網絡分析身高的準確率最高(49.5%),其次為赤足長(X1)+BP神經網絡的方法(48.5%),傳統方法僅為15.6%。在身高誤差小于3cm時,利用赤足長和足跖寬(X6)+BP神經網絡分析身高的準確率最高(65.4%),其次為赤足長(X1)+BP神經網絡的方法(64.5%),傳統方法僅為24.4%。在身高誤差小于4cm時,利用赤足長(X1)+BP神經網絡的方法分析身高的準確率最高(71.8%),傳統方法僅為38.3%。在身高誤差小于5cm時,利用赤足長(X1)+BP神經網絡的方法分析身高的準確率最高(83.2%),傳統方法僅為44.9%。在各個誤差范圍內,本文方法均比傳統方法表現出了更高的分析準確率,在身高誤差分別小于1cm、4cm和5cm時,利用赤足長(X1)+BP神經網絡分析身高的準確率最高;在身高誤差分別小于2cm和3cm時,利用赤足長和足跖寬(X6)+BP神經網絡分析身高的準確率最高,其次為赤足長(X1)+BP神經網絡的方法。
對于殘缺赤足跡,在無法測量赤足足跡全長時,可根據本文方法采用赤足跡局部部位的長寬測量值提取特征向量,然后結合BP神經網絡進行分析。例如,當赤足跡缺少足跟部位時,可以采用第二趾長和足跖寬(X8)+BP神經網絡的方法;當赤足跡缺少足趾部位時,可以采用足跖寬和足跟寬(X8)+BP神經網絡的方法。不論采用何種特征組合的特征向量,其分析準確率在不同身高誤差范圍內均高于傳統方法,表現出較好的分析性能。
6結論
本文提出了一種基于赤足跡長寬特征的身高自動分析方法,根據赤足跡各長寬測量值與身高存在關聯的特點,利用赤足足跡全長、第二趾長、足跖寬和足跟寬的測量值提取不同的特征向量,然后通過預設的誤差值將身高等分為多個區間,為每個樣本重新賦值新的類別標簽數據,再結合BP神經網絡算法對樣本進行訓練和分類,實現身高的自動分析。實驗結果表明,本文方法在選擇赤足長(X1)或赤足長和足跖寬(X6)特征向量時,其分析性能最好,且不管利用何種特征向量均比傳統方法的分析準確率高得多,同時為利用殘缺赤足跡分析身高提供了新方法。