王 東,張建功,湯澄清
(中國刑事警察學院,遼寧 沈陽 110854)
足跡是犯罪現場出現率和提取率都比較高的痕跡物證[1],是進行人身同一認定的重要證據之一,在物證技術與偵查破案中具有不可替代的作用和意義。因此,通過選取足跡進行性別分析更具有統計學意義的特征,針對犯罪現場遺留足跡的性別進行研究是非常必要的。
在相關方面研究中,Jaydip Sen 等[2]使用足部指數(Foot Index)作為性別預測特征,提出了針對北孟加拉邦人群預測性別的方法,結合足長、足寬,使用多元回歸模型取得了最高84%的性別預測準確率。Jubilant Kwame Abledu 等[3]嘗試驗證足跡特征在加納人群中性別預測的可靠性,提出了采用足跡長度特征進行性別預測的方法,從足跡中提取7 個長度特征,包括每個腳趾前點到后跟中點長度、足跖寬度和足跟寬度,使用判別函數分析,性別預測準確率為69.8%~80.3%。姬瑞軍等[4]使用足跡長、足跡掌寬和足跡跟寬作為性別預測特征,通過Logistic 線性回歸建立左足、右足的性別預測模型,分別取得了左足88.8%和右足90.0%的預測準確率。
本文將成年人腳型性別差異應用在足跡檢驗領域,選取足跡的第一跖足長、第五跖足長、內足弓長、外足弓長、足弓輪廓內凹最深點垂直足跟長、足跖寬以及足跟寬共7 個幾何特征,利用多元統計分析方法,通過SPSS 軟件建立Fisher 判別函數模型,從量化特征方面入手解決公安領域足跡分析性別的難題。
本實驗隨機選取中國刑事警察學院的400 名本科生,年齡在18~22 歲之間,其中男性和女性各200 名,所有參與者均無足部病史。
參與者清潔雙腳后,使用最小的壓力將足底踩在油墨墊上,然后將沾有油墨的腳轉移到平坦A4紙上,直立且雙腳稍微分開,分別收集左足、右足清晰的油墨捺印足跡。
2.1.1 選取足跡特征
洪友廉等[5]采用三維視頻解析和人工測量的方法,測量人體腳型共25 個指標,從能反映出足跡特征的長度變量上來看,結果顯示男性和女性在內足背長、外足背長、足寬和后跟寬方面有明顯的性別差異。李育奇等[6]利用三維足型掃描儀采集足弓數據,結果指出,不同性別在足弓長、足弓輪廓內凹位置、足弓高、舟狀骨位置比例有顯著差異。根據以上腳型性別差異研究,結合足跡檢驗技術,本文選取出足跡上用于分析性別的7 個幾何特征:第一跖足長FL1、第五跖足長FL2、足弓輪廓內凹最深點垂直足跟長FL3、內足弓長AL1、外足弓長AL2、足跖寬FB 以及足跟寬FHB。
2.1.2 測量足跡特征
結合Krishan[7]和史力民等[8]的方法,確定足跡中心線和垂直于足跡中心線的后跟切線為測量基線。采用傳統方法對實驗捺印的赤足油墨足跡進行測量,為了便于統計分析,規定左足幾何特征測量值 以LFL1、LFL2、LFL3、LAL1、LAL2、LFB、LFHB 命名,同理右足幾何特征測量值以RFL1、RFL2、RFL3、RAL1、RAL2、RFB、RFHB 命名。足跡特征測量方式見圖1。將所有數據輸入到Excel表格中,方便后期對數據進行處理。

圖1 足跡特征測量
本實驗使用SPSS 25.0 軟件進行分析。使用配對樣本T 檢驗比較左足、右足足跡特征間是否存在顯著性差異,是否需要建立左足、右足不同的性別預測函數;再通過組平均值同等檢驗,考察特征對判別模型的貢獻程度;考慮Person 相關性,檢驗變量特征間是否存在多重共線性;用Fisher 判別分析建立判別函數模型,最后采用自身驗證法對樣本數據進行檢驗,考察判別函數模型的性別預測能力。
判別分析(Discriminant Analysis,DA)又稱分辨法,是在分類確定的條件下,根據某一研究對象的各種特征值判別其類型歸屬問題的一種多變量統計方法。在農業、醫學以及金融問題中有著廣泛的應用。
Fisher 判別分析是對數據降維處理的一種判別分析方法。核心思想是將N 維空間中的點投影到低維空間中,在低維空間中設法找出一個最合適的投影方向,使得在該方向上樣本的投影能盡量分開,同類樣本盡可能地緊湊,異類樣本盡可能地分散,Fisher 判別分析原理示意見圖2。

圖2 Fisher 判別分析原理示意圖
為了比較左足、右足間變量是否存在顯著性差異,是否需要分別建立左足、右足性別判別函數,需要對14 個測量值分成7 組進行配對樣本T 檢驗。表1 為配對樣本T 檢驗結果。由表1 可知,在第一跖足長FL1、內足弓長AL1 和足跖寬FB 上,男性和女性均是左足更大;而在第五跖足長FL2 和足弓輪廓內凹最深點垂直足跟長FL3 上,無論男性還是女性均是右足更大;但是在外足弓長AL2 上,男性的左足比右足更小,而女性的右足比左足更小;相反的,在足跟寬FHB 上,男性的左足比右足更大,而女性的右足比左足更大。在顯著性水平α=0.05的水平上,在男性中,FL1、FL2、AL2、FB 在左足、右足上有顯著差異,而其他測量值差異均不顯著;在女性中,FL2、RFHB 在左足、右足上有顯著差異,其他測量值P 值均大于0.05 并不顯著。因此,不需要分別建立用于性別預測的左足、右足的Fisher 判別函數模型,以下分析結果均以右足特征為例進行說明。

表1 配對樣品T 檢驗結果
為了實現對未知樣本的預測,在構建Fisher 判別模型前,使用組平均值同等檢驗,考察變量對判別模型的貢獻程度。顯著性(Sig)和威爾克Lambda(Wilks’Lambda)是評價分組變量的標準。如果Sig 值較小(Sig<0.05),則表明組間差異較為顯著;如果Sig 值較大(Sig>0.05),則表示組間差異不顯著。組內平方和與總平方和的比值為威爾克Lambda,其值的范圍在0~1 之間,值越小,表示組內有很大差異;值接近1,表示沒有組內差異。
表2 為變量間組平均值的同等檢驗。

表2 變量間組平均值的同等檢驗
從表2 中可以看出,7 個變量的威爾克Lambda值在0.33~0.75 之間,表示這些變量組內差異很大,對判別模型影響顯著;顯著性(Sig)值均為0,也可以表明這些變量對判別模型影響的顯著性極高,通過這些變量能很好地解釋各樣本的分類。因此,使用這些變量來構建的Fisher 判別模型能更準確地預測未知樣本的性別。
嚴格意義上來說,當相關性系數大于0.8,就表明變量間存在多重共線性,而多重共線性會對Fisher 判別分析產生一定的影響。
表3 為變量間的相關性。從表3 中可以看到,在變量間第一跖足長FL1 與第五跖足長FL2 和內足弓長AL1 的相關性系數為0.934 和0.924,第五跖足長FL2 與內足弓長AL1 和外足弓長AL2 的相關性系數為0.860 和0.866,可以認為變量FL1 與FL2和AL1 之間、FL2 與AL1 和AL2 之間均存在多重共線性。其余變量之間的相關性系數均小于0.8,因此其他變量間不存在多重共線性。

表3 變量間的相關性
本文研究目的在于通過Fisher 判別分析建立函數模型來預測未知樣本性別,最終在于判別模型的預測能力高低。雖然多重共線性導致系數估計方差變大,但是預測能力不會降低,且相關性系數并沒有達到完全相關(即相關性系數等于1),因此可以使用上述7 個幾何特征作為變量來構建Fisher 判別模型。
3.4.1 典則判別函數
表4 為典則判別函數系數。

表4 變量間的相關性
從表4 的典則判別函數系數可知,典則判別函數為
表5 和表6 是典則判別函數摘要,從中可知,典則判別函數Y1的特征值為2.608,典型相關系數為0.85,特征值分析中方差百分比為100%,表明該函數能完全解釋已知樣本的性別信息。威爾克Lambda 值為0.277,顯著性(Sig)值為0 小于0.05,可以推斷出該判別函數具有統計學意義,可以顯著區分樣本的性別。

表5 典則判別函數特征值

表6 典則判別函數顯著性檢驗結果
表7 為男性和女性的組質心坐標,男性的組質心坐標為1.611,女性的組質心坐標為-1.611。通過典則判別函數預測樣本性別時,將樣本數據輸入典則判別函數中,得到的函數坐標離男性的組質心坐標更近,表示樣本的性別為男性;同理,離女性的組質心坐標更近,表示樣本的性別為女性。

表7 男性和女性的組質心坐標
3.4.2 Fisher 線性判別函數
不同于典則判別函數需要代入樣本數據求出樣本坐標后比較與兩質心間的距離來預測性別,Fisher 線性判別函數針對各類別都有一個函數,進行判別時將樣本數據輸入到各個函數模型中,比較函數值大小,樣本的類別對應函數值最大的判別函數。表8 為Fisher 線性判別函數系數。

表8 Fisher 線性判別函數系數
由表8 可知,男性的Fisher 線性判別函數為
女性的Fisher 線性判別函數為
將樣本數據中對應的特征變量輸入到兩個函數模型中,比較函數值大小,如果男性的函數值更大,說明樣本的性別為男性;反之,樣本的性別就是女性。
采用自身驗證法,對Fisher 線性判別函數進行檢驗,考察其判別效果,最終的性別預測正確率為92.3%。判別分析結果見表9。

表9 判別分析結果單位:名
本研究結合了腳型性別差異相關方面的研究,從幾何特征的角度入手,選取了第一跖足長FL1、第五跖足長FL2、足弓輪廓內凹最深點垂直足跟長FL3、內足弓長AL1、外足弓長AL2、足跖寬FB 以及足跟寬FHB 共7 個在性別分析上具有統計學意義的特征。采用Fisher 判別分析,建立了一種通過函數預測性別的方法。
本實驗結果中,性別預測準確率達到90%以上,與傳統利用足跡進行性別分析相比較,在一定程度上提高了足跡預測性別的準確性。將其他跟足型、足跡有關的研究與足跡檢驗領域相結合,豐富了利用足跡進行性別預測的方法。在辦案實踐中,可以根據現場足跡,利用上述建立的Fisher 判別模型來預測犯罪嫌疑人的性別,為技術偵查辦案提供幫助。