姬瑞軍,湯澄清,王明月
(中國刑事警察學院 遼寧沈陽 110035)
基于Logistic回歸模型的赤足跡的性別分析
姬瑞軍,湯澄清,王明月
(中國刑事警察學院 遼寧沈陽 110035)
目的:犯罪現場遺留足跡的性別。方法:選取足跡長、足跡掌寬和足跡跟寬特征作為自變量,性別作為因變量,建立左、右足logistic回歸模型。樣本:410名男女左、右赤足跡樣本(其中男性207名,女性203名),測量了足跡長、足跡掌寬和足跡跟寬等特征。結論:所獲取的模型對左足赤足跡的性別預測正確率為88.8%,對右足赤足跡的性別預測正確率為90.0%,均具有較高的性別預測準確率。在一定條件下,所建立的數學模型可以為現場勘驗人員對赤足跡的性別分析提供參考。
赤足跡;性別;足跡長;足跡掌寬;足跡跟寬;logistic回歸
近年來,隨著社會的發展,犯罪現象呈現出新的規律和特點,犯罪主體的新特點主要表現在女性犯罪的增多。在我國“文化大革命”以前,女性犯罪占犯罪總數的5%左右,20世紀70-80年代,占整個犯罪的6-7%,現在則達10-20%,數量直逼德國[1]。眾所周知,犯罪必然會留下痕跡,足跡又是犯罪現場的重要痕跡之一,隨著女性犯罪的比例增多,對犯罪現場遺留足跡的性別研究是非常必要的。本文結合我國足跡勘驗技術,選取赤足跡的足跡長、足跡掌寬和足跡跟寬作為變量,性別作為因變量,運用統計學的方法,建立logistic線性回歸模型,用量的方法對赤足跡進行性別分析。
(一)材料。
隨機選取身體健康,無殘疾,無足病史的207名成年男性和203名成年女性,分別收集每人左、右足清晰的靜態油墨捺印足跡樣本各一枚。其中,男性年齡在25±5歲,女性年齡在25±5歲。對獲取的赤足跡捺印樣本使用傳統的足跡測量方法[2]對足跡長、足跡掌寬、足跡跟寬進行測量。其中,足跡長是赤足跡沿足跡中心線方向上的最長距離;足跡掌寬是赤足跡掌內外側突點間的距離;足跡跟寬是赤足跡跟內、外側突點間的距離。為了便于實驗數據的處理,規定左足跡長、左足跡掌寬、左足跡跟寬、右足跡長、右足跡掌寬、右足跡跟寬分別記為LFL、LFB、LFHB、RFL、RFB、RFHB。
(二)方法。
將所獲取的數據輸入到SPSS 20.0軟件進行統計學分析。為了獲取男性和女性足跡中差異較明顯的變量,使用獨立樣本T檢驗比較變量在性別間是否存在顯著性差異。使用配對樣本T檢驗比較左、右足間的數據是否存在顯著性差異。對左、右足跡的足長、足掌寬和足跟寬進行兩兩相關性分析,從而防止變量間存在高度的共線性。最后,使用Wald統計量檢驗變量的顯著性并建立分析性別的logistic回歸模型。
(三)logistic回歸模型分析性別的原理。
Logistic回歸又稱邏輯回歸分析,用于處理因變量為定性變量的數據,常用于疾病和財務風險預測等領域。其計算原理如下:假設Y取值為0,1兩個值,Y=1的概率為P(Y=1),則m個自變量分別為X1,X2,,……,Xm所對應的logistic回歸模型為:或者寫為:式中:β0為截距;βi為Xi對應的偏回歸系數,也可理解為在控制了其他因素的條件下變量的預測能力。當P值大于0.5時,Y=1;當P值小于0.5時Y=0。基于logistic回歸模型的特點,可以建立性別(定性變量)作為因變量,足跡長、足跡掌寬和足跡跟寬作為自變量用于分析性別的logistic回歸模型。
表1分別給出了男性和女性關于左、右足的各項描述性統計量。由表1可知,男性的左足和右足的足跡長、足跡掌寬、足跡跟寬的均值均大于女性的相應值,這與我們日常認識男性足比女性腳大相一致。

表1 男女赤足跡左右足長、足掌寬和足跟寬的描述性統計量
(一)變量在性別間的差異性檢驗結果。
為了獲取男性和女性足跡中差異較明顯的變量,需對足跡長、足跡掌寬和足跡跟寬進行獨立樣本T檢驗。經過獨立樣本T檢驗,男性和女性的左足和右足的足跡長、足跡掌寬和足跡跟寬的P值均小于0.05(見表2),說明男性和女性的左足和右足的足跡長、足跡掌寬和足跡跟寬均存在顯著性差異,此結論與文獻[3][4]研究結論一致,從而可以將足跡長、足跡掌寬和足跡跟寬作為三個自變量用于構建分析性別的logistic回歸模型。

表2 變量在性別間的獨立樣本T檢驗結果
(二)變量在左右足間的差異性檢驗結果。
為了確定變量在左、右間是否存在顯著性差異,從而是否需要分別建立左、右足的logistic回歸模型,需要對男性和女性的左、右足相應數據進行配對樣本T檢驗。表3顯示了男性和女性的左、右足相應變量間的配對樣本T檢驗結果。由表3可知,在男性中,左足和右足的足跡長和足跡跟寬的P值均大于0.05,足跡掌寬的P值小于0.05,說明在男性中,左足和右足的足跡長和足跡跟寬不存在顯著性差異,而足跡掌寬存在顯著性差異;在女性中,左足和右足的足跡長和足跡跟寬的P值均小于0.05,足跡掌寬的P值大于0.05,說明在女性中,左足和右足的足跡長和足跡跟寬存在顯著性差異,而足跡掌寬不存在顯著性差異。這些變量雖然經過統計檢驗存在顯著異性,但是P值并不大,這些差異可能是由于男性和女性在左足和右足間的足底壓力分布的不同[5],進而對足部肌肉產生不同的擠壓,從而產生了略微顯著的統計差異。由于這些變量在左足和右足間的顯著性差異不同,所以分別建立用于分析性別的左足和右足的logistic回歸模型是必要的。

表3 變量在左右足間的配對樣本T檢驗結果
(三)變量間共線性診斷結果。
在建立logistic回歸模型前,需要考慮變量間的共線性問題。表4和表5給出了左足和右足的足跡長、足跡掌寬和足跡跟寬的相關性分析結果。由表4和表5可知,左足和右足的足跡長、足跡掌寬和足跡跟寬的Pearson相關性系數r均小于0.8,說明三變量間不存在高度的共線性,可以作為建立logistic回歸模型的三個獨立變量。

表4 左足變量間的相關性
在α=0.01水平(雙側)上。

表5 右足變量間的相關性
在α=0.01水平(雙側)上。
(四)logistic回歸模型的建立。
將男性和女性的左、右足的足跡長、足跡掌寬和足跡跟寬輸入SPSS軟件建立logistic回歸模型,采用向后Wald逐步剔除法確定最終模型。向后Wald逐步剔除法的計算過程是先將所有變量建立回歸模型,然后計算每個變量的Wald統計量值,對于不滿足顯著性水平的變量逐步從回歸模型中排除。經計算,SPSS軟件對左、右足分別建立一個logistic回歸模型(見表6,7)。

表6 左足logistic回歸模型
a.在步驟1中輸入的變量:LFL,LFB,LFHB;
b.在步驟2中輸入的變量:LFL,LFB。

表7 右足logistic回歸模型
a.在步驟1中輸入的變量:RFL,RFB,RFHB;
b.在步驟2中輸入的變量:RFL,RFB。
1.左足logistic回歸模型。由表6可知,步驟1所建立的左足回歸模型中變量LFHB的Wald檢驗的顯著性水平等于0.638大于0.05,說明在利用回歸模型對性別進行預測時,變量LFBH對性別預測的貢獻較小,即變量LFHB與性別關聯性較小,故將其排除獲得步驟2建立的左足回歸模型:

步驟2建立的回歸模型中變量的Wald檢驗的顯著性水平均小于0.05,說明在利用所建立的回歸模型對性別進行預測時,變量LFL、LFB對性別預測的貢獻較大,即變量LFL、LFB與性別的關聯性較大,可以有效預測和解釋性別。
將男性和女性左足的相應數據分別代入到以上步驟2建立的左足logistic回歸模型中進行預測,當P值大于0.5時預測為女性,當P值小于0.5時預測為男性。步驟2建立的左足logistic回歸模型預測結果見表8。

表8 左足步驟2回歸模型的預測結果
a.切割值為0.500。
由表6可知,步驟2建立的左足logistic回歸模型具有統計學意義,并且,由表8可知,步驟2建立的回歸模型對男性左足赤足跡預測正確的百分比為89.9%,對女性左足赤足預測正確的百分比為87.7%,對左足赤足跡性別預測正確的總百分比為88.8%。
2.右足logistic回歸模型。同理,由表7可知,步驟1所建立的右足回歸模型中變量RFHB的Wald檢驗的顯著性水平等于0.844大于0.05,說明在利用回歸模型對性別進行預測時,變量RFHB對性別預測的貢獻較小,即變量RFHB與性別關聯性較小,故將其排除獲得步驟2建立的右足回歸模型:

步驟2建立的回歸模型中變量的Wald檢驗的顯著性水平均小于0.05,說明在利用所建立的回歸模型對性別進行預測時,變量RFL、RFB對性別預測的貢獻較大,即變量RFL、RFB與性別存在關聯性較大,可以有效預測和解釋性別。
將男性和女性右足的相應數據分別代入到步驟2建立的右足logistic回歸模型中進行預測,當P值大于0.5時預測為女性,當P值小于0.5時預測為男性。步驟2建立的右足logistic回歸模型預測結果見表9。

表9 右足步驟2回歸模型的預測結果
a.切割值為0.500
由表7可知,步驟2建立的logistic回歸模型具有統計學意義,并且,由表9可知步驟2所建立的回歸模型對男性右足赤足跡預測正確的百分比為89.4%,對女性右足赤足跡預測正確的百分比為90.6%,對右足赤足跡性別預測正確的總百分比為90.0%。
本文通過提取男、女赤足跡中足長、足掌寬和足跟寬,用獨立樣本T檢驗比較了男性和女性在赤足跡中的足長、足掌寬和足跟寬的統計學差異,用配對樣本T檢驗比較了左足和右足在赤足跡中的足長、足掌寬和足跟寬的統計學差異,用Wald逐步剔除法分別建立了左、右足關于足跡長和足跡掌寬的logistic回歸模型。所建立的左、右足logistic回歸模型對樣本進行性別預測,預測正確的百分比分別為88.8%、90.0%,均具有較高的預測準確率,說明建立的logistic回歸模型擬合度較好,可以為現場勘驗人員對現場赤足跡的性別分析提供參考。同時,在辦案的實際工作中,現場勘驗人員在運用上述模型時,也應結合足型特征和案件的其他情況進一步提高對性別分析的準確率,從而為分析犯罪嫌疑人人身特點提供更有力的依據。
[1]尚金萍.女性犯罪增多的性別視角淺析[J].山西警官高等專科學校學報,2010,(3):18-21.
[2]史力民.足跡學[M].北京:中國人民公安大學出版社,2007.
[3]湯澄清.利用足跡足型特征分析性別的研究[J].山西警官高等專科學校學報,2009,(3):78-80.
[4]Jaydip Sen,等.Sex Estimation from Foot Dimensions in an Indigenous Indian Population[J].Forensic Sic,2011,56:S148-S153.
[5]張騰丹,等.青年大學生行走步態足底區域壓力特征變化的研究[J].遼寧警察學院學報,2016,1:85-91.
[6]榮泰生.SPSS與研究方法[M].大連:東北財經大學出版社,2012.
[7]郭志剛.社會統計分析方法[M].北京:中國人民大學出版社,2015.
[8]DM Fessler,等.Sexual dimorphism in foot length proportionate to stature[J].Taylor&Francis,2005,32(1):44-59.
[9]Jacqueline Domjanic,等.A Combined Morphometric Analysis of Foot Form and Its Association with Sex,Stature,and Body Mass[J].American Journal of Physical Anthropology,2015,157(4):582-291.
[10]Kewal Krishan,等.Sex Determination from Hand and Foot Dimensions in a North Indian Population[J].Forensic Sic,2011,56 (2):453-459.
[11]Naomi Hemy,等.Sex estimation using anthropometry of feet and footprints in a Western Australian population[J].Forensic SciInt,2013,231(2013):402e1-102e6.
Gender-analysis of Bare Footprints Based on Logistic Regression Model
JI Ruijun,TANG Cheng-qing,WANG Ming-yue
t:Objective:To investigate the gender of the footprints left at the crime scene.Methods:Select the footprint length,footprint width and footprint heel width as independent variables,and gender as the dependent variable,then establish the logistic regression model.Sample:Collected 410 men and women left and right bare footprint samples(male 207,female,203),and the characteristics of footprint length,footprint width and footprint are measured.Conclusion:The prediction’s accuracy of the model acquired by left bare footprints on gender was 88.8%,and the right footprints was 90.0%.Gender prediction has a higher accuracy.On certain conditions,the mathematical model can provide a reference for the crime scene examiner for gender analysis by bare footprints.
Bare footprint;Gender;Footprint Length;Footprint width;Footprint heel width;Logistic regression
D981.912
:A
:1674-5612(2017)01-0062-07
(責任編輯:吳良培)
2017-01-12
姬瑞軍,(1991-),男,河南鶴壁人,中國刑事警察學院碩士生,研究方向:痕跡檢驗學;湯澄清,(1969-),男,遼寧沈陽人,碩士,中國刑事警察學院教授,研究方向:痕跡檢驗學;王明月,(1993-),男,山東濱州人,中國刑事警察學院碩士生,研究方向:痕跡檢驗學。