郭洪玲,權養科,陶克明
(公安部物證鑒定中心,北京 100038)
泥土是最常見卻又容易被忽略的物質。在一些犯罪過程中,現場的泥土可能會轉移到罪犯身上或作案工具上。利用泥土的某些特殊性判斷泥土的來源,為偵破案件提供方向、線索;通過現場泥土與嫌疑人身上泥土的比對檢驗,證實嫌疑人是否到過犯罪現場,通過現場泥土與被害人身上附著泥土的比對,尋找、判斷第一現場等,泥土物證在案件偵破工作中有時會發揮非常重要的作用。泥土物證的檢驗方法很多,包括顏色檢驗[1]、礦物檢驗[2]、元素分析[3-5]等。其中元素分析法是最為常用的方法。在很多案件中,由于提取到的泥土樣品量少,進行顏色和礦物檢驗有時無法給出好的檢驗結果,而元素分析法不僅適用于大量樣品的分析也可用來分析附著的少量泥土。X射線熒光光譜法(XRF)分析泥土物證有其獨到的優點。但是XRF分析會產生大量、復雜的定量數據,要完成對這些數據的統計處理,僅靠簡單、直觀的比較是無法完成的。對數據的準確處理和合理解釋是提高鑒定水平的一個重要標志,也是提高物證利用價值,挖掘潛藏有用信息的一個重要方面。而這些工作必須借助于專用的數據統計分析軟件。本文利用XRF分析從北京郊區10個區縣、遼寧沈陽、安徽泗縣、四川瀘州、山東威海和廣西南寧提取的225泥土樣品,利用社會科學統計軟件(Statistical Product and Service Solution,SPSS)對分析數據進行歐氏距離計算,確定不同空間距離樣品間差異的歐氏距離的閾值,并通過主成分分析法對這些泥土樣品進行歸類,為未知泥土樣品的來源推斷提供方法。

圖1 部分省市、北京郊區泥土樣品提取點分布圖

圖2 每塊耕地取樣的分布圖
分別在遼寧沈陽、安徽泗縣、四川瀘州、山東威海、廣西南寧(圖1中★標識地點)及北京順義、大興、昌平、房山、通州、懷柔、密云、平谷、延慶、門頭溝10個區縣提取樣品。選一塊面積大于1萬平方米的耕地,在對角線上東北角(編號X.1)、東南角(X.2)、西北角(編號X.3)、西南角(編號X.4)和中心(編號X.5)點取樣(如圖2所示)。在北京郊區取樣較為系統,分別在不同區縣的東(編號1)、南(編號2)、西(編號3)、北(編號4)四個方向按照圖2所示同樣的方法提取泥土樣品,如從延慶北方提取的樣品分別編號為延慶4.1~延慶4.5,依此類推。該實驗共提取到泥土樣品225個。
X射線熒光光譜儀,日本理學公司(Rigaku)ZSX100e型波長色散X射線熒光光譜儀,Rh靶,4KW光管。
1.3.1 XRF定量分析
將收集的泥土樣品在室溫下進行干燥,然后進行研磨。取粒度小于120目的部分4.0g,在20MPa的壓力下壓片1min成型,用于XRF元素定量分析。該實驗利用國家泥土標準物質(GBW(E)070041-6)標準樣品建立外標標準曲線,分析各樣品 中SiO2、Al2O3、Fe2O3、MgO、CaO、Na2O、K2O、TiO2、MnO、Zn 10種元素的含量(其中Zn元素的單位為μg/g,其他元素單位為百分含量)。
1.3.2 SPSS軟件分析
SPSS是Statistical Package for the Social Sciences的縮寫,是世界上應用最廣泛的專業統計軟件之一,目前全球約有25萬家SPSS軟件的用戶。2000年,SPSS公司正式更名為Statistical Product and Service Solution,意為“統計產品與服務解決方案”。在國際學術界有條不成文的規定,即在國際學術交流中,凡是用SPSS軟件完成的計算和統計分析,是不必說明算法的,由此可見其影響之大和信譽之高。
距離分析是對觀測量之間或變量之間相似或不相似程度的一種測量[6]。歐氏距離是距離分析中最常見的一種,是一種不相似性的測度,非常適合于微量物證中兩個檢材之間的比對檢驗。距離值越小越相似,距離越大差別也越大。
主成分分析(Principle Components Analysis,PCA)是將多個實測變量轉換為少數幾個不相關的綜合指標的多元統計分析方法,即降維的一種方法。通過降維后的綜合指標(即主成分)進行物證分類更加簡便。
通過XRF分析,得到225個泥土樣品中SiO2、Al2O3、Fe2O3、MgO、CaO、Na2O、K2O、TiO2、MnO、Zn 10種元素的定量分析數據。由于數據量巨大,各元素之間又彼此相關,因此,這些龐雜的數據只有通過多參數統計方法進行分析,才能挖掘數據潛藏的有用信息。本文主要對數據進行歐氏距離分析和主成分分析。
根據樣品在空間上的遠近程度,我們將收集到的泥土樣品分為四個距離層次。第一層次為如圖2所示的同一塊耕地內某一點如A點處提取的到泥土樣品;第二層次為同一塊耕地內不同取樣點之間泥土樣品(如A點與B點、A點與C點之間的泥土);第三層次為同一區縣內不同耕地內提取到的泥土樣品(如從北京順義的東、南、西、北四個方向選取的耕地內提取的泥土樣品);第四層次為在不同省市內提取的泥土樣品(如從北京的順義區與廣西南寧提取的樣品)。對這些泥土樣品的XRF分析數據進行歐氏距離計算,從理論上講,上述四個層次的歐氏距離值應該是逐級增大的。
歐氏距離的計算公式D=[∑(Xi1-Xi2)2]1/2
D—第1個和第2個樣品的距離;
Xi1—第1個樣品的某一參數i上的取值;
Xi2—第2個樣品在該參數上的取值;
n—參數個數。
由于歐氏距離值的大小受到參數的量綱的影響,因此,要想對歐氏距離值進行相互間比較,必須保證所用的參數個數以及每個參數的量綱都相同,才能進行比較。為了能使歐氏距離分析結果有可比較性,因此,在進行歐氏距離分析之前,將各元素的含量標準化到z得分。將原始變量按照以下公式轉換成新的標準化z值(z_x)。
首先對第一層次的樣品間差異進行計算。分別取從北京延慶和密云兩個區縣的耕地內提取到的第一層次泥土樣品各10個(分別編號為-1~-10),利用SPSS分析軟件對XRF分析數據進行歐氏距離分析,結果如表1~2。
由表1、2中歐氏距離數據可以看出,第一層次泥土樣品之間的XRF分析結果的歐氏距離D1小于0.05。用同樣的方法,對收集到的第二距離層次的泥土樣品的XRF數據進行歐氏距離分析,得到大量歐氏距離數據,通過對這些距離值的統計,第二層次泥土樣品之間的XRF分析數據的歐氏距離D2分布在0.2~2之間,這個差別在排除了分析儀器帶來的差異外,主要是泥土樣品本身的不均勻性導致的差異。相對于同一樣品的歐氏距離分析臨界值0.05要大很多,幾乎是5倍以上。因此,確定第二距離層次的泥土樣品的XRF數據的歐氏距離臨界值為2。
以歐氏距離2作為判斷兩個泥土樣品是否可以區分的依據。用同一塊耕地內提取的5個泥土樣品的分析數據的平均值代表該區縣泥土樣品的XRF分析數據,對從北京不同區縣提取的泥土樣品(第三層次)的XRF分析數據進行歐氏距離分析,結果見表3。

表1 第一層次泥土樣品間(延慶)XRF檢驗數據的歐氏距離分析結果

表2 第一層次泥土樣品間(密云)XRF檢驗數據的歐氏距離分析結果

表3 第三層次泥土樣品之間的XRF檢驗數據的歐氏距離分析結果
第三層次泥土樣品XRF分析數據的歐氏距離值D3大多大于D2。同樣,計算第四層次泥土間歐氏距離值D4,結果見表4。

表4 第四層次泥土樣品之間的XRF檢驗數據的歐氏距離分析結果
第四層次泥土樣品的XRF檢驗結果的歐氏距離值差別很大。這主要取決于兩個地區的土質是否相同。如上表中南寧的泥土樣品與北京昌平、瀘州、沈陽的泥土樣品的XRF檢驗結果的歐氏距離值均大于6,而威海泥土樣品與泗縣、瀘州、沈陽的泥土樣品的歐氏距離值均在2左右,這個差別與第三層次的差別類似。這主要是由于廣西南寧的土屬脫硅富鋁風化紅壤,而威海、泗縣、瀘州、沈陽的泥土屬于黃棕壤,土壤種類不同造成元素的明顯差異。
SPSS軟件中有主成分分析的功能,利用該軟件可提取到特征值大于1的前m個主成分[7]。特征值在某種程度上可以被看成是表示主成分影響力度大小的指標。本文利用SPSS軟件中主成分分析對225個樣品的XRF檢測數據進行分析。首先要對各元素之間的相關性進行考察,考察這些數據是否具有通過主成分分析達到降維,簡化數據的可能性。表5是各元素間相關系數矩陣。
由表5中數據可知,Si、Al與Fe元素之間,Si、Fe與Ti元素之間的相關系數均在0.8以上,說明這幾個元素之間存在著很強的相關關系,證明他們存在信息上的重疊。因此,可將這些數據進行主成分分析,提取到代表總體數據信息的少數幾個主成分。
通過對225個泥土樣品的XRF數據進行主成分分析,共提取到3個主成分,這三個主成分對原始數據的解釋率已達到82.38%,也就是說用這三個主成分是可以基本反映全部指標的信息,所以用這三個變量來代替原來的十個變量,大大簡化了數據。

表5 各元素間相關系數矩陣
通過計算得到主成分中每個指標所對應的系數。將對應的系數乘以標準化的數據,就得到如下三個主成分表達式。
f1=-0.3569WSi+0.4066WAl+0.4345WFe-0.285WMg-0.1929WCa-0.255WNa-0.3125WK+0.4152WTi+0.2499WMn+0.05WZn
f2=-0.3506WSi+0.1398WAl+0.1349WFe+0.4488WMg+0.3181WCa+0.3771WNa+0.3328WK+0.1121WTi+0.3277WMn+0.4045WZn
f3=-0.0943WSi+0.1309WAl-0.0200WFe-0.1453WMg-0.6387WCa+0.04554WNa+0.3042WK-0.0943WTi-0.1943WMn+0.6284WZn
按照上面三個表達式,分別計算每一個樣品的三個主成分值f1、f2、f3,利用三個主成分值做3D散點圖,如圖3。

圖3 泥土樣品主成分分析圖
由圖3可以看出,從不同地區提取的泥土樣品按照主成分都能夠聚成一類。由于土壤種類不同,廣西南寧泥土與其他泥土在主成分分析圖上差異非常明顯,這一點與歐氏距離分析結果完全吻合。從其他泥土樣品的歸類結果看,采樣位置近的泥土樣品能更好的歸為一類。對于土壤類型比較接近的樣品,如北京門頭溝提取的樣品與沈陽提取的樣品有部分重疊,在分類上有些交叉。因此,利用主成分分析法可對樣品進行大體分類,可對未知樣品進行地源推斷。
本文利用XRF法分析了采自不同地源的泥土樣品,確定了進行泥土樣品比對檢驗的歐氏距離臨界值,通過臨界值可對比對樣品之間的差別提供量化判別依據。此外,通過主成分分析,可對泥土樣品進行較為準確的歸類,為未知泥土樣品地源推斷提供依據。
[1]Ritsuko S,Yoshiteru M.Validity of color examination for forensic soil identification[J].Forensic Science International,1996,(83):201-210.
[2]R.S.T.Manhaes,L.T.Auler.et.al.characterization using Xray diffraction,photoacoustic spectroscopy and electron paramagnetic resonance[J].Applied Clay Science,2002,(21):303.
[3]Sterckman T,Douay F,Fourrier H,et al.Trace elements in soils developed in sedimentary materials from Norhtern France[J].Geoderma,2006,(121):912-929.
[4]Yoshihiro H.A possible approach to soil discrimination using X-ray fluorescence analysis[J].Journal of Forensic Sciences,1994,39(6):1381-1392.
[5]Pye K,Blott SJ,Wray D S.Elemental analysis of soil samples for forensic purposes by inductively coupled plasma spectrometry-precision considerations[J].Forensic Science International,2006,(160):178-192.
[6]杜一平,潘鐵英,張玉蘭.化學計量學應用[M].北京:化學工業出版社,2008,25-31.
[7]張文霖.主成分分析在SPSS中的操作應用[J].市場研究,2005,(12):31-34.