付鈞澤,姜 紅*,李 意,滿 吉
(1.中國人民公安大學 偵查學院,北京 100038;2.北京華儀宏盛技術有限公司,北京 100024)
隨著煙民數量逐年增多,煙草消耗量越來越大,香煙的種類日益增多[1],在各類案件現場經常能提取到香煙煙灰物證。通過對提取到的煙灰物證進行檢驗,運用多元統計方法建立分析模型,可以對香煙煙灰物證進行快速識別[2]。香煙物證是法庭科學研究的重點問題,筆者已對香煙水松紙做過系統地研究[3-4]。MA等人[5]利用原子吸收法測定了卷煙煙灰中金屬元素,提出了先進行灰化再微波消解的干濕結合前處理方法。CUI等人[6]采用電感耦合等離子體質譜法(inductively coupled plasma mass sprctrometry,ICP-MS)對香煙中的微量元素進行了準確測定。PéREZBERNAL等人[7]利用電感耦合等離子體原子發射光譜法研究了14種微量元素在不同品牌香煙煙灰中的分布情況。HAN[8]利用激光誘導擊穿光譜技術測量了煙草和煙灰中一些金屬元素的含量。ZHAO等人[9]利用X射線衍射法對28種國產香煙煙灰中礦物成分進行了研究。GARG等人[10]采用中子活化分析法對香煙煙灰中微量元素進行了檢驗。WU等人[11]利用掃描電鏡/能譜法對25個不同的香煙煙灰樣品進行了分析,結果表明同一品牌不同檔次、同一廠家不同品牌的香煙灰樣品中的元素種類和相對百分含量存在明顯差異。上述方法中,有的儀器設備價格昂貴,樣品制備復雜,最佳操作條件遴選過程周期較長、靈敏度較低。而X射線熒光光譜法具有分析時間短、分析元素廣、工作曲線線性范圍寬、對檢材無損且光譜干擾少等優點,被廣泛應用于冶金、化工等行業[12-16]。
本實驗中采用手持式能量色散型X射線熒光光譜儀對收集到的83個不同品牌、同一品牌不同系列的香煙煙灰樣品進行檢驗,結合系統聚類的方法對樣品準確分類,并通過回歸分析及判別分析法驗證其準確性。取得了良好的實驗效果,可為案件現場香煙煙灰物證快檢提供借鑒。
OXFORD X-MET7500型熒光光譜儀(OXFORD公司);Poly-MHP透射膜、樣品盒;Rh為陽極靶,電壓為40kV,電流為50mA,測試時間為90s。
不同品牌、同一品牌不同系列的香煙煙灰樣本83個,見表1。

Table 1 Sample table of cigarette ash

continue
將收集到的煙灰樣品裝入樣品盒內,用Poly-MHP透射膜將裝有煙灰的樣品盒上端封住,在上述實驗條件下進行檢測。借助SPSS24.0軟件,Zscore 標準化處理數據[17]。利用數理統計方法,對樣品進行分析。
按照相似性將物理或抽象對象分類,各個類別由類似對象組成,這一過程稱為聚類。聚類分析是按照一定的相似性對樣品分類后,通過分析發現全局數據的分布模式及樣品之間的相互關系[18]。現將樣品數據進行標準化處理,然后采用Ward法作為類間親疏程度的度量方法,平方歐氏距離作為個體間距離的計算方式。樣品經過聚類分析后的分類結果見圖1。

Fig.1 Dendrogram of cluster results
如圖1所示,為了不使樣品分類類別過多,同時達到聚類分析的目的,取重新標定距離為5,所有樣品被分為4類(見表2)。

Table 2 Classification results of tobacco ash samples
為了考察聚類結果的準確性,借助多元線性回歸分析考察聚類結果分成的不同類別與各個元素變量之間的相互依賴的關系。回歸分析是研究變量之間相關關系的一種統計方法,運用十分廣泛,這種技術通常用于預測分析[19]。回歸模型的相關參量方差分析結果見表3。回歸模型的分析結果見表4。殘差直方圖見圖2。標準化殘差預期累積概率-累積目標概率圖見圖3。

Table 3 Analysis of variance results

Table 4 Model summary
由表3可知,回歸模型的顯著性水平為0.000(預測變量:常數、鉛、鐵、鈷、鉀、鈦、鋯、鋅、銅、鈣、汞、錳、鋇、銣、鍶),其顯著性概率遠遠小于0.01,故說明該模型內各個元素變量對類別變量的影響達到顯著性水平。

Fig.2 Histogram of residuals

Fig.3 Expected cumulative probability-cumulative probability of observation of standardized residual
R2代表著模型參量對因變量的解釋能力,不同模型可以直接用R2來判斷模型精確度的高低,其值越接近1,說明回歸直線對于觀測值的擬合效果越好。由表4可知,該回歸模型的調整后R=0.793,擬合度較好(預測變量同表3)。Durbin-Watson統計量的值為2.010,與臨界值(d=2)十分接近,在無自相關性的值域之中,認定殘差獨立,通過檢驗。說明變量之間基本沒有自相關性,各個元素變量的獨立性較好[20]。
由圖2可知,標準化殘差直方圖呈一個倒扣的鐘形,左右兩側基本對稱。由圖3可知,標準化殘差的預期累積概率-累積目標概率圖中散點大部分靠近斜線,綜合而言,殘差符合正態分布。根據以上殘差獨立性檢驗和殘差正態性檢驗的結果,認為數據基本滿足線性回歸要求,所建立的模型可按照擬合質量進行預測,即通過2.1節中聚類分析得到的樣品類別與各元素之間可建立良好的擬合關系,說明聚類結果較為準確。
判別分析是一種判斷個體所屬類別的統計分析手段[21-22],是根據已知對象的某些觀測值和其所屬類別來判斷未知對象所屬類別,因此可將判別分析與聚類分析相結合,建立判別模型對聚類分析結果進行檢驗。將2.1節中聚類分析的結果作為已知類別,對樣品聚類結果進行逐步判別分析,根據判別函數計算得出相對應的得分, 樣品最終劃入得分最高的類中[23-24]。4個類別Wilk的Lambda檢驗判別結果見表5。

Table 5 Wilks Lambda result
由表5可知,軟件在判別過程中建立了3個判別函數,函數1、2、3的顯著性水平均小于0.05,說明3個判別函數顯著成立,采用這3個函數得到的判別結果較好,判別函數的特征值見表6。

Table 6 Eigenvalue of discriminant function
表6中的方差百分比反映了典型函數所能解釋的方差變異程度(*表示分析中使用了前3種典型的判別函數),由函數1的方差百分比值為76.0%,函數2的方差百分比值為17.7%,函數3的方差百分比為6.3%,函數1所能解釋的信息遠遠比函數2及函數3多。所以選取函數1作為區分樣品的主要判別依據。函數1與函數2之間典型相關性系數分別為0.961和0.860,表示樣品在函數1和函數2這兩個維度上具有顯著差異。故選擇函數1和函數2作為函數判別軸建立聯合分布圖,結果見圖4。

Fig.4 Joint distribution of discriminant functions
由圖4可知,1代表第Ⅰ類樣品,2代表第Ⅱ類樣品,3代表第Ⅲ類樣品,4代表第Ⅳ類樣品。這4類樣品在函數1、函數2的判別軸上區分明顯。由于函數1是區分樣品的主要依據,在函數1的維度上,4類樣本之間的差異性顯著,同一類的樣品均落在了同一區域。利用Fisher判別函數進行回判,樣品回判正確率為100%,表明該判別模型對樣品的區分效果顯著。結果見表7。

Table 7 Sample back judgment output table
第Ⅰ類樣品的線性判別函數是:
Y1=-24.019-4.080X1+1.949X2+1.869X3+
4.030X4-6.936X5+1.422X6-0.246X7+
2.423X8+8.208X9-12.735X10-4.689X11-
1.304X12-6.957X13-8.006X14
(1)
第Ⅱ類樣品線性判別函數是:
Y2=-28.162+1.769X1-2.951X2-5.120X3-
5.183X4+12.992X5-1.291X6-2.038X7-
3.221X8-4.050X9+12.648X10+8.530X11+
1.592X12+1.760X13+0.106X14
(2)
第Ⅲ類樣品線性判別函數是:
Y3=-4.974+0.185X1+1.956X2+2.897X3+
0.348X4-3.235X5+0.961X6-0.348X7+
0.297X8+0.347X9-3.112X10-3.673X11-
1.666X12+0.935X13-0.415X14
(3)
第Ⅳ類樣品線性判別函數是:
Y4=-3.180+0.711X1-0.840X2-0.830X3-
0.307X4+0.927X5-0.568X6+0.588X7-
0.204X8-1.652X9+2.517X10+1.314X11+
0.785X12+1.174X13+2.344X14
(4)
(1)式~(4)式中的Y1~Y4分別為判別函數的因變量,X1~X14分別為判別函數的自變量。
表7顯示,100.0%的初始樣品被正確分類,利用判別模型預測的樣品類別與實際樣品類別完全一致,若要檢驗其它未知樣品的分類,只需將樣品元素含量輸入各變量中,就能直接在聯合分布圖上找到與之距離最近的分組質心,進而完成對未知樣品的準確分類。
本實驗中利用X射線熒光光譜儀建立了一種鑒別香煙煙灰成分的方法,能夠對香煙煙灰樣品進行快速無損檢測。首先根據X射線熒光光譜數據對樣品進行定性半定量分析初步歸類,而后利用SPSS軟件,采用Ward法對樣品進行更為科學的聚類, 實現了對香煙煙灰樣品的種屬劃分。最后使用回歸分析和判別分析對聚類結果進行評價,從而發現各元素與聚類分析產生的類別具有很強的擬合關系,再借助判別分析確定各類樣品之間質心完全分離開來,判別情況良好,印證了系統聚類結果是準確可靠的。同時建立了判別函數模型,借助Fisher函數進行回判,得出的分類結果其歸類正確率為100%。利用該方法對現場提取到的未知香煙煙灰物證,可通過該判別模型進行快速分類,從而提高煙灰物證的檢驗效率,為偵查提供幫助。