吳秋香,李志豪,王 迪,孫堂強,杜振霞*,鄒積鑫*
(1.北京化工大學 化學學院,北京 100029;2.公安部物證鑒定中心,北京 100038;3.蘇州微木智能系統有限公司,江蘇 蘇州 215000;4.新鄉醫學院 藥學院,河南 新鄉 453003)
紙張作為假幣、文件等多種物證的核心載體,在案件偵破中十分重要。基于假幣用紙的特征,發現不同地點和不同時間的假幣之間的關系,有助于快速找到紙張源頭、串并案和擴線深挖,因此紙張分析技術成為反假幣技術新的突破口。目前許多技術已被用于紙張檢測,如顯微鏡檢查方法可用于識別紙張纖維類型[1],X射線衍射儀可測量紙張的結晶參數[2-3],掃描電子顯微鏡和X射線熒光可對紙張進行元素分析[4-6]。但以上方法所使用的儀器通常較為大型且貴重,不適于現場破案使用。
不同假幣所用紙張的配方不同,且許多用于紙張的化學分析方法會產生大量數據,因此結合化學計量學分析假幣用紙的小分子有機物特征,有助于發現不同案件假幣用紙的特征。Kumar等[7]采用衰減全反射紅外光譜技術結合主成分分析對24種品牌紙進行鑒別,準確率達到99.64%。Guo等[5]采用X射線熒光結合化學計量學將13起案件中查獲的21張假幣用紙分為3組,將9起案件成功聯系在一起。
離子遷移譜(Ion mobility spectrometry,IMS)是基于不同的氣相離子在電場中遷移速度的差異對化學物質進行表征的一項分析技術,其儀器具有便于攜帶、可靠性高、成本低廉、操作簡單、快速靈敏等優點,適用于現場快速分析和檢測[8]。最常用的離子遷移譜儀器配有的63Ni電離源具有放射性,且電子能量低、成本昂貴,應用受到限制。電暈放電(Corona discharge,CD)電離源通過調節直流電流進行放電,放電穩定,產生的總離子電流較63Ni源高一個數量級,可用于多種化合物的電離。目前已廣泛應用于司法鑒定[9-10]、食品安全[11-13]、環境監測[14-16]、生物醫學[17-18]、化學毒劑[19]等諸多領域。
本文基于電暈放電電離-離子遷移譜技術(CD-IMS)對公安部門收集的假幣用紙進行檢測,構建了假幣用紙的指紋譜圖庫,并結合主成分分析(PCA)和層次聚類分析(HCA)對遷移譜信息進行分類研究,為假幣的串并及溯源提供了一種現場微損檢測的新方法。
TR2000-DC離子遷移譜(中國同方威視公司);Agilent 7697A頂空儀器、Agilent 8890氣相色譜儀、Agilent 7010B質譜儀(美國安捷倫公司);GP225D電子天平(德國Sartorius公司)。
鄰苯二甲酸二丁酯(>99%,中國阿拉丁公司)。
本文用于測試的20種假幣用紙(依次編號1~20)和6種未知來源的半成品假幣(依次編號X1~X6)均由公安部門提供。所有樣本均密封儲存在室溫13~26℃,濕度30%~60%的環境中。
1.2.1 檢測條件的優化IMS的參數設置會影響檢測結果,因此對解吸器溫度、遷移管溫度、遷移氣流速和載氣流速等參數進行了優化。
解吸器溫度影響假幣用紙中小分子的解吸附程度和響應,過低的解吸器溫度可能會導致假幣用紙中難揮發小分子不能解吸出來,因此本文選取120、150、180、210℃系列解吸器溫度進行優化;并分別選取120、150℃,0.6、0.8、1.0 L/min和0.6、0.7、0.8 L/min分別作為遷移管溫度、遷移氣流速和載氣流速進行參數優化。
1.2.2 樣品檢測在優化的IMS參數條件下,將裁剪后的假幣用紙直接插入IMS進樣口檢測,每種假幣用紙一式三份(依次編號1.1、1.2、1.3,…,20.1、20.2、20.3)。每次分析共連續記錄40條遷移譜,分析時間約8 s。壓力、空氣濕度等環境因素會造成物質的遷移時間發生偏移,因此在IMS檢測假幣用紙之前,選取氯胺酮(K0=1.376 cm2/(s·V))作為IMS內標物,用于對儀器遷移時間的實時校正。
因IMS不能直接對各個峰進行定性,為了鑒定引起假幣用紙分類的特征峰,采用頂空氣相色譜-質譜聯用法(HS-GC-MS)對假幣用紙中的揮發性成分進行鑒定。
1.3.1 樣品制備將假幣用紙裁剪為小方塊(1 mm×1 mm),精確稱取1.1 g假幣用紙樣品,置于20 mL頂空瓶中密封。
1.3.2 檢測條件頂空條件:平衡溫度:100℃;定量環溫度:115℃;傳輸線溫度:130℃;樣品平衡時間:30 min;加壓時間:0.1 min;進樣時間:0.5 min。
色譜條件:Agilent J&W HP-5色譜柱(30 m×0.25 mm,0.25 μm);載氣:He,恒流模式,流速1.0 mL/min;進樣口溫度:150℃;升溫程序:初始溫度50℃,保持2 min,以15℃/min升至260℃,保持5 min;分流比為5∶1。
質譜條件:采用EI電離源,電子能量:70 eV;離子源溫度:230℃;四極桿溫度:150℃;全掃描模式,質量采集范圍45~450m/z,溶劑延遲4 min。
樣本的IMS信息為儀器在8 s內連續檢測40條遷移譜的三維數據。考慮到儀器產生的脈沖峰以及反應離子峰(RIP)的影響,選擇在檢測到樣品信息的時間段進行數據預處理:從三維數據中截取遷移時間為8~17.5 ms(共951個變量)的數據信息,并將每個樣品采集到的40條遷移譜中的35條遷移譜(第6~40條)在同一遷移時間的響應值進行平均,將獲得的平均譜圖作為該樣品的指紋譜圖。本研究共60個樣本,可構成60×951數據矩陣,對該數據矩陣采用平均中心化(Ctr)、單位方差(UV)和帕累托標準(Par)3種方式進行預處理,并通過PCA和HCA對假幣用紙進行分類研究。數據的預處理和模型的建立均采用SIMCA 14.1軟件。
運用NIST質譜數據庫對HS-GC-MS檢測到的假幣用紙中的揮發性物質進行定性分析。
由于解吸器溫度、遷移管溫度、載氣流速和遷移氣流速參數的設定會對樣品出峰情況以及響應強度產生影響,因此為了獲得最佳檢測條件,本研究以14號假幣用紙的出峰情況及其響應強度作為依據進行優化。電暈針的電壓設置為2.2 kV,以保證產生穩定的電暈。考察了解吸器溫度在120~210℃范圍變化時的影響,發現溫度過高,樣品易發生分解,且存在電荷競爭,產生基質干擾;而溫度過低,紙張中的小分子不能完全解吸出來,因此選擇150℃為解吸器最優溫度條件。遷移管的溫度過低,空氣濕度、環境溫度將產生干擾;溫度過高,則會因離子擴散、碰撞損失導致信號減弱,最終選擇遷移管溫度為150℃。遷移氣流速過低,分析周期短,但分辨率較差;流速過高,會稀釋濃度,抵消電場力,可能導致無響應信號,最終載氣和遷移氣流速均設置為0.6 L/min。
在優化的IMS參數條件下采集的14號假幣用紙的離子遷移譜如圖1A所示,X軸表示離子的遷移時間,Y軸表示遷移譜的采集條數,Z軸表示峰的響應強度。IMS一次性可采集40條遷移譜,每條遷移譜共采集2 000個信號點,一次樣本的采集只需8 s。研究發現IMS的脈沖峰和RIP峰的位置在遷移時間為8 ms以內,而樣品的相關信息主要包含在遷移時間8~17.5 ms內。刪除無重要信息的片段有利于優化、精簡模型,因此在采集的IMS信息中主要選取了遷移時間為8~17.5 ms的數據。在采集的40條遷移譜中發現前5條遷移譜只有脈沖峰和RIP峰,因此從IMS數據中刪除了這5條遷移譜的信息。為了確保重現性,將其余35條遷移譜(第6~40條)在同一遷移時間的響應值進行平均作為該遷移時間下的響應強度。

圖1 14號假幣用紙的三維離子遷移譜(A)及其IMS指紋譜圖(B)Fig.1 3-Dimensional ion mobility spectra of No.14 paper sample(A)and its IMS spectrum(B)
綜上,將假幣用紙IMS數據平均化的具體步驟為:將第6~40條遷移譜中遷移時間為8~17.5 ms的951個信號響應強度進行平均,處理后得到的平均譜(1×951)被認為是來自每個假幣用紙的IMS指紋譜圖,如圖1B所示。
在優化的IMS參數條件下檢測獲得的20種假幣用紙(共60個樣本)的IMS原始數據經平均化數據處理后,得到的IMS指紋譜圖如圖2所示。從圖2可知,20種假幣用紙的IMS指紋譜圖在遷移時間為8~12 ms時所出峰位較為相似,主要區別為響應強度的差異;在遷移時間為12~17 ms時只有幾種假幣用紙有信號,說明這20種假幣用紙在一定程度上存在差異。由于不同種類假幣用紙的配方存在差異,從而導致其指紋譜圖具有各自特征,進一步證明IMS具有鑒別假幣用紙的潛力。

圖2 20種假幣用紙的IMS指紋譜圖Fig.2 IMS spectra of 20 paper samples
2.3.1 假幣用紙的主成分分析主成分分析是一種廣泛用于數據可視化和特征提取等的技術,可通過將多元數據投影到更小的空間,降低原始數據集的空間維度,且不影響樣本之間的關系。因此將IMS與PCA結合對假幣用紙進行區分,可將IMS高維數據降維到低維平面,從而方便觀測假幣用紙之間的相似與差異。
在進行主成分分析之前,首先選擇Ctr、UV和Par 3種方法對指紋譜圖數據進行預處理,Ctr是將原數據減去每列變量的均值,著重對變化范圍相差不大的數據進行分析;UV是將數據中心化后除以標準偏差;相對于UV而言,Par使用標準偏差的算術平方根而不是標準偏差。本研究中發現經Ctr預處理后PCA模型的擬合參數R2X和預測參數Q2均優于UV和Par。因此,在后續聚類分析前選擇Ctr進行數據預處理。
采用Ctr對20種假幣用紙(60個樣本)的IMS指紋譜圖數據進行預處理后,對數據矩陣60×951進行主成分分析,假幣用紙的IMS響應強度被定義為變量,假幣用紙樣品被定義為觀測值。將PCA模型通過交叉驗證法進行內部驗證,通過優化潛變量的數量,共提取17個主成分(PC,圖3A),其最大R2X和Q2值分別達1和0.998,表明前17個主成分能夠解釋原變量信息的100%,包含了所有樣品信息。R2X和Q2值均接近1,表明模型有很好的擬合能力和預測能力。為了證明該模型的觀測值可靠,繪制了Hoteling’s T2圖。從圖3B中可知,所有觀測值均在95%置信區間內,未發現異常值。

圖3 主成分累積貢獻率圖(A)及霍特林統計量(B)Fig.3 Overview plots of PCs through(A)and Hoteling’s T2(B)
從PCA得分圖(圖4A)中可以看出,PC1、PC2分別解釋了原變量信息的57.0%和23.1%,即前兩個主成分可解釋原變量信息的80.1%,因此選取PC1和PC2作為主成分進行分析。圖4A中同種假幣用紙的3個平行樣本均聚在一起,且不同種類假幣用紙顯示出分離的趨勢。
PCA載荷圖反映了變量對主成分的影響程度,結合PCA得分圖和載荷圖(圖4B)進行分析發現,遷移時間為8.43 ms的響應值對PC1和PC2均產生正向影響,說明7、8、9、12、13、14、15和16號假幣用紙在遷移時間為8.43 ms的響應值低于其他假幣用紙;相較于7、9、12、15、16號假幣用紙,8、13、14號假幣用紙在遷移時間為8.43 ms時的響應值更低。從圖4B中發現在遷移時間為11.67 ms的響應值對PC1有負向影響,而對PC2是正向影響,表明7、9、12、15、16號假幣用紙在遷移時間為11.67 ms的響應值高于其他假幣用紙。
IMS不能對各個峰進行直接定性,為了鑒定引起假幣用紙分類的特征峰,通過HS-GC-MS對假幣用紙揮發性成分進行檢測。將檢出物質的標準品用IMS檢測,通過對比出峰的遷移時間,發現鄰苯二甲酸二丁酯的遷移時間為11.67 ms,與引起假幣用紙分類的其中一個特征峰遷移時間一致,結合圖2可知該特征峰響應強度與鄰苯二甲酸二丁酯濃度有關。
2.3.2 假幣用紙的層次聚類分析當聚類很多且分類不太明顯時,PCA無法完全觀察到數據集中的分組。如圖4A所示,盡管不同種類的假幣用紙顯示出一些分離,但出現了部分重疊的現象,無法觀察到20種假幣用紙的準確分組。為了更好地將所有假幣用紙分類,引入HCA分類。

圖4 20種假幣用紙的得分圖(A)及PC1、PC2的線形載荷圖(B)Fig.4 Score plot of 20 paper samples(A)and loading lines plot of PC1 and PC2 through PCA(B)
采用與PCA相同的數據處理方式,以HCA對IMS數據進行處理。以歐氏距離作為相似度量,采用離差平方和法對假幣用紙進行分組,得到的樹狀圖如圖5所示。從圖5中發現,當歐氏距離為109時,可將假幣用紙分為20組,且同種假幣用紙的3個平行樣本聚在一起,20種假幣用紙均被正確歸類。結果表明IMS能反映不同種類假幣用紙的特征信息,結合HCA可將20種假幣用紙進行區分。

圖5 20種假幣用紙層次聚類分析的樹狀圖Fig.5 HCA dendogram of 20 paper samples
為了進一步驗證HCA分類的可靠性,以6個未知來源的半成品假幣(X1~X6)對HCA實際應用時的準確性進行驗證。
在優化的IMS條件下對半成品假幣的空白部分進行檢測,將獲取的6個樣品的IMS原始數據平均化處理后,與20種假幣用紙的數據共同構建HCA,得到的樹狀圖如圖6所示。從圖6中發現歐氏距離為109時,未知樣本X1、X3、X5、X6分別與4、8、19、13號假幣用紙歸為一類,X2和X4均被歸為7號假幣用紙。經確認,X1、X2、X3、X5、X6的實際來源與預測來源相同,正確率達到83.33%。而未歸類正確的X4不屬于20種假幣用紙中的任何一類。因此所建立的假幣用紙指紋譜圖庫需進一步擴大才能更好地識別更多種類未知來源的假幣用紙。以上研究結果證明IMS結合HCA具有判別未知來源假幣用紙的潛力。

圖6 20種假幣用紙和6種假幣用紙的HCA樹狀圖Fig.6 HCA dendogram of 20 paper samples and 6 counterfeit banknote paper
采用電暈放電電離-離子遷移譜儀對假幣用紙進行檢測,通過將IMS原始數據進行平均化處理,獲取假幣用紙的IMS指紋譜圖,并結合PCA和HCA對假幣用紙進行分類鑒別,得到了滿意的結果。方法快速且易操作,無需復雜的樣品前處理。研究結果證明IMS具有鑒別假幣用紙的潛力。