張 平,張振宇,吳志生
(1.中國刑事警察學院 法化學系,遼寧 沈陽110035;2.北京中醫藥大學,北京100102)
鑒定科學Research Paper
近紅外光譜法鑒定簽字筆字跡形成時間的化學計量學模型的建立
張 平1,張振宇1,吳志生2
(1.中國刑事警察學院 法化學系,遼寧 沈陽110035;2.北京中醫藥大學,北京100102)
目的 隨著偽造文件犯罪的日益增多,常用的字跡形成時間鑒定方法難以做到快速、無損。采用近紅外光譜分析技術,結合化學計量學,以達到對簽字筆字跡形成時間進行準確、快速、無損分析的目的。方法 對40個黑色真彩簽字筆字跡樣本進行近紅外光譜數據采集,并運用相關模型進行預處理。建立字跡形成時間與近紅外光譜數據之間的多元分析模型,并用相對分析誤差 (RPD)來評價模型的預測能力。結果 應用多元散射校正(MSC)預處理方法所建模型最佳,其各項校正標準偏差與RPD均符合行業認定范圍,所建模型具有可行性。結論 近紅外光譜技術可對不同形成時間的黑色真彩簽字筆字跡進行準確定量分析,為字跡的形成時間的鑒定提供了一種綜合性參考方法。
近紅外光譜;字跡形成時間;偏最小二乘法
簽字筆最早起源于1984年日本櫻花株式會社研制開發的Ballsigll產品和1988年日本Pentel株式會社推出的Hybird新產品[1],20世紀90年代由中國廣東引進技術并開始大量生產。簽字筆墨水成分主要由溶劑、著色劑、表面活性劑和其他添加劑等組成。由于書寫順暢、色澤鮮艷、不易褪色等特點,簽字筆已成為人們日常生活中最常用的書寫工具。隨著社會經濟的不斷發展,偽造文件、合同的犯罪日益增多,特別是民事案件中,文件的形成時間鑒定爭議最為集中、矛盾最多[2]。因此,如何快速、準確、無損地鑒定文件中字跡的形成時間已成為司法鑒定工作者研究的一項重要課題。
近紅外光譜技術(Near-Infrared Spectroscopy,NIR)是一種典型的快速無損分析技術,自20世紀80年代引入到我國用于農產品的質量分析,現已經廣泛應用于石油化工、食品、煙草、藥物和臨床醫學各個領域。將其與化學計量學方法相結合,可為諸多領域的生產質量控制提供一種高效的檢測手段。
本文采用近紅外光譜技術對用黑色真彩GEIE550簽字筆書寫的不同時間的字跡樣本進行近紅外光譜采集,對采集到的原始光譜數據進行Savitzky-Golay卷積平滑法(SG)、標準正則變換(SNV)、多元散射校正(MSC),以及Normalize等光譜預處理,建立了字跡形成時間與其近紅外光譜數據之間的偏最小二乘(PLS)近紅外定量校正模型,并運用RPD來評價模型的預測能力,以期達到測定簽字筆字跡形成時間的目的。
近紅外光譜是指波長在780~2 500 nm(波數為4 000~12500 cm-1)之間的電磁波。近紅外光譜屬于分子振動光譜,產生于共價化學鍵非諧能級振動,是非諧振動的倍頻和組合頻。對于含氫基團,如含C-H,O-H,N-H的物質都會產生近紅外吸收。有機物以及部分無機物分子中各種含氫基團在受到近紅外線照射時,被激發產生共振,同時吸收一部分光的能量,通過測量其對光的吸收情況,可以得到極為復雜的近紅外圖譜,這種圖譜表示被測物質的特征。不同物質在近紅外區域有豐富的吸收光譜,每種成分都有特定的光譜特征。因此,近紅外光譜能反映物質的組成和結構信息,從而可以作為獲取化學信息的一種有效手段。
各種書寫材料經書寫工具寫到紙上后,由于改變了書寫材料存在的條件,使其直接暴露在空氣中或光線下,隨著時間的推移,書寫材料本身就會發生某些物理、化學性質的變化,這種變化的程度與書寫時間的長短相對應。測出這種變化并能掌握其變化規律,就可以利用這一特征判斷文字的書寫時間。
2.1 材料、儀器
由黑色真彩GEIE550簽字筆書寫的8組不同書寫時間字跡樣本,每組字跡樣本的時間間隔為90 d,每組字跡樣本中包含2個漢字樣本和3個數字樣本,實驗共計40個樣本。
XL410近紅外光譜儀及其漫反射光纖(AXSUN公司,美國生產);Unscrambler數據分析軟件(version9.6,挪威CAMO軟件公司);MATLAB(version7.0,美國Math Works公司)。
2.2 方法
2.2.1 樣本的制備
本實驗中用黑色真彩簽字筆在白色A4打印紙上書寫文字和數字,正常避光條件下保存。8組不同形成時間的簽字筆字跡形成時間分別為90、180、270、360、450、540、630、720 d。
2.2.2 NIR光譜的采集
采用漫反射模式采集簽字筆字跡光譜,光譜掃描范圍為1 350~1 800 nm,掃描間隔為0.5 nm,掃描頻率為64次/s。對所選取的每個實驗樣本進行6個不同位置的光譜采集,位置選取的標準為起筆位置、收筆位置、墨跡輕重程度不同的位置及墨跡交叉的位置等,40個樣品共計采集240條光譜,采集的原始近紅外光譜譜圖(圖1)。

圖1 簽字筆字跡的原始近紅外光譜
2.2.3 樣本集的劃分
采用 Kennard-Stone法(K-S)劃分240個樣本集,劃分后的校正集和驗證集分別為160個和80個。其中,校正集用于建立近紅外光譜數據與形成時間關系數據模型,驗證集用于模型的驗證。
2.2.4 光譜的預處理
為消除近紅外光譜的基線漂移、非線性以及光譜的低重復性[3]的影響,本文采用Savitzky-Golay卷積平滑法(SG)、標準正則變換(SNV)、多元散射校正(MSC),以及歸一法(Normalize)四種方法對采集所得的光譜進行預處理。SG卷積是一種加權平均法,此處理方法可消除近紅外光譜中含有的噪聲;SNV主要用來消除固體顆粒大小、表面散射以及光程變化對NIR漫反射光譜的影響;MSC主要用來消除顆粒分布不均勻及顆粒大小產生的散射影響,在固體漫反射和漿狀物透(反)射光譜中應用較為廣泛;Normalize可以消除因微小光程差異帶來的光譜變動,在NIR光譜分析中常用的歸一化法為矢量分析法。
2.2.5 定量分析模型的建立
將經過預處理的近紅外光譜數據與其形成時間建立全波段偏最小二乘(PLS)模型[4],采用交叉驗證方法確定模型的主因子數。校正集的統計參數包括交叉驗證校正標準偏差(RMSECV)、校正標準偏差(RMSEC)和校正集決定系數R2cal;驗證集的統計參數包括預測標準偏差(RMSEP)和預測集決定系數R2pre。其中,RMSECV、RMSEC的值越小,表明所建模型的質量越高,RMSEP的值越小,表明模型的預測能力越強,R2越接近于1,表明準確性越高。此外,也可以采用相對分析誤差[5-6](Residual Predictive Deviation,RPD)來評價模型的預測能力,RPD值越大,所對應的校正模型的預測性能越好,當RPD值大于2.5時,表明模型的定量分析具有可行性。

其中yi,actual為第 i個樣品參考方法的測定值;yi,perdicted為用所建模型對校正集中第i個樣品的近紅外光譜方法預測值;n為校正集的樣品數。

其中,yi,actual為第 i樣品參考方法的測定值;yi,perdicted為校正集交互驗證過程中第i個樣品的近紅外光譜方法預測值;n為校正集的樣品數。

其中,yi,actual為第 i樣品參考方法的測定值;yi,perdicted為驗證集預測過程中第i樣品的近紅外光譜方法預測值;m為驗正集的樣品數。

其中,yi,actual為第 i樣品參考方法的測定值;yi,perdicted為校正集或驗證集所有樣品參考方法測定的平均值;yactual為校正集或驗證集預測過程中第i樣品的近紅外光譜方法預測值;n為校正集或驗證集的樣品數。

其中,Ci為驗證集樣本參考方法的平均值;n為驗證集的樣品數。
本文采用了SG卷積平滑、標準正則變換、多元散射校正和歸一化方法對采集的240個樣本的近紅外光譜進行光譜預處理,來探討不同方法對模型性能的影響。表1給出各預處理方法所建立的模型的性能指標值,其中RMSECV值越小,R2越接近于1,RPD值越大表明模型性能越好。圖2為不同預處理方法的預測殘差平方和(PRESS)的值,通過考察主因子數對預測殘差平方和(PRESS)的影響,當曲線中趨于穩定的主因子數越多,且模型建立選取的主因子數越少,證明模型的性能越高。綜合以上標準,可優選出最佳的預處理方法。結果表明,表1中采用多元散射校正(MSC)預處理方法所得RMSECV值為78.484,R2cal為0.9207,R2pre為0.8843,RPD為2.958,主因子數為7。因此,采用MSC處理后的光譜建立PLS模型具有可行性,可得出簽字筆字跡在形成時間上存在規律性,可由此測定簽字筆字跡的形成時間。

表1 不同光譜預處理方法的定量模型的性能指標

圖2 不同預處理方法的PRESS值
本文采用近紅外光譜技術對用黑色真彩GEIE550簽字筆書寫的不同形成時間的字跡樣本進行了近紅外光譜采集,并建立了其形成時間與近紅外光譜數據的偏最小二乘定量模型,所得模型的R2pre為0.8843,表明字跡在不同時間的變化中存在規律性。同時,采用RPD來評價模型的預測能力,其RPD值達到2.958,說明其模型的定量分析具有可行性。近紅外光譜法可對字跡樣本進行快速、無損的檢驗,但在實際應用前,還應該對該方法進行進一步的改進,有必要擴充樣本集的數量及范圍,以提高模型的穩定性,對建模方法進行進一步的升級與完善,對模型在文檢應用中的各項指標進行討論并作出明確的規定,以提高模型的適應性,為今后的字跡檢驗提供一種綜合的研究方法。
[1]李彪.簽字筆墨水字跡形成時間研究綜述[J].法庭科學,2012,(4):95-98.
[2]籍康,趙杰.共焦顯微拉曼光譜對簽字筆字跡形成時間的研究[J].南京師大學報,2010,33(4):68-71.
[3]Devos O,Ruckebusch C,Durand A,et al.Support V ector machine(SNV)in N ear I nfrared(NIR)S pectroscopy:Focus on P arameters O ptimization and M odel I nterpretation[J].Chemometrics and Intelligent Laboratory System,2009,96(1):27-33.
[4]白雁,李珊,王星,等.近紅外光譜法快速測定金銀花中綠原酸的含量[J].中國實驗方劑學雜志,2011,(5):66-69.
[5]Chan C,Chu C,Mok D K,et al.Analysis of B erberine and T otal alkaoid C ontent in Cortex Phellodendri by N ear infrared S pectroscopy(NIRS)C ompared with H igh-P erformance L iquid C hromatography C oupled with U ltra-V isible S pectrometric D etection[J].Analytica Chimica Acta,2007,592(2):121-131.
[6]Joubert E,Manley M,Botha M.Use of NIRS for Quantification of Mangiferin and Hesperidin Contents of Dried Green Honeybush(Cyclopia genistoides)P lant M ateria[J].JAgric Food Chem,2006,54,(15):5279-5283.
(本文編輯:張清華)
Chem ometric M odel for Dating Gel Ink Entries by Near Infrared Spectroscopy
ZHANG Ping1,ZHANG Zhen-yu1,WU Zhi-sheng2
(1.NationalPolice University ofChina,Shengyang110035,China;2.Beijing University ofChineseMedicine,Beijing100102,China)
Objective With the increasing number of forged documents,the commonly used methods for dating ink entries is difficult to achieve fast and non-destructive analysis.In this study,a near-infrared spectroscopy method combined with chemometricswas established for the accurate,fast and non-destructive analysis of the age of gel ink entries.M ethod The near-infrared spectra of 40 black gel ink sampleswere collected and pre-treated with relevantmodels.Multivariate analysis models describing the relationship between ink ages and near-infrared spectra were established.The relative prediction error(RPD)was used to evaluate the prediction ability of the models.Result The model developed by the multiple scattering correction(MSC)method was the best,and the calibration standard deviation and RPD were acceptable.The model is feasible.Conclusion Near-infrared spectroscopy can analyze the black gel ink entries written at different time accurately and quantitatively,which provides a referencemethod for ink dating.
near-infrared spectroscopy;ink dating;partial least squares
DF794.2
A
10.3969/j.issn.1671-2072.2017.03.011
1671-2072-(2017)03-0061-04
2016-11-17
國家“十三五”重點研發計劃課題(2016YFC0800705)
張平(1992—),女,碩士研究生,主要從事微量物證研究。E-mail:1449967207@qq.com。
張振宇(1960—),男,教授,主要從事微量物證研究。E-mail:ccpczzy@163.com。