周貫旭,姜紅*,胡曉光,陳敏璠,莫修浩
紅外光譜結合主成分分析對紙質快遞文件袋的分類研究
周貫旭1,姜紅1*,胡曉光1,陳敏璠2,莫修浩2
(1.中國人民公安大學 偵查學院,北京 100038;2.北京鑒知技術有限公司,北京 100084)
建立一種快速無損的檢驗紙質快遞文件袋的分析方法。利用傅里葉變換紅外光譜對63個紙質快遞文件袋樣品進行檢驗,分析樣品的紅外光譜吸收峰的峰位,結合主成分分析對光譜數據進行了降維處理并分類。利用費歇爾判別對快遞文件袋的分類結果進行分析和驗證。同時建立多層感知器神經網絡和徑向基函數神經網絡2種分類模型,進行分析和驗證。63個紙質快遞文件袋樣品可被分成四大類,利用費歇爾分類模型進行驗證,準確率為100%;多層感知器神經網絡分類模型準確率為95.23%,徑向基函數神經網絡分類模型準確率為92.06%。通過比較發現,費歇爾判別可以實現對紙質快遞文件袋更加有效地分類。該方法簡單快速,樣品用量少且無損樣品,可為快遞文件袋類的物證鑒定提供科學依據。
傅里葉變換紅外光譜法;紙質快遞文件袋;主成分分析;費歇爾判別
隨著快遞行業的迅速發展,快遞業務非常普遍。在各類案件現場,經常能提取到紙質快遞文件袋物證,通過對該類物證的檢驗分析,并對其進行準確快速分類,有助于判斷該物證來源以及主要運輸途徑。可為偵查破案提供線索,縮小偵查范圍[1]。
目前,用于檢驗紙張物證的方法主要有,紅外光譜法、拉曼光譜法、掃描電鏡/能譜法、X射線熒光光譜法[2]、X射線衍射法、原子發射光譜法等[3]。利用紅外光譜結合主成分分析對紙質快遞文件袋的相關研究尚未見報道。本實驗采用便攜式紅外光譜儀對收集到63個不同品牌、不同來源的快遞文件袋樣品進行檢驗,依據快遞文件袋表面的涂漆填料的不同對其進行分類,借助spss 26.0軟件中的費歇爾判別式、多層感知器神經網絡和徑向基神經網絡對上述分類結果進行分析驗證,進而優選一種最適合此類樣品的分類方法。
IT 2000傅里葉變換紅外光譜儀(北京鑒知技術有限公司);掃描次數為32次;光譜范圍為4 000~500 cm?1;分辨率為4 cm?1。
來自不同城市的順豐、韻達、中通、圓通、EMS、京東、申通等7個不同快遞公司的紙質快遞文件袋樣品63個(樣品表略)。
分別剪取約1 cm2大小的樣品,利用紅外光譜在上述實驗條件下,對實驗樣品進行測試。
重復性實驗:隨機選取57#樣品,對其同一部位進行5次平行實驗;隨機選取13#樣品對其上、下、左、右、中心5個部位進行測試。
為驗證儀器的精密度和樣品的均勻性,確保實驗結果準確可靠,對樣品進行了重復性實驗。57#樣品同一個部位的5次平行實驗的紅外光譜圖見圖1;13#樣品的5個部位的紅外光譜圖見圖2。當把一些微小的干擾峰排除后,樣品在同一位置的紅外光譜圖基本一致,在不同位置的紅外光譜圖也基本一致,說明儀器具有較好的精密度,樣品的均勻性較好。因此,利用該實驗方法對紙質快遞文件袋進行檢驗的結果準確可靠。
圖1 57#樣品的紅外光譜圖
圖2 13#樣品的紅外光譜圖
紙質快遞文件袋的原料主要是纖維素和半纖維素,因為快遞文件袋表面一般是白色為主,因此在生產過程中,生產廠家常常會添加一定量的涂漆填料。常見的填料主要有如碳酸鈣、高嶺土、滑石粉、膨潤土等,其中713、876、1 434、1 796 cm?1可作為識別碳酸鈣的紅外光譜吸收峰,542、694、916、1 037、1 117、3 622、3 655、3 696 cm?1可作為識別高嶺土的紅外光譜吸收峰,670、1 019 cm?1可作為識別滑石粉的紅外光譜吸收峰,916、1 037、3 625 cm?1可作為識別膨潤土的紅外光譜吸收峰[4]。
為滿足不同紙張的性能要求,不同的快遞文件袋的填料成分或配比會有所不同。本實驗根據填料種類的不同,可以將樣品分為四大類(分類結果見表1)。
第I類樣品的主要填料是碳酸鈣(見圖3),其中864.39 cm?1為碳酸鈣C?O面內振動彎曲[5]吸收。碳酸鈣在填料中增強了涂層耐磨損和抗腐蝕的能力,使涂層的烘烤溫度降低,壓縮烘烤時間,在降低成本的同時,可有效提高產品質量。
表1 樣品分類結果
Tab.1 Sample classification results
圖3 第I類中1#樣品的紅外光譜圖
第Ⅱ類樣品的主要填料是碳酸鈣和膨潤土(見圖4),其中3 685.74 cm?1是膨潤土內表面—OH的吸收,2 920.87 cm?1是—CH3和—CH2對稱和反對稱伸縮振動吸收峰[6],1 026.75 cm?1是Si—O—Si反對稱伸縮振動吸收,1 005.10 cm?1為Si—O伸縮振動吸收,763.37 m?1為Si—O—Mg吸收[7];871.61 cm?1為碳酸鈣C—O面內振動彎曲吸收。膨潤土可以降低生產成本,并且還能使紙張顏料分散更加均勻、提高紙張表面光潔度等。
圖4 第Ⅱ類21#樣品的紅外光譜圖
第Ⅲ類中的主要填料是碳酸鈣和高嶺土(見圖5),其中870.41 cm?1為碳酸鈣C—O面內振動彎曲吸收;3 693.98~3 624.41 cm?1內的吸收峰均是高嶺土晶體內部—OH的吸收,1 005.40 cm?1為Si—O伸縮振動吸收,756.79 cm?1為Si—O—Mg吸收[8]。高嶺土具有可塑性好、黏結性高和絕緣性能好等特點,易分散懸浮于水中,在提高紙張抗酸溶性、耐火性等方面具有較好的作用。
圖5 第Ⅲ類57#樣品的紅外光譜圖
第Ⅳ類中樣品的主要成分是碳酸鈣加滑石粉(見圖6),其中876.42 cm?1為碳酸鈣C—O面內振動彎曲吸收;1 010.49 cm?1為滑石粉Si—O的伸縮振動吸收,672.52 cm?1為—OH彎曲振動吸收[9]。滑石粉不但能夠改善紙張的不透明度和平滑度,而且還能提高紙張的適印刷性,價格低廉,具有較高的經濟效益。
圖6 第Ⅳ類41#樣品的紅外光譜圖
主成分分析法(Principal Component AnalysisPCA)是一種基于統計特征的多維正交線性變換,常用來對信號進行特征提取和對數據進行降維[10]。可大大降低樣本數據的復雜程度,使樣本數據處理更加方便。當數據累計方差貢獻率大于80%,可以較好地解釋基本原始信息[11],實驗中將原樣品數據降維成26個變量,其方差累計貢獻率為99.71%,說明PCA提取效果好。
鑒于人工進行分類可能會存在誤差的情況,利用費歇爾判別分析對分類結果進行驗證,以降維后的26個變量為研究對象,建立費歇爾判別函數[12]。對3個判別函數的模型摘要進行分析,進而確定哪個判別函數在實現樣本分類預測方面具有更顯著的作用。判別函數的摘要統計見表2。
表2 判別函數的摘要統計
Tab.2 Summary statistics of discriminant function
費歇爾判別分別提取了3個特征函數[13],前2個特征函數所占方差百分比分別為74.1%和19.6%,累計方差貢獻率為93.6%。其方差的百分比代表著對于該模型對于樣本的分類問題的解釋能力的大小,故函數1和函數2這2個函數所攜帶的信息大于第3個函數,則以函數1和函數2作為模型的判別函數繪制樣品聯合分布散點圖(見圖7)。
由圖7可知,人工分類四大類的質心在散點圖上相對分離,其中第2類和第4類的分類效果尤其顯著。同時用該模型對分類結果進行了預測,其正確判別率為100%(見表3),說明人工分組的結果具有一定的準確性和科學性。
人工神經網絡(ANN)是一種監督學習算法的模型,其信息的處理大致分為3個層次,即在輸入層中輸入外部信息,然后通過隱藏層進行信息的處理,最后通過輸出層將信息進行下一步的傳遞[14]。多層感知器(Multilayer Perceptron,MLP)神經網絡和徑向基函數(Radical Basis Function,RBF)神經網絡分類模型,都是典型的神經網絡算法。
圖7 樣品聯合分布散點圖
表3 費歇爾模型分類預測結果
Tab.3 Classification prediction results of Fisher model
以63個樣本的紅外光譜數據為基礎,對原始數據構建MLP和RBF 2種分類模型,將樣本按照70%和30%的比例劃分為訓練集和測試集,即44個樣品作為訓練集,19個樣本作為測試集[15]。在MLP模型對該類樣品的測試中,協變量是每個樣品的波長作為輸入層神經元,隱藏層層數為1層,隱藏層中包含3個神經元。選擇雙曲正切函數為輸入函數,令Softmax函數作為輸出層激活函數,MLP模型分類結果見表4,其中訓練集的準確率為95.45%,測試集的準確率為94.73%,其總體準確率為95.23%。
在RBF模型的模型參數中,輸入層神經元選擇該類樣品的紅外波長作為RBF模型的協變量,選擇正態化徑向基函數作為隱藏層激活函數[16]。RBF模型分類結果見表5,其中對訓練集的正確率可以達到93.18%,反觀對測試集的正確率則只有89.47%,其總體準確率為92.06%。
表4 MLP模型分類結果
Tab.4 MLP model classification results
表5 RBF模型分類結果
Tab.5 RBF model classification results
利用紅外光譜法對快遞文件袋樣品進行了檢驗分析,依據填料的不同,可將63個樣品分為四大類。通過PCA進行降維處理后,提取了26個特征值大于1的主成分,其可以解釋原光譜數據中99.71%的信息。根據費歇爾判別分析對人工分類結果進行驗證,建立費歇爾判別函數和分類預測模型,該方法的識別準確率為100%。基于樣品數據建立的MLP和RBF這2種模型,也可驗證分類方法的準確率,其準確率分別為95.23%和92.06%。對未知樣品的判別,費歇爾判別分析模型的準確率更高。將紅外光譜與主成分分析相結合,可以對紙質快遞文件袋樣品進行快速無損地檢測,為公安機關實際辦案提供幫助。
[1] 姜紅. 刑事案件現場中紙張的檢驗及應用[J]. 上海造紙, 2005(3): 9-12.
JIANG Hong. On the Examination of Paper at Case Crime Scene and Its Application[J]. Shanghai Paper Making, 2005(3): 9-12.
[2] 廉哲, 梁魯寧, 光曉俐, 等. X射線熒光光譜在文件/紙質文物檢驗中的應用研究進展[J]. 刑事技術, 2022(2): 185-190.
LIAN Zhe, LIANG Lu-ning, GUANG Xiao-li, et al. Research Progress on XRF Applied into Examination of Document/Paper Cultural Relics[J]. Forensic Science and Technology, 2022(2): 185-190.
[3] FISCHER T, MARCHETTI-DESCHMANN M, CRISTINA ASSIS A, et al. Profiling and Imaging of Forensic Evidence – a Pan-European Forensic round Robin Study Part 1: Document Forgery[J]. Science & Justice, 2022, 62(4): 433-447.
[4] 付鈞澤, 姜紅, 陳煜太, 等. 傅里葉變換紅外光譜法檢驗香煙水松紙的研究[J]. 中華紙業, 2017, 38(20): 43-48.
FU Jun-ze, JIANG Hong, CHEN Yu-tai, et al. A Study on Test of Tipping Paper with Fourier Transform Infrared Spectroscopy[J]. China Pulp & Paper Industry, 2017, 38(20): 43-48.
[5] 趙華雄, 侯小紅. 制漿系統中出現的沉積物及其紅外圖譜簡析[J]. 中華紙業, 2022, 43(12): 20-24.
ZHAO Hua-xiong, HOU Xiao-hong. Deposit in Bleached Pulp Production System and Its Infrared Spectrum Identification[J]. China Pulp & Paper Industry, 2022, 43(12): 20-24.
[6] 楊瑩琴, 趙新富, 張永笑. 己內酰胺插層膨潤土的研制及其性能[J]. 信陽師范學院學報(自然科學版), 2009, 22(4): 565-567.
YANG Ying-qin, ZHAO Xin-fu, ZHANG Yong-xiao. Production and Performance of Caprolactam Intercalation Bentonite[J]. Journal of Xinyang Normal University (Natural Science Edition), 2009, 22(4): 565-567.
[7] CAGGIANI M C, OCCHIPINTI R, FINOCCHIARO C, et al. Diffuse Reflectance Infrared Fourier Transform Spectroscopy (DRIFTS) as a Potential on Site Tool to Test Geopolymerization Reaction[J]. Talanta, 2022, 250: 123721.
[8] ABDEL M M I A, YOUSSEF M A, GHOBASHY M M, et al. Gamma Radiation-Induced Synthesis of Organoclays Based Polyaniline and Ilmenite Clay Minerals for Cesium Ions Removal from Aqueous Solutions[J]. Separation and Purification Technology, 2023, 305: 122434.
[9] WU Hao-yu, HE Ming-yue, WU Shao-kun, et al. Near-Infrared Spectroscopy Study of OH Stretching Modes in Pyrophyllite and Talc[J]. Crystals, 2022, 12(12): 1759.
[10] PFEZER D, KARST J, HENTSCHEL M, et al. Predicting Concentrations of Mixed Sugar Solutions with a Combination of Resonant Plasmon-Enhanced SEIRA and Principal Component Analysis[J]. Sensors, 2022, 22(15): 5567.
[11] AHSAN M, MASHURI M, KHUSNA H. Comparing the Performance of Kernel PCA Mix Chart with PCA Mix Chart for Monitoring Mixed Quality Characteristics[J]. Scientific Reports, 2022, 12(1): 1-12.
[12] ZHANG Jin, GAO Peng-ya, WU Yuan, et al. Identification of Foodborne Pathogenic Bacteria Using Confocal Raman Microspectroscopy and Chemometrics[J]. Frontiers in Microbiology, 2022, 13: 874658.
[13] ZHANG Jin, JIANG Hong, DUAN Bin, et al. A Rapid and Nondestructive Approach for Forensic Identification of Cigarette Inner Liner Papers Using Shift-Excitation Raman Difference Spectroscopy and Chemometrics[J]. Journal of Forensic Sciences, 2021, 66(6): 2180-2189.
[14] 趙崇文. 人工神經網絡綜述[J]. 山西電子技術, 2020(3): 94-96.
ZHAO Chong-wen. A Survey on Artificial Neural Networks[J]. Shanxi Electronic Technology, 2020(3): 94-96.
[15] 李錦, 姜紅, 楊俊, 等. 差分拉曼光譜結合人工神經網絡對藥品塑料包裝瓶的分類研究[J]. 塑料工業, 2022, 50(8): 101-107.
LI Jin, JIANG Hong, YANG Jun, et al. Classification of Plastic Pharmaceutical Packaging Bottles Based on Differential Raman Spectroscopy and ANN[J]. China Plastics Industry, 2022, 50(8): 101-107.
[16] 田陸川, 楊俊, 姜紅. 基于RBFNN-FDA模型對塑料拖鞋鞋底的拉曼光譜研究[J]. 上海塑料, 2022, 50(4): 62-67.
TIAN Lu-chuan, YANG Jun, JIANG Hong. Study on Raman Spectra of Plastic Slipper Soles Based on RBFNN-FDA Model[J]. Shanghai Plastics, 2022, 50(4): 62-67.
Classification of Paper Express Document Bags by Infrared Spectroscopy Combined with Chemometrics
ZHOU Guan-xu1, JIANG Hong1*, HU Xiao-guang1, CHEN Min-fan2, MO Xiu-hao2
(1. Investigation Institute, People's Public Security University of China, Beijing 100038, China; 2. Beijing Jianzhi Technology Co., Ltd., Beijing 100084, China)
The work aims to establish a fast and nondestructive analysis method for testing paper express document bags. Sixty-three express document bag samples were tested by Fourier transform infrared spectroscopy. The peak position of the absorption peaks in the infrared spectrum was analyzed, and the spectral data were dimensionally reduced and classified in combination with principal component analysis. Fisher discriminant analysis was used to analyze and verify the classification results of express document bags. At the same time, two classification models of multilayer perceptron neural network and radial basis function neural network were established for analysis and verification. The 63 samples of paper express document bags could be divided into four categories, and the Fisher classification model could achieve 100% accuracy; the classification accuracy of the multi-layer perceptron neural network model was 95.23%, and that of the radial basis function neural network model was 92.06%. Through comparison, it was found that Fischer discriminant could achieve a more effective classification of paper express document bags. This method is simple, rapid, less sample consumption and non-destructive to samples. It can provide a scientific basis for identification of physical evidence of express document bags.
Fourier transform infrared spectroscopy (FTIR); paper express document bag; principal component analysis; Fischer discriminant
TB486;D918.9;O657.33
A
1001-3563(2023)23-0231-06
10.19554/j.cnki.1001-3563.2023.23.028
2023-01-06
中國人民公安大學2021年度基科費重點項目(2021JKF212)
責任編輯:曾鈺嬋