吳泳微,袁琨,*,王堅,張洋,王洋
基于塑料近紅外光譜的判別分類研究
吳泳微1,袁琨1,2*,王堅2,張洋1,王洋1
(1. 中國計量大學 光學與電子科技學院,杭州 310018; 2. 彩譜科技(浙江)有限公司,浙江 臺州 318000)
為了回收可用于不同物品包裝的塑料,對不同塑料種類進行識別分類。首先采集PP、PET、HDPE、TPE、PLA、PBT、TPU、POM-M90、PPO-GF20NC、TPB、PPS、ABS、PPO(natural)、SAN、POM-F20、PPO(white)16種塑料的近紅外光譜數據,其次針對光譜數據采集時存在的噪聲問題,使用SG平滑濾波進行了光譜數據預處理,之后利用主成分分析算法進行光譜數據降維,減少待處理數據量,最后分別運用無監督聚類K-means算法和監督聚類極大似然估計、Fisher判別式以及光譜角算法建立4類分類模型。K-means算法可以將PPO-GF20N、PLA和PPO(本色)與其他塑料粒子區分開,準確率分別是100%、100%以及80%;Fisher判別式和極大似然估計法對POM-M90和POM-F20的識別準確率為93%,其他塑料粒子識別準確率均為100%;光譜角算法對PET的識別準確率為80%,POM-F20的識別準確率為47%,其余粒子的識別準確率均大于90%。上述機器學習算法結合近紅外光譜成像技術建立分類模型可為常見塑料的鑒別研究提供參考。
塑料分類;近紅外;高光譜成像;主成分分析;聚類分析
塑料包裝在日常生活中被廣泛使用,回收包裝塑料再加工,制造新的再生塑料包裝,有助于減少環境污染、資源浪費和能源消耗。近紅外光譜分析技術[1-2]可以按照光譜特征的差異,進行定性判別和定量剖析[3-4],并以其特征性好、對樣品顏色不敏感、測樣速度快,可以對固體樣品直接進行快速無損測量等特點,故用于回收包裝塑料再加工之前的塑料分類工序[5-7]。
樣本為16種呈不同透明程度的乳白色塑料粒子,包括PP、PET、HDPE、TPE、PLA、PBT、TPU、POM-M90、PPO-GF20NC、TPB、PPS、ABS、PPO(natural)、SAN、PPO(white)、POM-F20。光譜儀選用近紅外成像光譜儀FS-25,采用8臺200 W鹵鎢燈作為光源,光譜范圍為900~1 700 nm,光譜分辨優于10 nm,圖像分辨優于320像素×256像素。
根據聚類算法的需求,采集了16種塑料粒子的混合高光譜圖像,其中一張圖中每種粒子有15粒,如圖1a所示;另一張圖每種粒子有5粒,如圖1b所示,共2張;不同種類塑料粒子單獨的高光譜圖像共16張,每一張圖中有5粒塑料粒子,如圖2所示。粒子不重復使用。
所有圖像測量完畢后,在18張近紅外高光譜圖像中,選擇一塊能夠代表樣本典型特征的感興趣區域(Region of Interest,ROI)內的光譜數據,即為選定區域內所有像素點反射率數據的平均值,ROI區域的大小為5×5個像素點。
實驗發現,972.86 nm之前和1 678.49 nm之后的信號量較低,存在噪聲干擾,因此提取972.86~1 678.49 nm波段的光譜數據作為實驗數據,共219個維度的高光譜數據。

圖1 16種塑料粒子混合的近紅外高光譜圖像

圖2 16種粒子單獨的近紅外高光譜圖像
在將樣本的光譜圖像數據用于聚類算法之前,使用SG濾波算法對所有近紅外高光譜圖像的光譜數據進行預處理,濾波時窗口大小為5,采用3階多項式擬合。未進行光譜預處理的16種塑料粒子中心點的光譜曲線如圖3a所示;使用SG平滑處理后,16種塑料粒子中心點的光譜曲線如圖3b所示。
由于所提取的光譜波段較多,而且含有大量的冗余信息,不利于下一步的數據分析,因此需要對采集到的光譜數據進行主成分分析(Principal Component Analysis,PCA)[8-9]降維處理。表1展示了各個主成分的得分,其中列4表示的是主成分累計得分,通過列4可得前9個主成分,即可顯示原始圖像數據中99.9%的信息,從而認定全光譜數據主成分分析的主成分數為9個。在選取了主成分后,圖像數據維度從219個降到了9個。
表1 各主成分得分

Tab.1 Scores of each principal component
K-means算法需要在計算前預先告知樣本中的類別個數[10],其算法思想如圖4所示,根據給定的類別個數在數據中隨機設置初始聚類中心,之后計算每一個點與各個初始坐標值之間的歐氏距離,并將其歸入與其最近的簇中心所在的分類中。在一次計算后,聚類中心的位置不在該類別所有樣本點的中心,針對該類別的所有樣本點重新計算一個聚類中心,并運用迭代提升K-means聚類的準確度。
將16種塑料粒子的2幅近紅外高光譜圖像,分別使用K-means算法進行無監督聚類。初始聚類中心設置為8個,迭代次數設置為15次,可視化算法分析軟件顯示分類結果如圖5所示。可知無監督聚類算法不能將16種塑料區分。按顏色分類,塑料粒子大致可以分為紫色、黑色和黃色3組。3組都包含多種塑料粒子,其余的塑料粒子無法區分。

圖4 K-means算法思想

圖5 第1次K-means聚類結果
分別對3組塑料粒子進行采樣,再次應用K-means算法進行聚類,結果如圖6所示。PPO-GF20N、PLA和PPO(本色)可以被識別。
監督聚類的思想是通過找出樣本中被標記部分的規律,然后將剩余的樣本進行分類。
極大似然估計是通過對已知的樣本數據進行反演,從而得到最有可能得到該樣本數據的參數[11]。從直觀的角度來看,最大似然估計方法使用了訓練集數據和分類標記,計算每一個類別的最大似然判別函數,將每個像素值帶入判別函數進行計算,哪一個函數計算的結果最大,說明該數據(像素點)屬于這個類別的概率最大。
Fisher判別式的基本思想是數據投影[12-14],它把組元數據投影到一定的方向上,目標是讓在投影之后,不同種類之間的距離越大越好,同類之間的距離越小越好,利用方差對類間的距離進行分析,得出判別函數,從而對樣本進行判別分類[15]。
光譜角分類的基本原則是,將每一個象元的光譜看成一個高維向量,用計算向量之間的cos值來對相似性進行評估,cos值越接近1,2個光譜就越接近,屬于同一類型的可能性就越大,以此來辨別未知樣本[16]。

圖6 第2次K-means聚類分析
使用采集了16種塑料粒子各5粒的近紅外高光譜圖像作為監督數據,并使用ENVI軟件制作類別標簽圖像,如圖7所示。另一張采集了16種塑料粒子各15粒的近紅外高光譜圖像作為未知粒子的圖像樣本,分別采用3種監督聚類算法進行分析,各類粒子的判別結果如圖8所示。
使用標簽圖像對16張單個塑料粒子的圖像進行監督聚類,Fisher判別式算法的分類結果如圖9所示。所有塑料粒子均能從背景中分離識別出來。
大部分塑料樣品在1 200、1 400和1 650 nm附近都有吸收峰,但不同塑料樣品在900~1 700 nm的光譜范圍上的吸收峰數量有所不同,如PP有2個吸收峰,POM-M90、HDPE、TPE、POM-F20、PP和PLA有3個吸收峰,其余塑料樣品有4個吸收峰。不同塑料樣品的特征波長也有所區別,因此在分類效果中都有良好的表現。
其中在光譜角算法下的POM-F20分類效果僅有47%,通過圖8的光譜角分類結果圖可見,一部分POM-F20與POM-M90混淆,POM-F20與POM-M90原材料都屬于聚甲醛,但是通過不同工藝和配方制成。由圖3可知,其光譜曲線非常相似,僅在特征波長上有略微差異,因此在混合分類中結果較差。


圖7 16種塑料粒子的標簽圖像

圖8 3種監督聚類算法的分類結果

圖9 16種塑料粒子單獨分類識別結果

統計結果如表2所示。通過表2中數據可知,無監督聚類的K-means算法在無人為判別信息的前提下,通過2次重復聚類可以將PPO-GF20N、PLA和PPO(本色)與其他塑料粒子區分開,準確率分別為100%、100%和80%。極大似然估計和Fisher判別式算法對14種塑料粒子的識別準確率達到了100%,其中POM-M90和POM-F20的識別準確率為93%。光譜角算法對12種塑料粒子的識別準確率達到了100%,其中PPS和SAN的識別準確率為93%,PET的識別準確率為80%,對POM-F20的識別準確率為47%。
表2 3種聚類算法的分類準確率

Tab.2 Classification accuracy of 3 clustering algorithms %
本文基于近紅外光譜分析成像技術,使用無監督聚類和監督聚類2種方法,對16種塑料顆粒進行了分類和鑒別,并通過可視化算法分析軟件來顯示分類結果圖。K-means算法采用2個重復的聚類方法,可以從16種塑料中篩選出PPO-GF20N、PLA和PPO(natural)3種粒子。無監督聚類算法的方式使用較為方便,但是無法對所選的16種塑料都進行準確的分類,在塑料種類上存在局限性。監督聚類算法通過少量16種已知的塑料粒子的類別標簽數據對應的光譜信息,獲取了光譜特征和塑料種類之間的對應關系,實現了對未知塑料粒子的分類識別。在混合塑料粒子的分類實驗中,極大似然估計和Fisher判別式算法對14種塑料粒子的識別準確率達到了100%,光譜角算法對12種塑料粒子的識別準確率達到了100%。在單種塑料粒子的判斷實驗中,Fisher判別式可以將所有塑料粒子均能從背景中分離識別出來。本實驗對推動近紅外光譜技術在塑料回收分類應用于塑料包裝領域起到了積極的作用。
[1] 葉靜. 應用近紅外光譜分析技術檢測茶葉成分的研究[D]. 鎮江: 江蘇大學, 2008.
YE J. Study on Detection of Tea Components by near Infrared Spectroscopy[D]. Zhenjiang: Jiangsu University, 2008.
[2] 褚小立. 化學計量學方法與分子光譜分析技術[M]. 北京: 化學工業出版社, 2011: 259-261.
CHU X L. Molecular Spectroscopy Analytical Technology Combined with Chemometrics and Its Applications[M]. Beijing: Chemical Industry Press, 2011: 259-261.
[3] 杜婧. 基于NIR技術的PET/PVC廢舊塑料分離系統設計[D]. 杭州: 浙江大學, 2011.
DU J. Design of PET/PVC Waste Plastic Separation System Based on NIR Technology[D]. Hangzhou: Zhejiang University, 2011.
[4] 張毅民, 王鵬, 白家瑞, 等. 基于近紅外光譜建立PE、PP和PET的識別分類模型[J]. 現代化工, 2016, 36(3): 182-186.
ZHANG Y M, WANG P, BAI J R, et al. Establishment of Identification and Classification Model of PE, PP and PET Based on near Infrared Spectroscopy[J]. Modern Chemical Industry, 2016, 36(3): 182-186.
[5] 尹鳳福, 閆磊, 韓清新, 等. 近紅外光譜(NIR)分選技術在塑料分選領域的應用[J]. 環境工程, 2017, 35(12): 134-138.
YIN F F, YAN L, HAN Q X, et al. Review on Application of near Infrared Spectroscopy Technology (Nir) in Plastic Sorting[J]. Environmental Engineering, 2017, 35(12): 134-138.
[6] 趙清華. 基于主成分分析報廢車用塑料近紅外識別技術研究[D]. 上海: 上海交通大學, 2014.
ZHAO Q H. Research on Near-Infrared Identification Technology of Plastics Used in Scrap Cars Based on Principal Component Analysis[D]. Shanghai: Shanghai Jiao Tong University, 2014.
[7] 張文杰, 焦安然, 田靜, 等. 卷積神經網絡和支持向量機算法在塑料近紅外光譜分類中的模型應用[J]. 分析測試學報, 2021, 40(7): 1062-1067.
ZHANG W J, JIAO A R, TIAN J, et al. Convolutional Neural Network and Support Vector Machine Models for Plastic Classification by Near-Infrared Spectroscopy[J]. Journal of Instrumental Analysis, 2021, 40(7): 1062-1067.
[8] JIN J, TANG L, HRUSKA Z, et al. Classification of Toxigenic and Atoxi-Genic Strains of Aspergillus Flavus with Hyperspectral Imaging[J]. Computers and Electronics in Agriculture, 2009, 69(2): 158-164.
[9] CONDE O, AMADO M, GARCIA-ALLENDE P, et al. Evaluation of PCA Dimensionality Reduction Techniques in Imaging Spectroscopy for For-Eign Object Detection Algorithms and Technologies for Multispectral[C]// Defense and Security Symposium. Orlando, Florida, 2007: 6565.
[10] BARNALI B, SWARNAJYOTI P. Variable Precision Rough Set Based Unsupervised Band Selection Technique for Hyperspectral Image Classification[J]. Journal of Robotics & Machine Learning, 2020, 10(5): 414-416.
[11] 張愉, 何和平, 田葉. 基于同倫分析法的威布爾分布極大似然估計[J]. 數學的實踐與認識, 2022, 52(11): 150-158.
ZHANG Y, HE H P, TIAN Y. Maximum Likelihood Estimation of Weibull Distribution Based on Homotopy Analysis Method[J]. Journal of Mathematics in Practice and Theory, 2022, 52(11): 150-158.
[12] 王瀟, 徐秋月, 黃本林, 等. Logistic回歸和Fisher判別分析模型在冠心病鑒別診斷中的臨床價值[J]. 臨床檢驗雜志, 2022, 40(9): 662-666.
WANG X, XU Q Y, HUANG B L, et al. Differential Diagnosis of Coronary Heart Disease by Logistic Regression and Fisher Discriminant Analysis Model[J]. Chinese Journal of Clinical Laboratory Science, 2022, 40(9): 662-666.
[13] ALEXANDRAVERONICA L, MELINDA S, NORBERTBOTOND M, et al. Fault Type Diagnosis of the WWTP Dissolved Oxygen Sensor Based on Fisher Discriminant Analysis and Assessment of Associated Environmental and Economic Impact[J]. Applied Sciences, 2023, 13(4): 45-46.
[14] SHISIR M, HASAN M T, MOTIUR M R. Robust Despeckling: Robust Speckle Noise Reduction Method Using Multi-Scale and Kernel Fisher Discriminant Analysis[J]. Biomedical Engineering Advances, 2023, 5(1): 52-54.
[15] ASHWINI M. Potential Use of Sentinel-2 Data for Discrimination of Tectona Grandis L. Healthy and Non- Healthy Tree Species Using Spectral Angle Mapper[J]. Environmental Sciences Proceedings, 2022,22(1): 120-123.
[16] 邱琳, 劉敏, 王磊. 基于多尺度光譜角制圖的遙感影像單木樹冠提取方法[J]. 安徽農業科學, 2022, 50(21): 119-125.
QIU L, LIU M, WANG L. Multi-Scale Spectral Angle Mapper Method for Individual Tree Crown Delineation from Remote Sensing Image[J]. Journal of Anhui Agricultural Sciences, 2022, 50(21): 119-125.
Discriminative Classification of Plastics Based on Near-infrared Spectra
WU Yongwei1, YUAN Kun1,2*, WANG Jian2, ZHANG Yang1, WANG Yang1
(1. College of Optical and Electronic Technology, China Jiliang University, Hangzhou 310018, China; 2. Caipu Technology (Zhejiang) Co., Ltd., Zhejiang Taizhou 318000, China)
The work aims to identify and classify different types of plastics, in order to recover plastics that can be used to pack different items. Firstly, the near-infrared spectral data of 16 kinds of plastics including PP, PET, HDPE, TPE, PLA, PBT, TPU, POM-M90, PPO-GF20NC, TPB, PPS, ABS, PPO (natural colour), SAN, POM-F20 and PPO (white colour) were collected. Then, for the problem of noise in spectral data collection, the spectral data were pre-processed by the SG smoothing filtering, followed by dimensionality reduction of the spectral data with the principal component analysis algorithm to reduce the amount of data to be processed, and finally the four-class classification model was established by the K-means algorithm for unsupervised clustering and the great likelihood estimation for supervised clustering, the Fisher discriminant, and the spectral angle algorithm, respectively. The K-means algorithm could distinguish PPO-GF20N, PLA and PPO (native colour) from other plastic particles with an accuracy of 100%, 100%, and 80%, respectively. Fisher's discriminant and great likelihood estimation had an accuracy of 93% for the recognition of POM-M90 and POM-F20, and 100% for the recognition of all other plastic particles. Spectral angle algorithm had a recognition accuracy of 80% for PET, 47% for POM-F20, and an accuracy greater than 90% for the rest of the particles. The above machine learning algorithm combined with near-infrared spectral imaging technology can be used to establish a classification model, providing a reference for the identification research of common plastics.
classification of plastics; NIR; hyperspectral imaging; PCA; cluster analysis
O433.4
A
1001-3563(2024)09-0171-07
10.19554/j.cnki.1001-3563.2024.09.022
2023-09-05
中國浙江省重點研發計劃項目(2020C03095);浙江省高校基礎研究運行專項資金(2020YW22)