羅 峻,吳淑煥,聶鳳明,許 敏,范 偉,梁逸曾3
(1.廣州纖維產品檢測研究院,國家紡織品服裝服飾產品質量監督檢驗中心(廣州),廣東 廣州 511447;2.湖南農業大學生物科學技術學院,湖南 長沙 410128;3.中南大學化學化工學院,湖南 長沙 410083)
近紅外光譜與模型集群分析測定毛滌混紡織物成分含量
羅峻1,吳淑煥1,聶鳳明1,許敏1,范偉2,梁逸曾3
(1.廣州纖維產品檢測研究院,國家紡織品服裝服飾產品質量監督檢驗中心(廣州),廣東 廣州 511447;2.湖南農業大學生物科學技術學院,湖南 長沙 410128;3.中南大學化學化工學院,湖南 長沙 410083)
將近紅外光譜法和模型集群分析方法應用于毛滌混紡織物成分含量的快速無損測定。以近紅外測量方法采集93個毛滌混紡織物的光譜信號,利用光譜預處理消除信號漂移的影響,在模型集群分析基礎上,剔除異常樣本,篩選出30個關鍵波長,采用偏最小二乘法(PLS)建立滌綸含量的預測模型。所建立模型的訓練集相關系數r2為0.9827、交互驗證均方誤差(RMSECV)為3.26、預測均方根誤差(RMSEP)為3.34,預測結果令人滿意,適合于毛滌混紡織物中滌綸含量的快速、無損檢測。
近紅外光譜;模型集群分析;毛滌混紡織物;偏最小二乘法
當前,我國的紡織品生產、出口和消費均居世界第一。所以無論是政府監管還是企業自檢自控,紡織品成分檢測的規模都非常巨大。然而,傳統的紡織品成分檢測方法如化學溶解法和顯微鏡法等,存在檢測時間長,檢測環境要求高、使用強酸強堿試劑,檢測成本高,需破壞樣品等缺點,無法滿足各檢驗監督部門,包括生產企業對紡織品進行大量檢測的需求[1-4]。在這種情況下,部分不法企業擅自降低混紡面料中某些纖維成分的含量,偷工減料,以次充好,牟取不當利潤,造成不良影響。由近期全國各地公布的質量狀況分析結果可看出,不合格紡織品中成分及含量與實際不符的問題最為嚴重[5]。
基于以上需求,研究和開發一種快速、無損、環境友好的檢測方法具有很好的應用前景。近紅外光譜(NIR)是一種無損分析技術[6],它將近紅外光譜信號與化學分析數據,利用統計回歸方法建立預測模型,然后測量未知樣品的光譜來快速預測其成分含量[7-8]。質檢部門可利用近紅外快速檢測技術進行初步篩查,對于快檢不合格的情況,依法啟動抽樣檢驗程序,實現對紡織品企業、原材料加工廠、成衣加工廠以及批發零售終端等大批量的抽檢,充分保證國內紡織品的質量[9-10]。
當前,已有關于近紅外光譜技術應用于紡織品定量分析中的報道,但相關的研究主要集中在棉/滌、棉/氨等混紡織物[1,3,8-9],毛滌混紡織物報道較少。另外混紡織物近紅外光譜檢測的目標在于建立一個有效可靠的預測模型,實現對未知樣本的含量預測。在實際工作中,這個模型的建立并不容易,由于模型完全未知,建模需要進行探索,并且需要解決異常樣本、干擾信息等問題。傳統的一次性建模思路容易陷入模型欠擬合與過擬合的狀況。而新進發展的模型集群分析打破了傳統一次性建模思路,力求最大限度地利用已有樣本信息,通過隨機采樣,從樣本空間、變量空間或是模型空間考察數據集的內在性質,基于所得結果的統計分析可進行異常樣品的檢測、關鍵波長的篩選和模型的評價等[11-12]。基于此,本研究共收集毛滌混紡織物樣本共93個,建立了基于模型集群分析的毛滌混紡織物組分含量的近紅外光譜快速無損檢測方法。
1.1樣本
本實驗研究的毛滌混紡織物樣本共計93個,均為市場購買成品樣本。成分含量按照標準 FZ/T 01057系列進行定性鑒別,按照國家標準GB/T 2910系列進行成分含量定量分析。
1.2光譜信號的采集
信號采集來源為近紅外光譜儀(ANTARIS II,Thermo fisher),樣品采用漫反射方式測量,為保證樣品信號的代表性,每個樣品測量3次并取3次平均值作為其光譜信號數據,信號采集時室內溫度為20℃,濕度為60%。
1.3方法與原理
模型集群分析。模型集群分析的算法框架主要包括3個基本要素:1)通過隨機采樣獲取子數據集;2)針對每個子數據集,建立相應子模型;3)從樣本空間、變量空間、參數空間或模型空間對所有建立的集群子模型的參數與結果進行統計分析,獲取有用信息[13]。
應用該算法框架可以進行異常樣品的檢測、關鍵波長的篩選和模型的評價。基于模型集群分析的異常樣本識別方法可克服不同異常樣本的掩蔽效應,有效識別光譜信號及化學分析數據的異常值。具體算法如下:采用隨機分組的方式,將樣本集分為70%的訓練集和30%的測試集。采用訓練集樣本建立回歸模型并對測試集樣本進行預測,重復該過程多次(本研究為3000次),可得每個樣本預測誤差的統計分布,計算每個樣本的殘差分布均值μ和標準偏差б并作圖,預測誤差分布的均值或偏差異常的樣本即被識別為異常樣本[14]。
基于模型集群分析的波長篩選方法可顯著提高近紅外分析預測的準確度。因為近紅外光譜數據的共線性非常嚴重,其波長點數為幾百個至上千個。如此多的波長點數不僅存在著信息的冗余,而且部分波長的信號可能為干擾信息,對預測不利。因此,在建立預測模型時也需要對近紅外光信號進行波長的篩選。對于毛滌混紡織物的關鍵波長篩選,我們設計了一種基于模型集群分析的新方法:MPA-PSO方法。PSO(粒子群優化)是一種源于對鳥群捕食行為研究的進化計算技術[15]。是一種基于疊代的優化工具,系統初始化為一組隨機解,在解空間通過疊代搜尋最優值。在PSO中,每個優化問題的潛在解都可以想象成D維搜索空間上的一個點,可稱之為“粒子”,所有的粒子都有一個被目標函數決定的適應值,每個粒子還有一個速度決定他們飛翔的方向和距離,然后粒子們就追隨當前的最優粒子在解空間中搜索。PSO方法實現較為簡便,本研究基于模型集群分析框架,通過隨機采樣,獲得不同的子數據集,然后對每個數據集進行PSO關鍵波長篩選,根據選出波長的頻率來確定最終關鍵波長。
1.4數據處理
本文所采用的光譜信號處理及回歸等程序均在Matlab R2015b環境下運行。
2.1樣本的劃分
在多元校正模型的建立及驗證時,需要將數據樣本劃分為訓練集和獨立測試集。訓練集用來優化參數建立模型,獨立測試集不參與建模過程,僅用來驗證模型的預測效果。本文采用Kenard-Stone樣本選擇方法,從總計93個毛滌織物樣本中篩選出具有代表性的80個樣本用于訓練模型,13個樣本用于測試模型。
2.2光譜的預處理
在進行混紡織物的近紅外光譜檢測時,一般采用積分球漫反射的模式測量。測量過程中雖然盡量保持了環境條件的一致,但是混紡織物其表面結構、平整性、厚度等不同因素會干擾光譜信息。從圖1中亦可以看出,近紅外信號的漂移非常嚴重,對近紅外光信號進行適當預處理可以干擾因素引起的信號漂移及旋轉等噪聲,從而提高信噪比,為建立預測模型提供有效信息。在本研究中,選擇5點2次多項式Savitsky-Golay一階微分法進行處理,處理后光譜如圖2所示。對比圖1和圖2可看出,經過預處理后,明顯消除了信號的整體漂移,強化了譜帶特征,處理后的光譜更適宜于預測模型的建立。
2.3異常樣本的檢測
依據模型集群分析的思路,為最大限度地利用已有訓練集樣本信息,可通過隨機采樣,從樣本空間考察數據集的內在性質,根據所得結果的統計分析進行異常樣品的檢測。因此在本研究中,采用隨機分組方法對訓練集重復進行分組,每次取總數70%的樣本來回歸預測模型,30%進行測試。重復3000次,每個樣本均得到多個預測值。計算多個預測值誤差的平均值與標準方差并繪圖,如圖3所示。可以看出,有樣本預測誤差均值明顯偏高,如13號樣本。或是預測誤差的方差較大,如34及77號樣本。經驗證,13號樣本為機織黑色布料,其表面具有裝飾嵌條,34號樣本為混色格子布料,77號樣本為呢料,表面起圈不平整。將此3個異常樣本剔除后建立回歸模型,并與全樣本預測模型作了比較,剔除后,交互驗證均方根誤差(RMSECV)由全樣本的5.27降低到4.62,預測的準確度明顯提高。

圖1 毛滌混紡織物的近紅外光譜圖

圖2 毛滌混紡織物的一階微分光譜圖

圖3 均值―方差分布圖
2.4關鍵波長優選
近紅外光譜信號存在較為明顯的信息冗余,因此通過優選波長可以提高模型的預測能力與適用性。本研究采用MPA-PSO法對毛滌混紡織物的關鍵波長進行篩選,PSO具有深刻的智能背景,同其他優化算法比較,PSO簡單易實現且沒有過多參數需要調整。運行時首先設置粒子群搜索參數:粒子種群大小為50,迭代次數為200,算法運行10次,以F=Q2作為適應度函數,Q2為交互驗證預測值和量測值的相關系數。重復選擇3000次后,對選出的波長進行統計分析,最終選擇頻率大于50%的30個波長作為其關鍵波長。30個關鍵波長具體為:4 034,4 177,4204,4 281,4 756,4 968,4 972,4 975,5 095,5 099,5 103,5 295,6 044,6 113,6 117,6 144,6 198,8 632,8 748,8 751,9 118,9 280,9 338,9 507,9 608,9635,9696,9700,9800,9812cm-1。
利用30個關鍵波長建立預測模型的結果表明,經過波長篩選后,預測誤差有所降低,關鍵波長預測模型的交互驗證均方差值為之前的70.4%。而且,波長數量由原始的1557個減少到30個,減少了數據處理的工作量,可見MPA-PSO法應用于波長篩選來處理近紅外信號可有效簡化模型并提高校正模型的預測能力。
2.5模型建立與預測
采用未參與模型建立的獨立測試集樣本對模型的預測效果進行測試和驗證。首先采用預處理方法對樣本信號進行處理,然后調用訓練集樣本建立PLS模型,并對未參與建模的獨立測試集樣本進行預測,回歸模型的測試集相關系數為0.982 7,預測均方根誤差為3.34,交互檢驗均方差為3.26,結果令人滿意。近紅外預測值與化學分析測定值之間的相關關系如圖4所示。

圖4 真實值與近紅外預測值之間的相關圖
基于近紅外光譜和模型集群分析對毛滌混紡織物中滌綸含量進行了快速無損檢測研究,在模型集群分析框架下,剔除了一些異常樣本,并篩選出了關鍵波長,利用關鍵波長進行偏最小二乘回歸建模,預測誤差較小,表明近紅外光譜結合模型集群分析適合于毛滌混紡織物中纖維成分的快速、無損檢測,而且能達到令人滿意的檢測精度,為今后混紡織物的快速無損檢測提供了新的選擇。
同時,在本研究中注意到混紡織物樣品復雜度較大,成分含量跨度同樣較大,下一步計劃開展分段動態建模研究,以進一步提高預測準確率。
[1]桂家祥,耿響,要磊,等.基于近紅外光譜法的棉/滌混紡紡織物中棉含量快速檢測[J].紡織學報,2012,33(4):55-59.
[2]王京力,耿響,桂家祥.基于近紅外光譜法快速檢測滌氨織物的纖維含量[J].上海紡織科技,2013,41(5):45-48.
[3]鐘浩,楊偉江.運用近紅外光譜定量分析紡織面料成分的可行性探討[J].中國纖檢,2008(2):46-47.
[4]馮紅年,甘彬,金尙忠.棉滌混合紡織面料含量的近紅外光譜檢測[J].激光與紅外,2005,35(10):768-770.
[5]虞學鋒.服裝產品纖維成分含量項目質量狀況分析[J].中國纖檢,2014(10):28-29.
[6]陸婉珍.現代近紅外光譜分析技術[M].北京:中國石化出版社,2006.
[7]梁逸曾.白灰黑復雜多組份分析體系及其化學計量學算法[M].長沙:湖南科學技術出版社,1996:32-36.
[8]王動民,金尙忠,陳華才,等.棉-滌混紡面料中棉含量的近紅外光譜分析[J].光學精密工程,2008,16(11):2051-2054.
[9]朱洪亮,楊萌,張琦.棉/氨混紡織物氨綸含量快速分析方法研究[J].中國纖檢,2011(24):54-58.
[10]耿響,桂家祥,要磊,等.近紅外光譜快速檢測技術在紡織領域的應用[J].上海紡織科技,2013,41(4):25-27.
[11]王京力,桂家祥,耿響,等.近紅外光譜檢測用纖維含量樣品準確度研究[J].上海紡織科技,2013,41(9):51-54.
[12]柴金朝,金尙忠.光譜預處理對棉滌混紡面料近紅外定量模型的影響[J].中國計量學院學報,2008,19(4):325-328.
[13]梁逸曾,許青松.復雜體系儀器分析-白灰黑分析體系及其多變量解析方法[M].北京:化學工業出版社,2012.
[14]CAO D S,LIANG Y Z,XU Q S.A new strategy of outlierdetection for QSAR/QSPR[J].Journal of Computational Chemistry,2009,31(3):592-602.
[15]KHAJEH A,MODARRESS H,ZEINODDINI-MEYMAND H.Application of modified particle swarm optimization as anefficient variable selection strategy in QSAR/QSPR studies[J].Journal of Chemometrics,2012,26(11-12):598 -603.
(編輯:徐柳)
Study on rapid determination of polyester content in polyester/wool based on near infrared spectroscopy and model population analysis
LUO Jun1,WU Shuhuan1,NIE Fengming1,XU Min1,FAN Wei2,LIANG Yizeng3
(1.Guangzhou Fibre Product Testing and Research Institute,Guangzhou 511447,China;2.College of Bioscience and Biotechnology,Hunan Agricultural University,Changsha 410128,China;3.College of Chemistry and Chemical Engineering,Central South University,Changsha 410083,China)
Near-infrared spectroscopy as a rapid,non-destructively testing technique,has been widely used in the fiber product testing field.93 polyester/wool samples were collected.Model population analysis method was employed to detect the outlier and select key variables after preprocessingthespectrabySavitsky-Golayderivativemethod.Partialleastsquares(PLS)calibration models were established by the optimal conditions to predict the content of polyester. Correlation coefficient of determination r2,root-mean-square error of cross-validation(RMSECV)and root-mean-square error of prediction(RMSEP)were used to evaluate the quality of the model. The best models showed satisfactory predictions as measured by the r2,RMSECV and RMSEP values:0.982 7,3.26 and 3.34.The prediction results were better than the whole spectra The results showed that the method was suitable for the fast and reliable determination of the content of polyester in polyester/wool product.
near-infrared spectroscopy;model population analysis;polyester/wool;PLS
A
1674-5124(2016)08-0044-04
10.11857/j.issn.1674-5124.2016.08.009
2015-12-28;
2016-02-19
國家自然科學基金項目(21275164);國家質檢總局科技計劃項目(2013QK290);廣州市海珠區科技計劃項目(2013-cg-08)
羅峻(1983-),男,廣東廣州市人,博士,主要從事紡織品檢測新技術研發、新型檢測儀器研發工作。
范偉(1983-),男,河北邢臺市人,博士,主要從事光譜分析與化學計量學研究。