馬公喆,楊曉麗,汪文超,陳云秀
(曲靖師范學院化學化工學院,云南曲靖655011)
水分含量是煤品質非常重要的檢測參數之一,水分含量對煤加工、運輸、銷售均起到至關重要的作用。水分傳統檢測方法是熱重分析,缺點是耗時較長。近紅外光譜采集1 100~2 500 nm范圍內的光,主要反映物質分子中C-H、N-H、O-H、C-O和S-H等基團振動的合頻與倍頻吸收[1]。因此,近紅外光譜可以通過O-H基團吸收獲得水分含量信息。目前已有一些科研工作者對近紅外光譜技術用于煤中水分含量的檢測進行了研究。武中巨等采用近紅外光譜技術和偏最小二乘對褐煤品質進行了快速檢測,結果表明水分檢測誤差較大[2]。Dong W K等從近紅外光譜中提取了5個波長點用于實現煤品質的快速檢測,檢測誤差在10%左右[3]。Wang Y等將小波變換方法用于提高近紅外光譜在煤品質檢測中的應用并低降建模難度[4-6]。
本文針對煙煤中水分含量的近紅外快速檢測,采用常用的主成分分析和偏最小二乘回歸建立檢測模型。
采集曲靖富源地區煙煤樣品100個,將煤樣粉碎研磨到0.180 mm(80目)。采用熱重分析檢測煤樣中水分含量[7]。精確稱量空氣干燥煤樣1.0±0.1 g(精確至0.000 2g),將煤樣平鋪于干燥恒重的Φ40 mm稱量瓶。打開稱量瓶蓋,放入預先鼓風并已加熱至105~110℃的干燥箱中,在一直鼓風的條件下干燥40 min。從干燥箱中取出稱量瓶,立即蓋上蓋,放入干燥器中冷卻至室溫(約20 min)后,稱量。再進行檢查性干燥,每次30 min,直到連續兩次干燥煤樣的質量減少不超過0.001 g或質量增加時為止。
采用Thermo AntarisⅡ光譜儀采集煙煤的近紅外光譜數據,光譜范圍4 000~12 000 cm-1,分辨率8 cm-1,掃描次數8。
偏最小二乘(partial least squares,PLS)[8]是一種基于因子分析的多變量校正方法,利用自變量矩陣中提取出的隱變量來建立模型,可以充分利用因變量矩陣和自變量矩陣的信息。PLS比多元線性回歸、主成分回歸等線性模型更穩定。
偏最小二乘法的基本數學模型為:

式中n為樣本數,r為自變量數,m為因變量數,s為隱變量數。E和F分別為關于X和Y的線性模型的殘差矩陣。
當E的元素服從正態分布時,根據最大熵原理,最大熵Hmax的大小取決于方差σ2:

此處eij為殘差,(r-s)為自由度。當σ2最小時,建立的數學模型具有最佳的預測效果。
PLS中的隱變量個數是十分重要的,只有確定出恰當的隱變量數,才能消除噪聲、避免過度擬合、獲得良好預測效果。PLS一般采用交互驗證(Cross-validation)的預測誤差平方和(predicted error sum of squares,PRESS)確定隱變量數,當PRESS最小時,該隱變量數最佳。
主成分分析(principal component analysis,PCA)是一種統計分析方法,可以進行數據降維、變量提取、數據壓縮、分類、聚類等處理[9]。主成分分析將數據進行特征分解,構造新變量(稱為主成分)并保證各變量之間正交。方差越大的主成分含原變量信息量越大。提取較少幾個主成分就可以包含原數據的信息,將高維數據降到低維。
首先采用PCA將含有1557個變量的高維近紅外光譜數據映射到低維空間,再根據低維特征變量建立PLS模型。為了檢驗建模效率,將100個樣本分為校正集和預測集,其中校正集包含85個樣本,預測集包含15個樣本。
PLS先提取數據的特征信息(隱變量)再建立預測模型,因此提取出的特征數目(隱變量數)會直接影響模型的性能。考察了1~15個隱變量數下模型的預測性能,結果見表1。從表1中可見,隨著PLS隱變量數的增加,預測誤差先減小后增大。當隱變量數為3時,預測最準確,平均預測絕對百分誤差為0.0828。

表1 PLS隱變量數對模型檢測精度的影響Tab.1 Effect of the number of hidden variables PLS on model detection accuracy

PLS 主分量個數 平均預測絕對誤差 平均預測絕對百分誤差0.0023 0.0927 5 0.0021 0.0856 6 0.0025 0.0977 7 0.0024 0.0971 9 0.0029 0.1156 10 0.0031 0.1247 11 0.003 0.1202 12 0.0032 0.126 13 0.0034 0.1342 14 0.0033 0.1328 4 15 0.0033 0.1323
PCA提取出的主成分包含樣本有用信息并能剔除一部分無用信息,主成分個數直接決定數據壓縮及濾噪效果。本文將PLS主分量數固定為3,考察了PCA主成分數3~30對建模的影響,見圖1。

圖1 PCA主成分數對預測效果的影響Fig.1 Effect of PCA main components on predict result
圖1表明,隨著主成分數的增加,平均預測絕對誤差和平均預測絕對百分誤差呈現相同的變化趨勢,隨著波動先下降后上升。當主成分數為16時獲得最低平均預測絕對百分誤差,0.0728。
為了進一步考察模型的預測性能,表2列出了真實結果、預測結果和預測百分誤差。結果表明有5個樣本預測偏差較大,超過了0.1,其余10個樣本預測效果較好。總而言之,可以通過PCA-PLS方法結合近紅外技術實現煙煤中水分檢測。

表2 PCA-PLS結果Tab.2 PCA-PLS results
本文收集了100個煙煤樣品,針對煙煤水分檢測探討了近紅外光譜法快速檢測的可行性。采用主成分分析和偏最小二乘分析近紅外光譜,主成分分析用來對近紅外光譜壓縮、濾噪,偏最小二乘用來建立檢測模型。通過對模型參數的考察和優化,最佳平均預測絕對百分誤差為0.0728。結果表明近紅外光譜技術可以用于煙煤水分快速檢測。
[1]McDonald R S.Infrared spectrometry[J].Analytical Chemistry,1984,56:349R-372R.
[2]武中臣,熊智新,王海東,等.褐煤品質的傅里葉變換近紅外光譜定量分析[J].光譜實驗室,2008,25(5):819-823.
[3]Dong W K,Jong M L,Jae S K.Application of near diffuse reflectance spectroscopy for on-line measurement of coal properties[J].Korean Journal Chemical Engineering,2009,26:489-495.
[4]Wang Y,Shi G,Zhong X,et al.PLS regression on coal infrared spectrum with wavelet pre-processing[J].Applied Mechanics and Materials,2011,80-81:279-283.
[5]Wang S,Feng X,Zhou J,et al.Fourier transform near infrared spectroscopy analysis of power plant coal quality[J].Advanced Materials Research,2011,236-238:799-803.
[6]WangY,Wang D,Xin H,et al.PLS regression on wavelet transformed infrared spectra for prediction of coal contents[J].R.Chen(Ed.):ICICIS 2011,PartⅠ,CCIS 134:348-353.
[7]常宏,李愛啟,王洪偉,等.煤中水分的快速測定[J].煤質技術,2004(2):50-52.
[8]Haaland D M ,Thomas E V.Partial Least-Squares Methods for Spectral Analyses.1.Relation to Other Quantitative Calibration Methods and the Extraction of Qualitative Information[J].Analytical Chemistry,1988,60:1193-1202.
[9]Jolliffe I T.Principal Component Analysis[J].New York,USA:Springer-Verlog,1986.