蔣宏霖,劉會杰,王學杰,賈海江,徐雪芹
近紅外光譜技術在煙葉化學分析中的應用*
蔣宏霖,劉會杰,王學杰,賈海江,徐雪芹
(廣西中煙工業有限責任公司,廣西 南寧 530001)
采用近紅外光譜法,對不同地區、不同等級具有代表性的500多個煙葉樣品進行掃描,同時應用化學分析儀測定煙葉中的總糖、還原糖、總煙堿、揮發堿、鉀含量,應用近紅外分析軟件QUANT6.5,將光譜與對應的化學成分值相關聯,建立近紅外模型。結果表明,建立的煙草中總糖、還原糖、總煙堿、揮發堿、鉀等化學成分的回歸模型線性很好,通過20個未知樣品對所建模型的驗證,所建指標的實際值和預測值的平均相對偏差均小于5%,表明所建模型可直接應用于煙草中主要化學成分的快速分析。
近紅外光譜技術;煙葉化學成分;模型;快速分析
近紅外光譜技術作為一種簡便、快速、低消耗和無污染的處理技術,具有分析過程高效、綠色、環保的現代分析特征,從而成為近年來發展較快、引人注目的光譜分析技術之一。煙草作為天然植物,含有大量的CH、OH、NH和C=O等官能團,因此可以應用傅里葉變換近紅外分析檢測技術對其進行分析,減少化學分析所用試劑帶來的環境污染。目前,應用傅里葉變換近紅外快速測定煙葉中化學成分已成為煙草化學研究的熱點之一,如蔣錦鋒等[1]應用傅里葉變換近紅外光譜法掃描具有代表性的煙草近紅外光譜數據, 采用偏最小二乘回歸建立了近紅外光譜信息與其含量之間的定量校正模型,建立了揮發性酸和揮發性堿的模型;王東丹等[2]應用傅里葉變換近紅外漫反射光譜儀,建立了卷煙煙絲總糖和還原糖的近紅外定量分析數學模型;覃鑫[3]將近紅外光譜分析技術應用于測定卷煙生產在線煙草樣本化學成分,建立了煙草總糖、還原糖、總植物堿、氯、總氮5項化學成分的校正模型;陳萍等[4]應用近紅外光譜法預測云南香料煙的總糖、還原糖和總氮。程志穎等[5]采用粒子群算法結合支持向量回歸法對化學成分進行建模。本研究利用傅里葉變換近紅外光譜近紅外(NIR)技術,建立煙葉總糖、還原糖、總植物堿、鉀和揮發堿進行定量分析模型,旨在實現快速無損檢測煙草中主要化學成分。
為了使建立的數學模型具有廣泛的適用性,本研究樣品選取了2015—2018年云南、貴州、廣西、湖南等不同產區、不同等級的初烤煙樣品共計500多個用于建立模型,選取20個未知樣品進行模型外部驗證。
將煙葉樣品抽梗,用QS-1試樣切絲機切絲,于40 ℃下烘干,使樣品的水分基本保持一致,再用1095 Cyclotec(XF-98B)型旋風精密粉碎機充分粉碎,過60目篩。
建模煙葉樣品的化學成分采用Skalar流動分析儀、AA3連續流動分析儀及蒸餾萃取裝置進行測定。其中,煙葉總糖、還原糖、總植物堿、鉀、揮發堿含量采用流動注射法測定。每個樣品以此檢測數據作為基礎化學值數據與樣品的光譜數據對應,采用偏最小二乘法(0PLS1)建立回歸模型。
煙葉樣品譜圖掃描采用BRUKER公司(德國)生產的MPA型傅里葉近紅外光譜儀(帶近紅外定量分析漫反射鍍金大積分球和樣品旋轉器采樣附件)進行,應用Bruker OPUS中定量分析
采用軟件QUANT6.5對譜圖進行處理,具體操作如下:將煙草粉末裝入樣品杯,在杯中的高度約為3 cm,將砝碼壓在樣品上10 s后取出,用紗布將杯子底部的石英玻璃擦拭干凈,然后將樣品杯置于旋轉平臺上進行NIR掃描。
操作參數為:光譜掃描范圍12 000~4 000 cm-1,光譜分辨率8 cm-1,掃描次數64次(約30 s)。
以透過方式采集光譜數據并處理為吸收光譜的一階微分。在建模過程中,為消除噪聲和基線的影響,采用一階導數9點平滑(Savitzky-Golay)對掃描后的原始光譜進行預處理。有研究表明,誤數據誤差水平與儀器相關系數及算法有關[6],因此模型建成后應用近紅外定量分析軟件包(偏最小二乘算法)對模型進行優化。
全光譜數據經一階導數預處理后,輸入對應建模樣品的總糖、還原糖、總植物堿以及鉀等化學測定數據,采用偏最小二乘法和交互驗證建立校正模型。采用光譜影響值(Leverage)和化學值誤差(Residua1)這2個參數分別剔除光譜和化學值的異常值。經過異常值的剔除進行逐步優化,最后得到總糖、還原糖、總植物堿、揮發堿、鉀的回歸模型。
當校正模型的雛形建立后,為確保其實用性,必須對模型進行優化。優化模型是一個重復運算模型的過程,其目的是剔除異常值(Outlier),直到獲得最佳數理指標的校正模型。異常值是指遠離模型整體的測量數據,對模型的回歸分析影響較大,這類數據一般具有較大的杠桿值(Leverage)和殘差值,需進行有效剔除。
本研究采用交互驗證(Cross-validation)建立校正模型,應用光譜影響值和化學值誤差這兩個參數分別對異常光譜和化學值進行剔除,并選擇與該組分或指標相關的最佳譜區范圍、最佳光譜預處理方法和最佳主成分維數。在確定上述參數的同時要對模型進行檢驗,以確保模型最優。對煙草中的總糖、還原糖、總煙堿等模型進行逐步優化,所得數學模型較為理想,具體模型見圖1~圖5,各模型具體參數見表1。從圖1~圖5和表1中可以看出5種化學成分的回歸模型均具有較好的相關性,可以進行定量預測。

圖1 總糖近紅外預測值與化學值的散點圖(單位:%)

圖2 還原糖近紅外預測值與化學值的散點圖(單位:%)

圖4 鉀近紅外預測值與化學值的散點圖(單位:%)

圖5 揮發堿近紅外預測值與化學值的散點圖(單位:%)
表1 各模型參數
參數Parameters總糖還原糖總植物堿氯鉀揮發堿 樣品數量467467467213213 主成分數1313141417 決定系數(R2)97.0896.7896.7995.0195.53 內部交叉驗證均方差(RMSECV)0.927 00.856 00.129 00.097 20.019 5
為更好地檢測模型的預測能力,本研究采用外部驗證的方法,選取未參與建模的20個樣品,用所建模型預測煙葉樣品的總糖、還原糖、總植物堿、揮發堿和鉀含量,并與其實測化學值比較,具體分析數據見表2。從表2可以看出,20個樣品的上述5種化學成分含量的近紅外預測值與實際化學測定值均基本一致,其平均相對偏差分別為2.76%,3.05%,3.91%,4.02%和4.35%,均小于5%,說明所建模型的預測精確性較高。
表2 近紅外方法預測值與化學值的比較
編號總糖還原糖總植物堿鉀揮發堿 測定值預測值RD/(%)測定值預測值RD/(%)測定值預測值RD/(%)測定值預測值RD/(%)測定值預測值RD/(%) 129.6728.523.9526.6125.593.912.452.411.651.761.770.570.290.283.51 231.9330.793.6428.0627.133.372.722.585.281.621.591.870.310.323.17 327.6828.161.7226.4426.011.642.352.263.902.232.163.190.360.352.82 424.1825.696.0522.4221.265.311.681.796.342.012.125.330.310.296.67 536.3737.523.1132.3430.984.291.621.591.871.891.852.140.380.405.13 627.2828.795.3925.0726.053.833.513.471.152.322.476.260.470.454.35 726.8826.063.1024.3323.682.711.651.713.572.972.834.830.530.513.84 835.9636.050.2531.8232.191.162.302.352.153.263.182.480.370.395.26 930.6031.232.0427.8726.973.283.042.943.341.941.835.840.420.432.85 1025.2726.615.1723.1922.154.593.293.362.112.292.242.210.340.365.71 1131.6132.081.4828.1429.113.381.821.841.091.631.640.610.510.533.84 1233.4833.560.2430.1929.671.741.421.516.142.572.715.300.400.385.13 1327.1627.290.4824.5925.262.693.043.215.442.652.534.630.390.375.26 1430.6931.061.2027.6826.853.042.432.315.061.982.032.490.520.543.77 1523.6423.221.7921.5820.495.084.133.983.702.712.671.490.420.432.35 1629.7929.162.1427.3226.353.611.992.115.952.652.592.290.300.326.49 1727.0227.622.2024.6724.062.503.633.581.391.871.975.210.350.375.56 1832.0532.190.4429.1829.872.342.592.455.562.682.752.580.440.424.65 1924.9123.575.5321.6221.042.722.922.784.912.422.513.650.540.563.64 2030.5831.723.1627.9328.160.823.012.894.071.851.934.230.310.323.17 平均相對偏差2.763.053.914.024.35
模型應用:應用分析系統的集成軟件將建好的校正模型編入分析流程,分析樣品時通過分析系統的操作軟件調出相應的分析流程,進行掃描光譜、預測,即對未知樣品的總糖、還原糖、總植物堿、揮發堿和鉀含量進行同時測定,在操作熟練的情況下,每小時可分析60多個樣品。
模型維護:采用外部驗證法,應用FT-NIR光譜法和化分儀、原子吸收、原子熒光等方法分別測定其相應化學成分的含量,然后進行統計評價,其目的是刪除原校正模型中不適應的光譜數據,增加欠缺的光譜數據,優化模型,使模型始終保持良好的適應狀態。
本研究采用換近紅外光譜技術建立的煙葉中總糖、還原糖、總植物堿、揮發堿、鉀的預測模型回歸系數在95%以上,說明所建模型的預測精確性較高。通過換近紅外光譜建立了預測煙葉中總糖、還原糖、總植物堿、揮發堿、鉀含量的數學模型,可以實現快速、簡便、大批量地分析煙葉中總糖、還原糖、總植物堿、揮發堿、鉀量的目的。
模型投入應用后,需每年選取一定量的具有代表性的樣品作為獨立校驗樣品,對模型進行適應性校驗,以提高模型的預測精度。
[1]蔣錦鋒,趙明月.近紅外光譜法快速測定煙草中的總揮發酸與總揮發堿[J].煙草科技,2006(3):33-37.
[2]王東丹,秦西云,趙立紅,等. 應用近紅外光譜技術分析煙絲總糖和還原糖的研究[J].分析試驗室,2007,26(5):30-32.
[3]覃鑫.在線近紅外光譜(NIR)快速測定煙草化學成分[J].西昌學院學報(自然科學版),2010,24(1):52-54,79.
[4]陳萍,逢濤,吳玉萍,等.近紅外光譜法預測云南香料煙中總糖、還原糖和總氮[J].光譜實驗室,2012,29(1):95-98.
[5]程志穎,孔浩輝,張俊,等.粒子群算法結合支持向量機回歸法用于近紅外光譜建模[J].分析測試學報,2010,26(12):1215-1219.
[6]CANDOLFI A,MAESSCHALCK R,JOUAN-RIMBAUD D.The influence of data pre-processing in the pattern recognition of excipients near-infrared spectra[J].J Pharma&Biom Anal,1999(21):115-132.
S572
A
10.15913/j.cnki.kjycx.2019.18.066
2095-6835(2019)18-0153-03
廣西壯族自治區科技廳科技攻關項目(編號:桂科AB18229002)
蔣宏霖(1974—),男,本科,研究方向為煙葉化學成分分析研究。
賈海江(1978—),主要從事煙草種植技術和分析研究工作。
〔編輯:王霞〕