許嘉東 唐 杰 朱 玲 朱立軍 譚廣璐 彭 忠 胡興鋒
(重慶中煙工業有限責任公司 技術中心,重慶 400060)
煙用爆珠是一種脆性膠囊,里面包裹了由多種香精香料和適量溶劑調和制成的特色香味液體[1],埋于成品卷煙濾棒絲束內,是用于卷煙香氣補償的技術手段之一。香精香料化學成分中無論是小分子易揮發的酯、醛、酮、不飽和醇、不飽和烴類,還是芳香族化合物以及生物大分子化合物,在紫外可見光譜區絕大部分都有吸收[2,3]。樣品化學成分和/或濃度發生改變,其在不同波長處的吸光度值將發生變化,光譜圖隨之改變。紫外可見光譜技術具有靈敏度高、儀器價格低、操作簡單及分析快捷等優點,方法便于普及與應用[4]。因此可選用紫外可見光譜技術檢測煙用爆珠內液。
在應用紫外光譜技術檢測復雜體系時,其核心是光譜數據的預處理和模型的建立。光譜數據的預處理方法主要有平滑、導數、歸一化、多元散射校正(MSC)及標準正態變量變換(SNV)等[5,6]。偏最小二乘判別分析(PLS-DA)方法是基于PLS回歸的一種判別分析方法,PLS算法與主成分分析(PCA)算法基本思想相近,但PLS算法將光譜分解和回歸同時進行,將濃度矩陣的信息引入到光譜矩陣的分解過程中,從而可以最大程度地利用光譜數據與主成分濃度之間的線性關系[7],因此具有高效的鑒別能力。目前對煙用爆珠的研究主要集中在不同類型爆珠的研發[8]、爆珠外觀質量檢測[9]、爆珠對卷煙有害成分及特性的影響[8,10]、爆珠安全性[11]及其內液化學成分的檢測[12]等,尚未見到煙用爆珠判別分析的研究,而煙用爆珠的錯、混和穩定性改變將極大的影響爆珠卷煙制品的質量。因此,本實驗以3種不同牌號的煙用爆珠樣品紫外可見光譜為基礎,采用PLS-DA算法建立煙用爆珠判別模型,旨在為煙用爆珠判別分析提供快速簡便的參考方法。
煙用爆珠樣品由重慶中煙工業有限責任公司技術研發中心提供。
無水乙醇(分析純,≥99.7,上海國藥集團)。
Cary60光纖紫外光譜儀(馬來西亞安捷倫公司);XSE204電子天平(感量:0.1 mg,瑞士Mettler Toledo公司)。
1.2.1煙用爆珠樣品的準備
A、B、C3種牌號煙用爆珠樣品,每月抽樣,連續抽樣12個月,每批次每個牌號隨機抽取不少于60顆。采用電子天平稱量,精確到0.001 g,篩選質量和粒徑偏差均不大于±5%的煙用爆珠作為測試樣品。
1.2.2樣品溶液的制備
在10 mL 試管中加入2~3 mL無水乙醇,取煙用爆珠1~3粒加入到試管中(由于不同牌號煙用爆珠樣品內液的濃度差異較大,因此需根據不同煙用爆珠樣品內液的濃度調整煙用爆珠和無水乙醇的料液比,使得樣品在250~330 nm范圍內的最高峰吸收值在0.2~1.0范圍內)。壓破煙用爆珠,使得爆珠內液釋放,充分搖勻,靜置,待測。
1.2.3紫外光譜測定
設定光纖紫外光譜儀測定波長范圍為190~350 nm,吸光度記錄范圍為-0.1~3.5,波長間隔0.5 nm,光程為10 mm,測定時將光纖探頭完全浸沒在溶液中,無水乙醇作為參比液調零,以連續波長掃描3次的光譜數據平均值作為樣品最終紫外光譜數據。
PLS-DA算法將光譜數據與分類變量進行線性回歸,其基本判別過程如下:首先建立校正集樣本的分類變量,將分類變量與光譜數據進行PLS分析,建立分類變量與光譜數據的PLS回歸模型,并計算預測集的分類變量的值(y)。具體的判別規則是[13]:①當y>0.5,且偏差<0.5,判定樣本屬于該類;②當y<0.5,且偏差<0.5,判定樣本不屬于該類;③當y的偏差≥0.5,判別不穩定。
根據正常樣本的y值作質量控制(QC)圖,中心線為樣本統計的平均值,控制上限(UCL)為平均值加3倍的標準偏差,控制下限(LCL)為平均值減3倍的標準偏差,對于未知樣本一致性判別規則是:①當LCL≤y≤UCL,判定樣本一致性較好;②當y>UCL或y 采用Orange軟件(3.16.0 版)和R軟件(3.5.1版)進行數據處理與統計分析。 2.1.1變量分類賦值及校正集、檢驗集樣本的選取 PLS-DA模型是基于PLS方法建立的樣本分類變量與樣品紫外可見光譜的回歸模型,根據煙用爆珠樣本不同的牌號進行分類變量和賦值。以A牌號煙用爆珠PLS模型為例,對于選定的爆珠樣本,隨機選取100個樣品,設定Y值為1,再從B和C牌號煙用爆珠樣本中各隨機選取105個樣品,設置y值為0,將上述選取的樣品作為校正集樣本。A、B、C牌號煙用爆珠各自剩下的20個樣品作為驗證集。 表1 煙用爆珠樣本分類變量 2.1.2特征波長區間的選擇 不同煙用爆珠內液的紫外可見光譜峰型和吸收強度存在差異,如圖1所示。為避免波段過寬造成光譜矩陣含有大量冗余信息和噪音干擾,導致后續分析的效率和準確度降低,本研究首先對紫外光譜波段進行了優化提取。煙用爆珠內液在190~230nm區域存在較強的末端吸收,噪音較大,不適合模型的建立,而在波長大于330nm區域吸光度小,曲線相對平滑,可利用信息少[6],光譜信息最為豐富的區域在230~330nm范圍內,因此選擇波段230~330nm作為優選譜區。 圖1 不同牌號煙用爆珠樣品紫外可見光譜圖 2.1.3紫外可見光譜數據預處理方法的比較 紫外光譜數據通過預處理可以減少噪音和干擾,提高信噪比,提取出更多的有效光譜信息,從而增強光譜的穩定性和分辨率[14]。本實驗對比了紫外光譜原始數據、平滑、平滑后標準歸一化、多元散射校正(MSC)、標準正態變量變換(SNV)、一階導數和二階導數預處理方法(表2)對PLS-DA模型的影響,依據校正均方根(RMSE)和決定系數(R2)值,判別數據預處理效果,其中RMSE越小,R2值越大,模型的穩定性越好。當主成分數均設置為7時,PLS-DA建模,不同預處理方式RMSE和R2值如表2所示。歸一化預處理對煙用爆珠PLS-DA模型沒有優化作用,1階導數處理對于B牌號、2階導數處理對于B和C牌號PLS-DA模型均起到負作用,可能是因為光譜數據中帶有的少許隨機噪聲,采用導數方法時放大了這些噪聲信號,從而導致信噪比降低。平滑加MSC以及平滑加SNV均能優化PLS-DA模型,其中SNV預處理結果略優于MSC預處理結果。因此,平滑加SNV被選為最優預處理方法。 表2 不同預處理方法不同牌號煙用爆珠PLS-DA模型RMSE和R2值 2.1.4最佳主成分數的確定 PLS-DA建模中最主要的問題就是確定最佳主成分數,主成分數的選擇直接影響模型的實際預測能力。本實驗通過不同主成分數下所建模型的RMSE和R2值的大小,綜合確定模型的最佳主成分數值[15]。從3個不同牌號煙用爆珠的PLS-DA模型的RMSE和R2值隨主成分變化圖(圖2)可知,隨著主成分數增加,3個模型的RMSE值均逐漸減小,R2值逐漸增加;當主成分數分別達到3、6、5時,A、B、C牌號煙用爆珠PLS-DA模型RMSE和R2值分別趨于穩定。而當主成分數過大時,將可能出現模型過擬合的現象[13]。因此,A、B、C牌號煙用爆珠PLS-DA模型的最佳主成分數值分別為3、6、5。 圖2 主成分數對PLS-DA模型RMSE和R2值的影響 (a):RMSE值;(b):R2值 3種不同牌號煙用爆珠樣品PLS-DA模型校正集樣本的預測結果如表3所示。A牌號煙用爆珠樣品分類變量校正集樣本的預測值分散在1附近,其他分類變量的預測值分散在0附近,偏差均小于0.2。因此,根據判別規則該模型對校正集樣本中A牌號的煙用爆珠均能準確判別,識別準確度為100%,模型的校正集相關系數(R2)為0.9862,校正集預測均方根誤差(RMSEP)為0.0550,說明該模型有較好的擬合性和較高的預測精度。B和C牌號煙用爆珠PLS-DA模型對其樣本同樣具有較好的判別能力和預測精度,預測準確度均為100%,R2分別為0.9562和0.9586,RMSEP分別為0.0994和0.0980,可用于判別和預測新的樣本。 表3 不同牌號煙用爆珠PLS-DA模型校正集預測結果 T 利用3種不同牌號煙用爆珠的PLS-DA模型對未參與建模的驗證集樣本進行分析預測,結果如表4所示。A牌號煙用爆珠樣品分類變量驗證集樣本的預測值分散在1附近,其他分類變量的預測值分散在0附近,偏差均在0.2以內。因此,根據判別規則該模型對驗證集樣本中A牌號的煙用爆珠均能準確判別,對A牌號煙用爆珠樣品的預測準確度為100%。模型的驗證集相關系數R2為0.9686, RMSEP為0.0835,說明該模型判別準確度高。B和C牌號煙用爆珠PLS-DA模型對其樣本同樣具有較好的判別能力和較高的預測精度,預測準確度均為100%,R2分別為0.9411和0.9560, RMSEP分別為0.1146和0.1063。B和C牌號煙用爆珠PLS-DA模型也具有較好的判別能力和較高的預測精度。 表4 不同牌號煙用爆珠PLS-DA模型驗證集預測結果 圖3 煙用爆珠內液單值控制圖 (a):A牌號;(b):B牌號;(c):C牌號 (1)通過無水乙醇稀釋煙用爆珠內液,紫外可見光譜掃描獲得煙用爆珠內液紫外光譜數據,光譜數據經平滑和SNV預處理后,建立了3種不同牌號煙用爆珠的PLS-DA判別模型。 (2)3個牌號煙用爆珠PLS-DA模型的校正集分類變量的預測值與實測值的相關系數均≥0.9562,PLS-DA模型對于參與建模的310個煙用爆珠樣本(校正集)和未參與建模的60個煙用爆珠樣本(驗證集)的預測準確度均為100%,模型擬合性好,預測精度高,判別能力強。且基于PLS-DA模型的分類變量值建立的單值控制圖可以對煙用爆珠內液的一致性進行快速判定。 (3)紫外可見光譜技術結合PLS-DA算法可對不同牌號煙用爆珠進行有效判別,且方法快速準確、經濟環保、易于推廣。1.4 數據處理
2 結果與討論
2.1 PLS-DA模型的建立




2.2 PLS-DA模型對校正集樣本的驗證結果

2.3 PLS-DA模型對驗證集樣本的預測效果

2.4 煙用爆珠內液一致性分析


3 結論