李 跑, 馬雁軍, 馬 莉, 周 駿, 王金明, 杜國榮
(1.湖南農業大學食品科學技術學院/食品科學與生物技術湖南省重點實驗室,湖南長沙 410128; 2.上海煙草集團有限責任公司技術中心北京工作站,北京 101121;3.山東京魯煙葉復烤有限公司技術中心,山東諸城 261000)
卷煙行業是各國重要的利稅來源,在國民經濟中占有極其重要的地位。煙葉原料的品質對卷煙產品質量有極其重要的影響[1],例如,卷煙中的還原糖與游離氨基酸可發生美拉德反應從而影響卷煙的香氣和刺激性;氯和鉀影響卷煙的燃燒性;糠醛和酚類物質影響煙氣的香氣和吸味[2]。流動分析方法是測定煙草原料中常規化學成分的主要方法。但是該方法中煙葉的前處理、溶液配制、儀器操作等比較復雜,因此流動分析實驗需要有經驗的工作者來完成,且需要較長的分析時間,產品的檢驗速度遠遠大于產品的生產速度,嚴重制約了產品質量控制的實施。
近紅外光譜法因具有分析速度快、對樣品無損、前處理簡單等優點而在煙草行業中得到了廣泛的應用[3]。近紅外光譜法利用煙草原料中被測物質含氫基團在近紅外區的吸收,以實現定性定量分析[4]。但是由于近紅外光譜的譜帶寬、吸收強度弱、特征吸收帶不明顯等缺點,用近紅外光譜法進行定性定量分析時需要借助化學計量學方法[5]。煙草原料常規指標近紅外光譜法測定的一般流程如下:采集樣品的近紅外光譜圖,并且用流動分析等方法測定其常規指標含量;利用化學計量學方法建立近紅外光譜和常規指標含量值之間的校正模型;最后利用校正模型直接對未知樣品進行定量分析[6]。其中建立穩健準確的近紅外光譜校正模型是關鍵。一旦完成模型建立即可實現對未知樣品的快速分析。近紅外光譜已經被運用至煙草原料常規指標的在線分析、調制過程穩定性實時評價等領域[7]。
由于不同儀器的光源強度、光程長度、電源穩定性、軟件參數、所處溫濕度等條件不同,同一樣品在不同儀器上采集的光譜具有一定的差異,因此近紅外光譜法的校正模型是和儀器相對應的,否則會引入較大的預測誤差[8]。由于重新建立校正模型需要很大的人力、物力投入,所以很多研究者開展了模型轉移方法研究,以期實現不同儀器間光譜模型的共享。本研究探討了煙沫樣品總煙堿近紅外光譜模型在布魯克PA型、熱電Antaris Ⅱ型光譜儀之間轉移的可行性,并且對常用模型轉移方法作了比較。通過分析發現,使用合適的模型轉移方法可以降低預測誤差,實現不同型號儀器間的模型共享。
本試驗收集從湖北恩施采集的20個白肋煙樣品、從湖北五峰采集的25個馬里蘭煙樣品共45個近紅外煙葉樣品作為標準樣品(用于2臺儀器偏差校正的樣品),將煙葉樣品放入 60 ℃ 烘箱中烘干并平衡至含水率小于10%后,用高速粉碎機制成40目篩粉末用于光譜掃描。
使用帶漫反射積分球和樣品旋轉器采樣附件的傅里葉變換近紅外光譜儀(MPA,Bruker,Germany)采集近紅外光譜,波數范圍為12 000~3 500 cm-1,間隔約為4 cm-1,分辨率為 8 cm-1,掃描次數為64次。使用帶漫反射積分球和樣品旋轉器采樣附件的傅里葉變換近紅外光譜儀(Antaris Ⅱ,Thermo Scientific,America)采集光譜,波數范圍為10 001~3 799 cm-1,間隔約為4 cm-1,分辨率為8 cm-1,掃描次數為60次。
由于2臺儀器之間的光譜采集范圍不同,在建模時都使用10 001~3 799 cm-1波段建模,便于后續分析。
模型轉移方法較多,比較經典的有單波長校正、直接校正、分段校正、斜率截距校正等[9]。
(1)單波長校正[12]。利用最小二乘原理按順序計算主儀器和從儀器每個波長處的擬合系數,并且利用該系數來校正主儀器和從儀器的差別。(2)直接校正[13-14]。收集主、從儀器上的標準光譜,利用標準光譜得出主從儀器光譜之間的轉換系數,利用轉換系數校正從儀器上的光譜為主儀器光譜。(3)分段校正[15]。分段校正和直接校正的原理相似,不同的是分段校正從光譜上分出連續的窗口,在每段窗口進行直接校正操作。(4)斜率截距校正[16]。計算標準樣品在主儀器和從儀器的預測值,得出兩者預測值的最小二乘擬合斜率和截距,利用得到的斜率和截距校正從儀器的預測值。(5)計算參數。在本研究中,煙沫樣品總煙堿近紅外光譜模型為已經建立好的MPA儀器光譜模型,建模光譜使用連續小波變換處理[10],所用小波基為Haar,尺度參數為20。用Kennard-Stone法選擇25個標準樣品來進行分析,剩余的20個樣品作模型驗證,樣品的參考值按行業方法測定。進行分段校正時,窗口參數為40。在本研究中使用主成分分析[11]方法進行數據降維,以使結果顯示更加直觀。使用預測均方根誤差(RMSEP)來表示模型的預測誤差,RMSEP越小,模型的預測誤差越小,模型的預測精度越高。
由圖1可以看出,MPA和Antaris Ⅱ這2種型號的傅里葉變換近紅外光譜儀的外觀具有較大差異,反映了2個廠家不同的設計理念。由于設計理念不同,MPA和Antaris Ⅱ的光斑大小、光源強度、轉速等測量參數不同,必然給樣品的光譜測量帶來差異,如何校正這種差異,是實現模型轉移的關鍵。

由圖2-A可以看出,相同樣品在2臺儀器上采集的光譜具有一定的差別,Antaris Ⅱ的光譜強度高。圖2-B為光譜經過主成分分析后,2臺儀器的數據在第1、2主成分上的得分,其中橢圓為99%置信橢圓。可以看出,相比于MPA儀器,Antaris Ⅱ儀器的得分圖向負方向有偏移,二者的光譜圖有差異,這種差異很有可能給后續的定量分析帶來影響。

圖3顯示了用MPA和Antaris Ⅱ采集光譜的預測結果。可以發現,MPA的預測結果優于Antaris Ⅱ。Antaris Ⅱ的預測結果相對偏高,結合圖2-A進行分析,這很可能是由于Antaris Ⅱ采集的光譜吸光度偏大的原因。

由于主儀器上的模型采用了連續小波變換預處理方法,所以在后續研究中,采用直接校正預處理以后的光譜。為了便于比較,圖4列出了幾種光譜校正方法前后儀器MPA和Antaris Ⅱ得到的光譜、光譜數據主成分的變化。
Antaris Ⅱ的光譜圖以及經過單波長校正、直接校正、分段校正的光譜圖分別見圖4-A、圖4-C、圖4-E、圖4-G(藍色虛線),為了便于比較,在圖4中標示了MPA的譜圖(黑色實線)。從圖4中大略可以看出,使用直接校正法,Antaris Ⅱ和MPA的譜圖很相似,兩者幾乎重合。為了比較幾種方法的校正效果,圖4-B、圖4-D、圖4-F、圖4-H顯示了未經校正,以及經過單波長校正、直接校正、分段校正后儀器光譜數據的得分圖,其中黑色實線表示MPA,藍色虛線表示Antaris Ⅱ。通過比較可以看出,直接校正法可以使儀器MPA和Antaris Ⅱ的主成分空間大致一致,分段校正法效果也較好,單波長校正法較差。由于斜率截距法只校正預測結果,所以該結果未在此段討論。

表1列出了Antaris Ⅱ、MPA以及經過模型轉移后驗證樣品集的預測結果,可以看出,經過直接校正后MPA的預測誤差和Antaris Ⅱ的很接近,表明該方法的優越性。而斜率截距校正法、分段校正法效果稍差,單波長校正法最差。圖5是直接校正后Antaris Ⅱ、MPA的結果,可以看出2臺儀器的預測結果基本一致。

表1 不同模型轉移方法對儀器Antaris Ⅱ、MPA驗證集預測結果的影響

研究表明,通過使用模型轉移,可以實現布魯克MPA型、熱電Antaris Ⅱ型光譜儀之間的煙沫樣品近紅外光譜模型共享。模型傳遞會引入一定的誤差,分析其來源可能是2臺儀器的噪聲水平不同、測試時樣品填裝程度不同、測試時溫度或濕度不同等。通過以上研究,表明今后的工作中可以借鑒模型轉移技術,整合不同實驗室的資源,實現不同實驗室儀器數據的共享,節約人力、物力。