王紅英 常楚晨 金 楠 陳媛媛 雷逸群 譚 宇
(1.中國農業大學工學院,北京100083;2.湖南偉業動物營養集團股份有限公司,湖南長沙410000)
我國作為飼料第一大國,近年來對飼料品質的要求逐漸提高,飼料品質高低和利用效率直接影響畜禽產品的安全[1-2]。采用近紅外在線分析技術實時檢測飼料原料成分,可動態監控配制過程,實現精準營養,保證飼料品質和利用效率。豆粕是產量最大、使用范圍最廣的植物性蛋白飼料原料[3];玉米粉能量居谷實類飼料之首,在配合飼料中的用量高達50%~65%。在飼料生產中對作為飼料原料的豆粕和玉米粉進行快速檢測,降低生產過程中飼料成分含量的波動引起的配方失真,尤其是水分和粗蛋白的含量,具有重要的現實意義。
目前飼料領域中,關于采用離線光譜建立近紅外模型的研究已較為廣泛,但生產線檢測環境惡劣,獲取的在線光譜與離線光譜差異較大,無法在生產線上直接使用離線近紅外模型。而僅用在線光譜建模,模型的穩定性不佳,且無法通用于離線近紅外檢測。當檢測環境發生變化時,模型也要隨之改變,需耗費巨大的人力物力重新建模[4],近紅外模型轉移技術可很好的解決以上問題。目前的近紅外模型轉移方法有斜率∕截距校正、樣品擴充[5]、差值轉移、直接校正、分段直接校正[6]、Shenk 法[7]、雙競爭自適應加權采樣法[8]等。但針對離線與在線近紅外設備之間的模型轉移研究較少,關于離線與非接觸式的在線近紅外設備之間的模型轉移研究更少。近紅外建模要求大樣本量且樣本的化學值分布范圍廣,但飼料企業受配方和控制的需求限制,原料來源單一,樣品數量少,營養成分含量分布范圍窄。較大規模的飼料生產企業,不僅有在線監控飼料營養成分的需求,還有在實驗室進行飼料營養成分質檢的需求,對模型在離線與在線檢測間的通用性要求也很高。
本研究采用基于光譜共享法的近紅外模型轉移技術,該方法能用于小樣本量、窄化學值范圍樣品條件下的近紅外建模,且所建模型能在實驗室與飼料生產線之間通用,成本低、快速便捷。將離線和在線光譜相結合建立光譜共享模型,對比了僅用離線光譜或在線光譜建模的效果,并評估了光譜共享模型的穩定性和通用性。
本研究采用在線非接觸式傅里葉近紅外檢測儀MATRIX-F(Bruker 光譜儀器公司,德國)獲取在線光譜,光譜范圍12 800~4 000 cm-1,波數準確度優于0.05 cm-1,波數精度優于0.1 cm-1[9]。使用中國農業大學自主設計的近紅外在線檢測平臺[10]配合非接觸式在線近紅外探頭采集連續有效的光譜,該裝置安裝在湖南偉業公司飼料生產線上粉碎-配料運輸系統的下料溜管處(圖1)。為滿足光譜共享法對獲取在線和離線光譜樣品的一致性需求,用于獲取離線光譜的樣品也在此處取樣。在下料溜管處獲取22個豆粕樣品和26個玉米粉樣品的在線光譜,每20 s采集一次在線光譜,同時進行人工取樣,在實驗室采用傅立葉變換近紅外光譜儀MATRIX-I(布魯克光譜儀器公司,德國)獲得22 個豆粕樣品和26 個玉米粉樣品的離線光譜,儀器參數為:光譜范圍:4 000~12 800 cm-1,分辨率4 cm-1,為降低由于樣品裝杯時不均勻導致的誤差,每個樣品掃描兩次[11]。樣本量過小無法成功建模,為滿足建模需求,再額外人工獲取15個豆粕樣品和23 個玉米粉樣品的離線光譜,共取37 個豆粕樣品和49個玉米粉樣品的離線光譜。
以豆粕和玉米粉樣品的濕化學法檢測結果為基準校正近紅外模型,按照GB∕T 6435—2014 和GB∕T 6432—2018測定水分和粗蛋白的化學值,每個樣品測兩次平行,取平均值作為定量分析模型的參考值。

圖1 飼料生產工藝流程及在線近紅外探頭安裝位置示意圖
按照3∶1 的比例隔三取一地對樣品進行分集,且保證校正集和檢驗集的平均值相差不大,檢驗集的數據范圍包含在校正集的數據范圍內。采用馬氏距離法判別異常光譜,采用化學值絕對誤差的F檢驗法判別化學值的異常,并將異常樣品剔除。采用平滑校正、導數校正[12]、多元散射校正[13]、標準正態變換[14]等光譜預處理方法降低無關信息和噪聲信號對建模的干擾[15]。之后使用偏最小二乘(Partial least squares,PLS)法建立近紅外定量分析模型[16-17]。首先使用離線光譜建立離線光譜模型,受樣品數量少和樣品來源單一的影響,建模效果較差,無法用于在線檢測,故本文不予以討論。之后采用在線光譜和共享后的光譜建立近紅外模型,建模結果在下文進行詳細分析。采用以下指標綜合對模型進行評價:模型校正集相關系數RC和驗證集相關系數RP,校正均方根誤差RMSEC、預測均方根誤差RMSEP,相對分析誤差RPD[18],模型改善率Ri。
模型轉移后模型預測能力有所提升,本研究定義模型改善率Ri評價模型轉移的效果,其含義是與離線光譜模型相比,光譜共享模型的RPD 提高的百分比。Ri的計算公式為:

式中:RPD——相對分析誤差(%);
Ri——模型改善率(%)。
采用所建立的近紅外模型進行在線預測,通過預測殘差絕對值的方差S2評價預測的穩定性。預測殘差絕對值的方差越小,說明模型的預測穩定性越好。

式中:Δy——預測殘差;
n——校正集或驗證集中樣品個數;
yi,a——第i個樣品的實測值;
yi,p——第i個樣品的預測值;
S2——預測殘差絕對值的方差。
模型轉移是避免模型在不同儀器間預測失效、實現模型通用的有效手段[19]。實際生產環境復雜,采集到的在線光譜與離線光譜偏差很大。圖2 為豆粕和玉米粉的離線和在線光譜曲線,紅色為離線譜線,其余為在線譜線,由于使用了在線近紅外檢測平臺采集在線光譜,光譜質量較高,譜線平滑,趨勢合理,在線譜線走向與離線譜線的基本一致,但在線譜線的吸光度明顯高于離線譜線。
根據比爾定律[20],對于同一樣品來說,吸光度的差異僅由光程不定引起。比爾定律的表達式為:
A=εbC
式中:A——吸光度[L∕(g·cm)];
ε——待測成分的摩爾吸光系數;
b——光程(cm);
C——待測成分的物質的量的濃度(g∕L)。
豆粕和玉米粉由斗式提升機拋出后有較大的初速度,在溜管中主要依靠重力作用運動,其速度高達2 m∕s 左右,物料間的空隙較大且無法均勻流過近紅外探頭檢測位置,而且物料顆粒大小存在差異,故入射光照投射到樣品后反射到光纖探頭的光程變大,導致樣品的吸光度升高。

圖2 豆粕和玉米粉的離線和在線光譜
本研究采用光譜共享方法進行模型轉移[21],降低吸光度整體偏移的影響。光譜共享法的具體做法為:首先在現場采集不同生產批次的樣品和光譜,然后在實驗室獲取樣品的離線光譜,并進行化學值的測量,最后使用離線和在線光譜共同進行建模,以消除生產線在線檢測條件的不同帶來的誤差,增加定標模型的穩健性,并且對不同應用場合的儀器具有通用性。采用同一樣品的在線和離線光譜共同建模,即采用吸光度不同但其他光譜特征和化學值相同的光譜共同建模,可使吸光度與光程的偏差對濃度值的影響降低,消除飼料生產線實際條件對在線近紅外檢測效果的影響。該方法操作簡單,無需其他算法或校正方法,適合推廣應用于飼料企業。
采用OPUS7.0(Bruker,德國)軟件進行異常值剔除、波段選擇、光譜預處理和模型構建等,采用Excel軟件進行數據分析和繪圖。
使用離線光譜和在線光譜分別建立豆粕和玉米粉的近紅外模型,光譜預處理方法及模型結果如表1和表2 所示。表1 可見,離線光譜模型的相關系數過低,玉米粉粗蛋白的離線光譜模型RP僅0.563;RMSEC與RMSEP差值最高達0.142%,差值越大,模型的預測誤差波動越大,穩定性越差,達不到建模要求,故采用小樣本量的離線光譜建立近紅外模型不可行。在線光譜模型的RP在0.8以上,均方根誤差RMSEC、RMSEP在0.25%以下,達到近紅外建模的要求。小樣本量的在線光譜建模效果優于離線光譜建模效果,但建模效果仍有優化空間。下文采用模型轉移技術,以提高近紅外建模的效果并實現離線和在線檢測間的通用。

表1 豆粕和玉米粉離線光譜建模結果

表2 豆粕和玉米粉在線光譜建模結果
本研究采用光譜共享方法,利用在實驗室采集的37個豆粕樣品和49個玉米粉樣品的離線光譜與其中22個豆粕樣品和26個玉米粉樣品的在線光譜同時建模,即采用樣品的所有光譜建模,以提高模型預測效果和穩定性。光譜共享后的建模結果見表3,豆粕和玉米粉樣品水分和粗蛋白模型的各評價指標皆較優。相關系數皆在0.94 以上,均方根誤差RMSEC、RMSEP在0.19%以下,且校正和預測均方根誤差的差值小,說明模型預測誤差的波動小,模型穩定性較好。根據評價指標綜合衡量,光譜共享模型的建模效果好于離線和在線光譜模型,模型改善率均大于0,其中,粗蛋白指標的模型改善率均超過60%,說明光譜共享法對粗蛋白指標的優化效果更明顯。為直觀地反映建模效果,本研究繪制了散點圖,以1∶1 線為基準,點和擬合線與1∶1 線的重合度越高,模型效果越好。由圖3 可知,點和擬合線與1∶1 線重合度很高,光譜共享對模型有明顯的優化功能。

表3 豆粕和玉米粉光譜共享模型建模結果

圖3 光譜共享近紅外定量分析模型預測散點圖
近紅外檢測的重現性在實際應用中也是至關重要的[22],這就需要預測結果具有良好的穩定性,分別使用離線光譜模型、在線光譜模型和光譜共享模型重新預測豆粕和玉米粉樣品的水分和粗蛋白含量。使用離線模型對獲取的在線譜線進行預測,水分和粗蛋白含量的預測殘差絕對值皆較大,預測殘差平均值高達7.45%,無法實現在線準確檢測,故此處不對離線模型的預測殘差予以討論,只比較在線光譜和光譜共享模型對在線譜線的預測殘差。由圖4 可知,光譜共享模型的預測殘差絕對值的方差S2均小于在線模型,即光譜共享后模型的預測性能和穩定性均優于在線光譜。

圖4 在線光譜預測殘差圖
除了實時在線監控生產線外,飼料企業對飼料的離線近紅外檢測也有需求,因此近紅外模型的通用性是非常重要的[23]。將光譜共享模型應用于離線光譜的預測,預測殘差絕對值的平均值為0.3,可用于離線檢測。建立離線近紅外模型通常需要高昂的建模成本,包括化學試劑的消耗,時間的耗費,技術人員對化學成分的測定,大量樣品的采集,光譜共享模型只需采集少量樣品即可同時用于在線檢測和離線檢測,適合在飼料企業推廣。
①本文獲取37 個豆粕樣品和49 個玉米粉樣品的離線光譜,并獲取其中22 個豆粕樣品和26 個玉米粉樣品的在線光譜,建立了基于光譜共享法的近紅外豆粕、玉米粉在線定量分析模型。
②光譜共享模型的建模效果優于離線光譜和在線光譜模型,預測穩定性最佳。既可用于在線檢測也可用于離線檢測,有較好的通用性。豆粕樣品的水分和粗蛋白模型的相關系數Rp分別為0.942和0.959,預測殘差絕對值的方差S2為0.075和0.003;玉米粉樣品的水分和粗蛋白模型相關系數Rp分別為0.944 和0.994,預測殘差絕對值的方差S2為0.042和0.011。
③應用基于光譜共享法的模型轉移技術,實現對豆粕和玉米粉成分含量的在線實時檢測和離線檢測,且適用于小樣本量和窄化學值范圍條件,為應用在線近紅外檢測技術在飼料生產線上實現動態調整配方、精準飼料營養提供新方法。