劉 偉,劉長虹,余俊杰,李 揚
(1.合肥學院機器視覺與智能控制實驗室,安徽 合肥 230601;2.合肥工業大學食品科學與工程學院,安徽 合肥 230009;3.阜陽師范大學生物與食品工程學院,安徽 阜陽 236037;4.安徽永成電子機械技術有限公司,安徽 六安 237161)
橄欖油營養價值高,氣味獨特,近年來備受市場歡迎。由于富含不飽和脂肪酸,在儲藏過程中橄欖油易氧化酸敗,導致感官品質和營養價值劣變,進而引起質量安全問題[1-2]。傳統的植物油品質檢測方法,如高效液相色譜、氣相色譜、氣相色譜——質譜聯用等方法,成本高、耗時、費力,難以對植物油在儲藏、加工等過程中的品質裂變進行監測分析。近年來,隨著光學技術和人工智能技術的發展,近紅外、多光譜以及高光譜技術越來越多的被應用于農產品和食品的品質檢測中。但到目前為止,受近紅外光譜波段范圍限制,針對植物油的檢測報道尚不多見。
太赫茲(Terahertz,THz)是位于微波和紅外之間的電磁波,輻射頻率在0.1THz~10THz,已有的研究表明大多數極性分子對THz輻射有強烈的吸收,許多有機大分子的振動能級和轉動能級之間的躍遷也正好在THz波段范圍,并在太赫茲區域具有指紋特征。因此,THz波譜包含有測量對象豐富的物理和化學信息[3-5]。相比于其他技術,THz具有可穿透能力強、安全性好、動態范圍寬等諸多特點,被認為是21世紀十大新興科學技術領域之一。近年來,隨著電磁波技術和信息技術的發展太赫茲光譜農產品檢測中得到廣泛應用,如轉基因種子識別[6]、真偽檢測[7]、品質分析[8]等農產品和食品的安全分析中均有相關報道。本文基于太赫茲時域光譜技術,結合不同的機器學習算方法,對橄欖油儲藏過程中的氧化酸敗進行分析,同時建立相關儲藏時間的預測模型,對比檢測結果,獲取最佳預測檢測方法,為太赫茲技術在農產品檢測領域的應用做出探索[9]。
采用日本Advantest公司研發的TAS7500TS型時域太赫茲裝置(THz-TDs),脈沖信號范圍為0.1THz~5 THz,光譜分辨率為7.6 GHz,消光比50db。該設備主要由5個模塊組成,包括測量模塊、分析模塊、系統控制模塊、空氣干燥模塊和X-Y測量移動控制模塊,可完成反射和透射實驗。本研究采用的透射模式裝置如圖1所示,THz脈沖由砷化鎵晶片產生,該晶片由Ti藍寶石激光器發出,激光發射平均功率為20 mW,中心波長為1 550 nm,脈沖寬度為50 fs,重復頻率為50 MHz。

圖1 THz-TDs光譜系統光路原理圖
橄欖油樣品購置于麥德龍超市(安徽,合肥),選取生產日期一致、同一批次的西班牙圣菲利普特級初榨橄欖油。實驗前將5個干凈的100 mL無蓋錐形瓶依次倒入橄欖油,為在短時間內得到不同品質橄欖油樣品,將樣品儲藏在40℃、有光照、相對濕度為60%、敞口環境中。分別在第0、2 d、4 d、8 d和16 d取樣,將取得樣品冷卻至室溫后,通過標準方法進行脂肪酸組成分析和太赫茲檢測。
橄欖油脂肪酸測定采用氣象色譜(GC)法,具體過程如下:首先用移液槍在離心管中加入1~2滴待測橄欖油樣品,而后加入500μL 1 mol/L KOH-CH3OH溶液和3 mL正己烷,搖晃約2 min后加入3 mL蒸餾水靜置,兩相分層后,用無水Na2SO4干燥上清液,取上清液至樣品瓶中,重復3次。選用DB-WAX毛細管柱,尺寸為30 m×0.25 mm×0.25 mm,相關參數如下,檢測器溫度為250℃,進樣口溫度設置230℃,升溫過程為在100℃保持1min,然后以20℃/min速度升至200℃,保持1 min后,再以3℃/min升至230℃,保持12 min,最后氮氣流速設置為0.6 mL/min。質譜儀參數選取為電子碰撞電離為70 eV,以40m/z~800 m/z進行全掃描模式運行,各脂肪酸含量用峰面積歸一化法計算出的相對。
太赫茲光譜信息的采集過程如下:測量前將太赫茲系統預熱30 min,采用的樣品池是由對太赫茲信號影響較少的聚乙烯制成,樣品池有兩個圓柱體構成,中間有一個墊圈,并通過四個螺絲結合,擰緊固定螺絲可以將兩個聚乙烯部件固定并排除其中樣品液體中的氣泡。每次測試取500μL的橄欖油樣本,擰緊螺絲確保樣本厚度的一致性和均勻性。測量前先采集無樣品信號作為對照,而后將裝好橄欖油樣品的聚乙烯樣品杯放置在TAS7500TS HF1的測試臺上,采集3個不同位置吸收度。實驗中針對不同儲藏時間取60個樣本,共300個樣本,將其中200(40×5)個作為建模集,其余100(20×5)個作為預測集。
橄欖油中主要含有六種脂肪酸,包括棕櫚油酸、硬脂酸、棕櫚酸、油酸、亞油酸和亞麻酸,其中含量最豐富的是單不飽和脂肪酸的油酸。已有的研究表明,植物油的氧化穩定性與油酸和亞油酸的比值呈顯著相關性。通過氣象色譜(GC)法測得的儲藏過程中不同種類脂肪酸含量變化結果如表1所示。從表中可見,受儲藏過程中脂質氧化的影響,橄欖油中不飽和脂肪酸含量逐漸降低,而飽和脂肪酸含量不斷增高。其中油酸(C18∶1)含量在儲藏過程中從約79.34%下降到約76.36%,而亞油酸含量從4.64%升至約5.29%。同時油酸和亞油酸的比值也逐漸降低,從約16.39降至約14.84,說明橄欖油氧化穩定性在儲藏過程中越來越差,導致橄欖油加速氧化。

表1 不同儲藏期EVOO的脂肪酸組成(%)分析
圖2為不同儲藏期橄欖油的太赫茲光譜吸收度曲線圖。由圖可見,不同氧化程度的橄欖油太赫茲吸收度波形曲線趨勢一致,但不同儲藏期的光譜吸收度值會出現差異,可能是由于橄欖油在儲藏期間的脂肪酸、氫過氧化物、醛酮類物質等有機物含量的變化導致。不同儲藏期的吸收度差異主要集中在0.3 THz~2.0 THz頻域范圍內,同時吸收度曲線中,在0.862 12THz和1.663 21THz處存在兩個較為明顯的波峰,而在1.174 93THz和0.350 95THz處存在明顯的波谷。受太赫茲光源限制,信號在2.0 THz之后較弱,信噪比較低,數據會有較大波動。因此,在本實驗中太赫茲的信號只選擇光譜頻率從0.3THz~2.0 THz范圍內的數據。

圖2 不同儲藏期橄欖油的太赫茲光譜吸收度曲線圖
針對不同儲藏期的橄欖油的太赫茲光譜數據,才用主成分分析(PCA)進行定性分析。光譜數據采用頻域譜范圍為0.3 THz~2.0 THz,共有223個數據。圖3是不同儲藏期橄欖油前三個主成分三維得分圖。從圖中可以看出,前三個主要成分占所有光譜信息總得分的98.09%(PC1:92.55%;PC2:24.37%;PC3:1.17%),說明前三個主成分包含了太赫茲光譜的主要信息。不同儲藏期的橄欖油在主成分的分圖上具有較好的聚類效果,顯示出太赫茲光譜對不同儲藏期橄欖油應該有較好的預測效果。通過對太赫茲光譜進行PCA分析,可定性的判別不同儲藏期橄欖油的分類效果,同時可以為高維太赫茲光譜數據的降維提供一種方法。

圖3 不同儲藏期橄欖油前三個主成分三維得分圖
分別采用偏最小二乘(PLS)、支持向量機(SVM)、反向傳播神經網絡(BPNN)、隨機森林(RF)四種機器學習方法對橄欖油的儲藏天數進行預測,用于表示橄欖油的氧化程度。其中,PLS兼具主成分分析法和多元線性回歸法的優勢,計算過程相對簡單;SVM是一種快速多元建模的方法,能夠進行線性和非線性的多元建模;BPNN采用一種反向傳遞并且改正誤差的多層映射網絡,能有效控制預測結果均方根誤差;RF是基于匯編學習算法的分類器,在多變量的學習建模中具有較好效果。通過四種典型建模方法,對橄欖油的儲藏時間進行預測,得到的預測結果如表2所示。通過表2可以看出,在所有的方法中SVM的預測效果最佳,其模型在建模集和預測集中的預測準確率分別達到了98.5%和99%。在其他三種模型的預測結果中,預測正確率雖然低于SVM,但均高于90%,說明太赫茲光譜在檢測橄欖油品質中具有良好的效果。RF方法的預測結果再預測集和建模集中的結果都是最低的,可能由于實驗樣本不足,沒有建立較為理想的檢測模型。總體上看,太赫茲光譜對橄欖油中脂肪酸的含量具有較好的敏感度,從而能夠反應出橄欖油的氧化進程。通過以上不同的機器學習方法,可以有效處理太赫茲的光譜數據,并建立相關的鑒別模型,將太赫茲光譜數據與橄欖油儲藏時間進行關聯。在對比的不同機器學習建模方法中,SVM最適合鑒別不同氧化程度橄欖油檢測。

表2 SVM、BPNN、PLS和RF檢測結果
本文對橄欖油儲藏過程中脂肪酸等品質變化情況進行了分析,基于太赫茲時域光譜技術,結合不同的化學計量學方法,對不同儲藏期的橄欖油氧化進程進行預測。采用THz-TDs系統檢測獲取了不同儲藏期橄欖油樣品在0.3 THz-2.0 THz范圍內的THz吸收光譜。應用SVM、BPNN、PLS和RF不同機器學習方法建立相關檢測模型,結果表明,在SVM建立的模型在建模集和預測集中的預測準確率分別達98.5%和99%,效果最好。本文的實驗表明,THz光譜結合機器學習算法,是快速預測橄欖油儲藏期的有效方法,并通過對算法和特征的優化提取可以為實現太赫茲技術在實際生產中的應用提供支撐。