葛朝紅,趙爽,張洪偉,閔卓,郭鑫麗,李偉明
(河北省農林科學院棉花研究所,河北 石家莊 050051)
文冠果為我國特有的藥食兩用木本油料植物,種 仁含油量高達60%以上,且果實、根和莖均可入藥,具有十分重要的經濟價值[1,2]。文冠果除加工食用油外,還可以制作高級的工業原油。目前文冠果脂肪含量測定以化學分析方法為主,檢驗結果準確,但過程耗時費力、破壞樣品。因此,急需開發一種簡單快速、不破壞樣品、綠色環保的文冠果脂肪含量測定方法。
近紅外光譜(NIRS)技術可以快速、高效、無損檢測出植物中的各成分含量[3,4],近年來已在農業、食品和醫藥等諸多領域廣泛應用[5~13]。其中在農業上,已經建立了大豆、花生、玉米等作物相關成分的NIRS模型,并分析了各成分在不同種質中的含量[14~20],但截至目前,有關文冠果脂肪含量的NIRS 預測研究尚未見報道。本研究將波通公司第三代二極管陣列近紅外分析儀DA7250 采集的光譜與對應的化學值相結合,通過The Unscrambler X 10.4(64-bit)軟件分析,建立非破壞性快速檢測文冠果脂肪含量的數學模型,以期實現文冠果脂肪含量的快速測定,節約測定時間和成本,為文冠果育種材料篩選和工業加工提供快捷有效的途徑。
試驗材料為來自河北、山東、河南、遼寧、陜西等地不同類型的文冠果種質,其中,用于建模的種質46 份,用于模型外部驗證的種質32 份。每份樣品均隨機選取種子100 g,去殼后烘干,進行NIRS 圖譜采集;然后,將種子研磨、粉碎,過直徑1.0 mm 的圓孔篩,取篩下物置于烘箱中80 ℃烘干至恒重,裝入密封袋中保存,用于文冠果脂肪含量化學值的測定。
主要儀器或試劑有近紅外分析儀DA7250(美國波通公司生產)、索式提取器(上海洪紀儀器設備有限公司生產)和石油醚(沸程60~90 ℃)等。
1.2.1 樣品集脂肪含量化學值的測定 參照GB 5009.6—2016,采用索式抽提法[21]測定文冠果種仁的脂肪含量。
1.2.2 樣品集NIRS 圖譜的采集 選擇46 個文冠果樣品種仁,采用近紅外分析儀DA7250,在高級模式下創建采集光譜數據項目,每個數據點的分辨率為5 nm,光譜范圍為950~1650nm。為了保證試驗的準確性,光譜采集時每個樣品均重復測定3 次,裝樣數為3 次。測定每個樣品種仁的光譜數據,形成dx 格式文件。
將dx 格式文件導入The Unscrambler X 10.4(64-bit)軟件,導入成功后添加每個樣品對應的化學值;以光譜波長范圍為X 變量、化學值為Y 變量,定義數據庫范圍;查看原始光譜,刪除異常光譜及對應的異常值,形成樣品光譜圖譜。
1.2.3 NIRS 模型的建立 利用The Unscrambler X 10.4(64-bit)軟件,對經過刪除異常值的光譜利用1stDerivative、SNV 和Detrending 進行預處理,消除散射光和光程變化帶來的影響,對化學值與采集的NIRS 數據分別進行擬合處理;采用偏最小二乘法(PLS)的化學計量學方法建立數學模型,利用反復采用內部交叉驗證剔除異值和因子數的影響進行模型優化;通過比較模型的R-Square (決定系數)、RMSE(標準誤差)和因子數的影響,篩選最佳模型。RMSE越小,R-Square 越大,模型的預測效果越好。
1.2.4 NIRS 模型的外部驗證 隨機選取32 個未參加建模的文冠果樣品作為驗證材料,利用篩選的NIRS 模型進行脂肪含量預測,采用索式抽提方法測定其化學值。通過比較每個樣品NIRS 預測值與化學值的相關性和準確性,對所建模型的預測效果進行檢驗。
采用Excel 2017 和The Unscrambler X 10.4(64-bit)軟件進行數據處理與分析。
索式抽提法測定結果(圖1)顯示,46 個文冠果種仁的脂肪含量為49.38%~68.98%,平均含量為61.62%。樣品的脂肪含量基本上覆蓋了生產和育種材料的常態分布范圍,具有良好的連續性與代表性,能夠滿足NIRS 定標條件的要求。本研究選取的文冠果種仁脂肪含量變幅較寬,可用于NIRS 模型的建立。
采集46 個文冠果種仁的光譜信息后,利用The Unscrambler X 10.4(64-bit)軟件生成其NIRS 曲線,結果(圖2)顯示,46 個樣品的光譜曲線趨勢基本相同,在波長950~1 650 nm 范圍均有明顯的吸收峰,同一個樣品具有多處吸收峰,不同樣品在同一吸收峰處的峰值差異明顯。說明文冠果種仁的近紅外吸收光譜可以反映其成分的定性定量分析結果。

圖2 樣品的NIRS 圖譜Fig.2 NIR spectra of X.sorbifolia samples
通過近紅外分析儀采集光譜數據,并利用Unscrambler 軟件,將種仁的脂肪含量化學值與采集的NIRS 數據分別進行擬合處理,采用偏最小二乘法(PLS) 建立模型,反復剔除異值,并利用R-Square和RMSE 篩選最佳模型,作為預測模型。結果(圖3)顯示,模型預測值與化學方法測定值具有較好的線性關系,擬合性較好,回歸曲線的R-Square 為0.985 6、RMSE 為0.414 9。文冠果脂肪含量NIRS 模型的預測值與化學方法的測定值吻合性較好,模型可信,對文冠果脂肪含量進行預測具有很好的參考價值。

圖3 預測模型的回歸曲線Fig.3 Regression curve of the predicted model
隨機選取32 個未參加建模的文冠果樣品,對建立的NIRS 模型的可靠性進行外部驗證,結果(圖4)顯示,NIRS 預測值與化學方法測定值具有較好的線性關系,樣品數據比較集中地分布在中心線附近,RSquare 為0.940 1,RMSE 為0.825 9。說明模型預測結果可靠性高。利用NIRS 模型得到的文冠果脂肪含量預測值較準確,該模式可用于文冠果育種材料的篩選和工業生產。

圖4 NIRS 模型外部驗證的回歸曲線Fig.4 Regression curve of externally validation for NIRS model
文冠果為我國特有的木本油料作物,種仁含油量60%以上,其不飽和脂肪酸含量大于90%,含有可修復大腦神經細胞、促進神經纖維再生,對于神經退行性疾病和神經系統紊亂等具有重要預防和治療作用的神經酸,具有特殊的營養保健功能。近年來,NIRS技術在農業上的應用越來越廣泛,在多種作物上建立了預測模型,如,耿立格等[14]建立了利用近紅外光譜無損測定大豆種子生活力的模型,紀紅昌等[18]建立了基于近紅外光譜的花生子仁含油量預測模型,方彥[20]建立了利用近紅外光譜法非破壞性測定玉米子粒粗淀粉含量的預測模型。而目前文冠果脂肪含量的測定通常采用索式提取法或酸水解法,需要粉碎樣品,并使用化學試劑對樣品進行處理,不但花費大量時間,破壞樣品的完整性,還容易造成環境污染。本研究利用DA7250 近紅外光譜儀采集文冠果種仁的光譜信息,結合Unscramble 軟件,建立了種仁脂肪含量的預測模型,該模型可以較準確、快速地測定整粒、半粒、粉狀等各種狀態下文冠果種仁的脂肪含量。與傳統的檢測方法相比,該方法不破壞樣品,避免了原材料的浪費,可以在無化學試劑污染的條件下,高效、快速地測定文冠果種仁的脂肪含量。
由于近紅外光譜的收集受到測量環境、測量技術、背景成分、樣品待測成分等多種因素的影響[22],使得光譜信息大量重疊、異常復雜,預測模型的參數構成復雜,因此,近紅外光譜模型的預測準確性成為限制其自身發展的最大問題。因此,科學取樣,降低試驗誤差,對提高光譜分析模型的預測準確性非常重要。為了使模型達到理想的預測效果,本研究隨機選擇了覆蓋常態下生產和育種范圍,來源于河北、山東、河南、遼寧、陜西等多個產地,脂肪含量分布在49.38%~68.98%的文冠果資源材料,減少了試驗誤差,提高了模型的穩定性,拓寬了模型的適用范圍;模型構建過程中剔除了包含異常光譜的材料,通過預處理消除了散射光和光程變化的影響,并對化學值和光譜進行了多次擬合處理,建立并逐步優化模型,最終得到了R-Square 為0.985 6、RMSE 為0.414 9 的文冠果脂肪含量測定優化模型。綜上所述,我們建立的文冠果種仁脂肪近紅外光譜預測模型穩定、準確,檢測方法經濟、快速、高效、無污染,為文冠果育種材料篩選和工業加工提供了快捷有效的途徑。