王 斌,薛建新,張淑娟
(山西農業大學工學院,山西太谷030801)
壺瓶棗是山西十大名棗之一,以其果大、皮薄、肉厚、味美和極具滋補功能而享譽神州,且有極其豐富的營養價值和藥用價值[1]。目前,壺瓶棗的分級還是主要采用傳統方式,即依據果皮顏色、果實大小、形狀等進行分級、包裝,存在誤差大、果實的品質口感得不到保證、有效利用率低等問題。
近紅外光譜分析技術具有自身獨特的優點:分析速度快,可以同時測定多種組分、實現非破壞性和無污染性的測試,費用較低,應用范圍較廣等。近紅外光譜分析已經被廣泛應用于農產品品質、品種的檢測以及農業、生物化學和工業流程檢測等方面,并取得了較大的進展[2]。然而,近紅外光譜分析技術是一種間接分析方法,其依賴于復雜的化學計量學校準算法的間接定性定量分析技術,分析過程中受到很多因素(來自樣品、儀器、操作)的影響[3]。樣品掃描時樣品狀態、儀器的穩定性和分辨率、掃描的次數和方式等掃描條件都會影響近紅外數學模型的預測能力。張璐等[4]在應用近紅外漫反射光譜技術研究了研磨粒度、樣品送進程度和平行掃描次數等因素對預測豆粕中常規化學成分含量的影響,王一兵等[5]、謝麗娟等[6]分別研究了光譜分辨率對乙酰氨基苯酚和楊梅汁有效酸度的定量分析模型的影響,王竹云等[7]分析了不同掃描次數對油菜種子含油量測定值及其生活力的影響,趙巧麗等[8]分析了基于冠層反射光譜的玉米LAI和地上干物質量估測研究,高玉龍等[9]研究了新鮮煙葉不同處理對質體色素含量的影響,趙麗麗等[10]以小麥粉為樣品,研究了在傅里葉變換近紅外光譜儀上掃描條件(包括He-Ne激光頻率、分辨率、樣品粒度)對近紅外數學模型預測精度的影響,李軍會等[11-12]研究了樣品裝樣、樣品狀態和測試條件等因素對近紅外檢測結果的影響。但不同掃描次數、掃描位置對鮮棗近紅外光譜穩定性和模型建立的影響研究尚未見報道。
本試驗以壺瓶棗為研究對象,在其他條件不變的情況下,研究不同掃描次數、不同位置對模型的建立及預測能力的影響,旨在為建立實際模型時選擇最佳的測量條件提供可靠的依據。
試驗設備由微機、光譜儀、鹵光燈、校正白板等組成,其中,光譜儀為美國ASD(Analytical Spectral Device)公司生產的Field Spec 3,光譜數據間隔為1 nm,采樣范圍為350~2 500 nm,探頭視場角為10°,光源采用14.5 V鹵素燈。試驗采用漫反射方式進行樣品光譜采集。樣品硬度真實值測定采用TMS-PRO型食品物性分析儀(美國FTC公司)。
供試樣品產自太谷縣有機栽培棗園,無外部缺陷,外表全部呈紅色、形狀均一。采摘當天運至實驗室,選取無傷病及大小、顏色和成熟度基本一致的120個代表性鮮棗,并置于(0±0.5)℃冷庫中貯藏,試驗前取出于常溫放置1~2 h使之恢復常溫。將樣品按照1~120的順序依次編號,供光譜的采集、硬度的測定。
1.3.1 近紅外光譜的測定 對每一個樣品在其赤道上按120°的間隔選取3個部位采集光譜,各掃描1,3,6次,以減少隨機誤差。試驗樣品全光譜采集。在近紅外光譜分析技術的過程中,光譜采集方式的準確性、可靠性是影響光譜所建模型性能好壞的主要因素。本研究結合Field Spec 3型近紅外光譜儀的光譜采集特點,探究了樣品在不同掃描次數下不同位置的光譜模型的穩定性及所建硬度預測模型的精度。不同掃描方式的設定列于表1。

表1 不同掃描次數和掃描位置的設定
1.3.2 樣品硬度的測定 采用TMS-PRO型食品物性分析儀(美國FTC公司),用直徑為2 mm的圓平頭,測試模式為壓縮測試力,操作為返回開始;測前速率為5 mm/s,測試速率和測后速率均為2 mm/s;測試距離為15 mm,觸發力為5 g。探頭插入點與光譜采集位點相對應,每個樣品測定3次。硬度的統計結果列于表2。

表2 校正樣品和預測樣品硬度統計分析結果
1.3.3 近紅外光譜數據預處理 為了消除高頻隨機噪聲、基線漂移、樣本不均勻、光散射等對光譜質量的影響,在此采用9點平滑法(moveaverage)進行光譜預處理,能很好濾除各種因素產生的高頻噪聲;隨后再進行標準正態變量校正(SNV)處理;然后利用偏最小二乘法(PLS)建立壺瓶棗硬度的預測模型,并進行預測[13]。偏最小二乘法是一種新型的多元統計數據分析方法,它是多因變量對多自變量的回歸建模方法,在普通多元回歸無法解決的問題上能達到良好的效果,在建模方面有很明顯的優越性。
數據采用ASD View Spec Pro V5.0,Unscramble V9.8和SPSSStatistics17.0軟件進行分析。

從圖1可以看出,壺瓶棗樣品的光譜圖都在波長為875,1 090,1 625,1 820,2 100,2 200 nm處出現吸收峰。壺瓶棗在光譜圖中的吸收峰主要是由于水的吸收所導致的。
以90個壺瓶棗樣品為校正集,30個壺瓶棗樣品為預測集,對樣品的不同位置進行不同次數的掃描,從而得到樣品的全光譜數據,對其光譜數據進行預處理。采用PLS方法建立了9個硬度值預測模型。理論上好的檢測模型具有的RMSEC值和RMSEP值應該越小越好,且二者的值應非常接近,且有較高的決定系數R2值,這樣才能說明該模型穩定性好。關于樣品3個位置的1,3,6次所建預測模型的決定系數、校正集均方根誤差和預測集均方根誤差列于表3。

表3 不同掃描次數掃描不同位置的樣品模型參數
由表3可以得出,當對樣品的位置一進行1,3,6次掃描時,掃描1次的決定系數較高,但RMSEC值和RMSEP值相差較大;掃描3次的決定系數相對較低,但RMSEC值和RMSEP值較接近,表明掃描3次的模型較穩定。對樣品的位置二進行1,3,6次掃描時,掃描3次的決定系數較高,但RMSEC值和RMSEP值相差較大;掃描6次的決定系數相對較低,但RMSEC值和RMSEP值較接近,表明掃描6次的模型較穩定。對樣品的位置三進行1,3,6次掃描時,掃描1次的決定系數較高,且RMSEC值和RMSEP值較接近,表明掃描1次的模型較穩定。
當對樣品的3個位置進行1次掃描時,位置一的決定系數較高,但RMSEC值和RMSEP值相差較大;位置二的決定系數相對較低,但RMSEC值和RMSEP值較接近,表明位置二的模型穩定。當對樣品的3個位置進行3次掃描時,位置二的決定系數較高,但RMSEC值和RMSEP值相差較大;位置一的決定系數相對較低,但RMSEC值和RMSEP值較接近,表明位置一的模型穩定。當對樣品的3個位置進行6次掃描時,位置二的決定系數較高,但RMSEC值和RMSEP值相差較大;位置三的決定系數相對較低,但RMSEC值和RMSEP值較接近,表明位置三的模型穩定。其可作為以后檢測所選擇參數的參考。
校正集具有較高的決定系數和較低的標準均方根誤差,對一個模型的可靠性是十分必要的,但一個模型的優劣不僅取決于此,還要求有較高的預測能力,預測均方根誤差RMSEP值也應較低,在實際應用中后者往往尤為重要。本試驗應用所建模型對30個已知硬度值的樣品進行預測,分析模型預測能力的差異性,利用SPSS數據處理軟件對30個樣品的預測值進行方差分析,其結果列于表4。

表4 不同位置掃描1,3,6 次模型預測能力方差分析
由表4可知,不同位置掃描1,3次模型預測能力差異不顯著(P>0.05),顯著性檢驗概率分別為0.213,0.206,不必再進行Tukey檢驗的比較;不同位置掃描6次模型預測能力差異顯著(P<0.05),顯著性檢驗概率為0.037,需進一步進行均值多重比較(表5)。
由表5可知,模型預測能力按位置的不同從大到小依次排序為位置一、位置二、位置三;0.05水平上Tukey檢驗的比較顯示,3個位置的均值兩兩差異均顯著。

表5 Tukey 檢驗結果
本試驗研究了掃描次數對鮮棗近紅外光譜和模型精度的影響,結果表明,不同掃描次數下不同位置的掃描光譜所建立的硬度定標模型,其決定系數均達到0.8以上,校正均方根誤差都在0.65以下;對分別建立的1,3,6次不同位置硬度模型的預測結果進行方差分析,結果表明,不同位置進行1,3次所建的模型為較佳掃描方式,不同位置進行6次掃描時模型間有顯著差異性,顯著性檢驗概率為0.037。在采集光譜建立模型時,應考慮綜合因素選擇合適的掃描次數。
在實際的測定中,本試驗所考慮的影響因素還不夠全面,其對樣品所采集的光譜和近紅外模型的建立都有影響。下一步試驗將圍繞幾點進行更加完善的研究分析:對樣品的掃描次數將增加2,4,5次,進而對樣品所采集的光譜穩定性進行更加全面的分析;研究多測點掃描樣品的光譜對可溶性固形物含量(SSC)、有效酸度(pH值)模型建立的影響。
[1]樊軍,呂磊,尚宏偉.大棗的研究與開發進展[J].食品科學,2003,43(4):161-163.
[2]Krivoshiev G P,Chalucova R P,Moukarev M I.A Possibility for elimination of theinterferenceform the peel in non linn on destructive determination of the internal quality of fruit and vegetables by VIS/NIR spectroscopy[J].Postharvest Biology and Technology,2000,33(2):344-353.
[3]Peirs A,Schenk A,Nicolai B M.Effect of natural variability among apples on the accuracy of VIS-NIR calibration models for optimal harvest date predictions[J].Postharvest Biology and Technology,2005,35:1-13.
[4]張璐,郝永忱,劉桂賓,等.近紅外光譜法測定豆粕中常規化學成分的研究[J].檢驗檢疫科學,2003,13(1):25.
[5]王一兵,王紅宇,翟宏菊,等.近紅外光譜分辨率對定量分析的影響[J].分析化學,2006,34(5):699.
[6]謝麗娟,劉東紅,張宇環,等.分辨率對近紅外光譜和定量分析的影響研究[J].光譜學與光譜分析,2007,27(8):1489.
[7]王竹云,楊翠玲.油菜種子含油量NMR法測定的條件優化[J].西部糧油科技,2001,26(2):46.
[8]趙巧麗,鄭國清,段韶芬,等.基于冠層反射光譜的玉米LAI和地上干物重估測研究[J].華北農學報,2008,23(1):219-222.
[9]高玉龍,吳興富,宋春滿,等.新鮮煙葉不同處理對質體色素含量的影響[J].內蒙古農業科技,2008(1):25-27.
[10]趙麗麗,趙龍蓮,李軍會,等.傅里葉變換近紅外光譜儀掃描條件對數學模型預測精度的影響 [J].光譜學與光譜分析,2004,24(1):41-44.
[11]李軍會,秦西云,張文娟,等.樣品裝樣、測試條件等因素對近紅外檢測結果的影響與分析誤差源比較研究[J].光譜學與光譜分析,2007,27(9):1751.
[12]吳靜珠,王一鳴,張小超,等.樣品狀態與裝樣條件對近紅外光譜測定的影響研究[J].現代科學儀器,2006(2):69.
[13] 張淑娟,張海紅,趙艷茹,等.鮮棗可溶性固形物可見/近紅外光譜檢測建模方法比較 [J].農業機械學報,2012,43(3):108-112.