于智海,羅華平,孔德國,高 峰,徐嘉翊,王長旭,王玉婷
(1.塔里木大學機械電氣化工程學院,阿拉爾 843300;2.新疆維吾爾自治區普通高等學校現代農業工程重點實驗室)
新疆地區的紅棗種植面積在我國紅棗總種植面積中占有相當大的比重,而在新疆地區種植的紅棗尤以產自南疆地區的駿棗為典型代表[1-4]。在駿棗的加工過程中,對未經加工的駿棗進行清洗是至關重要的步驟,清洗步驟直接影響駿棗的水分含量,農產品的水分含量又是影響農產品儲存和加工的主要因素之一[5],過高的水分含量不利于駿棗的儲存,而駿棗中的水分含量對于駿棗干燥加工時的烘干溫度以及加工時間也有著直接的影響。通過實時檢測駿棗的水分含量來調整駿棗的儲存方式和駿棗干燥加工時的烘干溫度以及加工時間。因此,對駿棗清洗過程中駿棗的水分狀況進行快速的實時檢測對駿棗的儲存以及后續加工步驟的調整與選擇等具有指導和借鑒作用[6-9]。
近紅外技術是一種快速、無損的檢測方法[10-13],可應用于對食品中的蛋白質、糖類、脂肪等成分進行快速檢測[14-23]、對果實果腐病的快速篩查與監測和成熟度判別等[24-25]。羅一甲等[26]利用近紅外技術結合GA-ELM 模型進行預測,遴選出的最優預處理方法為MSC,結果表明利用近紅外技術結合GA-ELM 模型可實現對赤霞珠葡萄中的總酚含量的預測。呂都等[27]研究近紅外光譜技術與化學計量學相結合的方法,采用偏最小二乘回歸法建立模型,結果表明分位數標準化處理為最適合該鑒別模型的光譜預處理方式。
然而,國內外學者們對有關南疆駿棗在加工過程中其動態水分變化的近紅外光譜檢測方面研究卻不多。而筆者以南疆駿棗作為主要研究對象,分別在駿棗原始狀態下以及進行不同時長的浸泡處理之后對其進行了近紅外光譜采集,并將所收集到的樣本光譜分別進行了SNV、Autoscaling、Normalize 和MSC 四種不同的光譜預處理,對比不同的光譜預處理方式對駿棗動態含水量檢測模型的影響,進而遴選出四種預處理方式中最適宜該模型的預處理方式,可實現對駿棗在加工工藝程序中的動態含水量進行檢測,以及為進一步研究優化駿棗的加工處理工藝提供借鑒。
近紅外光,即NIR,是一種電磁輻射波,介于可見光和中紅外之間。NIR 在分析樣本時具有成本低、效率高、不使用化學藥劑、零污染、零損傷等優勢被人們所接受,逐漸成為一種新型的分析手段。使用近紅外光譜掃描還可以獲取樣本的內部結構信息,能夠更加全面地掌握樣本的情況。
試驗所用的駿棗樣本采集于阿拉爾市第一師10 團。主要檢測儀器是聚光科技(杭州)股份有限公司所生產的聚光世達近紅外分析儀(型號為supNIR1520,波長范圍1 000~1 800 nm,光譜分辨率≤12 nm,波長準確性±0.2 nm,波長重復性≤0.05 nm,鹵鎢燈光源,InGaAS 探測器,光譜標定使用PTFE 樹脂漫反射白板)。
試驗開始前,提前1 h從0℃的冰柜里取出待測駿棗,從中挑選出75 個大小均勻、顏色相近的駿棗作為試驗樣本,同時用水刺無紡布將駿棗表面擦拭干凈,并在駿棗的穩定面按1至75的順序進行標號。試驗樣本準備完畢后開始搭建試驗平臺,在農產品加工與無損檢測研究實驗室內通過遮光窗簾屏蔽太陽光以及其他外界光源和關閉實驗室照明設備等手段排除雜散光干擾,在試驗臺上擺放好近紅外分析儀,連接電源、數據線、電腦等輔助設備,并進行設備調試,將近紅外分析儀進行光源預熱以及參比校正。將駿棗樣品按照從左到右從上到下的順序擺放在實驗臺上,準備75 個一次性紙杯并分別注入純凈水至紙杯內約1/2 處備用。
試驗測定開始,使用近紅外分析儀按照順序對駿棗樣本的穩定面及其背面分別進行掃描并稱重及記錄掃描時駿棗樣品的質量。將駿棗樣本按順序放置于一次性紙杯中進行浸泡,20 min 后按順序取出駿棗樣本并使用水刺無紡布擦干表面水分,立刻進行掃描并稱重及記錄掃描時樣品質量。此后分別在駿棗樣品30 min 以及120 min后重復上述掃描和稱重及記錄步驟。
試驗結束后,將駿棗樣本按順序擺放到實驗托盤里,按照GB/5009.3-2010《食品中水分的測定》[28]的方法對駿棗樣本中的含水量進行測量。
因試驗環境、電噪聲、雜散光等各種因素的影響,使用近紅外光譜技術收集到的信息不但包含樣本中有用的信息,還包含某些會影響檢測結果的其他信息與信息噪聲。最終經過檢測所得到的信息真實值和實際數值之間會因此產生較為明顯的差異,導致檢測結果失真。因此需要將最原始的樣本光譜數據先進行光譜預處理,再使用經過光譜預處理后的樣本光譜數據建立光譜分析模型,本文中選擇SNV、Autoscaling、Normalize 和MSC四種光譜數據預處理方法。
通過無損檢測技術對農產品和食品的質量進行檢測的同時,應將所測得的待檢樣本的信號特點和常規檢測技術所獲取的數據信息進行有效的結合來建立分析模型。
1.5.1 近紅外分析法
在采集駿棗樣本的近紅外光譜之前,先將駿棗樣本靜置在室內1 h,使駿棗樣本的溫度等內外部品質基本趨于穩定狀態,縮小駿棗樣本的內外部與試驗環境間差差,隨后使用提前預熱30 min 的近紅外分析儀采集光譜。
對駿棗樣本采集的原始光譜進行預處理,并將駿棗樣本分為校正樣本集與預測樣本集,選取有代表性的特征波長變量作為建立模型的數據,同時通過理化手段測量駿棗內部數據信息,并將其和預處理之后的光譜數據信息建立關系。
1.5.2 建模方法以及模型評價
本文采用PLS 回歸法(偏最小二進位乘法),即一種采用類似主面體成分回歸分析法的多面體因子成分回歸計算方法對光譜數據進行建模。
預測模型進行綜合分析評價通過三個參數來判斷,相關系數(R)、預測殘差平方和(PRESS)以及預測標準偏差(RMSEP)均為其判斷標準。相關系數(R)的值越大(最大理論值為1),預測模型的預測(或回歸)結果越好,預測能力越強;相關系數(R)的值越小(最小理論值為0),預測模型的預測結果越差,預測能力就越弱。
對已經確定的75 個駿棗樣本,分別在其初始狀態下和用水浸泡處理20 min、30 min、120 min 時,從中隨機篩選出50 個駿棗樣本作為校正集樣本,將剩下的25 個駿棗樣本作為預測集樣本。駿棗樣本在初始狀態時的含水量最大值為0.2295,最小值為0.1667,平均值為0.1995,平均偏差為0.0099;駿棗樣本在浸泡20 min 時含水量最大值為0.2749,最小值為0.1699,平均值為0.2182,平均偏差為0.0168;駿棗樣本在浸泡30 min 時含水量最大值為0.3151,最小值為0.1745,平均值為0.2331,平均偏差為0.0226;駿棗樣本在浸泡120min時含水量最大值為0.4101,最小值為0.1938,平均值為0.2831,平均偏差為0.0374。
分別在初始狀態時和依次浸泡20 min、30 min、120 min 的75 個駿棗樣本中隨機選擇出其中25 個駿棗樣本,再根據隨機樣本選取的25 個駿棗樣本分別進行光譜采集,對這些樣本采集到的原始光譜對其分別采用SNV、Autoscaling、Normalize 和MSC 進行光譜數據預處理。對這些試驗樣本的原始光譜進行不同方式的光譜預處理后,再使用偏最小二乘法計算建立駿棗含水量預測模型,預測結果如表1。

表1 駿棗含水量的PLS 模型結果
為了排除光譜采集干擾,進一步提高駿棗含水量預測模型的光譜預測性和準確度,需要對駿棗樣本所采集到的原始近紅外光譜數據進行光譜數據預處理。對駿棗含水量預測模型進行綜合分析評價的判斷標準為預測相關系數(R)、預測殘差平方和(PRESS)和預測標準偏差(RMSEP)。對經過4 種光譜預處理后的樣本原始光譜分別建立對應的模型,并對所建立的駿棗含水量預測模型進行模型綜合分析評價,結果表明,利用近紅外光譜建立模型預測駿棗含水量的準確度受到預處理方式的影響。由此可得建立近紅外光譜駿棗含水量預測模型的最優預處理組合是原始光譜+MSC+PLS。相關系數由0.6845增加到0.8778,預測殘差平方和由0.0285 減少到0.0178,預測標準偏差由0.0387 減少到0.0298。
將75個駿棗樣本在初始狀態下和用水浸泡20 min、30 min、120 min 后進行光譜采集,將采集到的駿棗樣本光譜使用MSC 進行光譜數據預處理,然后將經過預處理的近紅外光譜數據使用偏最小二乘法建立駿棗動態含水量的PLS 預測模型,其結果如圖1、圖2、圖3 和圖4。

圖1 初始狀態下的駿棗光譜PLS 模型

圖2 浸泡20 min 后的駿棗光譜PLS 模型

圖3 浸泡30 min 后的駿棗光譜PLS 模型

圖4 浸泡120 min 后的駿棗光譜PLS 模型
由圖1、圖2、圖3 和圖4 可知,原始光譜+MSC+PLS所建立的預測模型中,期望值與測量值的折線趨勢相同,誤差小且均勻,可以結合NIR 技術作為檢測方法來快速、無破壞性地在駿棗的加工過程中對其含水量進行準確的實時檢測。
本次以南疆駿棗為主要研究對象、以南疆駿棗在加工過程中的動態含水量為主要研究試驗指標,以NIR為主要的試驗測定技術,在全波段(1 000~1 800 nm)測定了南疆駿棗中的動態含水量光譜檢測指標。以4 種預處理方式分別對于模型的檢測性與準確度差異顯著,相比于未經預處理的原始光譜所建立的模型,原始光譜+Autoscaling+PLS 的相關系數降低,而其它預處理方式對原始光譜進行預處理之后所建立模型的相關系數均有提高且達到0.80以上。遴選出有關南疆駿棗動態含水量檢測模型的最優光譜數據預處理組合為原始光譜+MSC+PLS,(R=0.8778,PRESS=0.0178,RMSEP=0.0298),并建立了基于近紅外光譜技術的駿棗動態含水量PLS 檢測模型。
(1)對第一師10 團所產駿棗進行試驗,為進一步提高模型的適用性和廣泛性,對南疆其他師團所產駿棗進行建模分析。
(2)對4種近紅外光譜預處理方法:SNV、Autoscaling、Normalize和MSC進行了比較,可以通過比較MC(數據中心化)、MA(移動窗口平滑)和一階導數+SG 等更多的預處理方法來增加預處理方法比較的廣泛性。
(3)建立了PLS 駿棗水分動態模型,可以使用如BP神經網絡、LS-SVM、ELM、PCA、GA-ELM、ANN 等建模方法來遴選出更優的模型。