龍家美,費倩雯,曾 艷,屠羽婕,陳繼昆,潘磊慶,屠 康,
(1.南京農業大學食品科學技術學院,江蘇南京 210095;2.云南省綠色食品發展中心,云南昆明 650225)
紅棗是許多化學成分的優質來源,其中包括總糖、VC、礦物質、蛋白質、氨基酸等,具有抗癌、抗氧化及延緩衰老、護肝養脾、鎮靜安神等作用,素有“營養保健丸”和“木本糧食”之稱[1]。鮮紅棗主要在秋季采收,由于其營養豐富、含水量高,極易發生腐爛變質。除少部分用于鮮食外,大部分紅棗用于深加工,常見的有干棗、紅棗飲料、蜜餞、果脯、棗酒等。脫水干制是常用的延長食品保質期的方法,以利于貯藏或作為加工原料[2?3]。熱風干燥技術是應用最廣泛的食品干燥加工方式,90%的果蔬干制品均是采用該技術加工獲得的。熱風干燥的優點是操作簡單、成本低,缺點是由于干燥時間長、溫度高等因素,干燥后的產品內外部品質均會受到一定的影響[4]。因此,對干燥過程中的紅棗進行品質檢測非常重要。VC和總糖是紅棗中主要的營養成分,是評價干燥過程中紅棗營養成分變化的主要指標。兩者的常規檢測方法均為分光光度計法[5]。該方法雖然精確,但是操作繁瑣、成本高、對樣本具有破壞性,不適合同時快速在線檢測。因此,需要尋找一種快速、便捷、無損且能同時預測VC和總糖兩種營養成分含量的檢測方法。
近紅外光譜技術在定性和定量檢測農產品內外綜合品質方面應用廣泛,但近紅外設備通常以點檢測形式進行光譜采集,無法提供樣品空間方面的信息,在分析非均質樣品和個體樣本整體特性方面有其局限性。高光譜成像技術可同時獲取待測物內外部品質的光譜信息與空間信息,相比傳統的單一波段光電探測技術,它能夠提供更加豐富的目標信息。目前,高光譜成像技術已被廣泛應用到農產品品質與安全檢測中,大量研究報道了關于谷物、水果、蔬菜、奶制品及肉制品的品質檢測,涉及到物理屬性[6]、化學屬性[7]、微生物檢測[8]、等級評定[9]、缺陷識別[10]、品種認證[11]、溯源分類[12]、食品污染[13]等各方面。近年來,已有關于高光譜成像技術無損檢測紅棗VC、總糖含量的一些研究。如何嘉琳等[14]在基于高光譜成像技術對靈武長棗VC含量的無損檢測研究中發現,基于競爭性正自適應加權(competitive adaptive reweighted sampling,CARS)建立的偏最小二乘(partial least squares,PLS)模型效果最優,其預測相關系數和預測均方根誤差分別為0.8892和12.1453%。李偉偉[15]在基于近紅外高光譜圖像技術的南疆紅棗內部品質的研究中發現,對于總糖含量采用反向傳播神經網絡(back propagation neural network,BPNN)建立的預測模型預測能力較好,其預測相關系數和預測均方根誤差分別為0.9184和0.9310。以上研究表明高光譜成像技術可以用于預測紅棗中的VC和總糖含量,但其樣本均為新鮮紅棗,對于加工紅棗營養品質的無損檢測鮮有報道。此外,大部分文獻已報道高光譜檢測農產品干燥過程中水分含量的可行性[16?18],而產品干燥過程中內部營養品質參數的高光譜檢測相關研究報道較少。
本研究擬對新鮮紅棗進行干燥處理,以獲取不同干燥時間紅棗樣本,通過高光譜成像系統獲得紅棗樣本的高光譜圖像,通過不同的光譜預處理方法建立不同的預測模型,優選出最佳光譜信息預處理方法。同時,采用連續投影算法(successive projections algorithm,SPA)分別提取針對紅棗VC和總糖含量預測的特征波長,通過灰度共生矩陣提取特征波長下的灰度圖像紋理數據,建立基于特征波長、圖像特征以及兩者融合特征的預測模型,以期實現紅棗VC和總糖含量的準確預測,為實際應用提供參考。
板棗 采摘于山西稷山稷峰鎮嘉莊村棗業聯合社采摘基地,采摘時間為2019年9月中旬,方式為人工手摘,采摘后立即快遞至實驗室,選取270個品質良好、大小均勻的新鮮紅棗,每個紅棗重約10 g,洗凈晾干后放入冰箱(0~4 ℃)冷藏保存;三氯乙酸(TCA) 成都市科隆化學品有限公司;磷酸 西隴科學股份有限公司;紅菲啰啉 山東奧康生物科技公司;蒽酮、三氯化鐵 上海沃凱生物技術有限公司;抗壞血酸 北京索萊寶科技有限公司;乙酸乙酯、無水乙醇 廣東光華科技股份有限公司;濃硫酸 南京晚晴化玻儀器有限公司;所有試劑 均為分析純。
DGG-9123A型電熱恒溫鼓風干燥箱 上海森信實驗儀器有限公司;UV-1800紫外分光光度計日本島津公司;高光譜成像系統:ImSpector V10E成像光譜儀 芬蘭Specim公司;ICLB1620CCD攝像機 美國Imperx公司;IT3900ER 150W鹵素光源 美國Illumination Technologies公司;IRCP0076-ICOMB001移動平臺、Spectra Image取像軟件、HIS Analyzer分析軟件 臺灣五鈴光學股份有限公司。
1.2.1 實驗樣本的制備 經預實驗發現,熱風干燥的最佳溫度為65 ℃,在該溫度下紅棗干燥24 h能達到安全含水量25%以下。將紅棗樣品放入65 ℃預熱30 min空氣溫度穩定后的烘箱中[6],分別熱風干燥0、3、6、9、12、15、18、21、24 h,每個時間段干燥30個紅棗,共270個紅棗。從烘箱中拿出來后放入干燥器中待其冷卻至室溫后立即進行高光譜圖像采集。
1.2.2 高光譜信息的采集 采用反射模式可見/近紅外高光譜成像系統進行實驗。采用可見/近紅外高分辨率CCD相機捕捉樣本圖像信息,單波長圖像像素為804×440。成像光譜儀光譜分辨率為2.8 nm,在消除前后噪聲波段區域后,保留400~1000 nm有效信息。為了獲取清晰無失真的高光譜圖像,設置相機鏡頭距樣本28 cm,曝光時間2 ms,平臺移動速率6.8 mm/s,光源強度為90 W。為了充分照亮目標樣本,投射角度與水平呈45 °夾角,與樣品距離30 cm,以減少陰影影響[19]。
由于相機暗電流、光源強度分布不均勻、食品形狀多種多樣等因素的存在,通常在弱光源強度的波長范圍內采集的圖像會產生較大的噪點,從而為數據處理帶來了多余的信息[20?21]。因此需要通過圖像采集軟件進行黑白板校正,暗反射圖像是通過用不透明的蓋子完全覆蓋相機鏡頭獲得,使用聚四氟乙烯白板(99.99%反射率)獲得白色反射圖像。該實驗所獲得的高光譜圖像校正公示如下:

其中,R代表校正后的圖像;R0代表原始高光譜圖像;D為全暗反射圖像,反射率幾乎為零;W表示全白反射圖像,幾乎為全反射。將校正后的圖像作為后續處理和分析的基礎。
1.2.3 VC和總糖含量的測定 高光譜圖像采集完成之后,立即進行VC和總糖含量的測定。VC含量采用分光光度法進行測定,稱取2.5 g樣品置于研缽中,加入10 mL 50 g/L TCA溶液,在冰浴條件下研磨成漿狀,轉入到25 mL容量瓶中,并用50 g/L TCA溶液定容至刻度,混合、提取10 min后,過濾,收集濾液備用。取1 mL樣品提取液于試管中,加入1.0 ml 50 g/L TCA溶液,再按制作標準曲線相同的方法,加入其它成分,將混合液置于30 ℃反應60 min,于波長534 nm處測定吸光度值。標準曲線方程為:y=0.0145x+0.0074(R2=0.9989),其中,x為抗壞血酸質量,y為吸光度值。
總糖含量采用蒽酮試劑法測定,稱取0.5 g樣品充分研磨后加入少量蒸餾水轉入到刻度試管中,封口煮沸30 min后,冷卻后過濾到50 mL容量瓶中,并用蒸餾水定容至刻度。取0.5 mL樣品提取液于試管中,加1.5 mL蒸餾水,0.5 mL蒽酮-乙酸乙酯和5.0 mL濃硫酸,沸水浴保溫1 min,于波長630 nm處測定吸光度值。標準曲線方程為:y=0.0079x(R2=0.9993),其中,x為總糖質量,y為吸光度值。每個樣本重復測定3次,取其平均值。
1.3.1 光譜特征信息提取 使用MatlabR 2010b軟件進行光譜數據的提取和分析。以整顆紅棗為分析對象,挑選背景與樣本光譜相對反射值差值最大的689 nm波長處的灰度圖像,進行二值化閾值分割和背景去除,統計樣本總的像素點個數和有效光譜值總和,提取每個紅棗的平均光譜值,經歸一化計算得到相對反射率用于后續數據處理和分析[22?23]。
1.3.2 光譜預處理及特征波長提取 光譜包含了噪音、背景顏色、暗電流等一些無用的信息。雖然圖像校正可以減少暗電流的影響,但不能消除噪聲和基線漂移現象,為了減少這些現象的影響,需要進行光譜預處理以提高模型的準確性和魯棒性[24]。本研究所嘗試的預處理方法有標準化(Autoscale)、一階導數(1-st)、二階導數(2-nd)、多元散射校正(multiplicative scatter correction,MSC)和變量標準化(standard normalized variate,SNV)。
每幅圖像都具有成百上千個連續波長的高光譜數據,這對于數據處理來說是一個很大的問題[25]。因此,特征波長的選擇對于降低計算負擔和簡化預測模型非常重要。本研究采用SPA進行特征波長的選擇,該算法利用矩陣向量的投影分析,通過將波長投影至其他波長上,比較投影向量的大小,并選擇投影向量最大的波長為待選波長,最后基于校正模型選擇最終的特征波長[26]。
1.3.3 圖像紋理信息提取 灰度共生矩陣(gray level co-occurrence matrix,GLCM)是一種有效的統計紋理分析技術,其中紋理特征通過統計方法從共生矩陣中提取[27]。本實驗引入圖像紋理特征用以反映干制紅棗表面的外在形態,考慮圖像各像素點之間存在關聯性,利用GLCM分別提取0 °、45 °、90 °和135 °方向上對比度、能量、熵以及相關性作為紋理特征參數。由于所得信息維度較大,故以4個紋理信息的平均值和標準差代表最終的紋理信息。每幅圖像可以獲得8個參數值來代表該圖像的紋理信息。GLCM的步驟在MatlabR2010b中進行。
1.3.4 模型的建立與評估 采用PLS算法對紅棗VC和總糖含量進行預測。關于建立模型的性能評價,分別通過對建模集和驗證集的決定系數(R2)、預測集均方根誤差(root mean square error of prediction,RMSEP)、剩余預測殘差(residual predictive deviation,RPD)進行計算。通常,一個好的模型應該具有較高的建模集決定系數,預測集決定系數和RPD值,較低的RMSEP值[28],且當RPD>2.5時,表明模型效果較好[26]。
如圖1(a)所示,紅棗在干燥過程中的VC含量隨干燥時間的增加而減少,當干燥時間達到12 h,紅棗的VC含量趨于穩定,這主要是由于VC在高溫下容易被氧化[3]。圖1(b)是不同干燥時間下紅棗總糖含量(以濕基計算)的變化趨勢圖,可以發現,紅棗的總糖含量隨干燥時間的增加而增加,這是由于在熱風干燥的條件下,紅棗水分不斷減少,從而導致紅棗中的所含糖分相對含量增高[29]。劉坤[1]利用相關性分析方法對干制過程中紅棗水分含量和糖分含量之間的關系進行了研究,結果表明兩者之間呈現極顯著的負相關關系,即干制過程中紅棗糖分含量的上升主要是由于水分含量的下降引起的。

圖1 紅棗干燥過程中VC(a)和總糖(b)含量的變化Fig.1 Changes in contents of VC (a) and total sugar (b) of jujube during the drying process
從圖2可以看出,不同干燥時間測試樣品整個光譜的總體趨勢是相似的。在630和660 nm處有一個小的峰和谷,可能與紅棗中的葉綠素有關[19],在730和970 nm處均有一個明顯的水分吸收谷,是水分子中O-H鍵三級倍頻吸收帶造成的[19]。900~1000 nm之間的光譜反射差異明顯,可以用來區分不同干燥時間段的樣本。紅棗含有總糖、VC、蛋白質,有機酸和多酚等化學成分,這些生物化學成分在檢測其光譜反射率值時會有相應的響應。由于紅棗中的某些化學成分會在干燥過程中發生變化,因此樣品的反射曲線在可見/近紅外光譜區域中發生了變化和重疊,從而導致復雜的光譜[25]。

圖2 紅棗干燥過程中相對反射率Fig.2 Relative reflectance of jujube during drying process
2.2.1 樣本集的劃分 根據含量梯度法[26],將270個樣本以2:1的比例選出建模集和預測集,樣本統計結果見表1。預測集樣本的化學值均在建模集樣本化學值范圍內,且化學值分布較均勻。

表1 紅棗VC和總糖含量樣本劃分統計結果Table 1 Statistical results of VC and total sugar contents in jujube samples
2.2.2 預處理方法的選擇 從表2可以看出,對于VC含量預測模型,基于原始光譜建立的PLS模型具有相對較好的預測準確度(=0.967,RMSEP=21.488 mg/100 g,RPD=5.534),基于MSC和SNV兩種預處理方法對模型預測效果沒有明顯的影響。原始光譜包含大量的噪聲和干擾信息,光譜預處理的目的是提高信噪比,以進行有效的多元建模,但是不恰當的預處理方法選擇反而會放大這些噪聲,降低信噪比。對于VC含量預測模型,Autoscale、1-st、2-nd三種預處理方法對模型的預測準確度都有不同程度的降低。結果表明,不經過光譜預處理的建模效果最好。楊曉玉等[30]在高光譜快速檢測靈武長棗VC含量的研究結果也表明未經過光譜預處理的建模效果較好。

表2 不同光譜預處理方法PLS模型VC和總糖含量預測結果Table 2 Prediction results of VC and total sugar contents of the PLS model built with different spectral pretreatment methods
對于總糖含量預測模型,基于原始光譜建立的PLS模型具有相對較低的預測準確度,五種光譜預處理方法均降低了噪聲和干擾,極大地提高了模型的性能。1-st、2-nd兩種預處理方法對去除原始光譜中不相關信息的重要性較低,基于MSC和SNV兩種預處理方法的PLS模型的預測結果相似,因為它們的目的基本相同,主要是校正散射影響,這一結論與Pu等[31]的結果一致。其中,采用Autoscale預處理方法建立的模型從0.851提高到0.880,RMSEP從0.0449降低到0.0405,其應用于預處理原始光譜可以更好地預測紅棗的總糖含量,即Autoscale為最優預處理方法。
對VC和總糖含量預測的原始光譜數據分別經過無預處理和Autoscale預處理后,在400~1000 nm的光譜范圍內獲得了總共420個波長信息。為了減小光譜數據的維數并減少計算時間,采用SPA從整個光譜范圍中選擇特征波長,以SPA算法處理過程中的RMSE值大小來確定特征波長及其數量。提取的VC特征波長分別為403、665、685、704、748、822、910、1000 nm,總糖特征波長分別為403、404、413、489、695、893、953、995 nm,均為8個。此外,GLCM用于從8個特征波長的特征灰度圖像中提取紋理特征。結果,每個樣本共計獲取64個紋理變量。
基于全波長變量、特征波長變量和紋理特征變量建立PLS回歸模型,對干制紅棗的VC和總糖含量進行預測。表3顯示了用于評估模型性能的主要統計數據。從表3可以看出,對于VC和總糖的含量預測模型中,VC含量的預測結果均優于總糖。于慧春等[32]在基于特征光譜模型對枸杞多糖和總糖含量的預測性能比較中也發現,多糖模型的校正集及預測集結果均優于總糖。此外,兩種含量預測模型均是基于特征波長建立的模型預測效果略低于全波段建模,說明在SPA特征波長篩選中,大量噪聲及背景信息被刪除,也同時存在部分特征數據丟失,從而造成了特征波長建模過程準確性下降。但是模型的RPD大于2.5[26],建模效果較好,另外經SPA處理后保留了不足2%的原始信息,考慮建模效率和模型維度方面,更適用于實際應用。

表3 不同特征信息建立的PLS模型VC和總糖含量預測結果Table 3 Prediction results of VC and total sugar contents of the PLS model built with different characteristic information
對于VC含量預測模型,相比較基于特征波長建立的模型,雖然基于紋理特征變量建立的模型效果較低,但是依然有一個較好的預測準確度(=0.895,RMSEP=38.386 mg/100 g,RPD=3.098)。基于光譜和紋理變量建立的PLS模型均具有較好的預測效果,可能是因為干制紅棗的VC含量變化在紅棗的光譜和紋理數據中都得到了很好的反映。光譜信息可以解釋紅棗樣品的化學屬性,這些化學屬性與VC含量的變化密切相關;而對于圖像信息,由于紋理變化通常伴隨紅棗相關化合物的變化,因此VC含量也可以通過紋理特征很好地預測,Cheng等[27]在結合光譜和紋理數據以增強高光譜預測紅肉中K值(肉的新鮮度)能力的研究中也提出,由于紋理變化通常伴隨著腺苷三磷酸(adenosine triphosphate,ATP)相關化合物的變化,因此K值也可以通過紋理特征很好地預測。
對于總糖含量預測模型,相比較基于光譜信息建立的模型,基于圖像信息建立的模型預測效果較差(=0.779,RMSEP=0.0552 g/g,RPD=2.120),這可能是因為在建立PLS模型時,光譜數據比紋理數據具有更大的貢獻,光譜特征與總糖含量的相關性大于紋理特征。光譜信息可以解釋紅棗的內部屬性(化學成分和組織結構等),這些屬性與總糖變化密切相關,而在干燥過程中發生的紋理變化與總糖含量變化沒有顯著相關性。
數據融合可將不同類型的數據信息進行協調優化和綜合處理,通過數據疊加或者特征結合等方式能實現整體大于局部的預測目的。對高光譜圖像的光譜和紋理特征進行整合,有望使高光譜成像技術預測干制紅棗VC和總糖含量的性能進一步提高。在多數研究中,將數據融合方式簡要歸納成三種形式,分別為:原始信息的數據融合、特征層的數據融合以及決策層的數據融合[33]。在這項研究中,為了避免巨大的數據計算量和潛在的信息丟失,通過特征層的數據融合將高光譜圖像的光譜和紋理特征融合在一起,然后基于融合特征使用PLS方法建立VC和總糖含量的校準模型。
對不同干燥時間的紅棗VC和總糖含量進行了無損檢測,分別優選出無預處理和Autoscale預處理為最佳方法。基于SPA分別篩選出8個特征波長,建立了PLS預測模型,考慮到模型運算速度,選擇SPA-PLS為光譜數據的最優建模方法。通過比較基于特征波長、圖像特征以及兩者融合特征的預測模型效果發現:對于VC含量,基于特征波長建立的模型為最優預測模型(=0.935,=0.930,RMSEP=30.439 mg/100 g,RPD=3.907);對于總糖含量,基于數據融合建立的模型預測性能最好(=0.921,=0.883,RMSEP=0.0400 g/g,RPD=2.925)。研究結果表明高光譜成像技術可以用于干制紅棗VC和總糖含量的無損檢測。