高 升 ,徐建華
(1.青島理工大學信息與控制工程學院,山東青島 266520;2.青島國際機場集團有限公司運行指揮中心,山東青島 266000)
紅提營養豐富,鮮嫩多汁,深受消費者喜愛[1-2]。可溶性固形物(SSC)、總酸(TA)、pH、硬度(FI)和含水率(MC)決定了果實的口味,可反映紅提的感官性能、商品價值、水果成熟度[3-4]。FI和MC也是評價果蔬貯藏及運輸運品質的重要參考[5]。掌握紅提的含水率能及時挑選出將要腐爛的果實,對減少腐爛蔓延至關重要[6]。傳統的水果內部品質檢測為破壞性抽樣檢測,檢測后的樣本遭到嚴重破壞而無法銷售和食用,且只能通過抽樣檢測來對整體進行評價,而每個果實的品質無法進行準確評價[7-9]。測定紅提的SSC、TA、pH、FI和MC含量需要獨立的實驗,常規檢測方法無法一次性獲得。市場迫切需要一種無損、快速準確的檢測方法,實現對紅提內部品質的檢測。
光譜技術已在果蔬品質檢測方面得到廣泛應用[10-12]。劉燕德等[13]利用近紅外光譜技術建立了不同產地蘋果糖度的在線檢測通用模型,實現蘋果糖度的快速在線無損檢測。王轉衛等[14]利用近紅外光譜技術建立了蘋果可溶性固形物含量、硬度、pH和含水率的最小二乘支持向量機和極限學習機模型,實現了蘋果各內部品質指標的檢測。羅一甲等[15]利用近紅外光譜技術結合GA-ELM預測模型實現了對赤霞珠葡萄總酚含量快速準確檢測。Mza等[16]利用近紅外光譜技術實現了蘋果成熟度無損檢測,選定的特征波長和光譜指數可以為開發測定蘋果成熟度的無損設備提供參考。Byun等[17]利用近紅外光譜技術研制了一種用于蘋果糖含量的近紅外(NIR)光譜儀器,實現了對蘋果糖含量的無損檢測。近紅外光譜技術逐漸應用于葡萄品質的檢測[18-19]。Luo等[20]提出了一種基于近紅外光譜的快速方法來測定整串赤霞珠葡萄的可溶性固體含量(SSC)、pH和總酚含量(TPC)的方法,實現了對赤霞珠葡萄整串的化學參數無損檢測。此外,近紅外光譜技術在獼猴桃、葡萄等食品已經證明預測的可行性[21-23]。目前大多數的研究都側重于采后和貯藏[24-26]中果蔬內部品質指標的檢測與變化。檢測的指標大多為單個,檢測指標相對較少[27-28],利用近紅外光譜技術對生長期紅提SSC、TA、pH、FI和MC等五個內部指標的研究還未見報道。
本文以生長期紅提為研究對象,利用近紅外光譜技術分別建立準確檢測紅提各內部指標(SSC、TA、pH、FI和MC)的最優無損檢測模型,所建最優模型可為生長期紅提內部品質SSC、TA、pH、FI和MC的無損快速檢測提供新的方法。
生長期紅提 從葡萄園選取10棵紅提植株并逐一進行編號,紅提生長的周期大約為兩個月,實驗從紅提開花后的第61 d開始,每隔5 d進行1次樣本采集,每次采集10串葡萄,共采集12次。樣本于實驗當天采摘并進行編號,之后保存于恒溫恒濕箱。
Antaris II傅里葉變換近紅外光譜儀 美國Thermo Fisher;HPX-25085H-Ⅲ恒溫恒濕箱 上海新苗醫療器械制造有限公司;WAY(2WAJ)阿貝爾折射儀 申光;TMS-PRO型質構儀 美國FTC公司;XGQ-2000電熱鼓風干燥箱 余姚市星辰儀表廠。
1.2.1 樣品的選擇 在每串葡萄串的頂部、中部、底部各挑選5粒大小相近、完好無損的果粒,每串共采集15粒果粒作為實驗材料。因單個果粒進行擠壓后擠出的果汁較少,無法利用實驗方法同時對紅提SSC、TA、pH指標的測定,所以在實驗材料中挑選3粒紅提作為紅提SSC、TA、pH指標檢測的1個樣本,每串測定3個樣本,需要9粒紅提。從每串紅提采集的實驗材料中分別挑選3粒作為紅提硬度和含水率的實驗樣本,每次試驗分別取用1粒紅提,兩個指標各進行3次實驗。
1.2.2 近紅外光譜數據采集 將經過恒溫恒濕箱處理后的樣本用Antaris II傅里葉變換近紅外光譜儀進行光譜采集。選擇積分球模塊,利用該儀器采集樣本10000~4000 cm-1范圍的漫反射光譜信息。
1.2.3 標準理化值測定 對樣本進行完光譜采集后,立即對樣本進行標準理化值測定,各指標檢測方法如下:
SSC測定:將樣本放入到紅提果粒擠壓裝置榨汁,測定經紗布過濾后的果汁的SSC值。樣本SSC測定參照NY/T 2637-2014《水果、蔬菜制品可溶性固形物含量的測定——折射裝置法》。
TA測定:TA測定方法與SSC測定方法基本相同,參照GB/T 12456-2008《食品中總酸的測定》方法。
pH測定:利用校準后的pH計對測定完SSC和總酸剩余后的果汁進行pH的測定。
FI測定:將進行光譜檢測后的紅提樣本橫向放置在質構儀的實驗臺上,采用P100/R探頭進行壓縮。設置質構儀的測前速度為2.0 mm/s,測試速度為1.0 mm/s,測后速度為2.0 mm/s,起始力設置為0.05 N,壓縮距離為8.0 mm。FI的測定值為壓縮過程中樣本承受的最大壓力值
MC測定:含水率采用國標GB 5009.3-2016《食品中水分的測定》進行測定。
PLSR算法是一種較優的通過最小化偏差平方和實現對曲線進行線性擬合的算法,具有較多的優點。各指標均建立PLSR模型。模型的評價由預測集相關系數(Rp)、均方根誤差(RMSEP)和殘差預測偏差(RPD)進行模型性能的評價[1]。
由圖1可知,樣本光譜曲線中存在4個明顯波谷,分別為 4520、6000、7900、9350 cm-1。為消除噪聲等干擾信息,本研究選擇標準正態變量變換(Standard Normal Variable transformation,SNV)等預處理方法對原始光譜(RAW)進行處理[29-30]。采用不同預處理方法對RAW進行處理后所建PLSR檢測模型的結果如表1所示。

圖1 原始光譜信息Fig.1 Raw spectral information

表1 采用不同預處理方法的全波長PLSR檢測模型Table 1 Full-band PLSR prediction model using different preprocessing methods
對于SSC、TA、FI、MC來說,經過SG預處理后的原始光譜所建PLSR模型的Rc(每個模型對應的Rc值分別為0.9834、0.9799、0.9241、0.9223)和Rp(每個模型對應的Rp值分別為0.9444、0.9697、0.9155、0.8812)較大,且校正集和預測集的均方根誤差較小。因此,針對SSC、TA、FI、MC四個指標,下文選取SG預處理后進行優化。對于pH經MA預處理后所建PLSR效果較好,選取MA預處理后進行優化。
實驗中每個指標各采集360個樣本,利用SPXY算法按照3:1比例劃分為校正集和預測集[31]。SSC、pH、TA、FI和MC分布范圍、校正集及預測集的平均值如表2所示。SSC、pH、TA、FI和MC校正集的分布范圍大于預測集的分布范圍,證明通過SPXY算法劃分后校正集的樣本更具有代表性,校正集樣本分布的范圍更廣對根據校正集所建模型的穩定性及準確性都會有所提升,利用SPXY算法劃分樣本集達到了較好的效果。

表2 生長期紅提樣本利用SPXY算法劃分樣本集的數據統計Table 2 Growth statistics of red globe grape extract samples during growing period using SPXY algorithm to divide the sample set
將經過光譜預處理的原始光譜利用CARS算法、SPA算法和UVE算法提取特征波長,以下以SSC特征波長提取過程舉例說明[32]。
CARS的提取過程見圖2,蒙特卡羅采樣設置為50次,5折交叉驗證。當RMSECV值達到最小值時,為所建PLSR模型的最優結果,當運行為圖中豎線的位置時,RMSECV值最小值時,采樣運行了18次。

圖2 基于CARS算法的樣本的SSC特征波長提取圖Fig.2 Characteristic wavelength selection chart of SSC content in red globe grape extraction based on CARS algorithm
SPA算法[33]提取過程見圖3,根據RMSE的變化來確定被選取的特征變量,隨著變量個數的增加,RMSE先迅速下降,表明光譜中的無用信息被高效剔除,然后趨于平穩。圖4(a)中RMSE取得最小值24為選定的波長個數,最終選取的波長點索引見圖3(b),模型取得最好的效果。

圖3 基于SPA算法的紅提SSC含量特征波長選取圖Fig.3 Characteristic wavelength selection chart of SSC content in red globe grape extraction based on SPA algorithm
UVE提取特征波長的后選取的結果見圖4,設定噪聲矩陣最大穩定性絕對值的99%作為剔除閾值,左側黃色曲線為光譜信息,右側紅色曲線為添加的噪聲信息,只保留兩條虛線外側的有用信息。

圖4 基于UVE算法的紅提SSC含量特征波長選取圖Fig.4 Characteristic wavelength selection chart of SSC content in red globe grape extraction based on UVE algorithm
結合表1選取的最優預處理方法,對于SSC、TA、FI、MC來說,經過SG預處理后的原始光譜所建PLSR效果最佳;對于pH指標,原始光譜進行MA預處理后所建PLSR模型效果最佳。本文對預處理后的光譜采用UVE算法、CARS算法和SPA算法等一次降維算法提取特征波長后建立PLSR模型。由表3可知,一次降維算法對樣本的SSC、TA指標的提取效果較差。經過二次降維算法提取特征波段后,樣本SSC和TA的CARS-SPA模型的RPD分別為4.8637和4.9006,模型的性能得到了提升。原始光譜經過MA預處理建立的pH的PLSR模型也需要進行二次特征波長提取,二次降維后建立的CARS-SPA模型的 RPD為 6.0939。對于 FI和MC兩個指標,經過CARS特征波段提取后,FI和MC的RPD達到3.4453和2.5825,所建模型的效果較好。

表3 基于不同特征波段提取方法建立的PLSR模型效果Table 3 Effects of PLSR models based on different feature band extraction methods
對于紅提SSC、TA和pH,CARS-SPA組合降維算法提取特征波長效果最佳;對于紅提FI和MC,一次降維算法CARS提取特征波長效果最佳。在特征波長提取的基礎上建立的紅提的SSC、TA的最優檢測模型為SG-CARS-SPA-PLSR模型,pH的最優檢測模型為MA-CARS-SPA-PLSR模型,FI和MC的最優檢測模型為SG-CARS-PLSR模型。所建立的紅提的SSC、TA、pH、FI和MC的最優PLSR模型的RPD值均大于2.5,說明模型檢測效果較好。圖5為樣本的檢測效果圖,五個模型的Rc的值分別為:0.9811、0.9816、0.9878、0.9579、0.9384,五個模型的Rp的值分別為:0.9787、0.9811、0.9870、0.9568、0.9329,五個模型的RPD的值分別為:4.4837、4.9006、6.0939、3.4453、2.5825。

圖5 基于最優特征波長組合建立的紅提內部品質各指標的PLSR模型Fig.5 PLSR model of various indexes of internal quality of red globe grape extract based on optimal characteristic wavelength combination
利用近紅外光譜技術對生長期的紅提進行光譜實驗采集后,不同生長期紅提的光譜曲線都呈現出相同的變化趨勢,波峰及波谷的位置比較固定,光譜曲線的變化產生的原因為紅提內部物質,主要是含氫基團的物質對不同波段光譜的吸收和反射特性不同,SSC、TA、pH、FI和MC等指標因內部各物質的不同而有所差異。說明光譜在進行紅提內部各指標檢測時光譜曲線比較穩定,也從另外一個方面說明了用近紅外光譜技術進行檢測的可靠性和穩定性。紅提生長過程中內部品質的變化會引起光譜曲線的變化,可通過本文建立的最優模型實現對紅提各內部品質指標的無損檢測。在紅提生長過程中內部物質會發生一定的轉化,SSC、TA、pH、FI和MC等指標因內部各物質的不同而有所差異,隨著果實的成熟,SSC和pH逐漸的增加,TA、FI和MC逐漸的減小,說明果實品嘗的甜度會慢慢增加,果實逐漸成熟。后期將在本文的研究基礎上,深入探究紅提成熟度各內部指標的轉化特性,建立紅提成熟度與近紅外光譜特征波長的對應關系模型。
本文選取生長期內的紅提作為研究對象,利用Antaris II近紅外光譜儀采集了360個紅提樣本的近紅外光譜信息。通過光譜預處理和各種降維算法提取光譜信息的特征波長建立了紅提的SSC、TA、pH、FI和MC的最優PLSR檢測模型。得到的結論如下:
對于紅提SSC、TA和pH,CARS-SPA組合降維算法提取特征波長效果最佳;對于紅提FI和MC,一次降維算法CARS提取特征波長效果最佳。
紅提的SSC、TA的最優檢測模型為SG-CARSSPA-PLSR模型,pH的最優檢測模型為MA-CARSSPA-PLSR模型,FI和MC的最優檢測模為SG-CARSPLSR模型。
紅提SSC、TA、pH、FI和MC的最優檢測模型的 RPD 的值分別為:4.4837、4.9006、6.0939、3.4453、2.5825,各指標最優檢測模型的Rp都大于0.93,RPD均高于2.5,表明以上模型均具有較好的檢測效果,實現了各內部指標的準確檢測。本文建立的各指標檢測模型可為生長期紅提內部品質的無損快速檢測提供新的方法。