孟慶龍,尚靜,黃人帥,張艷
1(貴陽學(xué)院 食品與制藥工程學(xué)院,貴州 貴陽,550005)2(貴陽學(xué)院 農(nóng)產(chǎn)品無損檢測工程研究中心,貴州 貴陽,550005)
獼猴桃屬于后熟型水果,為了延長其貯藏期,經(jīng)常采摘還未成熟的果實(shí),但是如果過早采摘,果實(shí)就會(huì)特別生硬,影響口感,果實(shí)也易受冷害;若過晚采摘,果實(shí)十分柔軟就會(huì)因?yàn)橐赘癄€而難以貯藏[1]。獼猴桃的硬度是衡量其成熟度的關(guān)鍵指標(biāo)之一,因此,開展獼猴桃硬度的快速無損檢測對(duì)于指導(dǎo)其采收時(shí)間、采后儲(chǔ)藏和加工具有重要意義。
水果硬度的傳統(tǒng)檢測方法是將果實(shí)硬度計(jì)的檢測探頭壓入水果果肉中檢測其硬度[2],然而這種方法最大的缺點(diǎn)是破損樣本。基于光譜技術(shù)的無損檢測方法具有諸多優(yōu)勢,如分析速度快、無污染、無損傷等,近年來,這種方法已被廣泛地用于水果品質(zhì)的快速檢測,引起國內(nèi)外研究學(xué)者的頗多關(guān)注[3-8]。目前,研究人員已開展了關(guān)于香蕉[9]、蘋果[10]、桃[11]、李子[2,12]、梨[13-14]和藍(lán)莓[15]等水果硬度的無損檢測,并取得了一定的成果。邵園園等[16]利用高光譜成像技術(shù)快速無損檢測了獼猴桃貨架期,研究發(fā)現(xiàn)獼猴桃的硬度值隨著貨架期的延長而逐漸減小,與貨架期表現(xiàn)出負(fù)相關(guān)性。HU等[17]無損監(jiān)測了1-甲基環(huán)丙烯對(duì)成熟期獼猴桃中糖分積累的誘導(dǎo)機(jī)制。尚靜等[18]采用光纖光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)實(shí)現(xiàn)了李子硬度的無損檢測,其連續(xù)投影算法-誤差反向傳播網(wǎng)絡(luò)(successive projections algorithm-back propagation,SPA-BP)模型的預(yù)測集相關(guān)系數(shù)(rp)和均方根誤差(root mean square error of prediction,RMSEP)分別為0.70和1.61 kg/cm2。但是,關(guān)于不同成熟期獼猴桃硬度無損檢測的研究卻未見報(bào)道,而且在水果品質(zhì)無損檢測中應(yīng)用光譜技術(shù)存在數(shù)據(jù)量冗余的問題,嚴(yán)重影響了預(yù)測模型的檢測效率。
本文采用光纖光譜采集系統(tǒng)獲取不同成熟期“貴長”獼猴桃的反射光譜;為預(yù)測獼猴桃硬度分別構(gòu)建基于全光譜數(shù)據(jù)的主成分回歸(principal component regression,PCR)和偏最小二乘回歸模型(partial least square regression,PLSR);然后分別利用競爭性自適應(yīng)重加權(quán)算法(competitive adaptive reweighted sampling,CARS)以及連續(xù)投影算法(successive projection algorithm,SPA)對(duì)全光譜數(shù)據(jù)進(jìn)行降維,并基于特征光譜構(gòu)建獼猴桃硬度的多元線性回歸(multiple linear regression,MLR)預(yù)測模型,以期為獼猴桃硬度無損檢測裝備的開發(fā)提供理論基礎(chǔ)。
不同成熟期(未熟期、半熟期、成熟期、過熟期)“貴長”獼猴桃于2019年9月17日至2019年10月19日分4批次采自貴州省修文縣龍關(guān)口獼猴桃果園,樣品從不同的果樹上隨機(jī)采摘,每批次采摘50個(gè)無病蟲害且無機(jī)械損傷的樣品,共計(jì)200個(gè)。樣品采摘后立即運(yùn)到實(shí)驗(yàn)室,在實(shí)驗(yàn)室溫度為(22±2) ℃條件下貯藏,用柔軟的紙品輕輕擦掉獼猴桃樣品表面的塵土等雜物,依次對(duì)其編號(hào)后采集光譜并測量硬度。
光纖光譜采集系統(tǒng),蔚海光學(xué)儀器(上海)有限公司,該系統(tǒng)主要由QEPro光譜儀(波長為198.2~1 006.4 nm,分辨率為2.84~3 nm)、R600-7-VIS-125F光纖(直徑為600 μm)、HL-2000鹵鎢燈光源(波長為360~2 400 nm)、RPH-1反射探頭支架、RPH-ADP適配器、WS-1標(biāo)準(zhǔn)反射白板以及Lenovo計(jì)算機(jī)等構(gòu)成,系統(tǒng)結(jié)構(gòu)如圖1所示。

圖1 光纖光譜采集系統(tǒng)Fig.1 Optical fiber spectroscopy acquisition system
GY-4數(shù)顯果實(shí)硬度計(jì),杭州綠博儀器有限公司。
將待測獼猴桃緊貼在反射探頭支架RPH-1上(通過RPH-ADP適配器將反射探頭固定在反射探頭支架RPH-1上,反射探頭支架表面距離樣本約1 cm),光譜采集部位為獼猴桃赤道位置,5次采集的平均值作為該樣本的光譜數(shù)據(jù)。系統(tǒng)的積分時(shí)間為110 ms,掃描平均次數(shù)為8,滑動(dòng)平均寬度為1,光譜采集由軟件OceanView控制完成。
實(shí)驗(yàn)使用數(shù)顯果實(shí)硬度計(jì)測量獼猴桃樣本的硬度,硬度計(jì)的探針直徑為7.9 mm,探頭壓入果子的深度約10 mm,計(jì)量單位為kg/cm2。測量時(shí)先將獼猴桃樣本測量部位去皮,然后將探頭正對(duì)果肉處,緩慢勻速壓入,至刻線處止,每個(gè)獼猴桃樣本分別測量3個(gè)位置,3次測量結(jié)果的平均值作為該樣本的實(shí)測值。
1.5.1 特征光譜提取
實(shí)驗(yàn)采取SPA和CARS選取特征波長。SPA是一種將矢量空間共線性最小化的前向變量選擇方法,其優(yōu)點(diǎn)在于從全光譜中選取若干個(gè)特征波長,來消除原始光譜中的多余信息,通常依據(jù)預(yù)測集均方根誤差的最小值來選定最佳的特征波長數(shù);CARS依靠指數(shù)衰減函數(shù)對(duì)每一次循環(huán)建立的偏最小二乘模型中回歸系數(shù)絕對(duì)值最大的因數(shù)進(jìn)行選擇,同時(shí)采用自適應(yīng)重加權(quán)采樣技術(shù)去掉權(quán)重小的因數(shù),經(jīng)過多次重復(fù)選擇,選出交互驗(yàn)證均方根誤差值最小的變量子集。特征光譜的提取在MATLAB R2016b軟件中執(zhí)行。
1.5.2 建模方法及模型評(píng)價(jià)
對(duì)全光譜數(shù)據(jù)進(jìn)行降維處理后,分別基于全光譜和特征光譜數(shù)據(jù)建立了獼猴桃硬度PCR、PLSR和MLR模型。PCR方法的主體思路是先將自變量進(jìn)行主成分分析,然后用主成分替換原自變量后與因變量做多元線性回歸,而PLSR是同時(shí)對(duì)自變量和因變量做主成分分析的一種多元線性回歸分析方法。當(dāng)有m個(gè)自變量X(光譜數(shù)據(jù)),即X1,X2,X3,…,Xm,則自變量X和因變量Y(硬度實(shí)測值)之間具有線性回歸方程,如公式(1)所示:
Y=β0+β1X1+...+βmXm+ε
(1)
設(shè)觀察值為{(Yi,Xi1,…,Xim),i=1,2,…,n},則MLR模型可以表示成如公式(2)所示方程:
(2)
(3)
(4)
(5)
(6)
(7)
式中:nC和nP為校正集和預(yù)測集中的樣本數(shù),yact和ymean為樣本參考值實(shí)測值和平均值,ycal和ypre為校正集和預(yù)測集中樣本預(yù)測值,SD表示預(yù)測集中樣本實(shí)測值的標(biāo)準(zhǔn)偏差。
不同成熟期獼猴桃硬度的統(tǒng)計(jì)結(jié)果如表1所示,獼猴桃的硬度值隨著其逐漸成熟而減小。在構(gòu)建回歸預(yù)測模型之前,需要基于采集的光譜數(shù)據(jù)和測量的硬度值將所有獼猴桃樣本劃分為校正樣本集和預(yù)測樣本集,校正集中硬度值的范圍要比預(yù)測集的范圍寬是劃分樣本集的評(píng)判標(biāo)準(zhǔn)。本文利用SPXY(sample set partitioning based on jointx-ydistances)方法[20]將200個(gè)獼猴桃樣本按照3∶1劃分成150個(gè)校正樣本集以及50個(gè)預(yù)測樣本集。校正樣本集和預(yù)測樣本集中獼猴桃硬度統(tǒng)計(jì)數(shù)據(jù)見表2,頻率分布圖如圖2所示,校正集中獼猴桃硬度的范圍比預(yù)測集中的范圍寬,這樣劃分的樣本集有助于后期建立較優(yōu)的預(yù)測模型。

表1 不同成熟期獼猴桃硬度統(tǒng)計(jì)結(jié)果 單位:kg/cm2

表2 校正集和預(yù)測集中獼猴桃硬度統(tǒng)計(jì)結(jié)果 單位:kg/cm2

圖2 獼猴桃硬度頻率分布圖Fig.2 The probability distribution of the firmness of kiwifruit
由于原始光譜的首末兩頭含有較多的噪聲,因此剔除前10個(gè)和后10個(gè)波長,選擇波段為206.33~999.06 nm的作為有效光譜,該區(qū)域共有1 024個(gè)波長。為了提升預(yù)測模型的精確度和穩(wěn)定性,在建模之前采取多元散射校正(multiplicative sactter correction,MSC)對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理。圖3給出了獼猴桃樣本的原始反射光譜(圖3-a)以及經(jīng)過MSC(圖3-b)預(yù)處理后的相對(duì)反射光譜。由圖3可知,在波長675 nm附近的吸收峰是由表面葉綠素的吸收而產(chǎn)生的,反映了獼猴桃表面的顏色信息,波長980 nm附近的吸收峰則是由水分的吸收而產(chǎn)生的,體現(xiàn)了獼猴桃的水分含量信息。

a-原始光譜;b-MSC預(yù)處理后光譜圖3 獼猴桃反射光譜Fig.3 Reflectance spectra of kiwifruit


表3 PCR和PLSR模型對(duì)獼猴桃硬度的預(yù)測結(jié)果Table 3 Firmness prediction results of kiwifruit by PCR and PLSR model
2.4.1 采用SPA提取特征波長
利用SPA提取特征波長時(shí),通常依據(jù)RMSEP的最小值來選定最優(yōu)的特征波長數(shù)。RMSEP隨SPA中有效波長數(shù)的變化情況如圖4-a所示,表明RMSEP隨有效波長數(shù)的增加而減小,當(dāng)有效波長數(shù)>7時(shí),RMSEP減小的趨勢不明顯,因此將這7個(gè)波長(占總波長量的0.68%)作為特征光譜。圖4-b給出了提取的特征波長分布圖。

a-RMSEP隨SPA中有效波長數(shù)的變化情況;b-提取的特征波長圖4 SPA算法提取特征波長結(jié)果Fig.4 The results of characteristic wavelengths selection by SPA algorithm
2.4.2 采用CARS選取特征波長
利用CARS選取特征波長時(shí),其蒙特卡洛取樣次數(shù)設(shè)定為50次,利用5折交叉驗(yàn)證方法計(jì)算所建立的偏最小二乘(partial least squares,PLS)模型的交叉驗(yàn)證均方根誤差(root mean square error of cross validation,RMSECV)。圖5給出采用CARS算法提取特征波長的結(jié)果,其中不同采樣次數(shù)下RMSECV的變化規(guī)律如圖5-c所示,可以看出第26次采樣獲得的RMSECV值最小,有42個(gè)特征波長(占總波長量的4.1%)包含在該最優(yōu)波長集中(如圖5-b所示),圖5-d給出了提取的特征波長分布圖。

a-回歸系數(shù)變化路徑;b-每次采樣中變量的變化情況;c-不同采樣次數(shù)下RMSECV的變化情況;d-提取的特征波長圖5 CARS算法提取特征波長結(jié)果Fig.5 The results of characteristic wavelengths selection by CARS algorithm


表4 基于特征光譜構(gòu)建的MLR模型對(duì)獼猴桃硬度的預(yù)測結(jié)果Table 4 Firmness prediction results of kiwifruit by MLR model based on the characteristic spectra

圖6 硬度實(shí)測值與預(yù)測值散點(diǎn)圖Fig.6 The scatter plot of the measured versus predicted values of the firmness

為解決光纖光譜技術(shù)應(yīng)用在水果品質(zhì)無損檢測中存在數(shù)據(jù)量冗余的難題,對(duì)全光譜數(shù)據(jù)降維結(jié)果表明應(yīng)用SPA和CARS分別在1 024條全波長里挑選出7個(gè)和42個(gè)特征波長,明顯提升了預(yù)測模型的運(yùn)行效率。
