許文麗,藥林桃,孫 通,胡 田,胡 濤,劉木華,*
(1.江西農業大學生物光電技術及應用重點實驗室,江西南昌 330045;2.江西省農業科學院農業工程研究所,江西南昌 330200)
基于CARS-SPA的蘋果可溶性固形物可見/近紅外光譜在線檢測
許文麗1,藥林桃2,孫 通1,胡 田1,胡 濤1,劉木華1,*
(1.江西農業大學生物光電技術及應用重點實驗室,江西南昌 330045;2.江西省農業科學院農業工程研究所,江西南昌 330200)
采用CARS(competitive adaptive reweighted sampling)聯合連續投影算法(SPA)方法篩選蘋果可見/近紅外光譜的特征變量,繼而聯合多種不同建模方法建立蘋果可溶性固形物(SSC)預測模型,并對預測模型進行對比研究。研究結果顯示,采用CARS-SPA聯合篩選出的31個變量,通過采用PLS建立蘋果SSC的可見/近紅外光譜在線檢測模型性能最穩定,其變量數僅為原始光譜的1.69%,預測集的相關系數和均方根誤差分別為0.936和0.351%。研究表明采用CARS-SPA能有效提取蘋果SSC的光譜特征變量,能有效簡化模型并提高模型精度。
可見/近紅外光譜,蘋果,CARS-SPA,PLS,可溶性固形物
蘋果乃世界四大水果之一,我國目前蘋果總產量位居世界前茅,但出口量很少且國內高端蘋果市場多被國外進口蘋果所占領,為改善這一狀況,則需針對蘋果的內在品質進行檢測,實行在線分級,以提升我國蘋果在國內外市場中的競爭力。本文選擇對水果口感的具有極大影響的水果可溶性固形物作為水果內部品質研究對象。
近年來,大量研究將可見/近紅外光譜技術應用于水果內部品質的檢測[1-8]。目前國內外學者利用可見/近紅外光譜技術對蘋果的內部品質做了一些研究。歐陽愛國等[9]對光譜范圍為482.2~1009.5nm的蘋果可溶性固形物光譜,采用三種方法篩選光譜變量,然后結合偏最小二乘法建立蘋果SSC的近紅外光譜檢測模型,結果顯示GA-PLS方法能夠提高蘋果SSC模 型 精 度 。Jha等[10]采 集900~1700nm范 圍 內 的 蘋 果近紅外光譜,對比不同波段、不同預處理方法以及不同建模方法所建立的蘋果可溶性固形物、酸度和糖酸比模型結果可知,多元線性回歸所建立模型效果較好,對于蘋果可溶性固形物和酸度來說采用多元散射預處理方法效果最佳,而糖酸比未經預處理效果最優。此外其他學者也對蘋果的內部品質進行了研究[11-17]。
本研究采用多種預處理方法對蘋果SSC的可見/近紅外光譜在線檢測光譜進行處理,繼而聯合CARS(competitive adaptive reweighted sampling)與 SPA(successive projections algorithm)對蘋果SSC的可見/近紅外光譜在線檢測光譜變量進行篩選,而后聯合多種建模方法建立蘋果SSC在線回歸模型,進行對比研究,用以考察CARS-SPA對蘋果SSC在線回歸模型的影響。
1.1 材料與儀器
蘋果 本實驗所選樣品為購自于南昌水果批發市場的一批蘋果。實驗進行前挑選200個表面沒有缺陷或碰傷的蘋果,將其表皮擦拭清理干凈,于果柄附近編號,繼而對樣品進行外觀數據測量,將樣品置于室溫下保存12h,使其溫度與室溫基本一致。實驗一共采用200個蘋果樣品,將實際測得的可溶性固形物值中最大值和最小值的樣品直接作為建模集,繼而按3∶1比例隨機分配建模集和預測集,150個樣品作為建模集用于建立蘋果SSC預測模型,50個樣品作為預測集用于評價蘋果SSC預測模型的性能。
蘋果可見/近紅外光譜在線檢測系統 見圖1,實驗采用的光譜儀為美國海洋光學公司的USB4000微型光纖光譜儀(Ocean Optics,USA),CCD檢測器,其波長范圍為465~1150nm;光源為2個15V/150W的鹵鎢燈,光纖為海洋光學的Qp600-2-VIS-NIR;折射儀 為 PR101 手 持 式 折 射 儀(Atago Co.,Ltd.,Tokyo,Japan),參比為一個是直徑為80mm的聚四氟乙烯球;對射型光電傳感器 滬工牌。

圖1 蘋果近紅外光譜檢測系統Fig.1 Schematic diagram of the setup for NIR measurement of apple
1.2 光譜采集
光譜數據采集前先將該裝置預熱30min以至系統性能穩定,承載水果的機械傳送系統以0.3m/s的速度運行,光譜儀外部觸發由光電傳感器控制,采用VC6.0編寫的軟件采集和存儲光譜,采集樣品光譜前,先采集參比和暗電流光譜,樣品放置于傳送系統的托盤上,控制每個樣品于蘋果赤道部位按120°旋轉間隔采集3次光譜,光譜由軟件直接換算成吸光度保存,繼而將吸光度光譜用于后續數據處理。
1.3 蘋果SSC的測定
蘋果可溶性固形物按照國標GB 12295-90的方法測定,先將蘋果樣品去皮、切片以及剔核,繼而將切片的果肉部分放入壓汁機進行壓榨,將汁液用濾紙過濾后滴于數字式折射儀的測試窗口上測量其SSC含量,取連續重復測得兩次相同值作為蘋果樣品SSC含量的實際測量值。
1.4 數據處理分析
1.4.1 數據預處理方法 采用不同預處理方法結合PLS建立蘋果SSC的預測模型,對比不同的預處理方法對模型性能的影響。本實驗對蘋果漫透射光譜采用 了 標 準 正 交 變 量 變 換(Standard Normal Variate,SNV)、多 元 散 射 校 正(Multiplicative Scattering Correction,MSC)、基線校正(Baseline)、正交信號校正法(Orthogonal Signal Correction,OSC)、解趨勢(Detrending)等預處理。
1.4.2 CARS-SPA數據特征變量優選 可見/近紅外本身數據量相當龐大,為了挑選出有效的光譜數據特征變量,簡化模型,本文采用了CARS聯合SPA用于挑選出光譜數據的特征變量。采用CARS對蘋果可見/近紅外光譜數據進行變量優選,設置其蒙特卡羅(MC)采樣次數為50次,所選擇的波長變量子集采用10折PLS交叉驗證建模,通過RMSEC值最小確定最優的變量子集本研究采用,繼而采用SPA對經CARS挑選出的變量子集進行二次挑選,以期獲得更少的特征變量,建立性能更加簡單、穩定的模型。
數 據 處 理 分 析 由 化 學 計 量 學 軟 件 The Unscrambler x 10.1 (CAMO AS,Trondheim,Norway)和Matlab 7.11(The Math Works,Inc,USA)實現。
選擇均方根誤差以及相關系數作為本研究評價模型性能的標準。模型的相關系數值越高,均方根誤差值越小,則模型的預測能力則越強。
2.1 蘋果可溶性固形物值統計結果
200個蘋果總樣本集以及經隨機挑選后分集統計所得出的建模集、預測集的樣本數量、可溶性固形物變化范圍、平均值以及標準差如表1所示,所有樣本、建模集和預測集樣本的SSC的平均值、標準偏差及范圍均較為接近,且建模集的SSC范圍略大于預測集,由此可知蘋果建模集所建立的模型能很好的適用于預測集樣品。

表1 蘋果可溶性固形物的統計結果Table 1 The statistical results of soluble solids content of apple
2.2 蘋果可見/近紅外光譜分析
本實驗光譜儀的檢測范圍為465~1150nm,共計3648個樣本變量點,采用如此龐大的數據進行計算,不僅計算量大,而且因樣品部分區域的光譜信息與樣品SSC成分關聯性極弱,而光譜數據兩端因靠近檢測器檢測極限兩端時會存在一些噪聲,故此本文剔除兩端光譜信息,選取600~950nm,共計1832個變量數作為后續處理數據。圖2為600~950nm范圍內200個蘋果樣品的可見/近紅外光譜圖,可見該波段范圍內存在較多波峰波谷,所含信息量豐富,適合用于建立同蘋果SSC的預測模型。

圖2 蘋果樣本的可見/近紅外光譜Fig.2 Vis/NIR spectra of all apple samples
2.3 預處理方法比較
對波段范圍為600~950nm樣本的透射光譜采用不同預處理結合PLS建模結果如表2所示,由表2可知,SNV、MSC、Baseline以及De-trending并不適合用于本數據預處理,所建立的模型性能均不如原始光譜所建立的PLS模型,而OSC與原始PLS模型性能相差無幾,并無明顯改善,因此對比多種預處理方法結合PLS建模結果得知,選用原始光譜用作后續數據處理更為合適。

表2 不同預處理方法的模型結果Table 2 The model results of different pretreatment methods
2.4 CARS-SPA
采用CARS對蘋果可見/近紅外光譜數據進行變量優選,經CARS挑選出的包含113個特征變量,將113個特征變量經SPA二次挑選出31個特征變量,同1832個原始變量數相比,僅占1.69%。CARS和CARSSPA聯合PLS分別建立蘋果可溶性固形物模型,其結果如表3顯示,CARS-PLS與CARS-SPA-PLS同原始的PLS模型相比,建模性能都略顯不足,但利用預測集對模型進行預測,預測效果卻有較大提升。由表3可知,CARS-SPA-PLS比CARS-PLS和原始PLS,不僅變量數目極大減少了而且模型性能也更加穩定,因此本研究確定CARS-SPA為本文的變量優選方法。

表3 不同變量優選方法的蘋果可溶性固形物結果Table 3 Results of SSC of apple using different varaibles select methods
2.5 不同建模方法比較
表4為CARS-PCA聯合不同建模方法所得出的模型性能結果。本研究對比了PLS、PCA、MLR、LSSVM四種建模方法用于建立蘋果的可溶性固形物模型,由表4可知,PCA建模效果最差,LS-SVM模型效果略好些,PLS與MLR模型效果較好。判斷模型優劣時,不單要求相關系數高、均方根誤差小,并且要求建模均方根誤差同預測均方根誤差間差值也小,故本研究選擇CARS-SPA-PLS作為最佳模型,采用50個預測集樣本對該模型進行預測所得關系如圖3所示,回歸線表達式為y=0.8248x+2.1673。

表4 不同建模方法的蘋果可溶性固形物結果Table 4 Results of SSC of apple using different modeling methods

圖3 蘋果預測集樣本的可溶性固形物預測結果Fig.3 Predicted results of SSC of apple in prediction set
本文采用可見/近紅外光譜聯合CARS-SPA變量優選對蘋果的SSC進行快速無損在線檢測研究。CARS-SPA聯合PLS所建立的蘋果SSC預測模型性能最優。與全光譜PLS預測模型相比,建模變量數從1832個下降到31個,預測集的相關系數由0.837上升到0.936,均方根誤差由0.541%下降為0.351%。研究結果顯示,CARS-SPA方法能有效應用于蘋果SSC的在線可見/近紅外光譜變量篩選,能降低建模變量數,簡化預測模型,提高預測模型的穩定性。
[1]Camps C,Christen D.Non-destructive assessment of apricotfruit quality by portable visible-near infrared spectroscopy[J]. LWT-Food Science and Technology,2009,42(6):1125-1131.
[2]Paz P,Sánchez M T,Pérez-Marín D,et al.Instantaneous quantitative and qualitative assessment of pear quality using near infrared spectroscopy[J].Computers and Electronics in Agriculture,2009,69(1):24-32.
[3]Jha S N ,Jaiswal P ,Narsaiah K ,et al.Non-destructive prediction of sweetness of intact mango using near infrared spectroscopy[J].Scientia Horticulturae,2012,138:171-175.
[4]王加華,戚淑葉,湯智輝,等.便攜式近紅外光譜儀的蘋果糖度模型溫度修正[J]. 光譜學與光譜分析,2012,32(5):1431-1434.
[5]Moghimi A,Aghkhani M H,Sazgarnia A,et al.Vis/NIR spectroscopy and chemometrics for the prediction of soluble solids content and acidity(pH) of kiwifruit[J].Biosystems Engineering,2010,106(3):295-302.
[6]韓東海,常冬,宋曙輝,等.小型西瓜品質近紅外無損檢測的光譜信息采集[J]. 農業機械學報,2013,44(7):174-178.
[7]代芬,蔡博昆,洪添勝,等.漫透射法無損檢測荔枝可溶性固形物[J]. 農業工程學報,2012,28(15):287-292.
[8]朱偉興,江輝,陳全勝,等.梨可溶性固形物含量NIR與變量篩選無損檢測[J]. 農業機械學報,2010,41(10):129-133.
[9]歐陽愛國,謝小強,周延睿,等.蘋果可溶性固形物近紅外光譜檢測的偏最小二乘回歸變量篩選研究[J]. 光譜學與光譜分析,2012,32(10):2680-2684.
[10]Jha S N,Garg R.Non-destructive prediction of quality of intact apple using near infrared spectroscopy[J].Journal of Food Science and Technology,2010,47(2):207-213.
[11]孫炳新,匡立學,徐方旭,等.蘋果有效酸度的近紅外無損檢測研究[J]. 食品工業科技,2013,34(15):298-301.
[12]孫炳新,匡立學,徐方旭,等.蘋果脆度的近紅外無損檢測[J]. 食品與發酵工業,2013,39(5):185-189.
[13]袁雷明,高海寧,呂松,等.可見/近紅外光譜半透射法檢測蘋果中可溶性固形物含量[J]. 食品安全質量檢測學報,2012,3(5):448-452.
[14]高玨,王從慶.基于 KPCA蘋果近紅外光譜的特征提取研究[J]. 食品科技,2012(3):275-278.
[15]周林峰,呂進,劉輝軍,等.溫度對果糖含量近紅外光譜檢測模型傳遞的影響[J]. 中國計量學院學報,2012,23(3):217-221.
[16]孫旭東,郝勇,劉燕德. 蘋果可溶性固形物近紅外光譜在線檢測影響因素研究[J]. 中國農機化學報,2013(1):86-90.
[17]王加華,戚淑葉,湯智輝,等.便攜式近紅外光譜儀的蘋果糖度模型溫度修正[J]. 光譜學與光譜分析,2012,32(5):1431-1434.
CARS-SPA baesd Visble/near Infraed spectroscopy on-line detection of apple soluble solids content
XU Wen-li1,YAO Lin-tao2,SUN Tong1,HU Tian1,HU Tao1,LIU Mu-hua1,*
(1.Optics-Electronics Application of Biomaterials Lab,Jiangxi Agricultural University,Nanchang 330045,China;2.Institute of Agricultural Engineering,Jiangxi Academy of Agricuhural Sciences,Nanchang 330200,China)
CARS was combined with SPA to select the important variables from the visible/near infrared spectrum of apple , then a variety of different modeling methods was used to develop calibration models for SSC of apple , finally , some comparative studies was done among those models.The analysis results showed that 31 variables which selected by CARS-SPA and PLS could build the most stable on-line detection model of apple soluble solids solids (SSC ) ,in this prediction model,the number of variables was only 1.69 percent of the orginal spectrum , the correlation coefficient of prediction and root mean square error of prediction were 0.936,0.351%repectively.This study showed CARS-SPA could effectively extract important variables from spectrum of apple SSC , also it could simplify and improve the accuracy of prediction model effectively.
visible/near-infrared spectroscopy;apple;CARS-SPA;PLS;SSC
TS255.1
A
1002-0306(2014)22-0061-04
10.13386/j.issn1002-0306.2014.22.004
2014-02-28
許文麗(1990-),女,碩士研究生,研究方向:農產品無損檢測。
* 通訊作者:劉木華(1969-),男,博士,教授,研究方向:農產品光學檢測研究。
國家自然科學基金項目(31271612);留學人員科技活動項目(2012);江西省教育廳科學研究基金(GJJ13254)。