隨著我國進入小康社會,人們生活水平整體提高,水果成了人們生活中必不可少的食品。水果中含有維生素C、糖分等人體必不可少的營養物質,在改善人體的消化系統和抗衰老等方面有重要的作用。其中芒果作為消費者喜愛的水果之一,除了可食用,還有重要的藥用價值[1]。但由于芒果存在質地柔軟的特性,在采摘和運輸過程中容易受到機械損傷,這種輕微的機械損傷通常不易被發現,隨著時間的推移和芒果呼吸作用的促進,損傷會逐步顯現出來[2]。目前這種損傷主要依靠人工進行篩選,普通機器視覺無法進行區分[3],但是人工篩選效率低,鑒于此原因,具有速度快、效率高的無損檢測技術在水果的品質檢測中得到了關注[4]。
無損檢測技術是不對產品的內部特性和外觀造成損傷的情況下,檢測產品內外部性能參數的技術。其中,高光譜成像技術具有無損檢測技術的特點同時兼具圖譜合一的能力,使其成為水果內外部品質無損檢測技術中的熱門技術[5]。近年來,學者們利用此技術對蘋果、獼猴桃、毛桃等水果進行了品質檢測研究,取得了豐碩的成果。
在國內,高光譜成像技術廣泛應用于水果品質檢測方面。其中,談文藝[6]利用可見-近紅外波段范圍的高光譜成像系統對蘋果完好與損傷的高光譜圖像執行分段主成分分析操作,選出近紅外光譜區(780~1 037 nm)為識別損傷的最佳光譜區,并基于最佳光譜區域以及主成分圖像的權重系數在該區域選取了7個特征波長,使用這些選出的特征波長執行主成分分析操作,并結合圖像處理操作設計了一種針對不同程度的蘋果損傷的精確識別算法;張保華等[7]以具有代表性的雙色紅富士蘋果為研究對象,提出了一種以高光譜成像和最低噪聲分離變換的蘋果輕微損傷識別檢測方法,使用最低噪聲分離變換選出特征波段,并基于特征波段的圖像開發了圖像檢測損傷蘋果的算法;劉佳欣[8]使用黑白校正、基于近球體的亮度校正等方法對光譜圖像進行預處理,減少了蘋果上亮度分布不均勻的情況,使蘋果的損傷區域更加易于區分,利用主成分分析法和ROC曲線分析高光譜數據并選取有效波長,針對所選取的有效波長,使用SVM對有效波長下的蘋果光譜數據進行分類準確率檢驗,平均準確率為91.25%;沈宇[9]利用兩次連續投影法對完好與損傷光譜數據進行分析,得到識別蘋果損傷的特征波段,使用主成分分析的方法對特征波段進行變換,選擇完好與損傷區域差異明顯的主成分圖像作為檢測損傷的有效圖像,通過分割和邊緣檢測的方法對有效圖像進行輕微損傷部位的定位;廉孟茹等[10]使用波長范圍為900~1 700 nm的高光譜相機對水果玉米的含水率進行無損檢測,采用連續投影算法、競爭性自適應重加權算法以及隨機森林法選取特征波長,并使用特征波長分別建立了PLS、SPA-PLS、CARS-PLS和RF-PLS模型,經過比較發現CARS-PLS效果最好,實驗表明利用高光譜成像系統可以對水果玉米的含水率進行快速檢測。
在國外,高光譜成像技術同樣廣泛應用于水果品質檢測。其中,LEIVA-VALENZUELA等[11]使用500~1 000 nm的高光譜推掃式相機對藍莓進行檢測,檢測其硬度與可溶性固體含量,使用交叉驗證的方法建立偏最小二乘模型,研究表明,使用高光譜技術可以對藍莓的硬度與可溶性固體含量進行預測;RAJKUMAR等[12]使用可見光和近紅外區域的高光譜相機檢測香蕉,檢測其在不同溫度下含水率、硬度和可溶性固體含量的變化,通過選擇最佳特征波長,建立多元線性回歸模型,結果表明,使用基于高光譜建立的模型可以預測香蕉含水率、硬度和可溶性固體含量的變化;AMODIO等[13]采用近紅外波段的高光譜成像系統檢測草莓,通過建立PLS-DA模型,區分了來自不同生長環境下的草莓;KERESZTES等[14]通過偏最小二乘分析和逐步判別分析獲得有效波長,對最佳波長的去背景圖像進行平均,生成平均圖像用于多光譜成像檢測蘋果品質。
上述文獻中利用高光譜成像技術對不同水果的品質(硬度、可溶性固形物含量、含水率、pH等)進行了研究,但是根據目前報道的文獻,鮮有將高光譜成像技術應用于芒果外觀品質(表面損傷)的檢測。
本文以水仙芒果為研究對象,通過可見-近紅外高光譜相機進行圖像采集和光譜采集,利用Matlab對各個通道進行圖像和光譜數據預處理,分別使用圖像特征和光譜特征建立識別算法,使用建立的算法檢測識別不同時間段的損傷芒果,為開發芒果表面損傷在線快速無損檢測系統提供依據。
本文以水仙芒果為研究對象,樣本來自蘇州太倉當地的水果超市,挑選90個大小、重量、外觀顏色大體相同的芒果。對90個芒果進行統一編號1~90,隨機選擇其中45個芒果進行人為輕微損傷(使用100 g小鋼球,從10 cm高處垂直砸向芒果表面)。對芒果損傷進行計時,分別在1 min、5 min、10 min、20 min、30 min、1 h、3 h、5 h、8 h、12 h、16 h、18 h、24 h、36 h和48 h對損傷芒果和正常芒果進行高光譜成像。
本試驗所用高光譜圖像系統采集光譜范圍為400~1 000 nm,該系統主要由光譜儀、相機鏡頭、計算機、一對鹵素燈光源和移動平臺組成。高光譜圖像采集后所用的處理軟件包括Matlab 2016b(The MathWorks Inc.,USA)、Excel 2019(Microsoft.,USA)等。
1.3.1 圖像校正
由于高光譜成像系統采集到的圖像有很大的噪聲,為了后續除去圖像背景干擾所以需要進行黑白校正,校正公式為

式中:R是經過校正的光譜圖像;I是初始圖像;B為蓋上相機鏡頭蓋采集到的黑背景圖像;W是反射率為99.9%的標準白板圖像。
1.3.2 光譜區域的主成分分析和最小噪聲分離
主成分分析(Principal Component Analysis,PCA)是一種有效地將高維度數據轉換成低維度數據的分析方法,該方法在繼承原始信息的同時,將具有相關性的原始數據重新組合成互不相關的新數據即將多個數據指標轉換成幾個數據指標,減少數據運算量,是分析高光譜圖像信息的主要方法[15]。最小噪聲分離(Minimum Noise Fraction,MNF)變換本質上是連續進行兩次主成分分析變換,第一次通過使用主成分中的噪聲協方差矩陣轉換噪聲數據,使其只有最小的方差且沒有波段間的相關性;第二次是對噪聲數據進行標準主成分變換,其作用是減少數據處理,成為高光譜圖像分析的重要手段[16]。
1.3.3 特征波長選取
主成分圖像是由原始數據的各個波段經過公式(2)線性組合而成的。

式中:PCm為第m個主成分;αj為改主成分的權重系數;Ij為第j個波段的圖像。主成分圖像中權重系數αj的絕對值越大,所對應的主成分圖像的貢獻值就越大。
1.3.4 基于圖像特征損傷區域識別
首先選取一個特征波長圖像獲取掩膜,并使用掩膜圖像處理剩余特征波長的圖像,將獲得掩膜圖像進行主成分分析,得到主成分圖像,對主成分圖像先進行高斯模糊,然后進行膨脹腐蝕處理,最后通過閾值分割的方法,區分出芒果損傷區域。
1.3.5 基于光譜特征損傷區域識別
偏最小二乘法(Partial Least Squares,PLS)是一種集合眾多分析方法優點的分析法[17],它集合了典型相關分析、多元線性回歸及主成分分析方法的長處,通過建立數組變量之間的回歸模型,實現對數據的降維處理。基本原理是,測量n個樣本,通過分析這n個樣本里所有的因變量和自變量信息,提取出包含大部分自變量和因變量信息的主成分,使用提取的主成分信息建立模型。
本實驗使用主成分分析和最小噪聲分離變換分別對損傷芒果的高光譜圖像進行處理,變換結果如圖1所示。圖1(a)是主成分分析PC1~PC5的圖像,圖1(b)是最小噪聲分離變換MNF1~MNF5的圖像,從圖中可以看出相比于最小噪聲分離變換圖像,芒果損傷區域在主成分PC3上與正常表皮的對比度更加明顯,更加容易識別,對45組數據進行分析對比,結論與圖1相一致。

圖1 損傷芒果的主成分分析和最小噪聲變換圖像圖
主成分PC3權重系數如圖2所示,選取局部最大值和局部最小值對應的特征波長為有效波長,選擇4個有效波長分別為565 nm、650 nm、720 nm、835 nm。

圖2 主成分PC3權重系數圖
使用650 nm的圖像獲取掩膜,并使用掩膜圖像處理565 nm、720 nm、835 nm波長的圖像,將獲得的4個波長掩膜圖像進行主成分分析,得到主成分PC3圖像,對PC3圖像先進行高斯模糊,然后進行膨脹腐蝕處理,最后通過閾值分割的方法(分割閾值為210),區分出芒果損傷區域。
為檢測該算法的識別效果,使用該算法對同組樣品不同時間段進行損傷檢測,檢測樣品在1 min、5 min、10 min、20 min、30 min、1 h、3 h、5 h 和 8 h時的圖像。損傷識別圖像如圖3所示,可以看出有效波長經過主成分分析變換和圖像形態學處理可以識別芒果損傷,檢測出損傷區域。

圖3 不同時間段損傷識別圖
利用該算法對45個正常芒果和45個損傷芒果進行檢測,檢測結果如表1所示。由表1可以看出,45個正常樣本準確率是100%,損傷時間1 min準確率為93.33%,準確率最低,隨著時間的推移,準確率也隨之上升,當損傷時間超過30 min后,準確率是100.00%。損傷時間在30 min內未被正確識別的樣本,一個原因是損傷成分不在PC3圖像上,另一個原因是損傷表面反射率與正常表面反射率相差很小,導致無法用閾值法分割。為解決這一問題,以后的研究可以增加有效波段的數目和優化損傷識別算法進行識別。

表1 基于圖像特征芒果損傷識別結果表
選擇30個正常芒果和30個表面有損傷的芒果作為訓練樣本,剩余15個正常芒果和15個有損傷的芒果作為測試樣本。60個訓練樣本中,在每個正常芒果和有損傷芒果的表面各取2個感興趣區域(Region of Interest,ROI)光譜,每個ROI的面積在20~30個像素。30個測試樣本中,在每個正常芒果和有損傷芒果的表面各取1個ROI光譜,每個ROI的面積在20~30個像素。使用損傷芒果光譜數據進行建模,對光譜數據進行歸一化處理,損傷芒果數據歸一化為1,正常芒果數據歸一化為0,使用偏最小二乘法進行建模分析。
圖4是使用偏最小二乘法基于光譜特征建模的效果圖,其中黑色三角代表建模集,圓圈代表預測集,閾值T設置為0.42,當芒果數值小于0.42時判斷為正常芒果,數值大于0.42判斷為損傷芒果。

圖4 基于光譜特征建模圖
由表2模型檢測結果可以看出,15個正常樣本準確率是100%,損傷時間1 min和5 min準確率為93.33%,準確率最低;隨著時間的推移,準確率隨之上升,當損傷時間超過5 min后,準確率是100%。研究芒果損傷時間在5 min內未被正確識別的樣本,一個原因是損傷時間短,正常芒果和損傷芒果在光譜強度和反射率方面差別很小。為解決這一問題,以后的研究可以使用增加實驗樣本數目的方法提高準確率。

表2 基于光譜特征芒果損傷識別結果表
(1)為檢測芒果輕微損傷,使用了主成分分析方法篩選出4個有效波段(565 nm、650 nm、720 nm、835 nm),并基于這4個有效波段建立了芒果損傷識別算法。使用該損傷識別算法對不同損傷時間(1 min、5 min、10 min、20 min、30 min、1 h、3 h、5 h 和 8 h)的芒果進行識別,在各個損傷時間都有較高的識別率,圖像整體損傷識別率為98.22%。
(2)通過提取光譜特征和歸一化處理數據,使用偏最小二乘法進行建模,光譜整體識別率為98.67%。
(3)實驗結果表明,使用圖像特征和光譜特征可以對芒果早期輕微損傷進行檢測,奠定了多光譜檢測芒果系統的理論基礎。