李 斌 鄒吉平 張 烽 蘇成濤 劉燕德 肖毅華
(1.華東交通大學 機電與車輛工程學院,南昌 330013; 2.華東交通大學 水果智能光電檢測技術與設備國家與地方聯合工程研究中心,南昌 330013)
貢梨富含人體所需的微量元素,深受消費者喜愛。但貢梨在采摘、分揀、包裝、運輸的過程容易受到沖擊或擠壓等因素的影響,使得貢梨產生機械損傷,而在機械損傷類型中,沖擊損傷最容易產生[1]。損傷后的貢梨品質降低,進而造成大量的經濟損失。為了減少經濟損失,亟需一種準確評估和預測貢梨沖擊損傷的方法。
目前,對于水果損傷檢測的方法很多:1)電子鼻技術[2];2)X射線計算機斷層掃描[3];3)核磁共振[4];4)光譜檢測技術[5],其中光譜檢測技術在水果品質檢測方面具有很大的潛力。近年來,隨著光譜技術的不斷發展,作為新一代光電檢測技術的高光譜成像技術廣泛應用于農產品質量檢測領域[6]。高光譜成像技術結合了光譜學、機器視覺、計算機圖像學、近紅外光譜等多學科知識,將光譜技術和傳統的二維成像技術進行有機融合,可同時提供光譜信息和空間信息[7-8]。沈宇等[9]獲取400~1 000 nm波長范圍內完好和輕微損傷后不同時間段的蘋果高光譜圖像,并提取完好樣本以及損傷樣本的光譜數據。利用載荷系數法(x-LW)、連續投影法(Successive projections algorithm,SPA)以及二階導數法提取特征波長,基于特征波長分別建立遺傳算法優化的BP神經網絡(GA-BP)和支持向量機(Support vector machines,SVM)損傷識別模型,對比后發現SVM是最佳判別蘋果輕微損傷的模型。孟慶龍等[10]采集400~100 nm波長范圍內無損傷獼猴桃和表面有疤痕的獼猴桃高光譜圖像,利用多種圖像處理方法實現對無損和表面有疤痕的獼猴桃進行識別,正確識別率分別為98.3%和95.0%。Yuan等[11]利用定量損傷儀獲得5種不同損傷程度的靈武長棗,采用多種預處理方法建立偏最小二乘分析(Partial least squares discriminant analysis,PLS-DA)模型,結果發現MSC-PLS-DA模型是最優分類模型。又利用多種波段篩選算法對原始光譜和預處理后光譜進行特征波長的提取,建立PLS-DA分類模型,結果表明MSC-CARS-PLS-DA是最優分類模型,準確率可達89.52%。以上對水果的損傷的研究大多數是定性分析,且所建立的模型也只能區分水果是否受損。目前,也有關于水果損傷的定量研究。Zhang等[12]利用高光譜成像技術采集900~1 700 nm波長范圍內高光譜圖像以及壓敏薄膜技術測得蘋果跌落過程中的機械參數,對蘋果沖擊損傷進行了定量研究。Xu等[13]將900~1 700 nm波長范圍內所采集的光譜數據與利用壓敏薄膜技術所測得的機械參數相結合建立偏最小二乘回歸(Partial least squares regression,PLSR)模型,實現了對機械參數的定量預測。文獻[12]和[13]中的研究僅用了一種模型對力學參數進行預測,未進行多種模型對比分析,針對貢梨沖擊損傷的定量研究未見報道。
本研究擬采用397.5~1 014.0 nm波長范圍內的高光譜數據與力學參數相結合的方法,建立力學參數的不同預測模型,比較分析后選取最優預測模型,實現對貢梨沖擊損傷的準確評估和定量預測,以期為貢梨的品質分選以及包裝運輸提供理論支持。
貢梨購于江西省南昌市某水果市場,于-1~2 ℃的溫度下貯藏。試驗前將貢梨在室溫為20 ℃,相對濕度(Relative humidity,RH)為40%的條件下放置24 h,從而降低試驗中溫度對貢梨損傷造成的影響。為了降低貢梨質量和曲率半徑對貢梨沖擊損傷試驗的影響,共選擇240個表面沒有明顯缺陷、形狀規則的貢梨,赤道直徑約為70~80 mm,質量約(240±10) g。
本研究基于單擺原理設計貢梨碰撞試驗裝置,該裝置主要由底座、垂直支撐桿、水平支撐桿、魚線以及水果夾具等組成(圖1)。通過對水平支撐桿、壓力傳感器(HZC-H1,測量范圍0~100 kg,靈敏度2.00 mV/V,金屬材質)以及量角器裝置進行調節,從而確保貢梨撞擊在壓力傳感器的中心。每次貢梨與壓力傳感器碰撞后,立即用手抓住貢梨,防止產生二次碰撞。在整個試驗過程中,智能數據分析采集器(Data acquisition & signal processing, DASP)與壓力傳感器相連,可及時記錄力響應過程,并將記錄的數據傳輸至計算機中儲存。利用相關軟件對采集的數據進行計算分析,可獲得峰值力、平均接觸力等力學參數。
利用貢梨碰撞試驗裝置獲取不同損傷程度的貢梨:將貢梨樣本隨機分為6組,每組40個。6組貢梨樣本分別以釋放角度α為35°、40°、45°、50°、55°和60°釋放,釋放角度α為圖1中量角器裝置中軸線和魚線之間的夾角。由于受損的貢梨樣本難以通過肉眼辨別,還需將損傷的貢梨樣本在室溫條件下放置24 h,使其產生褐變,以便后續數據的測量與計算。

α,釋放角度,(°)。 Release angle. 1.底座;2.壓力傳感器;3.導軌;4.垂直支撐桿;5.量角器裝置;6.水平支撐桿;7.魚線;8.水果夾具;9.智能數據分析采集器;10.計算機 1.Baseplate; 2.Force transducer; 3. Guide rail; 4.Vertical support rod; 5.Angle measuring device; 6.Horizontal supporting rod; 7.Fishingline; 8.Fruit fixture; 9.Data acquisition & Signal processing; 10.Computer圖1 貢梨碰撞試驗裝置Fig.1 Gongli impact test device
高光譜成像系統的整體結構見圖2,其硬件組成包括2盞20 W鹵素燈(DECOSTAR51 MR16型,OSRAM,德國)、成像光譜儀(ImSpector V10E型,Specim,芬蘭)、CCD相機(C8484-05G型,Hamamastu,日本)、位移平臺、配有圖像采集卡的計算機、暗箱等[14]。位移平臺的移動通過步進電機來實現;光源、成像光譜儀、CCD相機、位移平臺等硬件都安裝在一個暗箱內。

1.步進電機;2.暗箱;3.CCD相機;4.成像光譜儀;5.鏡頭;6.鹵素燈;7.位移平臺;8.貢梨樣本;9.計算機 1.Stepper motor; 2.Camera obscura; 3.CCD camera; 4.Imaging spectrometer; 5.Lens; 6.Halogen lamp; 7.Displacement platform; 8.Gongli sample; 9.Computer圖2 高光譜成像系統示意圖Fig.2 Diagram of the hyperspectral imaging system
在進行圖像采集時,首先使高光譜成像系統預熱30 min左右,以防止基線漂移影響數據精度。然后利用電腦和成像光譜儀配套的SpectraVIEW軟件對高光譜成像系統的一些參數進行設置,將光譜分辨率設置為2.8 nm,CCD相機的曝光時間設置為20 ms,位移平臺前進和后退的速度設置為15 mm/s[15]。最后將在室溫下放置24 h后產生褐變的貢梨放置在移動載物臺上進行高光譜圖像采集。本研究中所采集的光譜數據的波長范圍為397.5~1 014.0 nm,共176個波段。
由于高光譜圖像易受暗電流和光照不均勻等因素的影響,在處理數據之前必須對高光譜圖像進行黑白校準[16]。在校準時,首先利用鏡頭蓋將鏡頭遮住,進行掃描得到全黑的校準圖像,然后將鏡頭蓋取下,掃描由聚四氟乙烯材料制成的白板從而獲得全白的校準圖像。校準公式[16]為:
(1)
式中:Rλ為校準后圖像數據;RW為全白校準圖像數據;RB為全黑校準圖像數據;Iλ為原始圖像數據。
利用ENVI4.5軟件提取光譜數據。首先,通過SpectraVIEW軟件將采集的高光譜圖像進行校正,然后,將校正后的高光譜圖像導入至ENVI4.5軟件中,以貢梨受損區域為感興趣區域(ROI),提取從不同釋放角度下貢梨損傷區域的光譜數據。
1.4.1損傷面積
由于損傷過后貢梨在室溫下放置24 h,損傷區域產生褐變。通過肉眼可以辨別損傷區域,方便對貢梨損傷區域進行測量。本試驗中,將所有貢梨樣本的損傷區域近似為圓形。用數顯游標卡尺(精度為0.01 mm)測量損傷區域的直徑,為確保試驗數據的精度,測量損傷區域的直徑時,每隔120°測量1次直徑,共測量3次損傷區域直徑,最后取平均值作為貢梨的損傷直徑。損傷面積計算公式為:
(2)
式中:A為貢梨的損傷面積,mm2;D為貢梨損傷區域直徑,mm。
1.4.2峰值力、平均接觸力和平均壓強
貢梨與壓力傳感器碰撞時,壓力傳感器的數據傳輸至DASP中,從而記錄了力響應過程。峰值力為貢梨與壓力傳感器碰撞過程中力傳感器所記錄的最大值。貢梨與壓力傳感器碰撞過程中,從碰撞開始至碰撞結束這一時間段內,力變化的平均值為平均接觸力,通過Coinv DASP V11軟件對采集的數據進行時域分析,獲得峰值力和平均接觸力。
通過智能數據采集系統所獲得的平均接觸力以及所測量的損傷面積計算平均壓強,公式為:
(3)
式中:σ為平均壓強,MPa;F為平均接觸力,N。
由于儀器、樣本、以及測量環境等條件的影響,所采集的原始光譜信息存在噪聲和背景等干擾信息,這些干擾信息會造成定量分析出現誤差、組分預測錯誤等問題[17-18]。因此,有必要對原始光譜進行預處理。光譜預處理方法有多種,如平滑、導數、多元散射校正(Multiplicative scatter correction,MSC)和標準正態變換(Standard normal variate,SNV)等[19]。本研究中采用Gap-segment求導、SG求導和基線校準(Baseline)3種預處理方法。
在提取的全光譜中存在部分無效或干擾信息,這些信息會降低模型的預測精度,同時全光譜中所含的數據量多,使得模型的運行時間增加。使用特征波長提取算法從全光譜中選擇最具代表性的特征波長可以有效提高模型的檢測效率。本研究采用競爭性自適應重加權(Competitive adapative reweighted sampling,CARS)和無信息變量消除(Uninformative variable elimination,UVE)2種算法選取特征波長。
CARS算法是基于蒙特卡洛采樣與偏最小二乘(Partial least squares,PLS)回歸系數的特征變量選擇方法,該算法主要依據達爾文進化論中“適者生存”的原則。其核心思想是通過在采樣過程中優先選擇PLS回歸過程中回歸系數絕對值較大的變量。經過多次采樣后,最終找出交叉驗證均方根誤差(RMSECV)最小的光譜數據子集作為最優變量組合[20]。
UVE算法的基本思想是將回歸系數作為波長重要性的衡量指標。首先,將一定變量數目的隨機變量矩陣引入光譜矩陣;然后,利用蒙卡羅交叉驗證建立PLS模型;最后,計算PLS回歸系數平均值與標準偏差的比值,進而選取有效光譜信息[21-22]。
試驗樣本共240個,均分成6組,利用Kennard-Stone(KS)方法,將樣本按3∶1的比例分為建模集和預測集,即建模集180個樣本,預測集60個樣本[23]。分別建立峰值力、平均接觸力、損傷面積和平均壓強的PLSR和主成分回歸(principal component regression, PCR)模型。
為檢驗模型精度,需要相關參數對所建立的模型進行評價。通過比較建模集相關系數(RC)、預測集相關系數(RP)、建模集均方根誤差(RMSEC)和預測集均方根誤差(RMSEP)來評價[24]。如果模型具有高的建模集相關系數(RC)與預測集相關系數(RP),低的建模集均方根誤差(RMSEC)和預測集均方根誤差(RMSEP),則表明該模型具有較好的性能。
圖3示出6種不同釋放角度(α)下,貢梨碰撞力學參數的測量結果:隨著貢梨釋放角度的增大,峰值力、平均接觸力、損傷面積和平均壓強也在逐漸的增大。峰值力平均值從138.40 N增大至335.86 N,平均接觸力平均值從77.13 N增大至188.20 N,損傷面積平均值從208.07 mm2增大至544.42 mm2,平均壓強平均值從0.34 MPa增大至0.42 MPa。損傷面積可以直觀的體現貢梨的損傷程度,隨著貢梨釋放角度的增大,損傷面積越大,沖擊損傷越嚴重。損傷面積增大時,峰值力、平均接觸力和平均壓強也隨之增大。可以看出,本研究中的力學參數存在一定的波動性,這可能是由于貢梨的果肉硬度、曲率半徑和貢梨的內部結構差異等自身生理特性所導致。總體來說,隨著釋放角度的增大,力學參數呈現一定的線性變化。在一定程度上表明力學參數表征貢梨的沖擊損傷程度是可行的。

柱上豎線為力學參數的標準偏差。 The vertical lines on the columns are the standard deviations of the mechanical parameters.圖3 不同釋放角度(α)下貢梨力學參數的變化Fig.3 Changes of mechanical parameters of Gongli under different release angles

圖4 未受損及不同釋放角度(α)下受損貢梨的光譜曲線Fig.4 Average spectral curves of damaged Gongli under undamaged and different release angles
未損傷和不同損傷程度的貢梨在波長397.5~1 014.0 nm范圍內的光譜曲線見圖4:在739 nm處存在較為明顯的吸收峰,該吸收峰是由于碳水化合物中的C—H鍵伸縮振動引起的[25]。未損傷貢梨的光譜曲線與不同角度釋放下受損貢梨的光譜曲線整體相似,但是未受損貢梨和不同釋放角度下受損貢梨的光譜反射率在同一波段存在明顯差異。隨著釋放角度的增大,貢梨損傷越嚴重,光譜反射率越低,產生這一變化的原因可能是貢梨與金屬材質的壓力傳感器碰撞,使得貢梨果肉中完整的細胞壁和細胞膜被破壞,細胞破裂后,細胞中的水和酶被釋放,從而造成光譜曲線上反射率的差異。從光譜曲線中反射率的差異可反映貢梨受損程度。因此本研究通過光譜數據與力學參數相結合的方法,進一步實現貢梨沖擊損傷的定量預測。
通過Gap-segment求導、SG求導和Baseline預處理過后的光譜數據和原始光譜數據分別建立PLSR和PCR模型,模型性能參數見表1和表2:采

表1 不同光譜預處理后力學參數的PLSR模型性能參數Table 1 Performance parameters of PLSR model with different spectral pretreatment

表2 不同光譜預處理后力學參數的PCR模型性能參數Table 2 Performance parameters of PCR model with different spectral pretreatment
用不同的預處理方法過后,力學參數的預測模型性能存在差異,其中采用Baseline預處理后,力學參數的PLSR和PCR模型性能最優。Gap-segment求導、SG求導預處理只能消除光譜數據中不重要的基線漂移,同時還會增大數據的噪聲,降低信噪比。Baseline預處理消除光譜數據基線漂移的效果要比Gap-segment、SG求導預處理的效果好,因此,Baseline預處理是最佳預處理方法[26-27]。通過比較PLSR和PCR模型的RC、RP、RMSEC和RMSEP發現,對于力學參數的預測,PLSR模型的性能優于PCR模型的性能。PLSR模型對峰值力、平均接觸力和損傷面積的預測效果較好,但是對于平均壓強的預測效果并不理想。導致PLSR模型對平均壓強預測效果差的原因可能是由于平均壓強通過平均接觸力除以損傷面積而獲得,而貢梨本身的硬度、曲率半徑、質量均存在差異,導致貢梨碰撞過程中力傳感器所記錄的數據以及損傷面積的測量均存在一定的誤差,兩者誤差的累積導致平均壓強不準確。綜上所述,本研究采用Baseline光譜預處理并建立力學參數的PLSR模型。
利用CARS算法對Baseline預處理后的光譜數據進行特征波長的選取,以峰值力的特征波長選取為例,選取結果見圖5(a)。隨著采樣次數的增加,被優選的波長變量個數逐漸的減少,在第一階段變量個數減少的較快,隨后逐漸減慢,表明使用CARS算法選取特征波長中有“粗選”和“精選”2個階段(圖5(a1))。當采樣次數<31時,RMSECV值不斷降低,表明波長中所含的干擾信息被剔除;當采樣次數>31時,RMSECV值呈回升的趨勢,表明波長中所含的有效信息被剔除,從而導致RMSECV值上升[28];當采樣次數為31時,RMSECV值最小(圖5(a2)),即第31次采樣得到的變量子集為最優的特征波長變量子集,其中該子集包含45個特征波長[29]。

圖5 CARS和UVE算法選取峰值力的特征波長Fig.5 CARS and UVE algorithm selected characteristic wavelength results of peak force
利用UVE算法對Baseline預處理后的光譜數據進行特征波長的選取,以峰值力的特征波長選取為例,選取結果見圖5(b)。由于UVE算法在選取特征波長時集噪聲和濃度信息為一體,因此利用該算法對176個原始波長變量進行篩選時需要引入一定數量的隨機變量,本研究中引入了176個隨機變量,即原始波長變量和隨機變量總個數為352個。分割線左右兩側分別為原始波長變量和隨機變量的穩定性分布曲線,通過上、下閾值線進行特征變量的選取,閾值選定標準為隨機變量穩定性最大值的99%。位于2條閾值線之間的波長變量被剔除,超出2條閾值線的波長變量被保留,用于進一步分析。經過UVE波段篩選過后,共有37個變量被選擇。
利用CARS算法對峰值力、平均接觸力、損傷面積和平均壓強選取的特征波長個數分別為45、35、62和13個,選取的波長數量分別占全波長數量的25.6%、19.9%、35.2%和7.4%(表3)。UVE算法對峰值力、平均接觸力、損傷面積和平均壓強選取的特征波長個數分別為37、51、34和24個,選取的波長數量分別占全波長數量的21.0%、29.0%、19.3%和13.6%(表4)。從2個表中可以看出峰值力和平均接觸力中含有大多數相同的波段,而損傷面積和平均壓強中大多數特征波段并不相同,表明同一屬性的力學參數所含的特征信息相同,不同屬性的力學參數所含的特征信息不同。
本研究利用CARS和UVE算法進行特征波長的選取,通過2種算法選取的特征波長與全波長為變量分別建立PLSR模型進行比較分析,模型的性能參數見表5。相比于Baseline-PLSR模型的預測效果,Baseline-UVE-PLSR模型對力學參數的預測效果較差。可能是采用UVE算法進行特征波長的選取過程中,剔除原始光譜信息中干擾信息的同時將一些有效信息也剔除了,從而導致對力學參數的預測效果變差。Baseline-CARS-PLSR模型對力學參數的預測效果最好,在 Baseline-CARS-PLSR模型中,峰值力、平均接觸力、損傷面積和平均壓強的RP和RMSEP分別為0.892和31.527 N、0.883和18.861 N、0.895和54.411 mm2、0.661和0.045 MPa。表明不同的特征波長選取方法對PLSR模型性能的影響不同,選擇合適的特征波長選取方法可以有效的提高模型的預測精度。

表3 CARS算法選取力學參數的特征波長Table 3 Selection of characteristic wavelength of mechanical parameters by CARS algorithm

表4 UVE算法選取力學參數的特征波長Table 4 Selection of characteristic wavelength of mechanical parameters by UVE algorithm

表5 力學參數原始光譜與特征光譜的PLSR模型性能參數Table 5 Performance parameters of PLSR model for original and characteristic spectra of mechanical parameters
基于Baseline-CARS-PLSR模型力學參數的測量值與預測值見圖6。分別對建模集和預測集的力學參數的測量值與預測值進行擬合后發現,峰值力、平均接觸力和損傷面積的樣本點較為均勻的分布

圖6 基于Baseline-CARS-PLSR模型力學參數的測量值與預測值Fig.6 Measured and predicted values of mechanical parameters based on the Baseline-CARS-PLSR model
在擬合回歸線周圍,且樣本點與擬合回歸線的距離較近。峰值力、平均接觸力和損傷面積的RP和RMSEP分別為0.892和31.527 N、0.883和18.861 N、0.895和54.411 mm2。綜上,Baseline-CARS-PLSR模型對貢梨峰值力、平均接觸力和損傷面積等力學參數的預測較為準確。
由圖6(d)可知,對于平均壓強的預測效果并不理想,Baseline-CARS-PLSR模型的RP和RMSEP分別為0.661和0.045 MPa。平均壓強預測不理想的原因可能是平均壓強的計算誤差的累積或者是平均壓強并不適用于表征貢梨沖擊損傷程度。
為實現準確評估和預測貢梨的沖擊損傷,本研究采用波長為397.5~1 014.0 nm的高光譜成像技術與力學參數相結合的方法對貢梨的沖擊損傷進行定量研究。首先,對峰值力、平均接觸力、損傷面積和平均壓強等力學參數進行統計分析。然后,采用Gap-segment求導、SG求導和Baseline對原始光譜進行預處理,并建立力學參數的PLSR和PCR模型,從而選取最佳預處理方法及建模方法。最后,利用CARS和UVE算法進一步優化力學參數的預測模型,比較各模型的預測精度并確定力學參數的最佳預測模型,探索利用高光譜成像技術與力學參數相結合的方法預測貢梨沖擊損傷的可行性,主要結論如下:
1)采用3種光譜預處理后,力學參數的PLSR和PCR模型性能存在差異,其中Baseline-PLSR模型對力學參數的預測效果最佳,表明選擇合適的預處理方法以及建模方法可以提高模型的性能。
2)本研究在選取最佳的光譜預處理和建模方法后,利用2種算法選取的特征波長為變量建立力學參數的預測模型,其中 Baseline-CARS-PLSR模型對力學參數的預測效果最優,該模型中峰值力、平均接觸力、損傷面積和平均壓強的RP和RMSEP分別為0.892和31.527 N、0.883和18.861 N、0.895和54.411 mm2、0.661和0.045 MPa,表明CARS特征提取算法結合PLSR建模方法可以有效的提高模型的預測能力。高光譜成像技術與力學參數相結合的方法對貢梨沖擊損傷進行定量預測具有較高的可行性。