















摘要:針對抽樣化驗等傳統果實品質檢測方法具有破壞性以及現有回歸預測模型存在光譜信息損失和特征提取不夠完備等問題,提出基于近紅外光譜分析技術和一維卷積神經網絡(1D-CNN)實現蜜柑果實可溶性固形物含量預測的模型和方法。采集蜜柑的近紅外光譜和測定可溶性固形物含量建立數據集。并通過試驗對比確定使模型性能最優的網絡結構深度、卷積核尺寸和數量、有無批量歸一化(BN)層、池化方式、全連接層深度和Dropout值等網絡結構參數,形成包含2層卷積層、2層BN層,2層最大池化層和2層全連接層的一維卷積神經網絡,并設置Dropout值為0.2。與偏最小二乘回歸、主成分回歸和支持向量機回歸預測模型的性能對比試驗表明:提出的1D-CNN模型預測精度和模型穩定性均優于傳統回歸預測算法,其驗證集上的均方根誤差為[0.333 9],決定系數為[0.865 5],能夠實現對蜜柑近紅外光譜數據特征的有效提取和對蜜柑可溶性固形物含量的無損檢測。
關鍵詞:蜜柑;近紅外光譜;卷積神經網絡;可溶性固形物;無損檢測
中圖分類號:TS207.3 文獻標識碼:A 文章編號:2095?5553 (2024) 11?0139?06
Study on prediction model of citrus SSC based on CNN and near infrared spectroscopy
Xiang Zhiyong, Miao Yubin
(College of Mechanical and Power Engineering, Shanghai Jiaotong University, Shanghai, 200240, China)
Abstract: Aiming at the problems of destructive traditional fruit quality detection methods such as sampling assay, spectral information loss and incomplete feature extraction in the existing regression prediction models,a novel model and method based on near?infrared spectroscopy analysis technology and a one?dimensional Convolutional neural network (1D-CNN) topredict the soluble solids content of citrus fruit were proposed in this paper. A dataset has been established by gathering near?infrared spectroscopy of citrus fruits and determining their soluble solid content. The network structure parameters have been optimized to enhance the performance of the model, including the depth of the network structure, the size and quantity of convolutional kernels, the presence or absence of batch normalization (BN) layers, pooling methods, the depth of fully connected layers, and Dropout values. The final 1D-CNN model comprises two convolutional layers, two BN layers, two maximum pooling layers, and two fully connected layers, with a Dropout value of 0.2. Traditional Partial least squares regression, principal component regression, and support vector machine regression prediction models have been established to compare their performance with the 1D-CNN model. The outcomes reveal that the 1D-CNN model exhibits significantly superior prediction accuracy and model stability compared to conventional algorithms. The Root?mean?square deviation on the verification set is 0.333 9, and the Coefficient of determination is 0.865 5. This demonstrates that the 1D-CNN model can carry out feature extraction of citrus near?infrared spectral data, thereby permitting non?destructive detection of soluble solid content in citrus. Consequently, this approach provides a better solution for non?destructive detection of citrus based on near?infrared spectral analysis technology.
Keywords: citrus; near?infrared spectroscopy; convolutional neural network; soluble solids; non?destructive testing
0 引言
溫州蜜柑是受人們喜愛的常見水果。隨著生活水平的不斷改善,消費者對蜜柑的品質要求不斷提高,除關注蜜柑的外部成色之外,也更加注重蜜柑的內部品質??扇苄怨绦挝锖浚⊿SC)是衡量蜜柑品質的重要指標[1]。但隨機抽樣化學檢測的傳統檢測方法需要破壞果體,不利于對果實進行快速篩選分級,需要研究更便捷的無損檢測技術。
近紅外光譜分析技術是近年來發展起來的一種新型的無損快速分析技術,廣泛應用于農業、食品、醫療、化工等行業。國內外眾多學者利用近紅外光譜分析技術實現了蘋果[2?4]、梨[5, 6]、桃[7, 8]、柑橘[9, 10]、李子[11, 12]等果實可溶性固形物含量檢測研究。劉燕德[13]等利用近紅外漫透射光譜技術結合最小二乘支持向量機算法實現了蜜柑SCC的在線無損檢測。李俊杰等[14]運用偏最小二乘回歸(PLSR)建立了SCC、可滴定酸以及維C的檢測模型,取得了較好的結果。近紅外光譜預測模型的建立多采用PLSR等傳統建模方法,一般首先對光譜數據進行預處理,然后提取光譜中重要波峰信息或運用主成分分析等方法對光譜信號降維,保留重要特征,降低計算復雜性。這些方法存在訓練過程較為復雜,表征參數較少,回歸精度差強人意等不足。卷積神經網絡(CNN)是深度學習算法的代表算法之一,其采用端到端訓練模式,能自動提取數據體征[15],訓練過程更簡單,參數相對較多,具有更大的優化空間。且因為具備基于卷積權值共享和局部區域連接等機制,CNN具有很強的泛化能力。Mishra等[16]建立了基于CNN的水果不同性狀的多輸出預測模型,同時預測了梨果實的水分含量和SSC,模型性能優于PLSR模型。Huang等[17](2021)提出了基于多尺度短切卷積神經網絡的無損檢測方法,用于測量馬尾松幼苗葉片中的水分和氮含量,其對應的建模均方根誤差為0.242和0.061。Benmouna等[18]開發了基于CNN利用近紅外光譜信息對富士蘋果的成熟階段進行分類的新方法,正確率為96.5%,高于人工神經網絡、支持向量機等方法。
針對傳統果實品質檢測方法以及現有回歸預測模型存在的不足,根據光譜數據特點,提出一種基于一維卷積神經網絡(1D-CNN)和近紅外光譜信息的蜜柑SSC預測模型。根據采集到的蜜柑近紅外光譜數據,建立1D-CNN預測模型,并通過試驗優選網絡結構深度、卷積核尺寸和數量、有無批量歸一化(BN)層、池化方式、全連接層深度和Dropout值等網絡結構參數,使模型性能最優。通過與PLSR等傳統預測模型對比,討論本文預測模型的精度和穩定性優勢。
1 材料與方法
1.1 試驗樣品
選取10月份成熟期的新鮮采摘、顏色正常、大小均勻、且表面無明顯病變傷疤的蜜柑共340個,作為試驗樣品。對所選蜜柑表皮用濕紙巾做簡單的清潔處理,擦掉表面雜質,確保不會引入外來物質導致光譜異常。將蜜柑樣品依次編號,并在22 ℃實驗室環境下放置24 h,分別采集蜜柑的近紅外光譜和可溶性固形物含量數據。
1.2 試驗方法
1.2.1 近紅外光譜采集裝置
根據試驗需求設計并搭建近紅外光譜采集裝置如圖1所示,主要包括計算機、微型光譜儀、遮光箱、鹵素光源、參比球、準直透鏡和光纖等。光譜采集設置為漫透射采集方式,4個鹵素光源分別安裝在遮光箱四面,相對中軸線呈45°夾角,從4個方向照射果實。光譜儀采用FX4000微型光譜儀,光譜分辨率為0.06 nm,采樣波長范圍為200~1 100 nm,光源采用4盞100 W鹵素燈,總功率400 W,積分時間100 ms。采用Morpho軟件進行光譜采集,對每個蜜柑使其果梗朝向不同方向,采集4次取平均值作為對應果實的近紅外光譜數據。
1.2.2 可溶性固形物含量測定
使用AIOK高精度數顯糖度計測定蜜柑的可溶性固形物含量。將光譜采集后的蜜柑進行榨汁,并用濾網進行過濾,用試管收集濾液備用;利用蒸餾水對糖度儀進行校準后,使用滴管吸取果汁濾液滴入糖度儀的樣液池中讀數,多次測量直至連續兩次讀數相同,記錄糖度儀讀數。
1.3 光譜數據預處理
因背景噪聲、雜散光和人工操作等因素影響,所采集的光譜數據不可避免地包含噪聲信號,需在建模之前對所采集的原始光譜數據進行預處理。選取標準正態變換(SNV)[19]光譜預處理方法。
1.4 一維卷積神經網絡
卷積神經網絡(CNN)是一種多層非全連接的非線性深度學習方法,其基本結構由卷積層、池化層和全連接層組成,在正向傳播過程中利用卷積層層和池化層相互交替實現原始數據特征提??;在反向傳播過程中利用梯度下降法最小化誤差函數實現參數提張以此完成權值更新[20]。一維卷積神經網絡(1D-CNN)是卷積神經網絡的分支之一,其輸入樣本數據以及網絡結構中的卷積核、池化核等均為一維。1D-CNN的卷積和池化過程如圖2、圖3所示。
1.5 模型評價方法
為確定最佳網絡結構參數和系統參數,選擇均方根誤差(Root Mean Square Error,RMSE)和決定系數(Correlation of determination,R2)作為模型性能評價指標。其計算如式(1)、式(2)所示。
[RMSE=i=1m(yi-yi)2m] (1)
[R2=i=1m(yi-yi)2i=1m(yi-yi)2] (2)
式中: [yi]——模型預測值;
[yi]——預測值的均值;
[yi]——實際測量值;
[m]——樣品的個數。
2 試驗結果與分析
2.1 近紅外光譜和SSC分析
對340個溫州蜜柑果實樣本進行光譜采集,剔除異常樣本后得到332組原始光譜數據,如圖4(a)所示,使用KS樣本劃分法(Kennard-Stone,KS)劃分訓練集和驗證集。訓練集與驗證集的樣品數據統計表如表1所示,樣本數據分布合理,偏差較小,可以建立回歸模型。經過SNV預處理后的光譜數據如圖4(b)所示,相較于原始光譜,預處理后的光譜特征峰更明顯。
2.2 網絡結構深度設置
1D-CNN模型的第一部分是特征提取模塊,由卷積層、池化層、批量歸一化(Batch normalization,BN)和ReLU激活函數組成一個相對獨立的小型網絡層集合(后文稱該集合為特征提取層)。為確定最佳網絡深度,對比不同深度網絡結構的1D-CNN預測模型性能指標,結果如表2所示。
由表2可知,兩層網絡結構的1D-CNN模型性能最優,訓練集均方根誤差為0.276 3,決定系數為0.888 0,驗證集均方根誤差為0.405 4,決定系數為0.768 8。故此本文選用兩層特征提取層組成的特征提取模塊。
2.3 卷積核尺寸和數目的確定
卷積層利用卷積核對前一層的特征圖局部區域進行卷積運算實現特征映射,所以卷積核的大小和數量能夠影響卷積神經網絡的建模性能。在前文試驗基礎和相同網絡結構和參數條件下,通過試驗比較不同卷積核尺寸對模型性能的影響。因為池化層會縮短數據長度,所以本文設定第二層的卷積核比第一層小2。不同卷積核尺寸的1D-CNN模型效果如圖5所示。
由圖5可知,卷積核尺寸為19、17時對應1D-CNN模型的性能最優,所建模型在訓練集上的決定系數為0.888 0,驗證集的決定系數為0.768 8。
不同卷積核數目對1D-CNN預測模型性能的影響試驗結果如圖6所示。由圖6可見,卷積核數目為8、32時模型的性能表現較好,驗證集決定系數為0.768 8。
2.4 BN層的設置
卷積層的輸出通過BN機制進一步處理,BN機制能有效的解決梯度爆炸或梯度消失問題,并可提高收斂速度[21]。表3為網絡結構和參數相同的前提下,是否引入BN機制兩種情形對1D-CNN預測模型的性能影響對比。從表3可知,BN層能有效提高1D-CNN模型的性能。
2.5 池化方式的設置
池化層可以在保證數據特征的同時大大降低CNN的參數量。表4為網絡結構和參數相同的前提下,最大池化和平均池化兩種池化方式對1D-CNN預測模型的性能影響對比。由表4可知,采用最大池化的1D-CNN模型性能在驗證集上的表現優于平均池化。
2.6 全連接層的設計
1D-CNN模型的第二部分是全連接層,全連接層輸入層的神經元個數取決于輸入數據的維度和卷積核的數目,中間層數能影響模型的建模性能,表5為相同特征提取層條件下,不同全連接層數對1D-CNN預測模型的性能影響對比。
由表5可知,兩層全連接層的1 D-CNN模型在驗證集上的表現明顯優于其他模型。這是全連接層數增多,模型參數的增加導致模型過擬合。
2.7 Dropout的設定
由于近紅外光譜數據具有比較高的數據維度,網絡的參數量偏大,容易導致過擬合等問題發生。本文通過在網絡結構中加入Dropout層,減緩高維近紅外光譜帶給網絡的影響,從而提高蜜柑預測模型的穩定性。表6為相同網絡結構和參數的前提下,不同丟棄率對1D-CNN預測模型的性能影響對比。由表6可知,在本試驗中,選擇丟失率為0.2時,預測模型的性能表現最好。
2.8 1D-CNN蜜柑SSC預測模型建立
基于前文試驗結果,1D-CNN模型的網絡結構及參數如圖7所示。
圖7中1D-CNN網絡結構含有2個卷積層(C1,C3),其卷積核大小分別為19和17,卷積核數量分別為8和32。2個最大池化層(S2,S4)按照設定步長和窗口大小降低數據維度。為防止卷積計算過程中梯度消失,引入BN機制,在卷積層后加入BN層。全連接層有2層(F5,F6)的神經元個數分別為1 024和32, 并引入Dropout機制,提高模型穩定性,Dropout值取為0.2。
基于上述1D-CNN網絡結構建立蜜柑SSC預測模型,模型在訓練集上的均方根誤差為0.260 2,決定系數為0.896 1,在驗證集上均方根誤差為0.333 9,決定系數為0.865 5。蜜柑SSC測定值和預測值的散點圖如圖8所示。
2.9 模型性能對比
為驗證1D-CNN模型的有效性,選擇相同訓練集和驗證集樣本,采用SNV預處理,分別與偏最小二乘回歸(PLSR)、主成分回歸(PCR)和支持向量機回歸(SVR)預測模型進行對比分析,結果如表7所示。
由表7可知,在建模條件相同的情況下,1D-CNN、PLSR和SVR模型性能較好,PCR模型產生過擬合。其中又以1D-CNN模型性能最好,其在訓練集上的均方根誤差為[0.260 2],決定系數為[0.896 1];在驗證集上的均方根誤差為[0.333 9],決定系數為[0.865 5]。其次是SVR模型,在訓練集上的均方根誤差為[0.398 0],決定系數為[0.780 0];在驗證集上的均方根誤差為[0.414 3],決定系數為[0.802 5]。PLSR模型性能相對較差,在訓練集上的均方根誤差為[0.270 2],決定系數為[0.900 0];在驗證集上的均方根誤差為[0.471 2],決定系數為[0.761 9]。
綜上可見,1D-CNN預測模型性能相比其他模型性能更優。相較于傳統回歸算法,1D-CNN能夠提升模型的精度和穩定性,有效改進基于近紅外光譜的蜜柑品質無損檢測技術。
3 結論
1) 基于近紅外光譜分析技術對蜜柑進行無損檢測時,傳統建模方法所得模型存在光譜信息損失和特征提取不夠完備等問題,為此提出基于近紅外光譜分析技術和1D-CNN的蜜柑SSC預測模型。通過對比試驗,研究確定1D-CNN預測模型的最佳網絡結構參數,實現更為準確的蜜柑SSC預測,驗證集均方根誤差為[0.333 9],決定系數為[0.865 5]。
2) 對比試驗表明,相較于PLSR模型(在驗證集上的均方根誤差為[0.471 2],決定系數為[0.761 9])、SVR模型(在驗證集上的均方根誤差為[0.414 3],決定系數為[0.802 5])和PCR模型(在驗證集上的均方根誤差為[0.651 1],決定系數為[-0.124 9]),1D-CNN模型性能更優秀。
3) 研究結果為基于近紅外光譜實現快速高效的蜜柑SSC無損檢測提供技術支持。
參 考 文 獻
[ 1 ] 劉燕德, 施宇, 蔡麗君, 等. 基于CARS算法的臍橙可溶性固形物近紅外在線檢測[J]. 農業機械學報, 2013, 44(9): 138-144.
Liu Yande, Shi Yu, Cai Lijun, et al. On?line NIR detection model optimization of soluble solids content in navel orange based on CARS [J]. Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(9): 138-144.
[ 2 ] 龐新安. 近紅外光譜技術及其在農產品品質分析中的應用[J]. 廣西農業生物科學, 2007(1): 83-87.
Pang Xin'an. Near infrared spectrum technique and its application in quality analysis on farm produce [J]. Journal of Guangxi Agriculture and Biological Science, 2007(1): 83-87.
[ 3 ] Zhang Y, Chen Y, Wu Y, et al. Accurate and nondestructive detection of apple brix and acidity based on visible and near?infrared spectroscopy [J]. Applied Optics, 2021, 60(13): 4021-4028.
[ 4 ] Xia Y, Fan S, Li J, et al. Optimization and comparison of models for prediction of soluble solids content in apple by online Vis/NIR transmission coupled with diameter correction method [J]. Chemometrics and Intelligent Laboratory Systems, 2020, 201: 104017.
[ 5 ] Wang J, Wang J, Chen Z, et al. Development of multi?cultivar models for predicting the soluble solid content and firmness of European pear (Pyrus communis L.) using portable vis-NIR spectroscopy [J]. Postharvest Biology and Technology, 2017, 129: 143-151.
[ 6 ] Mishra P, Woltering E, Brouwer B, et al. Improving moisture and soluble solids content prediction in pear fruit using near?infrared spectroscopy with variable selection and model updating approach [J]. Postharvest Biology and Technology, 2021, 171: 111348.
[ 7 ] Minas I S, Blanco?Cipollone F, Sterle D. Accurate non?destructive prediction of peach fruit internal quality and physiological maturity with a single scan using near infrared spectroscopy [J]. Food Chemistry, 2021, 335: 127626.
[ 8 ] Yuan L M, You L, Yang X, et al. Consensual regression of soluble solids content in peach by near infrared spectrocopy [J]. Foods, 2022, 11(8): 1095.
[ 9 ] Song J, Li G, Yang X, et al. Rapid analysis of soluble solid content in navel orange based on visible?near infrared spectroscopy combined with a swarm intelligence optimization method [J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2020, 228: 117815.
[10] Santos C S P, Cruz R, Goncalves D B, et al. Non?destructive measurement of the internal quality of citrus fruits using a portable NIR device [J]. Journal of AOAC International, 2021, 104(1): 61-67.
[11] 趙志磊, 王雪妹, 劉冬冬, 等. 基于BP-ANN和PLS的近紅外光譜無損檢測李果實品質的研究[J]. 光譜學與光譜分析, 2022, 42(9): 2836-2842.
Zhao Zhilei, Wang Xuemei, Liu Dongdong, et al. Quantitative analysis of soluble solids and titratable acidity content in Angeleno plum by near?infrared spectroscopy with BP-ANN and PLS [J]. Spectroscopy and Spectral Analysis, 2022, 42(9): 2836-2842.
[12] Pérez?Marín D, Paz P, Guerrero J E, et al. Miniature handheld NIR sensor for the on?site non?destructive assessment of post?harvest quality and refrigerated storage behavior in plums [J]. Journal of Food Engineering, 2010, 99(3): 294-302.
[13] 劉燕德, 胡軍, 歐陽玉平, 等. 贛南臍橙可溶性固形物近紅外光譜在線無損檢測[J]. 廣東農業科學, 2016, 43(9): 105-111.
Liu Yande, Hu Jun, Ouyang Yuping, et al. Online detection of soluble solids content for Gannan navel by visible?near infrared diffuse transmission spectroscopy [J]. Guangdong Agricultural Science, 2016, 43(9): 105-111.
[14] 李俊杰, 張績, 汪小偉, 等. 近紅外光譜大數據分析塔羅科血橙內在品質的研究[J]. 食品研究與開發, 2020, 41(20): 193-197, 209.
Li Junjie, Zhang Ji, Wang Xiaowei, et al. Study on internal quality of Tarocco blood orange based on large data analysis of near?infrared spectroscopy [J]. Food Research and Development, 2020, 41 (20): 193-197, 209.
[15] 劉偉男. 基于深度學習的近紅外光譜豬肉新鮮度檢測研究[D].徐州: 中國礦業大學, 2022.
Liu Weinan. Study on pork freshness detection by near?infrared spectroscopy based on deep learning [D]. Xuzhou: China University of Mining and Technology, 2022.
[16] Mishra P, Passos D. Multi?output 1-dimensional convolutional neural networks for simultaneous prediction of different traits of fruit based on near?infrared spectroscopy [J]. Postharvest Biology and Technology, 2022, 183: 111741.
[17] Huang Z, Zhu T, Li Z, et al. Non?destructive testing of moisture and nitrogen content in Pinus Massoniana seedling leaves with NIRS based on MS-SC-CNN [J]. Applied Sciences, 2021, 11(6): 2754.
[18] Benmouna B, Garcia?Mateos G, Sabzi S, et al. Convolutional neural networks for estimating the ripening state of fuji apples using visible and near?infrared spectroscopy [J]. Food and Bioprocess Technology, 2022, 15(10): 2226-2236.
[19] 余懷鑫. 基于可見—近紅外光譜技術的柑橘品質無損檢測研究[D]. 武漢: 華中農業大學, 2021.
Yu Huaixin. Research on non?destructive testing of citrus quality based on visible near?infrared spectroscopy technology [D]. Wuhan: Huazhong Agricultural University, 2021.
[20] 溫馨. 基于深度學習的水果糖度可見/近紅外光譜無損檢測方法研究[D]. 北京: 北京交通大學 , 2018.
Wen Xin. Research on non?destructive determination technology of fruit sugar degree by visible/near?infrared spectroscopy based on deep learning [D]. Beijing: Beijing Jiaotong University, 2018.
[21] 邢超. 基于深度神經網絡的云環境服務故障識別方法[J]. 數據通信, 2022(4): 12-15.
Xing Chao. Fault identification method for cloud environment services based on deep neural networks [J]. Data Communication, 2022(4): 12-15.