唐偉萍 黃欣 陳泳锨



摘 要:蔗糖作為重要的食用糖和再生能源,在世界糖產業鏈中占有舉足輕重的地位。文章旨在通過設計一個準確、高效的模型來監測甘蔗生長狀況,進而有效指導科學培育,這是提高甘蔗產量的重要途徑。利用深度學習方法構建甘蔗生長監測模型,以解決傳統監測方式存在的問題。通過調研了解蔗糖的重要性及傳統的甘蔗生長監測方法,詳細分析深度學習在計算機視覺等領域的應用,提出基于卷積神經網絡(CNN)的甘蔗生長監測模型架構;設計基于CNN的圖像分類模型監測甘蔗生長,并通過試驗對比驗證模型的有效性。最后總結基于CNN的深度學習模型監測甘蔗生長的有效性,并探討如何進一步提高甘蔗生長監測的準確性。
關鍵詞:蔗糖;甘蔗生長監測;深度學習;計算機視覺;卷積神經網絡
中圖分類號:S566.1;S126? ? ? ? ? ? ? ? ? ? ? ? 文獻標志碼:A 文章編號:2095-820X(2023)03-0014-06
0 引言
甘蔗是重要的糖料作物和能源作物[1],作為世界上主要的糖源,對于全球食品產業具有重要意義。我國是世界第一蔗糖生產國和消費國,甘蔗糖業在保障我國食糖安全中的地位舉足輕重[2],蔗糖產業對促進國民經濟發展和保障農村經濟穩定具有重要作用,對廣西的農業經濟和社會發展而言同樣意義重大。據統計,2022年廣西年甘蔗種植面積超過666666.7 hm2(1000萬畝),位居全國第一;蔗糖產量600萬t,占全國蔗糖產量一半以上,年產值達到數百億元。甘蔗的種植、加工和銷售形成了完整的產業鏈,涉及到農業生產、食品加工、糖業、酒業和生物燃料等多個領域,為廣西經濟發展帶來了巨大的貢獻。
甘蔗生產受氣候變化、病蟲害等多種因素的影響,因此甘蔗生長監測尤為重要。我國作為甘蔗生產大國,近年來甘蔗糖量已得到明顯提升[3]。甘蔗種植的全程機械化和自動化是產業發展的趨勢[4],提高甘蔗糖產量和糖分離不開強化甘蔗生長的監測、及時防治病蟲害及科學合理的方式培育和管理甘蔗作物。傳統的甘蔗生長監測方法主要依賴于人工觀察和定期抽樣,效率低、耗時長且容易受人為因素的影響。因此,開發一種高效、準確的甘蔗生長監測方法對于提高甘蔗產量和優化農業資源配置具有重要意義。
1 甘蔗生長監測模型設計的概述
1.1 甘蔗生長監測信息化概述
長期以來,傳統的甘蔗生長監測方法主要依賴于人工觀察和定期抽樣,該方法優點在于直觀、易于操作,但存在諸多局限性,如效率低、耗時長、容易受到人為因素影響等,很難保證結果的準確可靠。同時,人工監測方式勞動強度大且成本高,難以實現對大規模甘蔗種植區域的實時監測,限制了其在現代農業生產中的應用。
近年來,遙感技術的發展為甘蔗生長監測提供了新的手段。通常使用光學和SAR衛星數據監測甘蔗生育狀況、病蟲害發生情況及應對措施效果。這些方法可定量化和客觀化地獲取作物生育參數信息,但也面臨一定的問題,比如光學數據容易受天氣影響,其中云層覆蓋會極大降低監測精度;SAR數據分辨率有限,難以精確提取甘蔗生育參數;衛星數據存在時滯性,精度較高的監測,圖像通常難以及時獲取。
1.2 深度學習技術
深度學習是通過神經網絡的學習方法對數據進行有效處理分析。深度學習模型通過大量的訓練數據來學習數據的規律與特征,還可通過反向傳播算法來調整網絡參數,從而提升模型的準確性和泛化能力。近年來,深度學習在計算機視覺和自然語言處理等領域取得了重要的成果。在計算機視覺領域,深度學習模型可實現圖像分類、物體檢測、語義分割等任務,已經成為了許多實際應用的核心技術。在自然語言處理領域,深度學習模型可實現文本分類、情感分析和機器翻譯等任務,為人工智能技術的發展提供了重要支持。
隨著計算能力的提高和大數據的匯集,深度學習模型已經超過人類在圖像分類比賽中的識別準確率,著名的深度學習模型如LeNet[5]、AlexNet[6]、VGG[7]、ResNet8]、Inception[9]等相繼提出,有效推動了機器視覺的發展。卷積神經網絡(Convolutional neural networks,CNN)是一種深度學習模型,能有效地進行圖像分類和物體檢測等任務。2012年Alex Krizhevsky等提出了AlexNet模型,利用CNN進行圖像分類和物體檢測,在ImageNet數據集上測試取得了顯著的結果[10],標志著深度學習在計算機視覺領域的崛起。除CNN之外,目標檢測和語義分割也是深度學習在計算機視覺領域的重要應用。目標檢測是計算機視覺中的一個重要任務,可識別圖像中物體并確定其位置。深度學習在目標檢測領域的應用主要有2個重要的發展方向:一是Faster R-CNN,一種基于區域提取的目標檢測框架,能在準確率和速度之間取得良好的平衡[11];二是YOLO(You only look once),一種端到端的目標檢測模型,可在較短時間內實現高精度的目標檢測[12]。語義分割任務旨在將圖像中的每個像素進行分類,從而實現對圖像的完全理解。深度學習在語義分割領域的應用主要有2種方法:一是基于CNN的全卷積網絡(Fully convolutional networks,FCNs),可對整個圖像進行像素級的分類[13];二是基于編碼器—解碼器(Encoder-Decoder)[14]結構的模型,可對圖像進行分層解碼,從而實現更加準確的語義分割。
深度學習模型采用CNN能自動學習數據的特征并進行分類或識別,但也存在一定的局限性。采用傳感器技術的方法受到傳感器的精度和數量限制,同時需要進行復雜的數據處理和分析。采用圖像處理技術的方法需要高質量的甘蔗圖像,且對于甘蔗生長過程中的其他因素(氣候、土壤等)的影響不夠敏感。
1.3 基于深度學習的農作物生長監測研究
深度學習在農業上的應用前景非常廣闊,近年來在農業方面取得了不少的成就[15],其中計算機視覺技術在農業應用中最廣泛[16],涵蓋農業生產的各方面。如幫助農民進行農業生產管理,通過識別農田中的作物種植情況,預測作物的生長趨勢等,此外,深度學習還可幫助農民優化農業生產的各環節,從而提高整個農業生產系統的效率和質量,為基于深度學習的甘蔗生長監測模型提供了有力的技術基礎。
隨著深度學習技術的發展,越來越多的研究者開始關注基于深度學習的農作物生長監測。通過利用衛星遙感圖像、無人機航拍圖像等數據,設計多種基于深度學習的農作物生長監測模型,運用于預測農作物生長、檢測病蟲害等方面。深度學習對甘蔗生長檢測模型發展的影響主要包含2個方面:(1)深度學習模型可利用其強大的特征提取和分類能力,對甘蔗生長過程中的圖像進行準確的分類和檢測,從而提高甘蔗生長檢測模型的準確率;(2)深度學習模型可實現對甘蔗生長過程中的圖像進行自動化檢測,從而極大減少人工操作的時間和成本,并實現實時監測,及時發現甘蔗生長過程中的問題。
但現階段針對甘蔗的深度學習監測模型研究仍相對較少,因此文章提出建立一種使用深度學習方法自動監測和分類甘蔗生長圖像的方法,以實現更加準確、高效的生育監測。構建基于CNN的深度學習模型,采用甘蔗生長期的高光譜圖像作為模型的訓練和測試數據,建立甘蔗生長階段分類模型,從而達到監測甘蔗生長動態的目的,以提高甘蔗生產效率并為農業生產提供科學依據。
2 甘蔗生長監測模型設計方法
本研究提出的甘蔗生長監測模型,能及時發現并解決可能影響生長效率的問題,指導農民在合適的時間和地點進行灌溉和施肥,分析生長環境和甘蔗生長狀態的變化,及早發現病蟲害的存在并預測其發展趨勢,提前采取相應的防治措施,幫助農民做出科學合理的決策,從而提高甘蔗的產量、質量和農業可持續發展水平。
2.1 總體思路
采集甘蔗從萌發期到成熟期不同生育階段的高光譜圖像作為模型的訓練集。采用基于CNN的模型對這些圖像進行分類訓練,建立甘蔗生育分類模型。將新采集的待測圖像輸入模型,模型可判斷圖像屬于哪個生育階段,從而實現對甘蔗生長的監測。
2.2 數據獲取與預處理
為了訓練和驗證甘蔗生長監測模型,首先需要獲取大量的甘蔗生長圖像數據。本研究將利用無人機航拍圖像作為數據來源,并對數據進行預處理,包括圖像裁剪、縮放和旋轉等操作,以增強模型的泛化能力。同時采集甘蔗的生長數據,包括溫度、濕度和光照等環境因素及甘蔗的生長狀態。最后將這些數據劃分為訓練集和測試集,其中訓練集占總數據量的80%,測試集占20%。在數據預處理階段,對數據進行歸一化處理,將所有數據縮放到0~1,以便于模型的訓練和預測。
2.3 模型架構
采用CNN作為基礎架構,設計甘蔗生長監測模型。CNN是一類用于圖像識別和分類的深層神經網絡,其包括輸入層、卷積層、池化層、全連接層和輸出層。卷積層采用卷積核對輸入數據進行特征抽取;池化層用于進一步提取圖像的空間信息;全連接層對抽取的特征進行分類或回歸。CNN具有強大的圖像特征提取能力,能有效地捕捉甘蔗生長過程的關鍵信息。具體而言,模型將包括多個卷積層、池化層和全連接層等組件,以實現對甘蔗生長狀態的自動識別和預測。
如圖1所示,甘蔗生長監測模型包括以下7層:(1)輸入層。輸入甘蔗生長的圖片數據和時間序列數據。(2)卷積層。用于提取圖像特征,包括多個卷積核和激活函數。(3)池化層。用于降低特征圖的維度和大小,減少參數數量。(4)LSTM層。用于處理時間序列數據,捕捉序列中的時序信息。(5)GRU層。用于處理時間序列數據,與LSTM相似,但計算復雜度更小。(6)全連接層。用于將卷積和時序的特征進行融合和分類。(7)輸出層。輸出甘蔗生長狀態的預測結果。
2.4 訓練與優化
在獲取并預處理數據后,將使用隨機梯度下降(Stochastic gradient descent,SGD)等優化算法對模型進行訓練。SGD算法的迭代更新過程如下:
Step 1:隨機初始化模型參數;
Step 2:對每個訓練樣本作如下工作:(1)計算損失函數關于參數的梯度,(2)根據學習率和梯度方向更新模型參數。
Step 3:是否達到最大迭代次數或損失函數收斂。是則停止,否則重復執行Step 2。
在訓練過程中,模型將根據損失函數的梯度信息不斷調整參數,以提高對甘蔗生長狀態的預測準確性。
此外,為防止過擬合現象,還采用正則化(Regularization)和dropout等技術對模型進行優化,幫助提高模型的泛化能力,并在處理復雜數據集時減少過擬合問題的發生。
3 甘蔗生長檢測試驗與評估
3.1 試驗設置
為評估甘蔗生長監測模型的性能而進行多組試驗。試驗數據將分為訓練集、驗證集和測試集,用于模型的訓練、參數調整和評估。模型包括4個模塊:輸入模塊、特征提取模塊、深度學習模塊和輸出模塊(圖2)。試驗步驟如下:
Step 1:將采集到的萌發期到成熟期不同生育階段的高光譜圖像作為模型的訓練集,結合時間序列數據作為模型的訓練數據。
Step 2:對高光譜圖像使用主成分分析(PCA)降維,將降維后的數據作為特征提取模塊的輸入。
Step 3:將特征提取后的數據和甘蔗生長周期數據作為模型訓練數據集,進行模型的訓練。
Step 4:使用訓練后的模型對測試集數據進行預測,從而得到甘蔗生長周期預測結果。
通過將樣本分為5個子集,進行5折交叉驗證,每次選擇其中一折作為驗證集,其余的折作為訓練集。重復5次,每次使用不同的驗證集,最后將5次評估結果進行平均,得到模型的性能評估。
將訓練的Epoch設為200輪,隨著訓練次數的增加,該模型的邊界損失、目標損失、分類精度和召回率如圖3所示,通過該圖可見,在訓練150輪后,模型開始逐漸收斂,精度在95%以上。訓練出來的模型可對甘蔗的生長周期做出判斷,分別為萌芽期、幼苗期、分蘗期、伸長期和成熟期。農場主更具甘蔗不同的生長周期做出合理的決策,從而提高甘蔗作物產量。
3.2 試驗結果
為了驗證所提出的深度學習模型相較于其他方法的優勢,將本研究提出的模型與1D-CNN、2D-CNN和ResNet進行對比。所提出方法與其他3種方法的算法準確率,試驗對比如圖4所示。通過試驗發現,文章所構建的深度學習模型通過結合ResNet和2D-CNN,在提升分類精度的同時,減少了模型的復雜度,實現較高精度地分類甘蔗生育階段。相對于2D-CNN和ResNet,該模型在測試集上精度提升幅度分別為5.1%和2.4%。同時將訓練好的甘蔗生長監測模型應用于實際場景中,對甘蔗的生長狀態進行了預測,結果表明,該模型具有較高的準確率,能有效監測和判斷甘蔗的生長階段,為科學培育甘蔗提供了重要依據。
4 結語
本研究基于分析蔗糖的重要性及傳統監測方法的不足,提出利用深度學習自動監測和分類甘蔗生長圖像的方法,構建了基于CNN的深度學習模型,并進行驗證其監測甘蔗生長的有效性。就進一步提升深度學習模型的能力,提出以下幾點建議:(1)采用更大規模和多樣化的數據集訓練深度學習模型,提高模型的泛化能力??山Y合更長時間跨度的甘蔗生育數據,同時加入不同品種、不同區域等數據進行訓練。(2)采用更深和復雜的網絡架構,如DenseNet等[17],提高模型的特征學習能力,也可在原模型基礎上加入注意力機制或記憶機制,進一步優化模型。(3)將深度學習模型與時間序列模型或推薦系統相結合,實現對甘蔗全生育周期的精準監測和預警。如利用廣西某地區甘蔗歷史生育數據預測生育趨勢,一旦發現異常情況及時發出預警。(4)將深度學習模型部署至終端設備,實現實時監測。通過邊緣計算的方式,將模型運行在現場的終端設備上,可減少數據傳輸和提高監測響應速度。(5)探索將深度學習與遙感監測相結合,發揮兩者優勢。深度學習模型可高精度提取生育參數,而遙感可定期監測較大范圍內甘蔗生長狀況,結合使用能實現對更加廣泛區域內甘蔗高效和精準監測。
綜上所述,本研究構建的深度學習模型為高效和精準監測甘蔗生長提供了可能。模型具有較高的準確率和精確度,能有效地監測甘蔗的生長狀態,為甘蔗生長管理和決策提供了參考依據。今后不斷改進模型的性能,將其應用于更廣泛的農業領域中,以提高作物生產的效率和質量。
參考文獻
[1] 楊婷, 沈石妍, 王智能,等. 100份甘蔗種質資源營養品質分析及評價[J]. 熱帶作物學報,2023,44(3):484-493.
[2] 張華, 羅俊, 袁照年,等. 甘蔗機械化種植的農藝技術分析[J]. 中國農機化學報,2013,34(1):78-81.
[3] 馮麗鋼. 農藝技術在甘蔗機械化種植中的應用[J]. 廣西農業機械化,2023(1):5-7.
[4] 凡云雷, 周德強, 鄧干然, 等. 基于機器視覺的甘蔗切種裝備設計與試驗[J]. 農機化研究,2021,43(5):55-60.
[5] LeCun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Procee-dings of the IEEE,1998,86(11):2278-2324.
[6] Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[J]. Communications of the ACM,2017,60(6):84-90.
[7] Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition[C]//Computational and Biological Learning Society. International Conference on Learning Representations,2015. doi:10.48550/arXiv.1409.1556.
[8] He K M, Zhang X Y, Ren S Q, et al. Deep residual learning for image recognition[C]//IEEE. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2016. doi:10.1109/CVPR.2016.90.
[9] Szegedy C, Vanhoucke V, Ioffe S, et al. Rethinking the inception architecture for computer vision[C]//IEEE. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2016. doi:10.1109/CVPR. 2016.308.
[10] Ballester P, Araú R M. On the performance of GoogLeNet and AlexNet applied to ketches[C]//AAAI. AAAI'16: Proceedings of the Thirtieth AAAI Confe-rence on Artificial Intelligence,2016:1124-1128.
[11] Ren S Q, He K M, Girshick R, et al. Faster R-CNN: Towards real-time object detection with region propo-sal networks[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence,2017,39(6):1137-1149.
[12] Redmon J, Divvala S, Girshick R, et al. You only look once: Unified, real-time object detection[C]//IEEE. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2016. doi:10.1109/CVPR. 2016.91.
[13] Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation[C]//IEEE. IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2015),2015. doi:10.1109/TPAMI.2016. 2572683.
[14] Badrinarayanan V, Kendall A, Cipolla R. Segnet: A deep convolutional encoder-decoder architecture for image segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(12):2481-2495.
[15] 徐衍向,張敬智,蘭玉彬,等. 基于紅外熱成像和機器學習的作物早期病害識別研究進展[J]. 中國農機化學報,2023,44(5):188-197.
[16] 邊柯橙,楊海軍,路永華. 深度學習在農業病蟲害檢測識別中的應用綜述[J]. 軟件導刊,2021,20(3):26-33.
[17] Huang G, Liu Z, van der Maaten L, et al. Densely connected convolutional networks[C]//IEEE. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2017:751-759.
(責任編輯 鄧慧靈)