何相良, 戴建國, 侯文慶, 蔣 楠, 左昌鑫
(1.石河子大學信息科學與技術學院,新疆石河子 832000; 2.兵團空間信息工程技術研究中心,新疆石河子 832000)
我國是紡織大國,棉花在我國是僅次于糧食的大宗農產品。根據國家統計局發布的數據來看,我國棉花使用量每年仍有上萬噸的進口需求,棉花生產的提質增效是農業工程領域內普遍研究的問題。長期種植經驗表明,精準施肥是提高產量的主要手段。隨著智慧農業的深入研究和逐步應用,施肥量的精確控制成為智慧農業研究的一個重要分支,而高效精確的棉花缺氮水平診斷是精準施肥的前提和基礎。傳統的生物化學方式測定植物氮含量存在檢測周期長、破壞性強等問題,不適用于現代農業的生產方式。由于植物的葉片顏色、紋理、形狀甚至質地等特征可以直接反映植株的氮營養狀況,因此通過對作物的數字圖像進行分析,可以建立光譜特征參數與實際含氮量之間的數學模型[1-5]。魏全全等通過分析馬鈴薯冠層圖像的數碼參數與氮素營養指標之間相關性,篩選出氮含量的最優估測參數,擬合出氮營養含量估測方程[6]。陳佳悅等分析冬小麥冠層數字圖像的特征參數后提出了顏色組合標準化指數,其與葉片氮含量線性擬合后的決定系數與均方根誤差分別能達到0.97、0.129 9[7]。近年來,隨著計算機視覺領域的發展,國內外學者常用機器學習和數字圖像處理技術建立植物葉片的理化特征與其氮素含量之間的回歸或分類模型,并取得了諸多成果[8-10]。李小正等提取棉花葉片圖像彩色參數與其氮含量做相關性分析,用顯著相關的向量組合訓練不同神經網絡模型,結果表明,使用藍色通道(B)、色調(H)、歸一化藍色波段指數(NBI)、歸一化紅色波段指數(NRI)、綠減紅(G-R)、綠比紅(G/R)訓練的徑向基網絡在預測棉花葉片的氮含量上具有優越性[11]。王金星等提取蘋果樹葉片圖像中的主要彩色參數構建了基于自適應遺傳算法優化的主成分支持向量機(PCA-SVM)、主成分神經網絡(PCA-BP)、主成分極限學習機(PCA-ELM)共3種氮含量預測模型,結果表明,經過遺傳(GA)算法優化后的PCA-SVM模型的預測效果最佳[12]。羅建軍等通過提取水稻葉片圖像中的顏色和幾何特征建立了基于遺傳算法優化的BP神經網絡對水稻氮素營養進行診斷,結果表明,該模型在各施氮水平上的識別平均精確率均能達到97%以上[13]。雖然機器學習結合數字圖像處理技術在檢測作物氮營養含量的研究上是一種快速、無損、高效的手段,但由于不同作物的缺氮營養特性、生長周期和拍攝環境以及成像方式都不同,故導致上述研究方法過于復雜,且普適性不強,受數據質量的影響較大,不能滿足智慧農業生產模式的要求。而隨著深度學習的發展,卷積神經網絡已成為作物缺氮診斷中更便捷、快速、精準的途徑之一。楊娟娟等改進了VGG-16的全連接層,對不同梯度氮含量的葡萄葉片圖像進行識別,在室內簡單背景下的識別平均精確率可以達到78%[14]。熊俊濤等利用Mask-RCNN模型對大豆葉片圖像進行分割去除背景特征,繼而采用VGG-16完成缺素分類,該分類模型在測試集上的分類準確率達到了89%[15]。綜上所述,深度學習在農作物氮含量診斷的應用上,研究者們主要使用較淺層網絡模型開展研究,這些模型由于提出的時間相對較早,與現在的深度神經神經網絡相比,其學習能力已落后。棉花功能葉片的顏色特征與植株含氮量之間有著緊密的聯系[16],目前,通過作物的可見光數字圖像進行氮含量檢測時,多數使用機器學習結合圖像處理的技術,而使用深度學習模型進行研究的尚且較少,本試驗以深度學習模型為研究對象,以尋求最適宜棉花缺氮水平診斷的模型。本試驗基于智能手機高清攝像頭的優勢,采集花鈴期時不同缺氮水平的棉花葉片數字圖像,比較AlexNet、VGGNet、GoogLeNet、MobileNet、Inception-v3、ResNet-v2和ResNeXt及其改進網絡的檢測效果,對比分析各模型的特征提取結構在棉花葉片缺氮水平檢測上的優劣,以期為自動化棉花缺氮診斷提供算法支持,并為基于深度學習的作物營養檢測研究提供借鑒和參考。
田間試驗地點位于新疆維吾爾自治區石河子地區新疆農墾科學院試驗站(85°59′35″E,44°18′45″N)。研究區所在農業園地勢平坦,平均海拔高度 450.8 m,地處天山北麓中段,古爾班通古特大沙漠南緣,屬溫帶大陸性氣候,晝長夜短,年平均氣溫 7~8 ℃。試驗數據采集于7月中旬花鈴期,當季平均氣溫25~26 ℃;棉花于2021年4月18日種植,4月27日第1次灌溉,用寬窄行膜下滴灌種植方式,15穴/m,1膜3行。水肥管理采用隨機區組設計。設置5個氮肥處理,每個處理重復3次,共計15個小區,每塊小區的面積約為78 m2。施氮水平正常區N240的施氮總量為240 kg/hm2,為當地棉田常規施氮量。在蕾期至初花期固定施入底肥60%的基礎上,調整盛花期和盛鈴期的施氮比例。以N240區域為例,即蕾期至初花期施肥60%,盛花期追肥30%,盛鈴期追肥10%。其他處理區域為N0、N72、N144和N192。詳細的施氮周期和施氮量見表1。

表1 不同處理下的施氮周期與施氮量
試驗棉花品種為金墾1161,密度為 23.9萬株/hm2。于10月1—7日進行收獲。行距為76 cm,行內植株間距為5.5 cm。將3行棉花用一塊寬度為205 cm的塑料薄膜覆蓋,用3條直徑為16 mm的滴灌帶進行灌溉,流量為2.1 L/h。水肥灌溉從6月16日開始,8月16日結束,滴灌周期為 7~8 d。總灌溉量為4 800 m3/hm2。6月灌溉3次,占總灌溉水量的63%。7月灌水3次,占灌水總量的26%。8月灌水1次,占灌水總量的11%。K2O和P2O5的施用量分別為51、78 kg/hm2。氮肥的來源為尿素,K2O和P2O5的來源為KH2PO4。蕾期、花期至盛鈴期施氮、磷、鉀的比例均為 5 ∶11 ∶4,盛鈴后期除不施氮外,磷與鉀的比例保持不變。其他實地管理措施與當地實際生產管理相同。實地試驗設計見圖1。
1.2.1 圖像采集 本試驗數據于7月中旬花鈴期采集,為提高本研究的泛化能力,將圖像采集試驗分為Ⅰ、Ⅱ2組,Ⅰ組于2021年7月23日(晴) 12:00—15:00在研究區棉田進行。試驗內容主要針對種植區內5種不同氮處理下的棉花葉片進行拍攝,拍攝時選取小區域內長勢較好植株的主莖倒1葉位葉片、主莖倒4葉位葉片和主莖倒3節位葉片[17],且采樣時葉片表面保持無病害、無蟲卵、無其他雜質。試驗中為了降低植株間的群體競爭所帶來的長勢差異,僅對距離支水管1 m范圍以外的棉花植株葉片進行圖像采集。Ⅱ組試驗于2021年7月29日(多云轉陰)18:00—20:00在研究區棉田進行,試驗內容和試驗原則與Ⅰ組相同。拍攝時將手機鏡頭與葉片的距離保持在20~50 cm范圍內,將鏡頭與葉面夾角控制在45~90°范圍以內。最終得到原始圖像共1 156張,晴天925張,陰天231張。圖像拍攝設備使用的是華為P40-Pro,拍攝模式中各參數統一設置如表2所示。


表2 P40-Pro專業模式參數設置
1.2.2 氮含量測定 氮含量測定與圖像采集同期進行,拍攝當天在各小區內選取經過圖像采集后的6株長勢均勻的植株進行破壞性取樣帶回實驗室送檢。將葉片放在自來水下沖洗干凈,用5%的鹽酸溶液清洗1~2 min,然后用無離子水潤洗2次,放入105 ℃高溫烘箱殺青30 min,再調至80 ℃持續烘干至恒質量,將葉片樣本研磨成粉末,稱取0.2 g干樣,用H2SO4-H2O2消解,然后在消煮爐中消煮 4 h,在消煮好的樣品中加入H2O2,之后用海能K9860全自動凱氏定氮儀對樣本進行氮含量檢測。最后對相同氮處理小區內的樣本氮含量取平均值,最后即得到5種平均全氮含量水平。
1.2.3 特征分析 由實際種植經驗可知,缺乏氮營養的棉花表型特征主要體現在葉片的顏色上,其中包括棉花葉片顏色發黃、葉脈根部退化成紅褐色、葉肉上的綠色變淡、葉片干枯等[18]。除此之外,為提升研究的泛化能力,本數據還包含2種不同的光照強度特征。基于此,數據集中的1 156張圖片可劃分為2種環境條件下的5種含氮量等級:嚴重缺氮、中度缺氮、適度缺氮、輕度缺氮、正常。本研究為了方便描述下面用N0、N72、N144、N192、N240來表示上述各對應缺氮狀態下的葉片平均含氮量,具體如圖2所示。其中,圖2-a葉片變老,葉面黃化嚴重;圖2-b葉脈出現黃色斑塊,葉肉中葉綠素淡化;圖2-c葉基部逐漸呈現紅褐色,有輕微黃化;圖2-d植株矮小,葉面少部分枯萎;圖2-e為晴天氮含量正常葉片;圖2-f為晴天氮含量缺乏葉片;圖2-g為陰天氮含量正常葉片;圖2-h為陰天氮含量缺乏葉片。

1.2.4 數據預處理 葉片顏色是體現棉花氮營養盈缺的主要特征,由于昏暗環境對圖像亮度的影響容易造成圖像中某些重要判別特征的模糊或某些主要生理細節的缺失,故為了減少拍攝過程中不同光照強度對特征學習網絡的干擾以及抑制圖像中的冗余信息,本研究的預處理工作主要是對光線較暗的陰天背景數據進行特征增強處理。
由于用彩色分量(RGB)直接進行增強處理會產生奇異的像素點,導致結果圖像不協調。因此本試驗將RGB顏色空間轉換到HIS顏色空間后再做灰度變換以解決上述問題。在進行空間轉換后使用伽馬函數(Gamma)對圖像中的過度曝光或者曝光不足進行修正。通過對231幅HIS數據的灰度直方圖進行分析后發現,在大多數未歸一化的圖片中,像素在亮度通道上都呈現正偏態分布,如圖3-a所示。

因此,本研究將伽馬變換與線性變換組合,在亮度通道I的低灰度區使用Gamma函數,高灰度區使用線性函數,分段閾值設為120,如圖 3-b 所示,標準化后變換函數閾值點為0.47。原理為通過非線性函數讓數字圖像中較暗像素的灰度值得到拉伸,使用線性函數對圖像中高亮像素(如噪點)進行抑制,使細節增強。具體公式如下:
(1)
式中:r為標準化亮度通道的灰度值,取值范圍在 0~1之間;式中的0.47為分段閾值;s為經過變換后的輸出灰度值。γ為變換因子,控制整個函數的縮放程度,本研究經過多次試驗對比后將γ設置為0.75。
為了方便后續深度學習模型的訓練,將HIS空間中灰度增強后結果再轉換為RGB圖片。由于在色彩空間轉回RGB后會出現圖像失真等新問題,所以使用限制對比度的自適應直方圖均衡化(contrast limited adaptive histogram equalization,CLAHE)算法對RGB圖像再進行一次處理。至此,本研究完成了對陰天環境下獲取的231張圖片的特征增強預處理,之后將所有數據一起通過高斯濾波器以消除噪點;最后使用雙線性插值重采樣算法來統一圖像的尺寸。總體預處理流程見圖4。

首先,通過裁剪、旋轉、鏡像等方法將數據擴容為原來的5倍。然后對數據集進行劃分。利用簡單隨機抽樣方法將數據集劃分為訓練集、驗證集、測試集,所占比例分別為90%、5%、5%,即5 202張圖片用于訓練,289張圖片用于驗證,289張圖片用于測試。數據集制作完成后各缺氮水平中所含樣本數量如表3所示。

表3 數據集樣本分布詳情
試驗環境基于Ubuntu 18.04和Windows 10共2種操作系統,計算50層以下的淺層網絡時選擇在Windows環境下;將50層以上的深層網絡部署在性能更高的計算環境中運行,操作系統為Ubuntu 18.04。詳情見表4。
1.5.1 基礎網絡的選取 深度學習已被廣泛應用于圖像識別等領域,如AlexNet、VGGNet、GoogLeNet、Inception-v3、ResNet-v2、ResNeXt、MobileNet等[19-26],隨著殘差模塊(Residual-Block)的引入解決了深層網絡中梯度消失和模型退化的問題,使得對模型的研究可以在更深的維度上展開,而分組卷積中的分割-轉換-合并策略使得深度殘差網絡在深度、寬度、參數量不變的情況下能達到更好的性能。本研究在對上述模型依次試驗后,考慮到若繼續增加模型深度時則必須保證原網絡結構的性能,因此選擇ResNeXt作為基礎網絡模型。

表4 硬件和軟件的配置
1.5.2 基于深度可分離和恒等映射的ResNeXt模型 由于在深度殘差網絡問世后,ResNeXt和ResNet-v2這2種相互獨立的殘差模型都能提高原ResNet網絡的圖像識別精度,且都是在ResNet模型的基礎上做出改進,前者是改進主要特征提取結構,后者則是微觀調控殘差單元內各功能模塊的次序。因此本研究將上述2種模型的設計理念加以結合,即基于恒等映射原理調整批歸一化與激活函數的順序來改進ResNeXt的分組卷積模塊。其原理是將網絡前端的特征信號直接傳遞到網絡末端的卷積層,使得網絡后端的卷積核抽象特征時依舊能學習到前端卷積層輸出的低層特征。具體公式如下:

(2)
式中:F為殘差單元的卷積計算;xl為第l層的輸出神經元信號值;Wl為相應的第l層的權值矩陣;xi為第i層的輸出信號;Wi為第i層的權值矩陣;ε為損失函數;xL為前向傳播時最后一層的輸出神經元。因此,公式(2)表示深層梯度信號可以不經過任何權值和非線性變換,直接反向傳播給淺層的參數。
此外,由于網絡前端卷積層提取的各通道顏色特征對檢測棉花葉片缺氮水平的精度有著很大的影響,而Inception中的不同尺寸的卷積核可以提取大到葉片輪廓、形狀,小到色斑、紋理、脈絡等幾何特征,豐富了傳遞到網絡后端的低層特征的多樣性,因此可以在ResNeXt模型的頭結構中利用深度可分離卷積對Inception結構進行改進,以便于提升網絡頭部對各顏色通道的特征學習效率,提高特征學習能力,減少參數量。深度可分離原理分為2步:(1)用n個卷積核對n個通道分別卷積;(2)用m個1×1×1的卷積核(m≥n)對各通道的特征矩陣進行上采樣,以有效利用特征圖的不同通道在相同空間位置上的特征信息;隨著提取到的特征圖越來越多,各輸出通道中包含的特征組合也愈來愈多,模型的泛化能力也就越強,還能節省更多的參數。基于此,本研究實際試驗中將ResNeXt模型的第1個卷積層改為基于深度可分離的Inception結構,并在前2個分組卷積模塊中也加入Depthwise卷積,以期在保證模型性能的前提下減少模型加深所帶來的大量參數。綜上所述,在深度卷積神經網絡的淺層模型塊中使用深度可分離卷積和Inception結構既可以減輕模型體量,也可以提升模型對葉片缺氮特征的抽象能力。ResNeXt整體結構的改進方式見圖5。
1.6.1 訓練方法 在模型訓練時,為客觀對比AlexNet、VGGNet、GoogLeNet、Inception-v3、MobileNet、ResNet-v2、ResNeXt和其改進模型的性能,訓練時所有模型統一采用相同的關鍵超參數:優化算法均采用自適應矩估計(Adam),損失函數使用稀疏交叉熵;所有模型訓練都使用指數衰減學習率,隨著迭代次數的增加將學習率設置為從0.001下降至0.000 1,具體公式如下。
lr=α×δepochs/τ
。
(3)
式中:lr為學習率;α為學習率初始值;δ為學習率衰減率,δ∈(0,1);epochs是當前訓練的輪次;τ為更新頻數;實際訓練時各參數的設置為α=0.001,δ=0.811,τ=3;此外,還固定了每個模型訓練輪次為34次,每個輪次中的迭代批次為162次(batch-size=32,batch-size表示機器學習模型每次訓練時的所用數據規模大小)。 為研究各模型在訓練過程中的學習能力,每訓練一個輪次后進行一次驗證,同時記錄每個模型訓練過程中的各參數指標。

1.6.2 模型評價 本研究主要目的在于解決棉花葉片缺氮水平分級檢測的問題,屬于多分類問題。針對此類問題的模型性能評價指標包括準確率(Accuracy)、查準率率(PPV)、平均精確率(AP)、查全率(Recall)、Kappa系數、混淆矩陣等;上述指標公式表示如下。
(4)
(5)
(6)
(7)

(8)
式中:T表示總樣本被正確分類的個數;A表示總測試樣本個數;ni為測試集中第i類的樣本個數;TPi表示預測的第i類樣本中正確的個數;FPi表示預測的第i類樣本中錯誤的個數;FNi為第i類樣本沒有被預測正確的個數;aj+表示測試結果的混淆矩陣內,第j行的總觀測數;bm+表示測試結果的混淆矩陣內,第m列的總觀測數。其他輔助評價工具還有訓練時驗證集準確率變化曲線;測試集上的缺氮水平分級混淆矩陣。本試驗用上述評估參數在不同模型上進行控制超參變量的性能對比,最終通過各模型的準確率和參數量等各個方面綜合評估棉花花鈴期葉片缺氮水平診斷模型的性能優劣。
由于深度學習的可解釋性較差,訓練時需要通過模型在驗證集上的表現動態來反映其學習能力的優劣以實時調整訓練模式。本研究中,各模型訓練時的準確率變化曲線和損失函數變化曲線見圖6。
從圖6中不難發現圖中淺層模型的損失函數值從訓練開始后就沒有降低,一直保持著較高狀態。AlexNet、VGG-16、VGG-19的最高驗證集準確率分別只有24.4%、55.0%、50.0%。這說明上述模型的特征學習能力不夠,無法有效地提取到葉片的缺氮等級特征。但只有28層可訓練參數的輕量級網絡MobileNet和只有22層的GoogLeNet在驗證集上的最高準確率卻分別能達到91%和88%,可見在無需大幅增加網絡深度的前提下,恰當地使用某些特定卷積結構也可以實現相對理想的缺氮分級檢測效果。此結果表明僅僅依靠堆疊普通卷積層無法學習難以量化的葉片缺氮水平特征。相反地,間接表明了MobileNet中的深度可分離卷積和GoogLeNet中的Inception結構至少能學習到各缺氮水平下的棉花葉片特征。
本研究在同樣的訓練方式下又對比試驗了在Inception結構的基礎上同時增加了寬度和深度的Inception-v3模型。對比2個模型的訓練曲線可以看出,Inception-v3這種48層的模型,其在驗證集上的最高準確率雖然能達到95%,但是在運行了相同輪次的情況下,最終準確率并不如GoogLeNet,模型的性能也不能達到穩定。通過分析該試驗中Inception-v3的準確率曲線無法收斂的特點,筆者認為,對于本研究來說,單純地改進Inception結構和增加模型深度會給模型優化過程造成梯度彌散的問題,從而導致在反向傳播過程中,梯度信號在多個局部最優之間振蕩,延長了計算出全局最優解的時間。此外,通過Inception-v3的準確率曲線可知,由于其在訓練集和驗證集上的表現差異過大,該網絡在結果模型上必定存在著過擬合現象。同理,MobileNet和GoogLeNet在相同的訓練輪數下也易產生過擬合。因此,本研究認為用深度學習研究葉片的缺氮水平分級問題時不宜采用較淺層(50層以下)網絡模型。

后續試驗在增加模型深度的思路上使用了基于殘差鏈接的網絡結構,即ResNet-v2(101層)、ResNeXt(101層)和Improved-ResNeXt(108層)等模型。訓練結果(圖7)表明,在使用殘網絡后,隨著深度和寬度不斷增加,其在驗證集上的準確率也越來越高,模型訓練時的收斂速度也越來越快。例如,ResNet_101的驗證集準確率最高能達到90%,ResNeXt_101的驗證集準確率最高達到了95%,Improved-ResNeXt的驗證集準確率最高則達到了99%;并且在整個訓練過程中,深層模型在訓練集上并沒有明顯的過擬合現象產生,收斂速度也比淺層模型快了1倍;尤其在最后幾個輪次中,驗證集準確率變化曲線的波動范圍也穩定在了很小的區間段內,證明在葉片缺氮等級檢測的應用中,深層卷積神經網絡模型有著更強的適應能力。

用測試集對上述訓練的結果模型進行測試,其分級效果制作的混淆矩陣如圖8所示。可以看出,本研究提出的Improved-ResNeXt模型出現識別錯誤的缺氮水平最少(只有N72和N192這2個級別)。此外,各模型對缺氮水平的錯誤分級主要發生在陰天環境下采集的樣本上,因為在289個測試樣本上(含58個經過預處理的陰天環境樣本)各模型對陰天樣本識別出錯的個數均超過總識別錯誤數的一半,但沒有一個模型對陰天樣本識別出錯超過29個(測試集中總陰天樣本個數的一半)。以準確率最低的GoogleNet模型為例,在其56個識別錯誤的樣本中,陰天樣本占28個,這表明不同曝光程度的數據確實會影響深度學習模型在葉片缺氮水平診斷上的效果。同時,也能說明訓練前的特征增強工作起到了一定的作用。
利用圖8中的混淆矩陣計算各模型的查準率、查全率評價指標。從圖9可以看出,幾乎所有模型對N0(N_nil嚴重缺氮)和N240(N_normal氮含量正常)這2種氮素水平的葉片都能達到很好的檢測效果,說明花鈴期時N0和N240這2種氮素等級的棉花葉片具有很高的區分度。但與之相反的是,除本研究提出的Improved-ResNeXt模型外,幾乎所有模型在檢測其他缺氮水平處于中間級別的葉片時(N192、N144、N72分別為輕度缺氮、適度缺氮、中度缺氮),查準率和查全率都不能達到理想的效果,尤其是MobileNet和GoogLeNet模型在檢測N144時的查準率甚至沒有超過50%。這可能是因為適度缺氮和中度缺氮的葉片,其類間特征的差異性不大且類內特征的相似度較高。而Improved-ResNeXt網絡模型在原ResNeXt模型原本能力的基礎上,改進了殘差鏈接的信號傳遞結構,這使得網絡末端的卷積層也提高了特征學習能力,進一步增強了對各缺氮水平葉片上差異不明顯特征的提取效果。從圖9也不難看出,本研究提出的Improved-ResNeXt模型檢測所有缺氮水平的樣本時確實有著更高的查準率和查全率。

最后統計各項綜合評價指標(表5),相比之下,Improved-ResNeXt不論是在驗證集還是在測試集上的準確率均已達到97%,對各類缺氮水平檢測的平均精確率也有97%,Kappa系數達到了0.96,說明該模型的診斷結果與按實際等級分級的結果幾乎完全一致。從模型參數量來看,雖然MobileNet的參數量最少,但其作為棉花葉片缺氮檢測模型的性能卻較差,而Improved-ResNeXt模型各方面性能最優參數量比ResNeXt反而減少。
棉花葉片的缺氮診斷是一項十分復雜的任務,不止局限于本試驗研究的情形,通過對試驗設計、模型應用等環節的分析,本研究應存在以下幾點不足:(1)盡管較深的網絡層數能提高任務性能,但隨之而來的復雜結構也會提高推理成本、消耗內存空間。將參數量最多的3個缺氮水平診斷模型的內存占比大小繪制成百分比堆積柱狀圖。其中,ResNet-v2 的結果模型文件大小達到了170.1 Mb,ResNeXt-101的模型文件大小為157.7 Mb,Improved-ResNeXt所占內存大小為136.5 Mb。雖然Improved-ResNeXt所占空間大小僅有ResNet的80%,但其模型體積仍不能滿足便攜式移動設備的部署需求,為了縮減推理時間,可能還需對基于深度學習棉花葉片缺氮診斷模型的復雜度做進一步的簡化。(2)相比于其他棉花氮素水平診斷的研究,本研究的氮素測定試驗由于受到人力成本的限制,所測數據規模有限,為充分利用現有的數據,將其按照不同氮處理的種植區域劃分成5個氮含量等級,該研究方式雖然能增強模型的泛化能力,但也忽略了作物培育過程中的個體差異,降低了診斷模型的精細化程度[27-28]。(3)因為不同的棉花品種缺氮元素時的表型特征不同,所以對缺氮棉花進行診斷研究時常常根據不同品種設置對照試驗來分析模型的可移植性。但由于研究區的面積限制,本研究未比較不同的棉花品種對結果模型的影響。
本研究針對棉花葉片可見光數字圖像提出了一種基于深度學習模型的棉花葉片氮含量水平檢測方法。試驗中用灰度變換和限制對比度的自適應直方圖均衡化算法消除光照變化對缺氮特征的影響,繼而采取5種淺層網絡模型和3種深層網絡模型進行比較分析,并結合缺氮棉花葉片的形態學特點提出用恒等映射和深度可分離的Inception結構對ResNeXt模型進行改進。經分析后認為,50層以下的淺層網絡不適合作為室外復雜背景下的棉花葉片缺氮水平診斷模型,而使用基于恒等映射的深度殘差網絡檢測棉花葉片缺氮水平時有明顯成效。此外,在ResNeXt的頭部引入基于深度可分離的Inception結構能使卷積運算在豐富輸出特征的同時大幅抑制參數量的增加,從而進一步提升模型的性能。本研究提出的Improved-ResNeXt模型可以有效地解決棉花的葉片含氮量水平診斷問題,且對陰天、晴天2種環境條件有良好的適用性,其在測試集上的準確率、F1分數、Kappa系數分別能達到97%、0.980 0、0.96,可以滿足智慧農業發展對識別植株氮含量的精度要求。綜上所述,本研究針對棉花葉片缺氮水平診斷進行了深度學習方法上的探索,所采用的深度學習模型可供后續其他基于數字圖像的作物營養診斷研究參考。


表5 模型評估