趙振中 楊帆 徐彪 葛增瑞 郁亞楠


摘 要:南疆自然條件惡劣,棉花常受枯萎病的侵害。為盡早發現并快速預防棉花枯萎病大面積擴散,基于手機拍照利用深度學習,設計一款識別南疆棉花枯萎病的系統,專門針對南疆棉花枯萎病進行識別。該系統首先通過智能手機對棉花進行圖像采集并上傳至服務器;然后服務器對圖像進行處理,通過構建棉花葉片病害分割模型和棉花葉片病害識別模型對棉花枯萎病進行識別;最后將識別結果顯示至用戶手機,從而實現棉花枯萎病識別的目的。
關鍵詞:深度學習;南疆;棉花;枯萎病
0引言
南疆位于天山以南、昆侖山以北,多旱少雨,自然條件惡劣[1]。南疆還是有名的棉花產地,每年出產棉花百萬噸,棉花生產已成為人們主要的經濟來源之一。但是棉花枯萎病的發生會對棉花的生產造成了巨大的損失。為盡早發現并快速預防棉花枯萎病大面積擴散,該系統基于手機拍照利用深度學習識別棉花枯萎病,該技術基于深度學習技術實現棉花枯萎病分類識別。首先,通過手機拍照獲取棉花葉部病害圖像數據構建數據集,并使用圖像旋轉與鏡像、圖像亮度調整和基于生成式對抗網絡的方法擴充數據集;其次,結合圖像分割算法對棉花葉片進行提取,選用Mask R-CNN模型對正常棉花葉片和病害棉花葉片分別進行葉片提取;最后,實現深度遷移學習算法在棉花葉部病害圖像數據集上的分類,并對學習結果進行分析評價。通過構建棉花葉片病害分割模型和棉花葉片病害識別模型,解決棉花葉片病害識別問題,專門針對南疆棉花枯萎病進行監測,以長期達到對南疆棉花枯萎病起到一定的防控作用。
1圖像預處理技術
為深入研究棉花葉片病害識別模型,以棉花葉片枯萎病為研究對象,對于棉花葉片提取和棉花葉片識別兩個關鍵問題,從圖像預處理、棉花葉片分割和棉花葉片病害識別三部分進行研究。
圖像預處理部分首先對棉花葉片病害圖采用圖像旋轉鏡像、圖像亮度調整和條件式對抗生成網絡進行數據增強,使用雙線性插值算法進行圖像大小的縮放[2];棉花葉片分割部分首先基于遷移學習,在 ImageNet 數據集上對 Mask R-CNN 進行訓練,然后在棉花葉片病害數據集上進行微調,標注棉花葉片區域之后,再對葉片區域進行分割,對分割后的結果進行掩碼填充操作,從而建立病害區域分割模型;棉花葉片病害識別部分通過對標準的殘差網絡添加多卷積組合和 SENet 網絡[3],構建 Multi-Scale ResNet 網絡對棉花葉片病害進行識別,最后以微信小程序作為可視化平臺,實現棉花葉片病害識別。
2卷積神經網絡的使用
在傳統的卷積神經網絡中,隨著網絡深度的不斷增加,有兩個問題是不可避免的,梯度消失和梯度爆炸。在這種情況下,由于識別率逐漸達到飽和,繼續增加網絡的深度反而會造成識別率下降,這是由于訓練過程中產生的梯度退化問題造成的。AlexNet網絡結構雖然解決了梯度消失問題但在小于0的地方會出現神經單元死亡,并且不能復活的情況。VGG網絡結構雖然其簡單、同構的拓撲結構和增加的深度而廣受贊譽,但使用了1.38億個參數,使得在低資源系統上部署VGG變得非常昂貴和困難。而ResNet利用捷徑連接,實現了輸入與輸出之間的數據疊加。在捷徑連接下,網絡的參數量和計算復雜度并沒有增加,因此ResNet的層數在很深的情況下也可以保持較快的計算速度。ResNet通過增加跨層的連接來解決梯度退化問題,ResNet相對于其他的DCNN所做的優化還有在卷積和激活函數之間使用BN的方法,BN可以加快網絡訓練,防止網絡的梯度爆炸。本項目采用基于的深度遷移學習方法,該方法在進行模型遷移學習時,通過增加網絡層數提取圖像的高階統計特征進行分類,以ImageNet數據集作為源域,利用深度殘差網絡進行基于同構數據下的模型遷移。
3識別方案
由于棉花枯萎病有多種類型癥狀,對于識別系統的識別方案也應對應識別。通過對棉花枯萎病癥狀類型的分類研究,得出不同類型癥狀的顏色特點以及其他特征。棉花枯萎病類型顏色及其特征見下表6-1:
4系統設計
在對系統進行設計時,需要對硬件裝置的提供方面和軟件技術的支持方面進行設計。其中硬件裝置的設計是通過手機完成,手機獲得的圖像信息可以通過網絡直接傳輸給云服務器,讓服務器進行處理。軟件設計是通過將手機拍攝的圖像傳輸給服務器后,經過存儲、預處理、特征提取和特征分析技術獲得有效特征值;再使用數據庫的相關技術,將提取后特征值與數據庫樣本的特征值比對、匹配,如若匹配成功,就將最終結果通過微信小程序輸出顯示到用戶手機,達到棉花枯萎病識別的目的。
8.1硬件設計
用戶需配備一臺手機,終端通過拍攝棉花數據上傳至云服務,接收服務器發來的最終識別結果,最后獲得棉花是否患枯萎病的識別信息。硬件設計框架圖如下圖3-2所示。
8.2軟件設計
云服務器通過需求設計出服務器可對手機端傳輸過來的圖像信息進行圖像預處理、特征提取以及特征分析的程序,再通過使用數據庫,將最后服務器分析出來的樣本特征值發送到數據庫,對樣本特征值進行存儲、對比以及匹配,實現對該區域棉花枯萎病的有效識別。
5總結
隨著圖像識別技術的不斷發展和完善,其越來越多的被利用于在農業、醫療、教育、制造等各個方面,圖像識別技術在南疆棉花枯萎病應用的特點在于,首先,種植戶可以很便捷的對問題植株進行檢測,及時發現病情,其次是可以大大縮短病情由發現到擴散的時間,避免因為病情控制不及時造成重大損失,同時該隨著智慧農業的發展,該技術未來可以自動的去監測棉花的生長發育過程,及時檢測到棉花枯萎病的產生和避免其擴散。
參考文獻:
[1] 蓋有軍,朱明俊.【放眼南疆四地州】南疆之“特”[EB/OL].http://www.xinjiangnet.com.cn/2017/0528/1863935.shtml,2017-05-28.
[2] 鄭世茶. 基于機器視覺技術的棉花病害識別[D].江蘇大學,2007.
[3] 張建華,孔繁濤,吳建寨,翟治芬,韓書慶,曹姍姍.基于改進VGG卷積神經網絡的棉花病害識別模型[J].中國農業大學學報,2018,23(11):161-171.
基金項目:塔里木大學大學生創新創業訓練項目(2021120)。
作者簡介:趙振中(2000-),男,本科,研究方向為計算機科學與技術。