摘 "要:深度學(xué)習(xí)(Deep Learning,DL)附屬于機器學(xué)習(xí)算法的一個分支,實質(zhì)是一種通過海量數(shù)據(jù)對構(gòu)建的多層隱藏層進行訓(xùn)練,使其習(xí)得一種更有意義的抽象特征,從而提高分類及預(yù)測準確性的算法,其是通過模擬人腦的深層神經(jīng)結(jié)構(gòu)來學(xué)習(xí)和表達文本、圖像、聲音和動作等數(shù)據(jù)。近些年來深度學(xué)習(xí)已經(jīng)廣泛應(yīng)用于智慧農(nóng)業(yè)各類病蟲害。該文首先詳細介紹深度學(xué)習(xí),其次以深度學(xué)習(xí)在茶樹病蟲害智能識別方面的具體進展及研究為例進行介紹,最后在查閱相關(guān)文獻的基礎(chǔ)上討論分析,得出進一步的結(jié)論。通過對相關(guān)研究的系統(tǒng)綜述,以深度學(xué)習(xí)為基礎(chǔ)深入探索農(nóng)業(yè)病蟲害智能識別的研究。
關(guān)鍵詞:深度學(xué)習(xí);病蟲害;智能識別;神經(jīng)網(wǎng)絡(luò);研究進展
中圖分類號:S43 " " " " 文獻標志碼:A " " " " "文章編號:2096-9902(2023)04-0001-04
Abstract: Deep Learning (DL), which is attached to a branch of machine learning algorithm, is essentially an algorithm that trains multi-layer hidden layers through massive data to acquire a more meaningful abstract feature, so as to improve the accuracy of classification and prediction. It learns and expresses text, image, sound and action data by simulating the deep neural structure of the human brain. In recent years, Deep Learning has been widely used in all kinds of diseases and insect pests in smart agriculture. This paper will introduce Deep Learning in detail, and then take the specific progress and research of Deep Learning in intelligent identification of tea diseases and insect pests as an example, and finally discuss and analyze it on the basis of consulting relevant literature, and draw further conclusions. Through a systematic review of related research, this paper explores the intelligent identification of agricultural diseases and insect pests on the basis of Deep Learning.
Keywords: Deep Learning; diseases and insect pests; intelligent recognition; neural network; research progress
中國作為一個農(nóng)業(yè)大國,農(nóng)作物因其品種龐雜,在培育過程中會受到不同類型有害微生物和害蟲的侵襲[1],導(dǎo)致農(nóng)作物在產(chǎn)量和質(zhì)量上會有不同程度的損失,嚴重時甚至?xí)?dǎo)致農(nóng)作物大范圍絕收、絕產(chǎn)。近些年,由于各類農(nóng)產(chǎn)品廣泛出口,國內(nèi)農(nóng)產(chǎn)品市場不斷擴大,出口額節(jié)節(jié)攀升,經(jīng)濟占額比快速提升。但是經(jīng)濟社會不斷發(fā)展的同時新問題也層出不窮,各類病害的發(fā)生和真菌的變異影響了人們的生產(chǎn)、生活,農(nóng)作物發(fā)病率越來越高,極大影響了我國農(nóng)業(yè)經(jīng)濟的發(fā)展,影響了農(nóng)產(chǎn)人員的生活。因此,研究農(nóng)作物病蟲害的預(yù)防以及診斷、治療和補救措施顯得尤為重要。植保專家和相關(guān)技術(shù)人員因人員數(shù)量有限,無法滿足中國廣大農(nóng)民的需求;有經(jīng)驗的農(nóng)民因其視覺系統(tǒng)存在局限性、模糊性和主觀性等缺點,可能導(dǎo)致誤判、錯判;農(nóng)民進行診斷時,在查閱相關(guān)資料、尋求專家援助過程中,不僅會很大程度浪費時間,甚至還會貽誤對作物進行最佳防治、補救的時間。因此針對上述問題,運用現(xiàn)代信息技術(shù),尋找一種合適的方法對植物病蟲害進行高效、準確識別和防治具有重要意義。
深度學(xué)習(xí)持續(xù)創(chuàng)新發(fā)展,其研究價值和潛力不斷被人們挖掘,基于在圖像識別領(lǐng)域中的優(yōu)勢,成為當(dāng)下推動農(nóng)業(yè)向著精準化、智能化發(fā)展的新興動力。據(jù)大數(shù)據(jù)顯示,圍繞農(nóng)田中作物病蟲害的識別和預(yù)測系統(tǒng)、模型、APP及其研究都還在起步階段[2]。本實驗項目以大田作物病害識別研究圖像數(shù)據(jù)集為基礎(chǔ),基于深度學(xué)習(xí)方法構(gòu)建茶樹病蟲害智能化識別系統(tǒng),改造傳統(tǒng)病蟲害診斷模式,使其最終能夠部分替代專業(yè)人員診斷,從而提高病蟲害監(jiān)測預(yù)警和科學(xué)防治水平。
1 "深度學(xué)習(xí)
深度學(xué)習(xí)實質(zhì)上是通過添加多種算法,建立多樣化的模型來對人類神經(jīng)系統(tǒng)進行模擬,然后通過海量數(shù)據(jù)對構(gòu)建的多層隱藏層進行訓(xùn)練,對圖像抽象特征進行提取并分類整合,從而提高分類及預(yù)測準確性的算法。深度學(xué)習(xí)以其優(yōu)越的表現(xiàn)及前景在機器學(xué)習(xí)中脫穎而出,發(fā)展成為一個新的分支,對推動人工智能的發(fā)展具有重要意義。
1.1 "深度學(xué)習(xí)起源
深度學(xué)習(xí)的概念源自人工神經(jīng)網(wǎng)絡(luò)。在最開始的研究中,由于感知機對非線性問題無法進行處理,神經(jīng)網(wǎng)絡(luò)研究發(fā)展陷入低谷期。2006年,由Hinton等在《Science》發(fā)表的文章中提出,深度學(xué)習(xí)正式出現(xiàn)在大眾的視野中。深度學(xué)習(xí)是模擬類似于人腦深層的神經(jīng)網(wǎng)絡(luò)來實現(xiàn)多種數(shù)據(jù)擬合的一類機器學(xué)習(xí)方法,運用多層次的圖像空間位點特征學(xué)習(xí),形成一種樹狀的操控模式,進行深層次鑒別。深度學(xué)習(xí)的過程可以視為由底層到高層,通過逐層加工輸入信號,從而將與輸出目標聯(lián)系不緊密原始的輸入表示轉(zhuǎn)換成與輸出目標緊密聯(lián)系的表示特征學(xué)習(xí)過程,這種自下而上的信息分層處理方式,有利于獲取更抽象、更少歧義和更具魯棒性的特征。深度模型處理問題的能力依賴于其模型的復(fù)雜度,通過增加隱層神經(jīng)元的數(shù)目提升模型的復(fù)雜度,且增加的層次越多準確性越好,大幅提升模型的性能。
1.2 "深度神經(jīng)網(wǎng)絡(luò)
典型的深度學(xué)習(xí)模型通過逐步將低層神經(jīng)元累加組合成便于區(qū)分的高層抽象表示,構(gòu)成一種深層的神經(jīng)網(wǎng)絡(luò)。“神經(jīng)元”是其基本構(gòu)成單位。
深層神經(jīng)網(wǎng)絡(luò)一般可被區(qū)分為3大類。
1)對數(shù)據(jù)的高階相關(guān)特性進行描述生成的深層結(jié)構(gòu)。
2)描述數(shù)據(jù)的后驗分布的判別深層結(jié)構(gòu)。
3)結(jié)合了上述2種結(jié)構(gòu)的混合深層結(jié)構(gòu)。
深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法也分為3類:監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和混合學(xué)習(xí)。
其中監(jiān)督學(xué)習(xí)模型主要有MLP(多層感知器)、CNN(卷積神經(jīng)網(wǎng)絡(luò))等類型,無監(jiān)督學(xué)習(xí)模型主要有DBN(深度置信網(wǎng)絡(luò))、自動編碼器等類型。混合學(xué)習(xí)模型是利用無監(jiān)督學(xué)習(xí)來生成深度結(jié)構(gòu),由監(jiān)督學(xué)習(xí)進行微調(diào)。
1.3 "深度學(xué)習(xí)框架
深度學(xué)習(xí)框架是進行深度學(xué)習(xí)相關(guān)領(lǐng)域研究的工具集。目前普遍流行的深度學(xué)習(xí)框架有: Theano 、Caffe、Torch、TensorFlow、Keras、CNTK、MXNet、Paddle Paddle和PyTorch等[3-8](表1)。
Theano庫是由MILA在加拿大魁北克的蒙特利爾大學(xué)主導(dǎo)開發(fā)。是為了進行高效計算數(shù)學(xué)表達式符號而被改善出來的一個Python庫。其經(jīng)常與Numpy庫相連接使用,使大規(guī)模矩陣運算得到了進一步的優(yōu)化。
Caffe是2014年賈揚清團隊開發(fā),由BAIR和 GitHub社區(qū)貢獻者共同維護和支持的一種廣泛運用的深度學(xué)習(xí)框架。
Torch是Facebook開發(fā)的開源機器學(xué)習(xí)庫、科學(xué)計算框架和基于Lua編程語言的腳本語言。其提供的深度學(xué)習(xí)算法,已被多個公司用于解決數(shù)據(jù)流的硬件問題。
TensorFlow是由2011年Google內(nèi)一個機器學(xué)習(xí)系統(tǒng)DistBelief衍生出來的,經(jīng)過內(nèi)部優(yōu)化改進于2017年2月發(fā)布了1.0 版本,TensorFlow穩(wěn)定版正式誕生。
Keras是FrancoisChollet開發(fā)的深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)API,能夠在TensorFlow、Theano或CNTK之上運行。Keras是一個為創(chuàng)建深度學(xué)習(xí)模型提供基礎(chǔ)模塊,對基礎(chǔ)的張量和微分不進行處理的高級模型庫。與TensorFlow的系統(tǒng)設(shè)計過于復(fù)雜、學(xué)習(xí)門檻高不同,Keras學(xué)習(xí)門檻較低,易掌握,適合快速試驗。
CNTK是微軟基于深度學(xué)習(xí)在人工智能領(lǐng)域的研究成果計算網(wǎng)絡(luò)工具。其發(fā)布的CNTK v2.0版本,兼容深度學(xué)習(xí)前端平臺Keras,在準確性和速度方面性能表現(xiàn)極其優(yōu)秀。
MXNet最初是由李沐博士牽頭開發(fā),后由Apache完善的一種分布式深度學(xué)習(xí)框架。優(yōu)秀的開發(fā)速度、可編程性和可移植性,并對多種編程語言有一定接口,是MXNet作為深度學(xué)習(xí)框架被廣泛應(yīng)用的原因。
Paddle Paddle是百度開發(fā)的一個易上手、高效率、靈活和可擴展的深度學(xué)習(xí)平臺,其使得研究人員更迅速、簡捷地構(gòu)建深度學(xué)習(xí)模型,可以較容易地上傳訓(xùn)練數(shù)據(jù),執(zhí)行準確、直接和清晰的預(yù)測分析,極大提高速度和生產(chǎn)率。
PyTorch是由FAIR基于Torch推出的一種進階的深度學(xué)習(xí)框架。在2018年5月才正式公布1.0版本,并且PyTorch 0.4與Caffe2合并被應(yīng)用,主要是被開發(fā)用來應(yīng)對一些在前任數(shù)據(jù)庫Torch使用中遇到的問題,同時拓展一些新功能。
2 "深度學(xué)習(xí)在我國農(nóng)業(yè)中的應(yīng)用
2.1 "研究的對象與目的
目前我國深度學(xué)習(xí)在農(nóng)業(yè)方面的研究主要集中在可食性農(nóng)作物物種上,其中包括糧食類,如水稻、小麥和玉米,水果類,如柑橘、蘋果和葡萄,蔬菜類,如番茄、黃瓜和花生等物種[9-12]。對比近些年來,此方面研究文獻及期刊,目前研究者們主要還是以糧食作物研究為主,發(fā)現(xiàn)以深度學(xué)習(xí)為基礎(chǔ)研究茶樹病蟲害研究人員極少。以深度學(xué)習(xí)為基礎(chǔ)探索智能識別病蟲害方法,可以驅(qū)動農(nóng)業(yè)生產(chǎn)向精準化、智能化轉(zhuǎn)變,最大化降低病蟲害對作物產(chǎn)生的不良影響,提高作物質(zhì)量和產(chǎn)量,降低因病蟲害濫用農(nóng)藥對環(huán)境的影響,并且?guī)椭r(nóng)民提高收益。
2.2 "數(shù)據(jù)源
目前進行研究的數(shù)據(jù)集來源主要是來自網(wǎng)絡(luò)上各大瀏覽器,包括百度、谷歌、搜狗和微軟等公開的數(shù)據(jù)集[13],但由于版權(quán)限制,收集到的病蟲害圖片清晰度普遍不高;有的是研究者深入田間進行病害數(shù)據(jù)采集和收集網(wǎng)絡(luò)公開數(shù)據(jù)集,如由plant Village工程提供的公開數(shù)據(jù)集,包含14種農(nóng)作物共26類病害葉片及部分健康農(nóng)作物葉片;全國農(nóng)業(yè)技術(shù)推廣服務(wù)中心聯(lián)合公司,利用實時拍照記錄, 建立的38種害蟲樣本庫等。
2.3 "品種類間差異
各種智能檢測產(chǎn)品檢測、識別和分類等的準確率與各類間差異程度成正比。以植物為例,主要是不同種類、不同個體之間的表觀特征差異。當(dāng)發(fā)生異種疾病時,植物很可能因為環(huán)境等因素,病果圖像表現(xiàn)出共性,呈現(xiàn)出相似的生化病理特征。當(dāng)植物表觀形狀較為相似,由于類間差異較小,很可能導(dǎo)致識別準確率下降。
2.4 "數(shù)據(jù)預(yù)處理
進行智能化識別系統(tǒng)框架構(gòu)建時,需要添加各種數(shù)據(jù)預(yù)處理方法來增加識別的準確性,優(yōu)化系統(tǒng)的參數(shù)[14]。數(shù)據(jù)預(yù)處理過程包括數(shù)據(jù)的清洗、轉(zhuǎn)換及降維處理。其中數(shù)據(jù)清洗技術(shù)主要是用于確保數(shù)據(jù)特定特征的完整性;數(shù)據(jù)轉(zhuǎn)換主要是將數(shù)據(jù)進行格式和結(jié)構(gòu)轉(zhuǎn)換,滿足深度學(xué)習(xí)模型的要求;降維處理是通過除去無關(guān)變量,提高建模效率,降低分析及形成模型的復(fù)雜性。預(yù)處理的方法有圖像分割、歸一化、降噪、裁剪、像素平均減法、空間轉(zhuǎn)換、縮放和灰度化等。一般來說為了增加網(wǎng)絡(luò)模型的泛化性,除了豐富數(shù)據(jù)集以外還可通過數(shù)據(jù)增強的方式增加數(shù)據(jù)庫的多樣性。數(shù)據(jù)增強方法主要有2大類。一是數(shù)據(jù)補充,空間幾何變換方法有翻轉(zhuǎn)、裁剪、旋轉(zhuǎn)和縮放等;二是數(shù)據(jù)轉(zhuǎn)換,像素顏色轉(zhuǎn)換方法有添加高斯噪聲、對比度變換和模糊等。從原始圖像中隨機選出一些圖像后,進行縮放處理,給初步處理的圖像,進行一些隨機光照、飽和度和對比度調(diào)整,隨機剪裁得到一張?zhí)幚砗玫膱D片,圖像像素大小一般有5種規(guī)格大小:600×600、256×256、128×128、95×95、48×48。部分數(shù)據(jù)預(yù)處理方法圖像展示如圖1所示。
2.5 "與傳統(tǒng)圖像識別方法對比
傳統(tǒng)的圖像識別技術(shù)對圖像各個顏色空間及紋理特征進行提取,利用所得特征值線性建模,但線性建模存在比較大的局限性,對非線性建模識別成功率極低。采用基于深度學(xué)習(xí)的建模方法相較于傳統(tǒng)的建模方法而言,可以省去大量預(yù)處理手段,只需將圖像剪裁合適大小進行鑒別,大量節(jié)省識別時間,同時大幅度提高識別準確率、成功率[15]。相較于傳統(tǒng)識別方法,深度學(xué)習(xí)的學(xué)習(xí)能力明顯更強,識別準確率也更高,但是在進行模型訓(xùn)練時會消耗大量時間,需要大量的數(shù)據(jù)集樣本進行模擬訓(xùn)練,成本較高。
圖1 "數(shù)據(jù)預(yù)處理——圖像旋轉(zhuǎn)
2.6 "深度學(xué)習(xí)在國內(nèi)外農(nóng)作物病蟲害檢測識別方面的研究進展
在2017年以前,對于農(nóng)作物病蟲害檢測識別,國內(nèi)基本是采用高光譜技術(shù)檢測,在2017年以后逐漸利用高光譜技術(shù)結(jié)合變量選擇方法和機器學(xué)習(xí)方法進行研究,結(jié)合深度學(xué)習(xí)的應(yīng)用對農(nóng)作物病蟲害方面進行識別研究[16]。國內(nèi)與國外此方面研究相比較而言,國內(nèi)的相關(guān)技術(shù)研究起步較晚,各種圖像數(shù)據(jù)庫的建立也落后于國外。國內(nèi)研究訓(xùn)練的集中數(shù)據(jù)集均為研究人員自行采集并儲存,一般不對外公開。網(wǎng)絡(luò)上公開的數(shù)據(jù)集,不僅量少,而且售價昂貴。當(dāng)需要研究不同類型作物時研究人員往往需要花費大量的時間進行數(shù)據(jù)圖像采集,導(dǎo)致人力、物力及財力消耗巨大。
3 "結(jié)論
1)本文主要從深度學(xué)習(xí)的發(fā)展及深度學(xué)習(xí)在農(nóng)業(yè)中的應(yīng)用2個方面對深度學(xué)習(xí)在農(nóng)業(yè)病蟲害智能識別方面的研究進展進行了闡述。
2)深度學(xué)習(xí)的圖像處理技術(shù)可以將復(fù)雜背景下的圖像進行高分辨率、高效率歸類識別,從傳統(tǒng)的人工檢測轉(zhuǎn)變?yōu)橹悄芑瘷z測,并提高病蟲害的識別準確率和精度。
3)此技術(shù)可以實時監(jiān)控、檢測植物的生長,同時實時利用強大的物聯(lián)網(wǎng)信息為農(nóng)民提供對此類病蟲害的最優(yōu)防治措施,及時反饋給管理人員,以便快速對植物進行最佳防治措施,保證農(nóng)產(chǎn)品的產(chǎn)量和質(zhì)量。
4 "展望
目前深度學(xué)習(xí)在病蟲害檢測方面研究還不夠完善,人們對其研究一直在持續(xù)。隨著科技日益發(fā)展創(chuàng)新,深度學(xué)習(xí)的研究也在逐步深入發(fā)展。過去對病蟲害的鑒定識別技術(shù)種類繁多,但成效不佳,問題層出不窮。在這種情況下,探尋更好的智能方法,實現(xiàn)部分代替人工對病蟲害進行監(jiān)測和防治仍然具有重要現(xiàn)實意義。目前大多研究表明,智能識別技術(shù)在病蟲害防治方面識別速度快、成功率高、采取防治措施快且效果顯著,因而結(jié)合深度學(xué)習(xí)進行深入研究,開展深入探索,必然是物聯(lián)網(wǎng)時代發(fā)展的新趨勢[17]。
參考文獻:
[1] 呂盛坪,李燈輝,冼榮亨.深度學(xué)習(xí)在我國農(nóng)業(yè)中的應(yīng)用研究現(xiàn)狀[J].計算機工程與應(yīng)用,2019,55(20):24-33.
[2] 傅隆生,宋珍珍,張鑫,等.深度學(xué)習(xí)方法在農(nóng)業(yè)信息中的研究進展與應(yīng)用現(xiàn)狀[J].中國農(nóng)業(yè)大學(xué)學(xué)報,2020,2(25):105-120.
[3] 本刊訊.五大深度學(xué)習(xí)框架介紹[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2018,2(5):58.
[4] 黃玉萍,梁煒萱,肖祖環(huán).基于TensorFlow和PyTorch的深度學(xué)習(xí)框架對比分析[J].現(xiàn)代信息科技,2020,4(4):80-82,87.
[5] RAMI A R ,et al. Theano:A-Python framework for fast computation of mathematical expressions[Z]. CoRR abs/1605.02688.2016.
[6] 孫振.深度學(xué)習(xí)框架研究及初步實現(xiàn)[D].長春:吉林大學(xué),2018.
[7] 龐濤.開源深度學(xué)習(xí)框架發(fā)展現(xiàn)狀與趨勢研究[J].互聯(lián)網(wǎng)天地,2018(4):46-54.
[8] Al-B G, Al-Q R, Al-A M, et al. Benchmarking open source deep learning frameworks[J]. International Journal of Electrical and Computer Engineering (IJECE),2020,10(5):5479.
[9] 李昊,劉海隆,劉生龍.基于深度學(xué)習(xí)的柑橘病蟲害動態(tài)識別系統(tǒng)研發(fā)[J].中國農(nóng)機化學(xué)報,2021,42(9):195-201,208.
[10] 劉鵬鵬.基于深度學(xué)習(xí)的番茄葉面型病蟲害識別研究[D].南昌:南昌大學(xué),2020.
[11] 張善文,謝澤奇,張晴晴.卷積神經(jīng)網(wǎng)絡(luò)在黃瓜葉部病害識別中的應(yīng)用[J].江蘇農(nóng)業(yè)學(xué)報,2018,34(1):56-61.
[12] 蘇婷婷,牟少敏,董萌萍,等.深度遷移學(xué)習(xí)在花生葉部病害圖像識別中的應(yīng)用[J].山東農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版),2019,50(5):865-869.
[13] 計雪偉,霍興贏,薛端,等.基于深度學(xué)習(xí)的農(nóng)作物病蟲害識別方法[J].南方農(nóng)機,2020,51(23):182-183.
[14] 陳天嬌,曾娟,謝成軍,等.基于深度學(xué)習(xí)的病蟲害智能化識別系統(tǒng)[J].中國植保導(dǎo)刊,2019,39(4):26-34.
[15] 王彥翔,張艷,楊成婭,等.基于深度學(xué)習(xí)的農(nóng)作物病害圖像識別技術(shù)進展[J].浙江農(nóng)業(yè)學(xué)報,2019,31(4):669-676.
[16] 孫紅,李松,李民贊,等.農(nóng)業(yè)信息成像感知與深度學(xué)習(xí)應(yīng)用研究進展[J].農(nóng)業(yè)機械學(xué)報,2020,51(5):1-17.
[17] 郭祥云,臺海江.深度學(xué)習(xí)在大田種植中的應(yīng)用與展望[J].中國農(nóng)業(yè)大學(xué)學(xué)報,2019,24(1):119-129.