999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器學習在植物表型中的應用進展

2023-06-02 09:34:03李阿蕾戴志剛陳基權鄧燦輝唐蜻程超華許英張小雨粟建光楊澤茂
中國麻業科學 2023年5期
關鍵詞:分類植物

李阿蕾,戴志剛,陳基權,鄧燦輝,唐蜻,程超華,許英,張小雨,粟建光,楊澤茂

(中國農業科學院麻類研究所,湖南長沙 410221)

植物表型包括從細胞層面、代謝層面到植株層面等由基因型和環境互作產生的生理生化及物理特征與外在可辨識的全部性狀,表型組學可以獲取生物體范圍內所有高維表型數據[1],從基因水平的SNP、分子標記到轉錄組水平的DNA 甲基化、蛋白質修飾,再到外觀特性水平的株型、抗性與產量等研究都屬于植物表型組學的范疇[2]。在可查閱到的最早文獻中,1997年Schork[3]在醫學領域首次提出表型組學的概念,起初只是為方便復雜疾病的研究,但近十幾年隨著對表型組學研究的深入,越來越多的研究領域引進表型組學的概念[4]。

在植物科學領域,傳統植物表型通常依靠人工或借助少量儀器測量統計植物相關性狀,不僅效率低,還需使用大量人力物力,誤差大、隨機性高、準確率低。隨著表型組學概念引入植物科學領域,植物表型組學研究也有了極大的進步。植物表型組學研究順應潮流,逐步拋棄繁雜的人工統計,同信息科學有機結合。近年機器學習在人工智能方向發展迅速,作為人工智能中的重要組成,機器學習使用代表性數據訓練的算法預估其他數據的輸出結果,其過程并不依賴人的主觀思想,是機器自主習得的算法[5]。

機器學習輔助植物表型研究流程主要分為獲取原始數據、數據預處理、特征數據提取與選擇、訓練集評估和輸出預測數據等5 個步驟[6-7]。在原始數據獲取和數據處理方面,表型組學數據具有多態性(Variety)、時效性(Velocity)、數據量大(Volume)和高維度(High dimension)、高復雜性(High complexity)、高度不確定性(High uncertainty)的3V 和3H 特征[8],傳統表型獲取方法難以達到如此高的要求,但機器學習實時成像、存儲數據量大、速度快、準確性高的特征[7]和表型組學數據需求十分契合,能為表型數據獲取分析提供有力支持。在表型數據特征提取方面,原始表型圖片存在青苔和泥土等噪音干擾的問題[9],作為最常用機器學習圖片分割算法,K-means 等可對植物和噪音的光譜信息、顏色等信息進行分割,確保表型分割的準確性和有效性。訓練集評估方面,機器學習有豐富的算法,植物識別、分類、病蟲害檢測甚至產量等表型研究指標,都可以在機器學習中找到適用算法。輸出預測數據方面,眾多研究結果顯示[10-12],機器學習輸出的植物表型模型準確率可達80%以上。未來植物表型的深入研究離不開同機器學習緊密結合,用機器學習輔助植物表型研究將會使植物表型研究范圍擴大,結果更可靠。

1 機器學習

1.1 機器學習定義及分類

作為人工智能的重要一環,機器學習通過學習人為輸入現有數據(圖片、語音和文本等),自主構建對應復雜的數據模型,以預測其他相似數據[13]。機器學習可分為監督學習和無監督學習兩種方式:監督學習是機器學習中最普遍的方式,通過對部分已添加標簽的數據進行訓練后用來預測剩余數據的結果,在電子科技、地質探索、生命科學等領域都有涉及;無監督學習是將全部數據輸入,再由機器探尋各個數據之間相似與差異的地方,進而依照數據的特征將結果分類輸出,無監督學習過程幾乎沒有人為因素參與。基于監督和無監督學習,機器學習又演化出半監督學習和強制學習等新型學習方式。

1.2 機器學習經典算法及應用

機器學習的多種算法都可應用在植物表型研究中,既有單一算法,也有多種算法組合的多分類器(MCS)算法[14-17]。經典單一算法有卷積神經網絡(CNN)、支持向量機(SVM),除此還有K 近臨(KNN)、隨機森林(RM)和決策樹(DT)等算法。支持向量機、卷積神經網絡、隨機森林泛用性廣,在植物識別、分類、預測等方面均適用,是最常用的機器學習算法。決策樹和隨機森林算法效果相似[18],可以很好地處理離散和回歸的問題,但隨機森林處理大數據效率低,適用于小數據集。K 近臨屬于半監督學習[19],原理簡單,可處理大量數據[18],但準確率不如隨機森林。下面將著重介紹SVM、CNN 等代表性算法及多種分類器算法在植物表型研究中的應用。

1.2.1 支持向量機(SVM)

支持向量機是機器學習最常用的算法,屬于監督學習的一種,通過非線性變換將輸入數據映射到高維特征空間,以找到最優線性邊界超平面,已成功應用在各種植物病害識別的場景。因支持向量機算法對被黃龍病感染的柑橘葉片的分類效果好,Wetterich 等[20]在數據預處理中利用支持向量機提取的特征作類的輸入,采用歸一化圖切割對數據進行分割,共現矩陣提取紋理特征,開發出柑橘黃龍病感染快速檢測技術,準確率高達90%。

1.2.2 卷積神經網絡(CNN)

人工神經網絡(ANN)可以根據人類的期望結果來調整數據的輸入,被廣泛地應用于以結果說明輸入的說明性分析。卷積神經網絡(CNN)是人工神經網絡的一種,擁有非常強大的圖像處理能力[21],在植物葉片分類中應用廣泛[22]。Hao 等[23]首次建立了一套不同光強脅迫下的生菜葉片圖像,根據萵筍鮮重與光強脅迫的關系,將萵筍葉片分為4 類,構建多尺度分層卷積神經網絡結構MFC-CNN 對葉片脅迫水平進行分級,通過對比實驗驗證模型的性能,發現采用融合策略的算法在葉片分類任務中十分有效。

1.2.3 多分類器算法應用

相比于單一的機器學習算法,多種分類器結合算法具有更高的準確率和更廣泛的適用性。YANG 等[10]采用卷積神經網絡(CNN)算法對玉米籽粒霉變等級進行圖像特征分類提取,將K 近鄰(KNN)、支持向量機(SVM)和偏最小二乘判別分析(PLS-DA)分類器結合光譜和圖像特征建立玉米粒霉變分類模型,分類結果表明,結合多種分類算法的分類正確率可高達99%。由此可見,基于融合特征建立的機器學習方法能夠有效提高植株受害的識別能力。

Araujo 等[24]提出了一種基于葉片圖像紋理和形狀特征的多分類器系統(MCS),在4 個不同的特征集上訓練不同的支持向量機和神經網絡分類器,結果表明,結合多分類器是一種有效的植物自動識別策略,MCS 的識別性能比單片方法提高了28%。Massi 等[25]提出了一種基于神經網絡和支持向量機分類器并行組合的多分類器系統,對采葉蟲潛葉蠅、薊馬、土蜂番茄潛葉蛾3 種病蟲危害和早疫病、晚疫病和白粉病3 種真菌病的癥狀進行了6 類測試。與現有方法相比,多分類器方法具有較高的識別率。Dat 等[26]通過結合多模態CNN 的損失函數,提出多種CNN 集成訓練改進的藥草葉片識別技術,用于基于集成學習的聯合學習多損失任務,與單一CNN 算法相比,多集成器算法可以顯著提高準確率并有一定的魯棒性能。

2 機器學習在植物表型研究中的應用

隨著植物表型研究的深入發展,對表型數據的采集分析方式也提出了更高的要求,盡管有高光譜圖像、熒光成像、熱成像等多種表型數據采集的方法,但是采集過程中還會出現植物冠層干擾重疊、采集時間不同、光照強度不同等影響因素。機器學習開發出可移動采集車、無人機、雷達、衛星等多種表型數據采集平臺,無論是室內小空間還是戶外低空甚至高空等條件下均有相適配的采集平臺,且機器學習具有無人為主觀因素干擾、自動處理數據量大、結果準確率高等優點,在植物研究的表型數據采集、分析和圖片處理等方面顯示出極強的優勢。這里將介紹機器學習在植物育種、抗逆和識別中的應用。

2.1 機器學習在植物育種中的應用

機器學習是科學研究常用的方法,在語言識別[27]、醫藥開發[28]、疾病診治[29-30]等方面都有成熟的研究方式,但在植物科學研究中該技術尚不成熟,多集中在作物產量預測方面。植物表型包括株高、葉型葉色、穗粒重、淀粉含量、糖分含量等各種質量特性和品質特性,如何準確快速地識別植物特征以及簡化田間育種流程,是植物育種主要的研究目標之一。

機器學習在植物產量預測中使用廣泛,Parmley 等[31]為研究大豆產量與不同耕作方式下表型性狀之間的關系,使用隨機森林算法訓練大豆產量預測模型,利用不同生長時期的大豆冠層溫度、葉綠素含量、高光譜反射率、葉面積指數等表型特征確定變量的最佳時間組合。結果表明,機器學習方法可以用于確定農業生產中特定的作物產量預測因子。作為2018年先正達作物挑戰賽的獲獎團隊,Khaki 團隊利用最先進的建模技術,設計了深度神經網絡(DNN)預測方法,結合9年2247個地點2267 個玉米品種的基因型和產量數據,對2017年玉米產量進行預測,模型預測精度極高[32]。Silva Júnior 等[33]基于表型信息和先前已知的遺傳結構,利用計算智能和機器學習技術,評估了主性狀的輔助性狀的重要性,利用計算智能和機器學習可以有效預測植物育種計劃中不同情景下輔助性狀的相對貢獻。

2.2 機器學習在植物抗逆鑒定中的應用

植物病害包括細菌性病害、真菌性病害和病毒性病害等生物脅迫和干旱、凍害等非生物脅迫病害,機器學習擁有強大的圖像處理技術,可檢測識別多種植物病害圖像,且識別靈敏度高于人工鑒定,能在植物受害初期識別出病害,減少病害對植物的危害。

2017年Johannes 等[34]提出了一種通用的多疾病圖像處理算法,在識別小麥七星病、條銹病和褐斑病上取得較好的成果,2018年該團隊又依據原算法改進,利用基于深度殘差神經網絡的機器學習算法,處理三年兩地的不同條件下的八千多張小麥3 種病害圖片,整體平衡精度從第一次的0.78 提高到0.87[35]。

玉米條大斑病是最常見的危害玉米生長發育的真菌性病害,Dechant 等[12]針對玉米條大斑病提出使用高通量圖片采集結合卷積神經網絡的方法,首先將光譜相機采集的圖片分割成數個熱圖,利用訓練神經網絡檢測圖像中受到條大斑病損傷的玉米葉片,再使用神經網絡生成熱圖標注圖片中每個區域的感染率,最后使用熱圖對完整圖像進行分類,結果證實該系統可靠性高,試驗結果準確率可高達96.7%。

除在農作物抗逆方面應用外,機器學習的多種算法在功能性植物上也有成功運用案例。作為具有經濟和藥用價值的模式植物,煙草生長過程中常遇到煙草花葉病毒病、炭疽病等影響煙草產量的病害,ZHU 等[36]利用高光譜成像系統采集感染病害的煙草葉片圖像,以葉片紋理特征為依據,使用反向傳播神經網絡(BPNN)、極限學習機(ELM)和最小二乘支持向量機(LS-SVM)模型進行葉片病害識別檢測,準確率達到95%以上。

2.3 機器學習在植物識別中的應用

除了通過表型性狀鑒定來提高作物育種效率外,機器學習還可對農田中的植物進行鑒別,識別作物和周圍的雜草,及時報告雜草對農作物生長的影響,避免農作物產量下降[37]。

Brahimi 等[38]使用卷積神經網絡的機器學習算法訓練受到病害的番茄葉子分類模型,準確率高達99.18%。與支持向量機、K 近臨等基礎機器學習方法相比,深度學習識別植物病蟲害準確率更高。機器學習方法同高光譜圖像采集技術研究在植物耐逆性研究中應用較少,且大部分模型被應用于病蟲害、病毒感染等生物脅迫方面。

2021年,Nesteruk 等[11]在歐洲采取遠程調控技術對南極溫室EDEN ISS 內植物進行分類試驗,由于通信的限制,他們使用圖像壓縮方法傳輸高通量數據,平均7.2 次/s 的傳輸速度,將機器學習應用于植物分類技術,雖然壓縮圖片傳輸方法可能導致圖片失真,但試驗結果準確率仍達到了92.6%,此項技術不僅在傳輸距離上有新的突破,還首次選擇壓縮圖像技術傳輸數據集。

SUN 等[39]基于手機采集圖像自主設計了一個26 層的深度學習模型,使用該模型對北京林業大學內100 種觀賞植物的10 000 張圖像進行分類,識別準確率達到了91.78%。Pushpanathan等[40]使用幾種高性能深度學習算法對藥用植物進行自動分類,提出一個由馬來西亞12 種不同的高藥用價值植物的34 200 幅圖像組成的數據集。該數據集由不同比例、不同照明強度和不同角度的數據組成,可為高級分類研究創造更多的機會。

3 總結與展望

目前,機器學習和表型組學結合技術尚在起步階段,相關研究少且集中于基礎研究。植物表型組學是一個龐大的概念,從DNA 到染色體、細胞、組織再到表型都屬于表型組學的研究范圍,表型組學包含的表型層次類型豐富,但機器學習僅在植物病害監測、分類中有所應用,植物分子層面研究尚不深入。機器學習算法眾多,優缺點各不相同[41],支持向量機、神經網絡和隨機森林所訓練出的模型準確率高,是最為常用的機器學習模型,但是支持向量機不能有效地處理多分類問題,隨機森林可以用于處理多分類問題但效率過低,決策樹雖然使用方便,但結果會出現過擬合風險,樸素貝葉斯、神經網絡運行時有無法人為控制的“黑箱”因素,模型擬合結果可靠性一般。

在進行植株表型數據采集時,機器學習還須注意選取合適的采集方法,常用的有高光譜圖像、熒光圖像[42]、紅外光譜、熱成像[43]、RGB 成像。高光譜圖像是最常用的采集方式,可采集植物生化組成、水分含量、葉綠素含量等信息,精度高;紅外光譜、熱成像技術常用在監測植物生長變化,獲得植株表面溫度、氣孔導度和蒸騰作用等表型;RGB 圖像可獲得植物紋理、形態和顏色等信息[44]。表型信息采集方式是影響機器學習輸出模型準確率的因素之一。

與植物表型結合對機器學習采集數據平臺提出了更高的要求。現已開發出多種適合機器學習采集植物表型平臺,例如:與小分子蛋白篩選相適應的高通量篩選系統[45],針對植株根系研制的根系表型采集平臺(Root phenotyping platforms)[46],近地端和航空航天超遠距離都適用的植物表型采集平臺HT3P[47]等。選擇與目標表型相適應的采集平臺不僅可以提高機器模型準確度,還可以提升表型數據采集的通量,進行精確的抗病育種與類別鑒定。

本文概括了植物表型組學的研究范疇,梳理了機器學習的定義、分析流程和相關算法的優劣類別,重點從植物育種、抗逆和識別3 個方面介紹機器學習在植物表型研究中的應用。盡管機器學習在植物表型領域剛剛起步,理論研究尚不充實,模型擬合結果可靠性有待進一步提升,但機器學習和植物表型組學的交叉融合展現出廣闊的前景,在識別植物病蟲害等問題中表現突出,將來機器學習會出現更全面、多層次表型獲取平臺,結合繁多的表型獲取技術,涵蓋植物表型研究方方面面,助力智慧農業發展。

猜你喜歡
分類植物
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
植物的防身術
把植物做成藥
哦,不怕,不怕
將植物穿身上
植物罷工啦?
主站蜘蛛池模板: 亚卅精品无码久久毛片乌克兰| 国产va欧美va在线观看| 欧美日韩中文字幕在线| 亚洲国产精品一区二区第一页免 | 少妇被粗大的猛烈进出免费视频| 亚亚洲乱码一二三四区| 日日摸夜夜爽无码| 麻豆精品视频在线原创| 热伊人99re久久精品最新地| 欧美一区二区福利视频| 国产v精品成人免费视频71pao | 亚州AV秘 一区二区三区| 久久99精品久久久久纯品| 在线中文字幕网| 一级毛片高清| 女同久久精品国产99国| 亚洲午夜国产精品无卡| 亚洲视频在线网| 三上悠亚在线精品二区| 精品久久久久久中文字幕女| 久久精品国产国语对白| 国产一级在线观看www色| 亚洲欧美成人| 久久久久人妻一区精品| 人妻熟妇日韩AV在线播放| 99re免费视频| 白丝美女办公室高潮喷水视频 | 中文字幕亚洲精品2页| 久久久噜噜噜| h网址在线观看| 午夜福利网址| 91丝袜乱伦| 国产福利在线免费观看| 亚洲丝袜第一页| 欧美日本二区| 欧美在线免费| 亚洲动漫h| av一区二区三区高清久久| www.亚洲天堂| 亚洲乱码精品久久久久..| 毛片免费视频| 99国产精品一区二区| 三上悠亚在线精品二区| 亚洲欧洲日韩综合| 97在线公开视频| 青青青伊人色综合久久| 久热精品免费| 综合社区亚洲熟妇p| 欧美亚洲综合免费精品高清在线观看| 最新国产麻豆aⅴ精品无| 国产永久在线视频| 国产区91| 亚洲国产无码有码| h网站在线播放| 丁香婷婷久久| 97se亚洲| 久久香蕉国产线看观| 国产成人喷潮在线观看| a天堂视频在线| 亚洲区视频在线观看| 亚洲系列中文字幕一区二区| 国产精品亚洲欧美日韩久久| 久久青青草原亚洲av无码| 青草午夜精品视频在线观看| 黄色国产在线| 欧美成在线视频| 97久久免费视频| 91成人在线观看| 欧美精品1区| 国产精品9| 亚洲人成在线精品| 久久亚洲高清国产| 久久人体视频| 国产18页| 欧美特黄一免在线观看| 国产精品女人呻吟在线观看| 欧美不卡二区| 日韩成人在线一区二区| 国产乱子伦手机在线| 丰满人妻一区二区三区视频| 国产精品大白天新婚身材| 亚洲一区波多野结衣二区三区|