苗春麗,李仲賢,趙志成,伏帥,高金龍,劉潔,馮琦勝,梁天剛*
(1. 蘭州大學草地農業科技學院,草地農業生態系統國家重點實驗室,蘭州大學農業農村部牧草創新重點實驗室,蘭州大學草地農業教育工程研究中心,甘肅 蘭州 730020;2. 蘭州大學網絡安全與信息化辦公室,甘肅 蘭州 730000;3. 寧夏彭陽縣畜牧技術推廣服務中心,寧夏 彭陽 756500)
苜蓿(Medicago sativa)因具有產量高、營養豐富、適口性好、易于家畜消化等特點[1],成為世界上廣泛種植的優良牧草,素有“牧草之王”的美稱[2]。隨著畜牧業的大力發展以及農業結構的調整,苜蓿作為優質牧草,在我國北方地區大面積集約化種植,極大地促進了苜蓿產業的發展[3]。近年來,我國栽培苜蓿規模化生產優勢明顯,但與發達國家相比,仍然存在生產管理較粗放,在大部分生產區域尚未實現水、肥、藥的一體化精準管控,苜蓿生產過程缺乏數字化、智能化的管理系統,苜蓿生產及管理效率低下,生產成本逐年增加等問題,嚴重制約著苜蓿產業綜合競爭力的提升和高質量發展。
智慧農業是以信息和知識為核心要素,通過互聯網、物聯網、大數據、人工智能(artificial intelligence, AI)和智能裝備等現代信息技術與農業跨界融合,實現農業生產全過程的信息感知、定量決策、智能控制、精準投入、個性化服務的全新農業生產方式,是農業信息化發展從數字化到網絡化再到智能化的高級階段。智慧農業整合生物技術、信息技術、智能裝備三大生產力要素[4]。美國、英國、澳大利亞、法國、德國、日本等國家圍繞智慧農業進行了廣泛的布局,分別出臺了“人工智能研發戰略計劃”“產業戰略白皮書”“農業4.0 手冊”“農業創新2025”“數字農業”“社會5.0”等政策,預計2015-2025 年全球智慧農業市值將達到683 億美元[5]。我國 “十四五”規劃提出要發展智慧農業,目標是用電腦強化人腦、用機器替代人力、用自主替代進口,實現生產智能化、作業精準化、管理數字化和服務網絡化[6]。智慧農業的迅速發展為栽培苜蓿精細化管理提供了新契機。因此,迫切需要加快轉變苜蓿產業發展方式,從粗放發展模式向精細管理發展模式轉變。利用地面物聯網等方法構建栽培苜蓿觀測技術體系,建立栽培苜蓿生產大數據分析與決策管理平臺,有利于推進栽培苜蓿資源環境數字化,加強栽培苜蓿生產過程監控、災害動態監測和智能作業,服務宏觀管理決策,指導栽培苜蓿生產,推動生產管理的數字化、網絡化和智能化發展。
智慧農業包括智能農業裝備、智能傳感器系統、智能無人機、智能機器人、軟件等主要技術。在智能感知系統研發及應用方面,吳文斌等[7]構建了天空地一體化的果園感知系統,開發了天空地遙感大數據驅動的果園生產診斷與作業決策系統,優化果園資源要素配置,提高果園生產率、土地產出率和勞動生產率,打造出了新型的果業生產發展模式;李巖等[8]針對農作物的長勢與農業災害監測需求,集成北斗導航定位、遙感、通信等技術,建成以北斗導航數據與軍民高分數據融合應用為主體,研發面向農機監控管理、作物長勢監測、農業植保管理的具有區域特色的農業監測應用系統,為農作物長勢監測、氣象災害監測、病蟲害監控、無人機施藥管理、農機態勢監測和農作物節水灌溉提供了技術手段;柳平增等[9]針對精準變量播種、施肥、施藥及自動灌溉等作物生產關鍵環節的管理,研究設計了精準農業信息感知系統。然而,已有的田間系統大多數主要側重于智能傳感系統的設計,并且使用的樣本來自單一地區,其適用性有限且并沒有在后臺應用蓋度與產量相關算法模型,不能實時分析和計算作物的蓋度和產量。
國內外在農作物蓋度和產量衛星遙感方面開展了大量研究工作,如張加楠等[10]、伏帥等[11]、周濤等[12]采用不同算法分析了玉米(Zea mays)、天然草地和植被的覆蓋度;Li 等[13]使用了無人機RGB 高分辨率遙感影像和Otsu閾值法從裸土中提取馬鈴薯(Solanum tuberosum)植物對象,開發了半自動化圖像分析軟件來估計作物出苗情況。研究結果表明,該方法是一種有前途的高通量表型方法,可用于評估馬鈴薯在出苗階段的發育情況。鄧璐希[14]使用無人機影像技術和支持向量機(support vector machine, SVM)的分類模型,來識別無人機影像中的不同顏色的開花覆蓋度,并發現不同顏色的開花覆蓋度與傳粉者數量呈指數關系。王成波[15]使用無人機遙感技術獲取玉米可見光影像,選取不同的植被指數進行可見光圖像閾值分割,較好地提取了夏季玉米在四葉期、拔節期、抽穗期和花粒期的植被覆蓋度。以上研究均利用無人機影像數據采用機器學習或閾值法對農作物覆蓋度進行計算,雖然取得了不錯的識別效果,但是普遍存在精度偏低、樣本量較少、研究區跨度較小、模型普適性低等問題。針對以上研究的不足,本研究將利用四省區的無人機影像數據集和U-Net 算法為栽培苜蓿智能感知系統建立一個精度和普適性更高的栽培苜蓿蓋度估算模型。
近年來,隨著無人機和近地表傳感器技術的不斷發展,越來越多的農業應用場景開始采用機器學習等方法來實現栽培農作物的生長動態監測和產量估算。然而,在苜蓿等作物方面,對于在蓋度及產量等關鍵生物物理指標算法構建及應用方面的探索研究還相對不足。許多學者針對小麥(Triticum aestivum)[16-17]、水稻(Oryza sativa)[18]、玉米[19]、棉花(Gossypiumspp.)[20]、馬鈴薯[21]、大豆(Glycine max)[22]等大宗農作物開展了長勢監測和產量估算研究,費時費力且效果不穩定。已有的研究成果表明,使用機器學習算法可以顯著提高栽培苜蓿生長狀態的監測精度和可靠性。例如,競霞等[23]利用高光譜遙感數據,以及貝葉斯嶺回歸(bayesian ridge regression,BRR)、支持向量回歸(support vector regression, SVR)和偏最小二乘(partial least squares regression, PLSR)等方法對廣東省鐘落潭試驗基地水稻進行估產分析,結果表明,當輸入參數組合為全波段光譜協同作物群體長勢參數、作物養分吸收量時,BRR 模型對產量的估算精度達到最高,R2為0.94。尹瀚民等[24]利用Landsat 影像與雙循環神經網絡模型對哈薩克斯坦北部地區的春小麥進行了估產分析,春小麥產量與植被凈初級生產力(net primary productivity, NPP)相關性分析結果顯示,北哈薩克斯坦州、阿克莫拉州和庫斯塔納州決定系數(R2)在0.50 以上,面積占比分別為44%、94%和77%。余新華等[25]利用一種基于多光譜衛星遙感數據和作物生長模型估算農作物產量的模型框架(soil-crop yield model, SCYM)來估測安徽省冬小麥的產量,研究結果顯示,2012-2018 年實測單產平均值為6058.00 kg·hm-2,SCYM 估算單產平均值為5984.95 kg·hm-2, 且估算產量與實測產量的年際時間序列的相關性為0.822,均方根誤差(root mean square error,RMSE)為189.96 kg·hm-2,SCYM 估產框架對安徽省冬小麥產量估算具有一定的可行性,在產量預測方面效果良好。盡管已有研究在栽培苜蓿產量估測方面取得了較高的模型精度,但是仍存在一些問題需予以解決。其中,利用遙感衛星數據的時間分辨率較低,受到云的干擾影響,導致產量模型誤差增大;此外,遙感影像數據的采集和處理需要大量人力物力,增大了成本。同時,由于影像過境時間和野外實測時間存在一定的誤差,實測產量與影像監測產量不能夠實時匹配,限制了監測的準確性。另外,現有模型中的變量多為遙感數據等,基于植物生物物理指標變量的模型研究不足,模型變量較為復雜,不利于栽培苜蓿智能感知系統的快速監測。因此,針對上述問題,本研究將利用機器學習等算法為栽培苜蓿智能感知系統建立一個更為高效、準確和穩定的苜蓿生長狀況的動態監測和產量估算模型。
基于以上因素的考慮,本研究將利用四省區2018-2021 年地面大量觀測數據和無人機圖像及視頻資料,采用傳統統計方法和機器學習算法,構建用于智能感知系統的統一、標準化的苜蓿蓋度和產量動態反演算法,以期為多點位高時頻的網絡化、自動化和智能化數據實時采集與動態分析提供技術支撐,為栽培苜蓿草地的田間科學管理提供智能化的信息服務。
本研究組裝的栽培苜蓿智能感知系統包括多種地基傳感器,可實現苜蓿生長環境和關鍵生物物理信息的快速感知、采集、傳輸、存儲和可視化,可以解決傳統栽培苜蓿遙感監測和地面調查中數據時空不連續的難點問題,可顯著提高信息獲取的保障率和時效性,實現對栽培苜蓿生產信息全天時、大范圍、多點位的動態監測與管理。從技術體系看,栽培苜蓿智能感知系統主要由地面傳感網智能感知和決策支持系統兩大子系統構成:1)地面傳感網智能感知系統。通過物聯網和傳感器技術建立無人值守的固定點位的栽培苜蓿智能感知系統,可自動、連續和高效獲取苜蓿植物關鍵生物物理和生長環境信息。其中,生長環境信息主要包括氣象和土壤參數,其中氣象因子包括空氣溫濕度、風速、風向、降水量等指標,土壤因子包括分層溫濕度等指標。同時,還可以獲取栽培苜蓿返青、開花、刈割等關鍵時期的長勢和產量等信息。地面傳感網感知系統的構建,可以為苜蓿生產大數據研究與應用提供基礎數據支撐。2)栽培苜蓿草地管理決策支持系統。結合手機、平板電腦、無人機等終端平臺,利用人工智能等技術深度挖掘智能感知系統獲取的數據,還可以綜合分析栽培苜蓿草地產量、品質、病蟲害和干旱等方面的信息,為苜蓿產業高質量發展決策提供信息服務。
從功能看,基于物聯網的栽培苜蓿智能感知系統主要包括 3 個方面的信息服務內容:1)氣象災害評價。以氣象災害應急管理為目標,利用土壤溫濕度傳感器和多種氣象觀測傳感器,分析旱澇災害、低溫凍害等氣象災害發生的時間、頻率和強度,建立災情動態監測及其對栽培苜蓿生長和刈割影響評估技術,進行實時監測與快速預警,提升栽培苜蓿產業對災害的應急管理能力;2)水肥管理。利用地面土壤、氣象傳感器和圖像、視頻監測數據,綜合分析栽培苜蓿生長發育特征,構建栽培苜蓿水肥診斷模型,研究水肥一體化調控方法,為栽培苜蓿水肥科學管理提供科技支撐;3)生長狀況及產量評估。利用苜蓿植物超聲波傳感器和圖像、視頻監測數據,構建栽培苜蓿蓋度及產量反演模型,實時動態提供診斷分析;基于栽培苜蓿生長發育及其周邊微環境變化等因素之間的關系特點,構建栽培苜蓿生長模擬模型,動態監測栽培苜蓿生長過程,為栽培苜蓿適時刈割等管理提供信息服務。生產過程的智能監測與分析是栽培苜蓿生產智能管理的核心。隨著傳感器技術的發展和成本的不斷降低,利用精度更高功能更加完備的傳感器(如高清照相機、定制化的多光譜儀等),可以進一步提升栽培苜蓿智能感知系統的功能,對栽培苜蓿病蟲害等生物災害,以及對牧草品質進行診斷和評估。
1.1.1 地面傳感網智能感知系統 栽培苜蓿草地智能感知系統中的地面傳感網智能感知系統是一種單片集成的多傳感器系統(圖1)。該系統包括土壤溫濕度傳感器、多項氣象指標觀測傳感器、植物超聲波傳感器、高清攝像頭以及在一片芯片上為每個傳感器設計的外圍電路(圖1)。目前該設備已經在監測點寧夏自治區彭陽縣白楊莊村(106.799848° E, 35.997256° N)應用。

圖1 地面傳感網智能感知系統Fig.1 Ground sensor network intelligent perception system
超聲波傳感器采用DYP-A16-V1.0,其盲區距離為508 cm,平面物體量程達50~1500 cm,測量精度達±(1+S0.3%)。其擁有防塵防水、遠距離測距穩定、低功耗供電、精確度高、帶有溫度補償功能、適應戶外等惡劣環境、抗干擾強、兼容多種輸出方式等優點。主要監測栽培苜蓿的草層高度;高清攝像頭傳感器運用GoPro 10(https: //gopro.com/zh/cn/shop/cameras)運動相機,采用GP2 處理器,具有2300 萬高分辨率像素,傳輸影像達60 FPS·S-1,具有可同時保證5.3 k 分辨率和360° 6 k 視頻功能。此外,GoPro 運動相機的質地輕盈,能更加迅速地捕捉影像。同時具有圖像穩定功能,可確保視頻畫面穩定清晰。該設備主要應用于栽培苜蓿影像的獲取,以及苜蓿草地蓋度、產量等信息的智能分析。
土壤傳感器(VMS-3005-TR-6EC6W6S-N01),主要進行不同分層土壤溫濕度的監測;氣象傳感器采用聚英全自動氣象指標采集系統,包括LORA 氣象采集網關、無線路由器、氣象監控主機箱及各類傳感器,可自動觀測風速、風向、雨量、太陽輻照度、空氣溫度、空氣濕度、PM 2.5 等指標。
1.1.2 栽培苜蓿草地智能感知與決策系統(web端) 栽培苜蓿草地智能感知與決策系統包含設備管理、知識庫、智能分析、系統管理等4 個模塊,旨在將地面傳感網傳回的數據進行實時分析。對監測點栽培苜蓿草地的降水量、土壤溫濕度、空氣溫濕度、風向、風速、紫外線等指標進行實時數據傳回,其中拍攝的苜蓿植物實時照片和視頻,能夠對栽培苜蓿的長勢、蓋度、產量、病蟲害等通過后臺算法進行實時計算和分析。
為了構建我國北方地區栽培苜蓿蓋度和產量智能感知算法,本研究采用了2018-2021 年蘭州大學草地農業科技學院草地遙感與信息管理研究團隊在新疆、內蒙古、甘肅、寧夏等省區開展完成的栽培苜蓿野外觀測數據庫(https://herbs.aiplants.cn/)。該數據庫包含在栽培苜蓿生長季開展的9 次外業調查數據記錄,總計有555 個樣方和185 個樣地數據(圖2,底圖無修改)。在外業調查時,樣地選在大于10 m×10 m 的苜蓿地塊,每個樣地內包括均勻設置的3 個0.5 m×0.5 m 的樣方,采樣點記錄的內容包括經度、緯度、高程、苜蓿植物蓋度、高度、鮮重、干重等指標,及無人機拍攝的照片編號、文字注記等信息。經度、緯度、高程數據由手持GPS(集思寶)獲取,精度為2~3 m。每個樣方隨機測量10 次栽培苜蓿的自然高度并取平均值作為該樣方實測植物高度。在每個樣方內,苜蓿留茬高度為5 cm,剪下樣方內所有地上部分去除雜質后裝入樣品袋,稱取地上生物量鮮重值。樣品帶回實驗室后經64 ℃烘箱烘干至恒重后記錄樣方生物量干重。統計每個樣地3 個樣方生物量平均值作為該樣地生物量實測值。

圖2 2018-2021 年栽培苜蓿觀測樣地空間分布Fig.2 Spatial distribution of cultivated alfalfa observation plots from 2018 to 2021
苜蓿植物蓋度數據是利用“中國草業與生態大數據服務系統”(http: //ecograss.lzu.edu.cn/)中蓋度識別模塊和大疆精靈4PRO 無人機(http: //www.dji.com)拍攝的可見光照片(分辨率為4864×3648)計算得到的。該無人機搭載的高清數碼相機可獲取紅、綠、藍波段范圍的可見光光譜信息,并以0~255 的數值形式儲存在JEPG格式的圖像文件中,每張照片的位置信息儲存在照片的屬性文件中。在使用無人機進行拍照時,利用飛控系統在樣方正上方保持懸停20 m 狀態,使相機鏡頭垂直向下拍攝照片,每個樣地拍攝5~9 張無人機照片。樣地內所有樣方的苜蓿蓋度平均值作為該樣地的苜蓿草地蓋度。
主要包括以下2 個方面的內容: 1)基于深度學習(deep learning, DL)方法和無人機照片的栽培苜蓿蓋度建模與分析,計算野外實測樣地的苜蓿蓋度,為估產模型構建提供基礎數據;2)以樣點經度(X)、緯度(Y)、高程(h)等環境因子和苜蓿草高(H)、蓋度(C)、草高×蓋度(H×C)等草地植物生物物理指標為自變量,構建栽培苜蓿產量多元線性回歸(multiple linear regression, MLR)和隨機森林(random forest, RF)機器學習模型。在以上模型研究的基礎上,評價各類模型的精度和實用性,篩選出適合栽培苜蓿草地智能感知系統實時動態監測分析的最優模型。
1.3.1 蓋度估測模型 圖像處理是深度學習最早嘗試的領域,U-Net 網絡則是其應用較為廣泛的一種。該網絡是2015 年由Ronneberger 等[26]基于FCN 提出的一種新型的語義分割網絡結構,最早應用于醫學圖像分割,能夠在少量樣本的情況下達到相對精確的分割結果。它是一種典型的編碼解碼結構(encoder-decoder)。編碼過程主要進行下采樣,實現特征提取,解碼過程主要是進行上采樣,還原像素尺寸,同時精準定位分割位置。
因此本研究使用深度學習框架Pytorch 構建栽培苜蓿植物蓋度反演模型。試驗的操作系統為Windows 10,GPU 配置為NVIDIA Quadro P5000,顯存為16 GB。根據無人機拍攝圖像的顏色、形狀和梯度等特征,利用UNet 算法進行裸地和苜蓿的二分類,共計使用了1124 張無人機拍攝的樣地照片(分辨率為4864×3648),批處理大小為16,圖像尺寸為1080×1080,損失函數是二分類交叉熵函數。生成的標簽作為監督信號,計算迭代次數100次,學習率為2e-4,并按照9∶1 劃分驗證集和訓練集,其中驗證集的圖像與訓練集獨立,不參與訓練。
準確率(accuracy,ACC)表示所有的預測樣本中,預測正確的比例。TP(true positive)表示實際為正樣本被預測為正樣本的數量;FN(false negative)表示實際為正樣本卻被預測為負樣本的數量;FP(false positive)表示實際為負樣本卻被預測為正樣本的數量;TN(true negative)表示實際為負樣本預測也為負樣本的數量。可以得出(TP+FN)是全部實際的正樣本數,而(TP+FP)是所有預測為正樣本的數量。
式中:TP 表示實際為苜蓿樣本被預測為苜蓿樣本的數量;FN表示實際為苜蓿樣本卻被預測為裸地樣本的數量;FP表示實際為裸地樣本卻被預測為苜蓿樣本的數量;TN表示實際為裸地樣本預測也為裸地樣本的數量。可以得出(TP+FN)是全部實際的苜蓿樣本數,而(TP+FP)是所有預測為苜蓿樣本的數量。
1.3.2 栽培苜蓿產量統計模型 多元線性回歸模型可以表述兩個或兩個以上解釋變量的統計依賴關系(公式1)。該類模型具有兩個或兩個以上的解釋變量和明確的參數化表達式,模型自變量參數可用最小二乘方法進行估算。線性回歸方程比較簡單,模型參數易于估計。在遙感監測中,基于多元線性回歸模型的農作物產量估測模型已得到廣泛應用[27]。因此,本研究利用MATLAB 2021a 軟件,分別構建與栽培苜蓿產量顯著相關的不同因素及其組合的多元線性回歸模型。
式中:y為栽培苜蓿產量;x1,x2, …,xi為與栽培苜蓿產量有顯著相關性的因子,在本研究中包括3 個環境因子(X、Y、h)和3 個苜蓿植物生物物理指標(H、C、H×C);β1,β2, …,βi+1為模型估測參數;ui為殘差項。
1.3.3 栽培苜蓿產量機器學習模型 相較于多元線性回歸模型,基于機器學習的非參數非線性模型具有更高的估測能力[28-29]。 本研究采用的多因素機器學習模型為RF。利用R Studio 軟件,分別構建與栽培苜蓿產量顯著相關的不同因素及其組合的RF 機器學習模型。
隨機森林[30]與傳統算法相比在處理非線性和多變量問題方面具有優越的性能,在糾正錯誤和缺失數據方面有更強的能力,可以規避過擬合和多重共線性問題。RF 算法包括ntree(回歸樹數量)、mtry(每個節點上測試的預測器的數量)和nodesize(樹的終端節點的大小)3 個主要變量。ntree 是基于樣本數所建立的決策樹數量,ntree越大,模擬結果就越穩定,但會導致計算量增加,本研究設置ntree 為1000;mtry 是隨機特征的數量,其默認值是輸入變量的平方根,從2~20 進行試驗,間隔為 1,本研究采用默認值設置。RF 算法是通過 R 軟件中自帶的“randomForest”數據包實現[31]。
以上兩種算法均使用十折交叉驗證方法[32]對苜蓿蓋度反演模型、產草量多元線性回歸模型和RF 模型進行精度評價。將所有自變量及其對應的因變量以等樣本數的方式分為10 組,進行交叉驗證。每次選取總體樣本數的1/10 作為測試數據集用來驗證模型的估測能力,剩下的樣本數據作為訓練集來構建反演模型。每次構建模型后利用測試集數據計算預測值與實測值之間的決定系數(R2)和均方根誤差(root mean square error, RMSE),重復選取測試集和訓練集數據10 次,直到所有的樣本都在訓練集和測試集中出現,模型的估測能力用10 次測試數據計算出來的R2和RMSE 的平均值表示,R2值越大,RMSE 越小,代表模型的精度越好。
R2和 RMSE 的計算公式如下:
式中:n為本研究樣本量;y為栽培苜蓿實測產量;yi為栽培苜蓿預測產量;xi為與栽培苜蓿產量有顯著相關性的因子,在本研究中包括3 個環境因子(X、Y、h)和3 個苜蓿植物生物物理指標(H、C、H×C)。
新疆、甘肅、內蒙古和寧夏是我國北方栽培苜蓿的主產區,本研究使用的185 個調查樣點基本覆蓋了這4 個省區的主要栽培苜蓿草地,調查時間跨度大,野外實測時間為5-9 月,涉及苜蓿生育期的不同時段,由于不同區域的灌溉苜蓿和旱作苜蓿刈割的時間差異較大,受刈割及氣象等因素的影響,栽培苜蓿的生物量和蓋度時空變化也有較大波動(表1)。統計分析表明,我國北方4 省區栽培苜蓿草地地上生物量和蓋度差異較大。與旱作苜蓿相比,灌溉苜蓿在蓋度及產量上都表現出一定優勢。總體而言,我國新疆、內蒙古、甘肅河西等地區的栽培苜蓿以灌溉為主,地塊集中連片、地勢平坦,苜蓿草地盛草期為5 月,平均產量和蓋度分別達5362.81 kg·hm-2和96.29%,產量標準差為1934.90 kg·hm-2,樣點離散程度較大;以旱作生產方式為主的甘肅隴東、寧夏南部地區的栽培苜蓿草地大多種植在山區水平梯田、一年刈割2 次,其盛草期為8 月,平均產量和蓋度分別達3987.57 kg·hm-2和91.55%,產量標準差為1436.25 kg·hm-2,誤差相對較小。

表1 2018-2021 年栽培苜蓿關鍵生物物理指標外業觀測數據統計分析Table 1 Statistical analysis of field observation data of key biophysical indicators of cultivated alfalfa from 2018 to 2021
表2 為栽培苜蓿草地蓋度反演模型參數,其中栽培苜蓿蓋度反演模型為U-Net 模型,樣本數量為1124。其中,R2為0.99,RMSE 為1.44%。總體而言,模型精度較高,誤差較小,預測效果較好。該模型算法可用于栽培苜蓿智能感知系統,對草層蓋度高精度、智能化估測具有實用意義。

表2 栽培苜蓿草地蓋度反演模型參數Table 2 Parameters of inversion model for cultivated alfalfa grassland coverage
圖3 表示不同時期與地域的部分無人機影像及標簽,基于U-net 深度學習算法的栽培苜蓿蓋度識別結果較好。對于不同長勢不同品種的苜蓿均具有較好的識別結果。

圖3 部分影像及標簽Fig.3 Some images and labels
表3 是基于苜蓿植物生物物理指標及其環境因子的多元線性回歸估測模型的十折交叉驗證結果,其中環境因子(X、Y、h)、植物生物物理指標(H、C、H×C)對生物量的動態變化響應較好,測試集R2為0.63,RMSE 為1218.15 kg·hm-2。

表3 基于環境因子和植物生物物理指標的多元線性回歸估測模型十折交叉驗證Table 3 10-fold cross-validation of MLR estimation model based on environmental factors and vegetation biophysical indicators
在基于RF 方法構建的3 類模型中,利用經度、緯度和海拔等環境因子構建的栽培苜蓿產量估測模型精度最差,其測試集R2為0.37,RMSE 為1623.17 kg·hm-2(表4);而植物生物物理指標對栽培苜蓿產量的動態變化響應較好,測試集R2為0.65,RMSE 為1216.24 kg·hm-2;基于環境因子(X、Y、h)、植物生物物理指標(H、C、H×C)構建的栽培苜蓿產量估測模型精度最高,其測試集R2為0.69,RMSE 為1151.24 kg·hm-2。與多元線性回歸估測模型相比,基于3 個生物物理指標和3 個環境因子指標構建的RF 模型精度最高,誤差最小。

表4 基于環境因子和植物生物物理指標的RF 估測模型十折交叉驗證Table 4 10-fold cross-validation of RF estimation model based on enviromental factors and vegetation biophysical indicators
圖4 是不同因素構建的栽培苜蓿生物量RF 估測模型的實測值與預測值統計分析結果,環境因子對栽培苜蓿產量估測的影響較弱(圖4a),僅能反映生長季內栽培苜蓿產量30%的變化情況,實測值和預測值分布離散,擬合效果較差。而基于植物生物物理指標和環境因子、植物生物物理指標構建的兩種模型對栽培苜蓿產量的估測效果較好,均能反映生長季栽培苜蓿產量60%以上的變化情況,植物生物物理指標在栽培苜蓿生物量的估測中效果較好(圖4b),圖4c 是基于環境因子、植物生物物理指標構建的栽培苜蓿生物量估測最優模型,其R2為0.63,RMSE 為646.35 kg·hm-2,說明基于環境因子、植物生物物理指標構建的模型在估測栽培苜蓿產量時結果最好,誤差較小。

圖4 基于不同因素組合的RF 苜蓿產量估測模型模擬Fig.4 Simulation of the optimal alfalfa yield estimation model based on different factors
現今,針對農作物智能感知系統,許多學者已經在不同方面展開研究和探索。其中,陳健等[33]開發了蘋果(Malus pumila)精準管理專家系統, 實現了對果園環境的實時監控,并且可以對蘋果的病蟲害和開花期進行預測, 但是沒有蓋度及生物量監測與決策等功能;王旭東[34]基于WSN 的農田智能灌溉系統的實時監測、感知和采集網絡覆蓋區域內環境和監測對象的信息,再發送到信息采集站或灌溉系統監控服務中心,根據土壤墑情合理計算灌水定額,突破了地域限制,實現了農業智能化監測和灌溉管理,但是該系統功能較為單一,只能動態監測農田的需水情況。鄭立華等[35]利用CLARE 專家系統外殼開發了棉花生產管理專家系統,但該系統沒有結合互聯網技術, 可擴展性不強,余國雄等[36]基于物聯網的荔枝(Litchi chinensis)園信息獲取與智能灌溉專家決策系統具有較強的實時性和較高的準確率,但是,該系統也存在一些缺點,例如人工管理方式比較粗獷,目的性不強,特別是采用漫灌等傳統的灌溉方式,導致嚴重的水資源浪費。對于以上研究的不足之處,本研究提出了一種針對栽培苜蓿的智能感知系統。該系統的地面物聯網具有實時連續觀測,信息快速傳輸等優點,但其覆蓋范圍較小,多應用于固定點位尺度的動態監測和診斷分析。該系統的信息服務內容主要包括氣象災害評價、水肥管理和生長狀況及產量評估。該系統通過采用精度更高、功能更完備的傳感器(如高清照相機和定制化的多光譜儀等),可以進一步提升系統的功能,對栽培苜蓿病蟲害等生物災害以及牧草品質進行診斷和評估。針對以往研究的局限性,該系統的功能更加全面,并且已經應用于實際生產中。另外,本研究已開發出相應的栽培苜蓿蓋度及產量估測模型,具有較高的精度并且已經應用在后臺中。
作物的生長狀況表現在其生物量、葉面積、覆蓋度等特征參數,通過觀測這些參數的變化情況,可以監測作物的生長情況,以便作出及時的田間管理決策[37]。而計算機視覺相關技術及設備的出現,恰恰可以解決這些問題。計算機視覺是借助攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等,自20 世紀 50 年代出現至今,已廣泛應用于各個領域,在農業氣象觀測方面特別是種子質量檢測、農產品分級與加工、植物生長監測、農作物病蟲草害監測與防治中的應用也比比皆是[38],均取得了不錯的研究成果。深度學習因為其類似人腦的分層結構模型,對輸入數據從底層信號到高層語義的特征提取建立起來的映射關系而受到關注,在圖像分類、圖像識別、圖像分割等領域都取得了很好的性能。吳趙麗等[39]基于無人機遙感影像和基于中值濾波與數學形態學相結合的邊緣檢測法提取芨芨草(Achnatherum splendens)圖像,將其與非芨芨草圖像分割,估算結果準確度高達97.3%。趙曉宇等[40]利用可見光波段差異植被指數結合Otsu 來區分植被與非植被。利用無人機可見光影像在紅綠藍3 個波段進行計算,所需的時間較長。針對以上研究中的不足并考慮到由于栽培苜蓿的覆蓋度計算結果將用于栽培苜蓿的生物量的計算中,其結果的準確性將直接影響到栽培苜蓿生物量模型的構建及結果,對其精度的要求較高。所以本研究所提到的基于深度學習算法的栽培苜蓿覆蓋度模型精度較高,尤其在研究區跨度較廣、觀測時間較長、地形因素差異大等多種復雜因素的影響下,該模型依然表現出其穩定性與精確性。但是,由于深度學習計算過程復雜度高,數據量大,在計算過程中會表現出延時性,未來研究還需要優化系統,簡化深度學習模型。
本研究基于不同因素構建的多元線性回歸模型,發現不同因素的組合對苜蓿產量估算的準確性有顯著影響。在3 種不同的模型組合中,基于環境因子(X、Y、h)、植物生物物理指標(H、C、H×C)的最優模型對苜蓿產量的估算效果最好。基于不同因素的RF 機器學習模型對苜蓿產量的估計結果與多元線性回歸模型相似。然而,這兩個模型在估計精度方面表現出顯著不同的水平。本研究中利用苜蓿植物生物物理指標的最佳機器學習模型與最優多元線性回歸模型相比,R2提高了0.03,RMSE 降低了55.34 kg·hm-2。在基于不同因子組合的不同機器學習模型中,隨著輸入變量的減少,因子的權重有減小的趨勢。與最優多元線性模型相比,基于環境因子和植物生物物理指標的最優機器學習模型R2提高了0.08,RMSE 降低了123.07 kg·hm-2。這說明除了考慮影響苜蓿產量的多種因素外,模型的形式對產量估計也有重要影響。黎銳等[41]利用支持向量機機器學習算法結合Landsat 多時相遙感數據構建了冬小麥產量估算模型,并與多元回歸模型相比較,發現支持向量機算法優于多元回歸模型。本研究與其相似:與多元線性模型相比,機器學習算法更適合復雜的計算,可以有效地進行變量選擇和組合,提高模型預測苜蓿產量的準確性。RF 模型可以組合不同特征的變量,有效解決了“過擬合”多重共線性問題[28,42]。許多研究者利用RF 模型估算作物生物量,結果顯示了良好的模擬效果[43]。然而,RF 模型有其局限性,特別是在構建回歸決策樹方面。它通常低估了訓練集以外的高生物量值[44]。此外,由于RF 模型是數據驅動的,它通常需要大量的樣本數據,如果數據集很小,可能會影響模型的準確性[45]。崔孟然[46]采用偏最小二乘算法和RF 算法,估算了馬鈴薯的產量,結果表明,在塊莖膨大期,RF 算法構建的建模集實測值和預測值的線性擬合決定系數R2達到0.88,表明RF 機器學習模型具有更高的預測精度。但是該研究的變量包括高光譜數據和地面測量數據,其中高光譜數據是通過高光譜成像儀獲取的,包括了馬鈴薯生長期間的遙感指數及光譜反射率等,該研究模型變量較為復雜,數據獲取需要大量的人力物力;楊北萍等[47]使用HJ-1A/B 和Landsat8 衛星遙感數據和隨機森林回歸算法(random forest regression,RFR)進行水稻產量遙感估算,表明RFR 模型的水稻產量估算精度明顯優于多元逐步回歸模型,RFR 模型的R2和平均相對誤差(mean relative error,MRE)分別為0.730 和0.090,多元逐步回歸模型的R2和MRE 分別為0.530 和0.120,該研究使用的變量包括了多時相遙感圖像數據和氣象數據,未考慮作物生物物理指標,另外該研究中使用的樣本來自單一地區,其適用性有限。針對以上研究,本研究以4 省4 年野外實測數據建立機器學習模型,在保證模型精度的同時也提高了模型的普適性與穩定性。另外,模型變量為植物生物物理指標和環境因子,其都具備數據獲取簡單,能夠直接被栽培苜蓿智能感知系統用于模型構建與實時分析,節省了大量的人力物力,并且能夠做到栽培苜蓿的連續時序性動態監測。
數據、算法和算力是人工智能的三要素。其中,算法是實現智能系統相關功能的關鍵,數據是構建模型的重要基礎。在本研究中,由于團隊設計開發的栽培苜蓿智能感知系統的軟硬件尚處在測試期,缺乏基于這種系統多點位高時頻的栽培苜蓿草地觀測數據,因此在苜蓿生物物理指標反演模型構建時使用了2018-2021 年研究團隊在新疆、甘肅、內蒙古和寧夏開展的栽培苜蓿草地外業調查數據和無人機拍攝的圖像數據。另外,栽培苜蓿生物量還受氣候、土壤和人為等多種因素的影響。其中,氣候因素包括光照、氣溫和降水等;土壤因素則包括土壤營養元素、土壤結構以及肥力等;人為影響因素主要體現在灌溉、施肥、噴藥等一系列田間管理措施。為了提高反演精度,未來可以考慮氣候、土壤等變量參與模型的構建,進一步優化栽培苜蓿草地關鍵生物物理指標的反演效果。
本研究以新疆、內蒙古、甘肅及寧夏4 省區栽培苜蓿為對象,利用無人機影像數據和多元線性回歸、深度學習算法和機器學習算法,結合我國北方4 省區的野外實測數據,構建了栽培苜蓿蓋度與產量的最優估測模型,對比分析了反演模型的精度與實用性,為栽培苜蓿智能感知系統的數據在線實時分析提供了算法支持。主要得出以下結論:1)總體而言,我國新疆、甘肅河西等地區的栽培苜蓿以灌溉為主,地塊集中連片、地勢平坦,一年刈割3~4次,苜蓿草地在盛草期的平均產量和蓋度達5362.81 kg·hm-2、96.29%;以旱作生產方式為主的甘肅隴東、寧夏南部等地區的栽培苜蓿草地大多種植在山區水平梯田,一年刈割2~3 次,其盛草期的平均產量和蓋度達3987.57 kg·hm-2、91.55%;2)利用深度學習算法所構建的蓋度模型R2達0.99,RMSE 為1.44%,模型準確度為92%,對栽培苜蓿草地蓋度估測效果良好,對自動化在線實時分析具有重要作用;3)在3 類多元線性回歸模型中,基于環境因子(X、Y、h)、植物生物物理指標(H、C、H×C)構建的栽培苜蓿產量估測模型效果最佳,其測試集的R2達0.63,RMSE 為1218.15 kg·hm-2;4)與多元線性回歸模型相比,利用RF 機器學習方法構建的栽培苜蓿產量的估測結果更好,其中,基于環境因子(X、Y、h)、植物生物物理指標(H、C、H×C)構建的RF 模型精度最高,其測試集的R2達0.69,RMSE 為1151.24 kg·hm-2,訓練集的R2為 0.94,RMSE 為536.09 kg·hm-2。
算法是實現智能系統相關功能的關鍵,本研究基于U-net 深度學習算法構建的蓋度模型與基于RF 機器學習方法構建的栽培苜蓿產量估測模型的估測效果良好,可以為栽培苜蓿智能感知系統提供算法依據,為栽培苜蓿蓋度及產量的實時、連續和智能監測提供重要支撐。