摘要:利用遙感技術采集作物信息,實時獲取作物生長情況,對作物長勢、產量、病蟲害等進行預測,有助于農業精準管理和農業政策制定。基于遙感監測技術,系統分析遙感數據源獲取、植被指數選取、地面監測數據獲取、預測方法選擇、預測模型精度評價等方面的現狀,為作物農情遙感預測研究提供依據。
關鍵詞:農情; 遙感; 預測; 指標; 建模
中圖分類號:S126 文獻標識碼:A 文章編號:1674-1161(2024)05-0068-03
全面準確地了解作物農情信息,是實施糧食安全戰略和發展綠色生產的前提和基礎。獲取各地作物信息,必然離不開農情監測。農情是對農業外界條件與作物生產狀態的動態跟蹤[1],農情監測可以實時了解作物的生長狀況,是降低農業生產風險、保障糧食安全和促進精準農業的重要實踐。遙感監測利用基于衛星或無人機的遙感技術對農業生產過程進行動態實時監測,彌補了傳統調查具有主觀性、耗時長、成本高等不足,能夠及時、快速、動態地監測大范圍的農情信息。作物農情預測基于農情遙感實時監測結果,結合不同波段數據計算后的遙感指標及地面監測數據,構建預測模型,從而實現對作物長勢、產量、災害等情況的預測。基于農情遙感監測技術,系統分析國內遙感數據源獲取、植被指數選取、地面監測數據獲取、預測方法選擇及預測模型精度評價等方面的研究現狀,以期為作物農情遙感預測研究提供理論基礎和技術參考。
1材料與方法
1.1數據源
以中國知網為數據庫,檢索該領域中文核心、CSSCI、SCI、EI類型期刊論文,專業檢索式為SU=(′遙感′+′衛星′+′無人機′+′UAV′)*(′作物′+′玉米′+′大豆′+′小麥′+′水稻′+′花生′)*(′農情′+′長勢′+′產量′+′病情′+′災害′+′品質′)*(′預測′+′反演′+′估算′+′估產′),檢索日期截至2023年4月30日,共獲取該領域研究文獻303篇,去掉不相關文獻,保留168篇用于分析。
1.2研究方法
內容分析法最早應用于學術研究,旨在對文本內容進行系統分析,將繁雜信息結構化,并揭示潛在的隱藏信息。采用內容分析法,從遙感數據源獲取、植被指數選取、地面監測數據獲取、預測方法選擇及預測模型精度評價5 個角度,開展農情遙感預測研究。
2結果與分析
2.1遙感數據源獲取與分析
2.1.1遙感數據類型分析 遙感數據一般通過衛星、無人機和地面設備獲取,數據類型包括多光譜遙感數據、高光譜遙感數據、激光雷達數據、微波遙感數據和熱紅外數據,尤以多光譜和高光譜遙感數據研究較多。
多光譜數據主要來自MODIS、高分(GF)系列及Sentinel衛星數據,適于大范圍監測。高光譜數據可以提供更豐富的圖像和光譜信息,一般通過無人機或便攜式光譜儀獲取,適用于作物產量估算、葉片相對含水量反演、病蟲害預測等。激光雷達技術能夠精確獲取作物的垂直結構參數,但冠層遮擋可能影響模型精度。微波遙感技術具備全天時全天候監測能力、地表及植被穿透能力、多極化信息獲取能力,可以反演作物葉面積和生物量、預報作物產量、評估作物生長狀況等。熱紅外成像技術能夠反映作物冠層溫度,而冠層溫度與植物蒸騰及水分情況相關,適用于葉片含水量和病害脅迫研究。
2.1.2遙感數據獲取位置分析 根據研究對象不同,遙感數據獲取所覆蓋的區域也有所差別。在已有研究中,冬小麥研究數據通常覆蓋北京、河北、河南、山東、江蘇、陜西等地,玉米研究數據一般覆蓋北京、河北、河南、黑龍江、遼寧、內蒙古、山東等地,水稻研究數據主要覆蓋黑龍江、廣東、江蘇、四川、安徽等地。
2.1.3遙感數據獲取時間分析 農情預測遙感數據獲取周期一般根據作物生長周期和衛星過境周期確定。
冬小麥遙感數據采集時間一般為當年10月—次年5月,玉米為5—9月,水稻為7—10月。
綜上,農情遙感預測研究應加強多光譜、高光譜數據與微波、熱紅外、激光雷達等遙感數據的耦合使用,拓展其他區域大豆、小米等經濟作物和糧食作物研究,并對作物重要生育期進行持續觀測,研究農作物長時間尺度的生長情況。
2.2植被指數選取
植被指數是最常用的農情預測模型輸入參數,是不同波段植被—土壤系統反射率因子以一定形式組合的參數。植被指數利用作物葉片對可見光、近紅外波段的光譜反射特性,來表征地表植被覆蓋和長勢情況,并將其與土壤、水體等背景相區別[2]。
比值植被指數(RVI)是最早提出的植被指數之一,也是近紅外光波段與紅光波段反射率的比值,對高覆蓋度植被敏感,與葉面積、葉干生物量、葉綠素含量相關性高,適用于作物生物量等估算。差值植被指數(DVI)是近紅外光波段與紅光波段反射率的差值,適用于作物估產,對土壤背景變化較RVI敏感。歸一化差異植被指數(NDVI)是近紅外光波段與紅光波段反射率差值與兩者之和的比值,作為最常用的指標,NDVI可以反映農作物長勢和氮營養狀況,但在植被茂密區域靈敏度有所下降。
為了提升預測精度,研究人員提出更為復雜的植被指數。例如:歸一化綠度植被指數(GNDVI)是在NDVI基礎上提出的,其將紅光波段反射率替換為綠光波段反射率,提高了作物氮含量或籽粒含量預測能力。土壤調整植被指數(SAVI)通過增加土壤調節因子L 來降低土壤背景對冠層光譜的干擾。大氣阻抗植被指數(ARVI)考慮大氣影響,引入光學路徑效應因子γ,但其依賴實際大氣參數,預測效果不佳。增強型植被指數(EVI)綜合SAVI 和ARVI的優點,通過藍光波段糾正氣溶膠散射影響,適用于植被覆蓋度高的地區。此外,還有反演葉面積的反轉差值植被指數(IDVI),與生物量高度相關的簡單植被指數(SR),預測棉花產量的綠色葉綠素植被指數(GCVI)、綠差指數(GDVI)、冠層葉綠素含量指數(CCCI)、反演玉米葉面積的歸一化綠紅差異指數(NGRD)及葉綠素植被指數(CVI)等。
綜上,結合多波段組合的植被指數或多種植被指數建立起來的預測模型,可以提高預測精度,但受環境、大氣等多種因素影響,這種模型具有地域性和時效性。為保證農情預測模型的精確性,在構建模型時需謹慎選用植被指數。
2.3地面監測數據獲取
地面監測數據是評價作物長勢、品質和生產能力的重要指標,對于農業生產決策具有重要參考意義。測量指標主要包含葉面積指數LAI、產量、葉綠素含量、地上部生物量、生物量、葉片含水量、葉片氮含量、地上部氮積累量、土壤含水量等地面數據。
葉面積指數是衡量作物長勢和估測產量的重要指標。傳統測定方法具有破壞性,目前常利用CI-203型激光葉面積儀、LAI-2200C型植物冠層分析儀等專業儀器測定,也可采用長寬系數法、比葉質量法測定。
產量數據獲取分為理論測產和實收測產兩種方式。理論測產按照公式產量=穗數×穗粒數×千粒質量×測產系數計算,測產系數常用0.85,但實收產量可能高于理論值,故有學者建議調整系數為0.90,或根據收獲方式進行修正。實收測產利用谷物水分測量儀測定作物籽粒含水量,按照13%或14%的產量水分折合計算。有學者發現理論測產與實收測產顯著正相關,采用九點隨機取樣法測產能夠較好地反映田間產量[3]。
葉綠素與光合作用相關,影響作物長勢和產量。利用便攜式SPAD-502葉綠素儀無損測定葉綠素的相對值,并通過公式轉換為植被單位葉片面積的葉綠素含量。此外,也可利用植物養分測定儀TYS-3N、Dualex4氮平衡指數測量儀等測量工具。
生物量是表征作物生命活動的重要參數,與作物長勢和產量息息相關,常采用烘干稱質量法測定。
葉片含水量是反映作物水分情況的重要指標,采用烘干法測定,即把作物樣品的莖、葉分離,稱取葉片鮮質量,再將樣品放入烘箱殺青、烘干至質量恒定,稱取葉片干質量,按照公式(鮮質量-干質量)/鮮質量×100%計算。
氮素是影響作物產量和品質的營養元素之一,氮積累量是預測作物長勢和品質的重要指標。將葉片烘干粉碎,采用凱氏定氮法測定葉片含氮量,計算葉片氮積累量。
目前大多數方法根據葉面積指數、葉綠素含量等單個地面監測數據對作物生長狀況進行評估和預測,將這些數據組合來進行評估和預測的研究相對較少。有學者為了更好地評價作物生長狀況,將反映作物長勢的參數按一定比例綜合成一個新的評價參數,再結合遙感指標建立預測模型。
2.4預測方法選擇
農情遙感預測是通過建立遙感參數與地面數據的反演模型來實現的,預測方法主要包括傳統統計回歸、機器學習、結合作物模型和深度學習。
傳統統計回歸方法主要包括經驗回歸模型、一元線性回歸、多元線性回歸和逐步回歸。根據遙感指標構建預測模型的回歸方法主要分為兩種:一種是分析遙感指標與農情變量相關性,選擇高相關性的指標進行回歸分析;另一種是直接將所有指標與農情變量進行回歸分析,確定最佳預測模型。傳統統計回歸方法簡單有效、技術門檻低,是常用的反演模型構建方法。
機器學習方法包括隨機森林(Random Forest,RF)、偏最小二乘法(Partial Least Squares Regression,PLSR)、支持向量機(Support Vector Machine,SVM)、BP 神經網絡(Back Propagation Neural Network,BPNN)等,通過建立輸入變量(遙感參數指標)與輸出變量(地面監測數據)間復雜關系來提高預測精度。機器學習方法能夠提高反演精度,但是缺少明確的回歸關系,需要防止模型過度擬合。
遙感數據與作物生長模型結合,通過驅動法和同化法實現。常用模型有PROSAIL模型和WOFOST模型。由于模型參數較多,構建普適性模型較難,故在使用前須進行本地化,以保證模擬結果更精準。
深度學習模型一般采用循環神經網絡(Recurrent Neural Network,RNN)和卷積神經網絡(Convolutional Neural Networks,CNN)框架。RNN 利用數據相關性進行遞歸學習,而CNN則通過深度結構和卷積計算挖掘數據間的潛在規律,實現高效并行學習[4]。長短期記憶(LSTM)和門控循環單元(GRU)作為RNN的變體,適用于長勢和產量預測研究。深度學習模型依賴大樣本。
在機器學習和深度學習方法的應用過程中,訓練數據和驗證數據的確定通常有3種方式:一是按照7∶3劃分訓練數據和驗證數據;二是選擇連續多年的數據作為訓練集,后一年的數據作為驗證集;三是選擇連續多年的數據逐年作為驗證集,其余年份的數據作為訓練集。
2.5預測模型精度評價
農情遙感預測模型評價采用訓練數據構建預測模型,利用驗證數據和特定指標來評估模型精度。常用評價指標有R2和RMSE,R2表示實測值與模擬值的擬合程度,RMSE 表示偏離程度。一般選用兩者組合評價模型精度,R2越接近1,RMSE 越接近0,表明模型精度越高。
除了R2 和RMSE,RF 預測模型評價指標還會選擇MAE、MAPE、RRMSE 或nRMSE 中的一種,用于判斷樣本誤差的離散程度。
3結語
為了實施國家糧食安全戰略,促進糧食生產穩定發展,為農業管理和決策提供更具價值的支持,應在農情遙感預測研究方面進一步拓展農作物類型范圍,除了關注特定區域小麥、玉米和水稻之外,還應考慮其他區域的經濟作物和糧食作物。此外,關于農情遙感預測的精準性,需在以下方面深入研究:1) 多源數據集成分析。利用不同遙感數據源的優勢,探索數據融合方法和技術,將遙感時間序列數據與氣象數據、土壤數據、地面監測數據等集成,建立基于時空動態的農情模型,從而更準確地預測農作物季節性變化和生長趨勢。2) 植被指數改進。采用多個植被指數組合,綜合利用不同波段信息,增強農作物生長感知,構建不受環境干擾且具有研究特色的新型植被指數。3) 預測方法優化。深度學習在處理小樣本、高維度農情數據時存在一定的局限性,可采用遷移學習、生成對抗網絡等方法增加訓練樣本,提升模型性能,并探索解釋深度學習模型的預測結果,提供可解釋的決策支持,增強模型的可解釋性。