劉建春,陳思,文波龍,劉宏遠,李曉峰
(1.吉林建筑大學 測繪與勘查工程學院,長春 130118;2.中國科學院東北地理與農業生態研究所,長春 130102;3.中國科學院長春凈月潭遙感實驗站,長春 130102;4.中國科學院東北地理與農業生態研究所 濕地生態與環境重點實驗室,長春 130102)
株高作為作物表型信息的重要組成部分,被廣泛應用于作物的葉面積指數(leaf area index,LAI)估算[1-2]、生物量估算[3]以及產量估測[4]等,是評價作物長勢的重要監測指標[5]。精準、無損、高效地獲取水稻株高信息,對于水稻長勢的精準監測具有重要意義[6-7]。傳統作物株高測量方法主要為測量作物的自然株高、葉枕株高或生理株高等[8]。這些方法效率低、破壞性強,不能滿足現代化農業的精準監測需求。
無人機遙感憑借其操作靈活、效率高和無損監測等眾多優勢被廣泛應用于農業精準監測中[9-10]。在株高監測方面,通過無人機搭載傳感器獲取地面數據并建立株高反演模型的方法,目前已被廣泛應用于玉米[11]、小麥[12]等農作物的株高估測研究中,為作物株高提取提供了新方法[13]。
目前基于無人機遙感技術提取株高主要有基于無人機搭載激光雷達構建點云模型提取株高法[14]、利用數碼相機采集實驗區表面模型相減法[15]以及植被指數株高估測模型構建法等[16]。周夢維等[17]基于無人機搭載小光斑全波形激光雷達(light detection and ranging,LiDAR)反演作物高度,取得了良好成果,但受LiDAR數據處理方法繁瑣及設備成本高昂等影響,限制了LiDAR在農業監測領域的發展。相對于LiDAR昂貴的價格,數據處理簡單且價格較為低廉的無人機載RGB相機,在作物株高反演研究方向上被廣泛應用。劉治開等[18]通過無人機搭載高清數碼相機獲取冬小麥不同生長期的數字表面模型(digital surface model,DSM),與裸土期DSM做差,最終求得作物高度模型(crop height model,CHM),表明了利用無人機拍攝的高清數碼影像可快速估算冬小麥的株高。顏安等[19]通過無人機搭載數碼相機獲取棉花育種區DSM和高清數字正射影像(digital orthophoto model,DOM),利用克里金插值法提取育種區棉花株高并與實測株高進行回歸分析,結果表明,提取的棉花株高與實測株高具有良好的擬合性。Kawamura等[20]采用地面采樣距離為1 cm的無人機影像提取泰國旱稻的高度值并用簡單的線性回歸進行分析,測量株高與估算株高最佳決定系數(R2)為0.712,均方根誤差(root mean square error,RMSE)為9.142 cm。在構建作物DSM時,零星的水稻葉尖點云數據可能會被認定為異常值被剔除,而采用植被指數(vegetation index,VI)株高估測模型估測作物株高可避免這種問題。李燕強等[21]基于不同品種冬小麥光譜指數株,構建了冬小麥株高估測模型,估測模型R2=0.85,驗證模型R2和RMSE分別為0.86和4.27 cm。
目前在基于無人機遙感技術估測作物株高方向上,主要體現于對生長環境穩定的陸生作物的研究,而對于水稻這種禾本科一年生水生草本作物還鮮有研究。本研究基于無人機搭載一體式多光譜成像系統獲取的研究區DOM、DSM和無人機多光譜影像數據,結合水稻株高實測數據,主要研究以下問題:探究基于多光譜遙感技術估測水稻株高的可行性;對比不同株高估測方法提取水稻株高的精度。
研究數據于吉林省大安市水稻示范區采集,該地地處吉林西部,屬中溫帶季風氣候,土質濕潤、土地肥沃,適合水稻的大面積種植。
研究區內水稻種植面積為13.6 ha,種植的水稻為在東北地區具有良好代表性的中晚熟香型水稻品種——吉宏6號,生育期約138 d。同時,該地為了對比在不同土壤條件下水稻生長適應性,每個稻田內都經過了不同的處理,所以不同稻田內的水稻長勢各不相同,但同一稻田內水稻株高變化不大。在各稻田內遠離田埂的地方共設置48個采樣小區,以采集具有一定群體代表性的研究數據。小區分布位置如圖1所示。

圖1 研究區概況及采樣小區空間位置分布
1)地面數據獲取。于8月15日對采樣區內的株高進行測量,隨機選擇采樣區內3株未倒伏的水稻,用卷尺測量自然狀態下水稻根部到水稻最頂端的距離(圖2),取3株水稻株高的均值作為采樣區內水稻的實測株高。

圖2 水稻株高測量示意圖
2)無人機多光譜數據獲取及預處理。無人機多光譜數據采集與地面數據獲取同步進行。本次實驗所用的數據采集設備為大疆創新科技有限公司生產的精靈4多光譜版無人機(P4 Multispectral,P4M),其采用的三軸穩定云臺使得無人機在高速飛行的狀態下也能拍攝出穩定的畫面。同時,RTK高精度定位結果實時補償至相機CMOS中心,實現了精準定位。集成6個型號為FC6360的1/2.9英寸CMOS影像傳感器,可排除環境光對數據采集的干擾。其中,1個彩色傳感器用于常規可見光(RGB)成像,5個單色傳感器用于常規多光譜(紅、綠、藍、紅邊、近紅外)成像,相機單個傳感器有效像素208萬,分辨率為1 600像素×1 300像素,光圈為f/2.2,焦距為6 mm。

表1 無人機多光譜影像采集系統參數及飛行設置
將采集后的影像數據導入大疆智圖內進行影像數據拼接處理,得到地面采樣距離為0.015 m的5個波段的反射率數據以及DSM和DOM。根據測量軟件ArcGIS10.6,結合DSM,利用編輯工具繪制研究區的面矢量文件,結合DSM和DOM通過點繪水面點法提取水面高程,將高程賦值到面矢量文件中生成研究區內數字高程模型(digital elevation model,DEM)。利用編輯工具繪制采樣小區的面矢量文件,使用統計工具計算小區內水稻反射率均值作為采樣小區的水稻冠層反射率,具體的操作流程如圖3所示。

圖3 無人機影像數據預處理流程
將植被指數與水稻株高進行相關性分析,根據皮爾遜相關系數(Pearson)評價植被指數與水稻株高間的相關性并優選植被指數。基于優選后的單個植被指數采用一元線性、指數、對數及冪函數回歸方法與實測株高進行回歸分析。分別利用逐步回歸、嶺回歸和隨機森林回歸進行多植被指數水稻株高估測模型的構建。本次實驗所用的模型均在SPSSPRO中完成。
采用決定系數R2和RMSE對水稻株高估測模型進行評價。R2越接近1,表明方程的自變量對株高的解釋能力越強,同時與之對應模型的RMSE越小,觀測值與真實值之間的偏差越小,表示對株高的估測精度越高。
本次實驗共采集了48份水稻實測株高數據,其中隨機選取32份數據作為建立水稻株高估測模型的訓練集,剩余16份數據作為檢驗模型精度的驗證集,各樣本的特征統計結果如表2所示。

表2 水稻株高的統計特征
其中訓練集水稻株高在68.33~121.50 cm之間,相對于總樣本來說分布均勻、區間合理,變異系數為0.157,呈輕度變異,用于構建的模型適應性強。驗證集相比總樣本變化不大,能夠有效地評價模型估測精度。
植被指數是兩個或多個波段反射率間的不同組合,可根據植被指數對地表植被進行精準、有效的分析。目前已有多種植被指數被發現并應用于農業研究當中[22],本實驗共選取28種常見的植被指數用于水稻株高反演研究,主要指數的計算公式可參考文獻[23-25]。
將選取的28種植被指數分別與水稻株高進行 Pearson相關性分析,分析結果如圖4所示。所選擇的28種植被指數與水稻株高相關系數絕對值均大于0.5,相關系數絕對值最高為0.800,對應植被指數為MCCCI,相關系數絕對值最低為0.522,植被指數為NPCI。其中OSAVI、NDRE、DATT、SAVI、MSR、EVI、EVI2、NDVI、CIre、TNDVI、MTCI、GOSAVI、SR、RVI、TVI、DVI、GDVI、GNDVI、SIPI、NGI與水稻株高的相關系數介于0.7~0.8之間,GRVI、CIg、VARI、PSRI與水稻株高的相關系數絕對值介于0.6~0.7之間,NRI、NDGI、NPCI與水稻株高的相關系數絕對值介于0.5~0.6之間,說明所選的植被指數與水稻株高間存在相關關系,可以擇優選取植被指數建立水稻株高估測模型。

圖4 多光譜植被指數與水稻株高相關性矩陣
根據圖4的分析結果,將相關系數絕對值按從大到小排序,選擇排在前50%的14種植被指數作為本次實驗的優選指數,結果如表3所示。這些植被指數與水稻株高的相關系數絕對值均大于0.7,與水稻株高呈0.01級別顯著性水平相關關系,可以進行建模分析。

表3 多光譜植被指數與水稻株高相關系數絕對值及排序
選取表3中的植被指數,分別利用一元線性、指數、對數、冪函數回歸方法與水稻株高進行回歸分析,并根據模型R2選擇擬合程度最好的回歸方程,分析結果如表4所示。

表4 優選植被指數與水稻株高一元回歸模型
根據表4可以看出,所有回歸模型均有較好的擬合性,整體R2在0.573~0.650之間,RMSE在8.86~9.65 cm之間,其中MCCCI與水稻株高建立的冪函數回歸模型效果最好,R2為0.650,RMSE為8.86 cm;植被指數GOSAVI與水稻株高建立的一元線性回歸模型效果最差,R2為0.573,RMSE為9.65 cm。所以,根據R2最大及對應的RMSE最小原則,認為基于MCCCI構建的冪函數回歸水稻株高估測模型效果最好,回歸方程如式(1)所示。
H=184.583MCCCI0.727
(1)
選取與水稻株高相關性系數絕對值排在前50%的植被指數作為自變量用于構建水稻株高嶺回歸估測模型。根據回歸結果,手動剔除與水稻株高相關性較低的植被指數,直至方程所用植被指數與水稻株高呈顯著性水平強相關關系,結果如表5所示。
模型Ⅵ和模型Ⅶ的R2分別為0.703和0.704,RMSE均為8.04 cm,使用的植被指數相對最少但模型的擬合效果和精度變化不大,且輸入自變量與水稻株高均呈0.01水平強相關關系,所以認為采用植被指數MCCCI和SAVI構建的嶺回歸株高估測模型效果最好,模型方程如式(2)所示。
H=33.947+95.767MCCCI+38.921SAVI
(2)
根據分析結果,選取對應的14種植被指數作為自變量,實測株高作為因變量進行水稻株高逐步回歸模型的構建,結果如表6所示。結果表明,在模型不斷剔除與水稻株高不相關變量后,得到模型Ⅰ和模型Ⅱ的R2分別為0.640和0.710,RMSE分別為8.86 cm和7.95 cm。根據R2最大及對應的RMSE最小原則,認為采用植被指數MCCCI和EVI2構建的逐步回歸水稻株高估測模型效果最好,模型方程如式(3)所示。

表6 優選植被指數與水稻株高一元回歸模型
H=33.167+108.069MCCCI+29.659EVI2
(3)
根據表3的篩選結果,將篩選后的14種植被指數作為隨機森林回歸模型的輸入變量,輸入到模型中進行重要性分析,首次重要性分析結果如圖5所示,植被指數MCCCI、SAVI、EVI、EVI2在模型中所占重要性超過10%。剔除重要性小于10%的植被指數繼續重復上述工作。隨著輸入變量的減少,模型中剩余的植被指數所占重要性會相應提高,因此用于剔除植被指數的重要性占比閾值也要逐步增加,所以繼續剔除重要性占比小于20%、30%的不重要變量,共構建了4個隨機森林水稻株高估測模型,結果如表7所示。

表7 隨機森林水稻株高估測模型精度對比

圖5 光譜植被指數重要性分析圖
根據表7可以看出,雖然在用于構建隨機森林回歸模型的輸入變量減少,但是模型精度逐漸提高,最好的隨機森林水稻株高估測模型為模型Ⅲ,采用植被指數MCCCI、SAVI、EVI2重要性占比分別為26.20%、41.80%和32.00%,模型R2為0.946,RMSE為3.44 cm。
地面數字高程模型DEM由拼接生成的地面數字表面模型DSM結合高清數字正射影像DOM經ArcGIS10.6賦值生成。通過式(4)計算DSM與DEM間的差求得水稻株高模型CHM0。
CHM0=DSM-DEM
(4)
通過ArcGIS10.6提取采樣小區內CHM0的平均值作為該采樣小區的株高。由于稻田內水的存在,提取后的采樣小區株高只是水面以上的株高,所以還需要選取與植被指數構建水稻株高估測模型相同的訓練集數據,將水稻水面株高與水稻實測株高分別進行一元線性回歸、指數回歸、對數回歸和冪回歸,并篩選出最優回歸模型,結果如表8所示。

表8 根據DSM提取水面以上水稻株高估測模型
將剩余的16份數據作為驗證集代入到各個模型中,并統一以一元線性回歸方程檢驗預測值與真實值間的擬合程度計算方程的決定系數和均方根誤差,結果如圖6所示。R2在0.876~0.666之間,RMSE在5.15~8.44 cm之間。其中采用植被指數MCCCI與水稻株高構建的冪函數水稻株高估測模型效果最好,R2為0.876,RMSE為5.15 cm;隨機森林水稻株高估測模型擬合精度較低,R2為0.666,RMSE為8.44 cm。綜上所述,可以確定在本次實驗中,采用植被指數MCCCI構建的冪函數水稻株高估測模型效果最好,擬合精度最優,整體實驗區株高估測結果如圖7所示。

圖7 實驗區水稻株高估測結果
隨著無人機遙感技術的普及,其被廣泛應用于農作物株高估測當中,但在水稻的整個生育期內,稻田內大部分時間都有水的存在且水深不一,這給水稻株高估測研究帶來極大的困難。基于DOM、DSM可以根據賦值做差法提取水稻的水面株高,而要想獲得真正的水稻株高還要進行二次建模,最終得到的結果與前人的結果基本一致。但是,根據此方法估測水稻株高,步驟極為繁瑣,且存在誤差。在根據DOM、DSM提取水面點時,考慮到每個稻田內都為獨立的水平面,所以直接將去除異常值后每個地塊的數據求均值作為對應地塊的水面高程,通過對面文件賦值生成最終的DEM,但受水稻枝葉以及水面漂浮物的影響,提取到的點可能并不是真實的水面點,導致生成的DEM與實際值有誤差,最終會對水稻株高的估測精度造成影響。同時,由于無人機根據點云數據生成DSM,而水稻葉尖處點云數據比較稀疏,也極有可能在影像拼接時就被系統認定為噪聲去除,因此基于DSM提取水稻株高具有很大的局限性。
植被指數能夠反映水稻長勢的優劣,而水稻長勢不同則生物量不同,因此能夠建立光譜指數與株高的關系,進而反演水稻株高。本研究共采集了48份無人機多光譜遙感數據和地面實際觀測數據,隨機選擇32份數據結合植被指數與水稻株高構建水稻株高估測模型,并將剩余的16組數據作為驗證集帶入到估測模型中進行檢驗,R2在0.666~0.876之間,表明基于無人機多光譜植被指數可以構建水稻株高估測模型。
其中采用隨機森林回歸模型構建的水稻株高估測模型訓練精度比較好,R2為0.946,但是驗證模型的擬合度和精度很差,這可能是機器學習需要大量的樣本來實現模型的泛化能力,而本次實驗只選擇了38組數據作為訓練集,致使隨機森林株高估測模型效果不好。想要訓練一個精準的隨機森林估測模型需要一個龐大的數據用于模型的訓練,對于大面積水稻株高估測研究,龐大的工作量給這項工作帶來了一定的負擔,因此需要一個所需數據少且估測精度高的模型來完成此項工作。
本研究發現,采用改良后冠層葉綠素含量指數MCCCI構建的冪函數水稻株高估測模型結果最好,R2為0.876,優于其他模型,且該模型僅采用一個植被指數,需要的數據量少,具有簡潔、高效,引入誤差少,實用性強的特點。水稻長勢不同葉綠素含量也不同,植被指數MCCCI的值也會因此而變化,本實驗用于建模的數據能夠代表部分生長階段的水稻長勢,因此該模型可以用于部分生育期內水稻株高的估測。
雖然本次實驗取得了良好的結果,但是,受不同品種水稻植株性狀以及生物量等因素的影響,相同長勢下不同品種水稻的光譜指數值會有差別,因此該模型對于其他品種的水稻株高估測可能還具有局限性。若想提高該模型的普適性,可參照本文的理論方法,采集更多品種、更全長勢的水稻數據,以獲得一個高通量水稻株高估測模型,進而還可以進行感興趣點水稻株高的估測,即輸入某點位的光譜數據,可直接反演出該處水稻株高。該技術的成熟發展,對于農業的精準監測有重要的實際意義。
本研究以無人機搭載多光譜傳感器獲取水稻種植區域單通道反射率數據、DOM、DSM、DEM數據,并基于上述數據計算多種植被指數,結合地面實測水稻株高進行株高估算模型的構建。基于上述過程得出以下結論。
1)基于無人機多光譜遙感數據獲取水稻冠層光譜反射率數據并計算植被指數,最終構建的水稻株高估測模型精度良好,模型驗證集最好結果R2=0.876,RMSE=5.15 cm,可以用于水稻株高的估測,為提取水稻株高提供了新方向。
2)基于植被指數MCCCI構建的冪函數水稻株高估測模型(R2=0.876,RMSE=5.15 cm)優于基于DSM提取的水稻株高估測模型(R2=0.774,RMSE=6.99 cm),優于基于植被指數MCCCI、SAVI、EVI2構建的隨機森林的水稻株高估測模型(R2=0.666,RMSE=8.44 cm),可用于部分長勢水稻株高的估測和對比。
致謝:文章中實驗基地和實測數據由吉林省大安市水稻示范區提供,無人機數據由任旭陽、王智、丁天雨采集,同時李雷、王錫剛、李鑫彪、魏佳佳、陳嘉惠、王彬在數據處理中給予了技術指導。在此,對各位提供的幫助表示由衷的感謝。