田宸宇,魯逸飛,劉永建,簡(jiǎn)思春,曾銀銳,楊興有,魯黎明*
(1.四川農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,成都 611130;2.成都淞幸科技有限責(zé)任公司,成都 610225;3.中國(guó)煙草總公司四川省公司,成都 610041)
農(nóng)業(yè)遙感輻射傳輸建模,其實(shí)質(zhì)就是通過(guò)建立一種定量的模型,用來(lái)描述遙感觀測(cè)信號(hào)與地表農(nóng)作物的特征與屬性之間的關(guān)系,是對(duì)地表農(nóng)作物的特征參量進(jìn)行定量反演的前提[1]。
傳統(tǒng)檢測(cè)方法,例如野外實(shí)地采樣,或者實(shí)驗(yàn)室分析測(cè)試,雖然測(cè)量精度高但存在較強(qiáng)的破壞性且難以實(shí)現(xiàn)大面積、高通量的動(dòng)態(tài)監(jiān)測(cè);而衛(wèi)星遙感影像受大氣等因素的影響較大,反演精度不理想。近年來(lái),作為新型低空遙感平臺(tái),無(wú)人機(jī)很好地彌補(bǔ)了衛(wèi)星遙感的不足,其體積小、重量輕、分辨率高且成本低,可以實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè),適合中小尺度范圍和高頻次的調(diào)查研究。所以,利用無(wú)人機(jī)遙感,開(kāi)展農(nóng)作物的長(zhǎng)勢(shì)與表型特征的高通量分析,就成為了當(dāng)前農(nóng)業(yè)遙感應(yīng)用的熱門領(lǐng)域[2]。隨著圖像識(shí)別技術(shù)的不斷進(jìn)步及各類數(shù)學(xué)模型的開(kāi)發(fā),農(nóng)作物多種特征參量反演模型的構(gòu)建也越來(lái)越成熟。本文就常見(jiàn)的建模方法進(jìn)行介紹,以期為高效、高精度建模方法的探索提供參考。
回歸分析,是揭示呈因果關(guān)系的相關(guān)變量間的聯(lián)系形式,建立變量之間的回歸方程,利用所建立的回歸方程,由自變量預(yù)測(cè)、控制因變量。一元回歸分析,是研究1個(gè)自變量與1個(gè)因變量的回歸分析;而多元回歸分析(MLR)則是研究多個(gè)自變量與1個(gè)因變量的回歸分析。在實(shí)際應(yīng)用中,一般以光譜參數(shù)/植被參數(shù)/紋理參數(shù)/顏色參數(shù)為自變量x,某一個(gè)農(nóng)藝參數(shù)的實(shí)測(cè)值為因變量y,通過(guò)建立多元回歸分析模型來(lái)估測(cè)實(shí)測(cè)值y[3]。
陶惠林等[4]利用多元線性回歸,構(gòu)建了冬小麥挑旗期、開(kāi)花期與灌漿期3個(gè)不同生育期葉面積指數(shù)(LAI)的估測(cè)模型。在7種光譜參數(shù)中,與LAI相關(guān)性最高的參數(shù)分別是NDVI(r=0.738)、SR(r=0.819)、NDVI×SR(r=0.835),LAI-MLR為冬小麥LAI的最佳估測(cè)模型,其中,開(kāi)花期擬合性最好,精度最高。
劉帥兵等[5]基于無(wú)人機(jī)圖像數(shù)據(jù),建立了能夠反演冬小麥氮素含量的多元線性回歸模型。通過(guò)決定系數(shù)(R2)、均方根誤差(RMSE)和歸一化的均方根誤差(nRMSE)3個(gè)指標(biāo),明確該模型是最佳模型,反演精度較高,能夠應(yīng)用于冬小麥氮肥管理決策。
偏最小二乘回歸法(PLSR)在某種意義上結(jié)合了多元線性回歸分析、典型的相關(guān)分析及主成分分析等較為經(jīng)典的統(tǒng)計(jì)學(xué)方法,是通過(guò)用最小化誤差的平方和而篩選出能夠匹配特定函數(shù)的另外一組數(shù)據(jù)最佳數(shù)據(jù)。現(xiàn)階段的很多優(yōu)化問(wèn)題,可用最小二乘法來(lái)加以解決。
朱婉雪等[6]及趙曉慶等[7]分別采用PLSR建立了不同植被指數(shù)與產(chǎn)量之間的回歸模型。模型的檢測(cè)結(jié)果表明,其對(duì)產(chǎn)量的反演精度均較高。
在利用高光譜數(shù)據(jù)反演冬小麥全蝕病病情指數(shù)的研究中,郭偉等[8]將3類光譜指數(shù)與DI構(gòu)建偏最小二乘回歸模型,得到較為理想的結(jié)果。
值得注意的是,由于PLSR包含主成分分析,建模時(shí)要對(duì)數(shù)據(jù)進(jìn)行降維,入選變量的物理意義較難理解,建立的模型相對(duì)復(fù)雜,不利于模型的推廣與應(yīng)用。
逐步回歸分析,在建立回歸方程時(shí),采用的是逐步引入自變量的方式。在所有可能的自變量中,按照自變量對(duì)因變量作用的顯著程度,從大到小依次逐個(gè)引入擬建立的回歸方程中。在所建立的最終回歸方程中,所有的自變量的偏回歸平方和經(jīng)過(guò)檢驗(yàn)都是顯著的。
陳浩等[9]采用與實(shí)測(cè)葉綠素含量極顯著相關(guān)的9種植被指數(shù),構(gòu)建了基于遙感光譜指數(shù)的夏玉米冠層葉綠素含量遙感監(jiān)測(cè)模型。結(jié)果表明,綠色歸一化植被指數(shù)與葉綠素含量的相關(guān)性系數(shù)最高,達(dá)到了0.892。采用逐步回歸分析方法建立的模型表現(xiàn)最優(yōu),決定系數(shù)為0.87,均方根誤差及相對(duì)誤差分別為0.15和2.68%。
田明璐等[10]和魏青等[11]也分別采用多元逐步回歸法,構(gòu)建了棉花與冬小麥的植物相對(duì)葉綠素含量(Soil and Plant Analyzer Development,SPAD)反演模型,建模效果較好。
支持向量機(jī),也叫支持向量網(wǎng)絡(luò)(support vector machines,SVM),于1964年提出,20世紀(jì)90年代后得到快速發(fā)展,并被逐步理論化而成為統(tǒng)計(jì)學(xué)習(xí)理論的一個(gè)分支。近年來(lái),SVM在高光譜數(shù)據(jù)反演建模中得到了較為廣泛的應(yīng)用。
王瑛[12]將NDVI、RVI、DVI、SAVI和TVI植被指數(shù)組合作為輸入量,葉面積指數(shù)為輸出量,進(jìn)行支持向量機(jī)模型的構(gòu)建,對(duì)小麥的葉面積指數(shù)進(jìn)行反演,并對(duì)模型進(jìn)行精度評(píng)價(jià)。結(jié)果表明,支持向量機(jī)模型效果較好,決定系數(shù)達(dá)0.828,均方根誤差為0.411。
田軍倉(cāng)等[13]采用偏最小二乘、支持向量機(jī)及BP神經(jīng)網(wǎng)絡(luò)模型,進(jìn)行了番茄冠層不同位置SPAD值的預(yù)測(cè)建模及驗(yàn)證。結(jié)果表明,番茄冠層上層葉片SPAD值與植被指數(shù)相關(guān)性程度及線性敏感程度,優(yōu)于冠層中層和下層葉片;基于番茄冠層上、中、下層及整個(gè)冠層SPAD值建立的支持向量機(jī)預(yù)測(cè)模型的R2高于偏最小二乘和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。
BP神經(jīng)網(wǎng)絡(luò)(back propagation neuron network,BPNN),是目前無(wú)人機(jī)高光譜遙感反演模型較為常見(jiàn)的建模方法之一。同時(shí),也是應(yīng)用范圍較為廣泛的神經(jīng)網(wǎng)絡(luò)模型。在農(nóng)業(yè)遙感建模實(shí)踐中,運(yùn)用較多的是反向傳播神經(jīng)網(wǎng)絡(luò)。
紀(jì)偉帥等[14]在棉花冠層SPAD的遙感定量反演建模中,采用BP神經(jīng)網(wǎng)絡(luò)(BPNN)、多元逐步回歸(MSR)和支持向量機(jī)(SVM)方法構(gòu)建棉花SPAD值定量分析模型。結(jié)果表明,基于BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行棉花葉片SPAD的空間分布反演,反演值與實(shí)測(cè)值具有高度一致性,BPNN模型精度最高,擬合結(jié)果較好。
喬浪等[15]建立了能夠反演大田玉米葉綠素含量的BP神經(jīng)網(wǎng)絡(luò)模型。利用該模型,能夠反演出大田玉米冠層的葉綠素含量,并可以通過(guò)可視化技術(shù),繪制出大田玉米葉綠素含量分布圖。通過(guò)分析田間玉米冠層葉綠素含量分布圖,可以直觀區(qū)分田間道路與冠層區(qū)域,顯示地塊葉綠素分布差異,可為田間作物長(zhǎng)勢(shì)評(píng)價(jià)和精細(xì)化管理提供技術(shù)支持。
隨機(jī)森林(random forest,RF)也是一種算法模型,2001年由Breiman和Cutler提出,是優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí),如BP神經(jīng)網(wǎng)絡(luò)的新一代模型算法。RF算法的基礎(chǔ)是分類樹(shù)或者叫決策樹(shù)。隨機(jī)森林模型的運(yùn)算速度快、預(yù)測(cè)精度高,尤其在進(jìn)行大數(shù)據(jù)運(yùn)算時(shí),其優(yōu)勢(shì)更為突出。同時(shí),RF避免了多元共線性等問(wèn)題,也不需要進(jìn)行變量的選擇。因此,隨機(jī)森林在農(nóng)業(yè)遙感實(shí)踐中得到了較為廣泛的應(yīng)用。
孔繁昌等[16]使用隨機(jī)森林算法,對(duì)高寒地區(qū)粳稻穗頸瘟的無(wú)人機(jī)高光譜遙感識(shí)別進(jìn)行了分類建模具有可行性分析。在所有輸入?yún)?shù)中,使用多種植被指數(shù)構(gòu)成的CVIs作為輸入?yún)⒘康慕r?yàn)證精度最高為90%,建模結(jié)果可以用來(lái)識(shí)別大田穗頸瘟。
馬怡茹等[17]發(fā)現(xiàn),棉花冠層LAI敏感響應(yīng)波段集中在可見(jiàn)光(400~780 nm)和近紅外(900 nm之后)波段;使用RFR建立的LAI監(jiān)測(cè)模型精度最高,穩(wěn)定性最好,其中以FDR-SFLA-RFR模型最佳。建模集的決定系數(shù)為0.74,均方根誤差為1.648 3,相對(duì)均方根誤差為26.39%;驗(yàn)證集的決定系數(shù)、均方根誤差分別為0.67、1.622 0,相對(duì)均方根誤差為25.97%。
王玉娜等[18]發(fā)現(xiàn),任意冬小麥2波段光譜指數(shù)對(duì)氮素營(yíng)養(yǎng)指數(shù)更為敏感,與氮素營(yíng)養(yǎng)指數(shù)均達(dá)到了極顯著性相關(guān);基于差值光譜指數(shù)和紅邊歸一化指數(shù)的單個(gè)光譜參數(shù)構(gòu)建的模型,具有粗略估算氮素營(yíng)養(yǎng)指數(shù)的能力,相對(duì)預(yù)測(cè)偏差分別為1.53和1.56;基于隨機(jī)森林回歸構(gòu)建的多變量冬小麥氮素營(yíng)養(yǎng)指數(shù)估算模型具有極好的預(yù)測(cè)能力,模型決定系數(shù)為0.79,均方根誤差為0.13,相對(duì)預(yù)測(cè)偏差為2.25。
目前,我國(guó)基于低空光譜成像技術(shù)獲取農(nóng)情信息還處于起步階段,低空光譜成像遙感機(jī)理性研究比較缺乏,特定信息遙感解析模型有待完善,不同因素對(duì)特定信息解析模型的影響規(guī)律有待深入研究。采用的反演方法均為傳統(tǒng)經(jīng)驗(yàn)統(tǒng)計(jì)模型或機(jī)器學(xué)習(xí)回歸模型,模型的精度受數(shù)據(jù)集劃分的影響,且對(duì)不同地區(qū)和條件普適性有待研究。下一步,可以考慮物理模型或建立混合模型,同時(shí),引入深度學(xué)習(xí)等模型,以提高模型的適用能力與穩(wěn)定性。
隨著農(nóng)業(yè)遙感技術(shù)水平的不斷進(jìn)步,在智慧農(nóng)業(yè)應(yīng)用場(chǎng)景中,利用無(wú)人機(jī)平臺(tái)對(duì)農(nóng)作物進(jìn)行長(zhǎng)勢(shì)監(jiān)控,獲取多元遙感數(shù)據(jù),將會(huì)成為常態(tài)化的趨勢(shì)。而對(duì)所獲取的海量的光譜數(shù)據(jù)進(jìn)行處理與分析,將會(huì)對(duì)算法模型提出越來(lái)越高的要求。可以預(yù)見(jiàn)的是,在不久的將來(lái),更加適合于農(nóng)情監(jiān)測(cè)的、速度更快、精度更高的新算法模型必將不斷涌現(xiàn),農(nóng)作物生長(zhǎng)的實(shí)時(shí)監(jiān)測(cè)將會(huì)越來(lái)越普遍,并且將會(huì)越來(lái)越智能化、輕簡(jiǎn)化。