999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Sentinel-2影像和機器學習算法的冬小麥秸稈覆蓋度遙感估算

2023-04-25 08:49:02朱奇磊徐新剛安曉飛陳立平楊貴軍黃林生許思喆
麥類作物學報 2023年4期
關鍵詞:特征模型

朱奇磊,梁 棟,徐新剛,安曉飛,陳立平,楊貴軍,黃林生,許思喆

(1.安徽大學電子信息工程學院,安徽合肥 230601;2.北京市農林科學院信息技術研究中心,北京 100097;3.北京市農林科學院智能裝備技術研究中心,北京 100097;4.安徽大學 農業生態大數據分析與應用技術國家地方聯合工程研究中心,安徽合肥 230601)

作物秸稈是指收獲后殘留在農田地表的作物剩余物質。作物秸稈覆蓋于農田土壤表面,具有減少土壤水分蒸發和減緩土壤風化的作用[1]。同時,秸稈還田也有助于提高農田土壤肥力,是保護性耕作的重要內容[2-3]。作物秸稈覆蓋度(crop residue coverage,CRC)指單位面積田塊中秸稈覆蓋所占的比例,是表征作物秸稈數量與分布的重要參數。實現大面積、實時和準確的作物秸稈覆蓋度監測,對評估農田生態環境和開展保護性耕作具有重要意義。

目前,作物秸稈覆蓋度測取方法有拉繩法和照相法。拉繩法在實際操作過程耗時費力,工作效率低[4];照相法具有便攜和易操作的優勢[5-8],但對于不同區域農田秸稈覆蓋度的監測,仍不能滿足大范圍、實時監測的需求。遙感技術具有大面積、快速和動態監測的特點,在作物秸稈覆蓋度估算中扮演著越來越重要的角色。李志婷等利用地面高光譜數據,構建不同遙感影像的波段反射率,通過構建敏感光譜特征指數用于小麥秸稈覆蓋度估測的分析比較,結果表明,Landsat-8 OLI數據在波段劃分上更為精細,且利用其構建的光譜指數NDIOLI21估測精度優于Landsat-5 TM[9]。Cai等綜合利用Sentinel-2光學與Sentinel-1微波數據,構建光譜與微波信息的復合指數對作物覆蓋度的估測精度較線性模型得到了提升[10]。Daughtry等在復雜混合場景下獲取的小麥、玉米、土壤等地物高光譜數據進行作CRC分析試驗,結果發現,作物秸稈在2 100 nm處所特有的光譜吸收特征能夠很好地將秸稈與土壤區分開來,進而構建纖維素吸收指數(cellulose absorption index,CAI)[11]。黃晉宇等運用哨兵Sentinel-2衛星遙感數據,結合典型的光譜指數與不同土壤類型因素實現玉米秸稈覆蓋度的估測[12-13]。在眾多CRC估測中運用光學特征居多。Jin等利用Landsat-8 OLI遙影像提取的植被指數和紋理特征估測玉米秸稈覆蓋度,結果顯示,影像紋理特征對玉米秸稈覆蓋度進行估測具有可行性[14]。紋理特征在遙感數據中能提供豐富的空間信息。Li等運用機器學習算法結合GF-1的光譜特征與紋理特征與Sentinel-1微波特征實現森林生物量的估測,結果表明,利用GF影像提取的光譜與紋理特征并結合隨機森林模型在森林生物量估測中精度最高[15]。

目前,在光譜植被特征信息的基礎上加入紋理特征,在玉米秸稈覆蓋度的遙感監測中是可行的,但小麥和玉米秸稈在農田地表結構和形態上具有較大的差異,在光譜植被特征基礎上引入紋理信息是否能顯著提高小麥秸稈覆蓋的監測精度需要進一步分析探究。此外,隨著遙感特征變量的增多,不同數據之間的特征融合,如何有效篩選對作物秸稈敏感的特征量,并盡可能提高估測精度是當前作物秸稈覆蓋度遙感監測研究的重要內容。

本研究以當前廣泛使用的Sentinel-2衛星影像為數據源,探討利用典型光譜特征、植被指數和紋理特征及其組合在估測小麥秸稈覆蓋度的可行性,通過灰色關聯度與隨機森林(GRA-RF)相結合的變量篩選方法,優選對小麥秸稈覆蓋度敏感的特征變量,利用套索(LASSO)、嶺回歸(RR)、高斯過程回歸(GPR)等機器學習算法,針對不同特征變量集,構建小麥秸稈覆蓋度遙感估算模型并實現小麥CRC遙感估測,以期為大范圍小麥秸稈覆蓋度估測提供新的思路和方法。

1 材料與方法

1.1 研究區概況

試驗于2020年7月在北京市小湯山國家精準農業示范基地進行 (40°00′N~40°21′N,116°34′E~ 117°00′E,見圖1)。研究區地勢平坦,平均海拔高度約為36 m,四季分明,屬于大陸性季風氣候,春季干旱多風,夏季炎熱多雨,年平均日照時長2 684 h,降水量500~600 mm。圖1為研究區位置及Sentinel-2衛星影像采樣點分布。

圖1 小麥試驗區域位置及樣點分布

1.2 數據獲取及預處理

1.2.1 田間實測小麥CRC獲取

于2020年7月7日,采用手持多光譜相機(具有紅、綠、藍、近紅、紅邊五個光譜波段)在固定高度對試驗采樣區域地面正上方垂直拍攝,共獲取115個高分辨率秸稈覆蓋數據及拍攝時間和經緯度信息。為了更接近秸稈還田真實場景,對試驗區秸稈在自然環境中靜置處理,以保證在下季作物種植期有更真實的秸稈覆蓋數據。圖2為原始多光譜數據真彩色合成圖。

圖2 田間地面實測圖像

對田間試驗樣點采用人工目視解譯的方法選取5個地物類別構建ROI感興趣區域[土壤、秸稈、綠植、陰影(土壤陰影、非土壤陰影)]。目前常見的地物分類算法有支持向量機、隨機森林、最小距離等,本研究通過試驗分析選取分類精度較高的隨機森林分類算法進行影像處理。地物分類后采用混淆矩陣與Kappa系數作為評價標準,其中RF的兩種系數評估結果分別為88.33%、0.85。

1.2.2 遙感數據處理

借助Google Earth Engine(GEE)平臺獲取Sentinel-2在2020年7月6日本試驗區域的遙感數據,并對遙感影像做相應預處理,包括輻射定標、大氣校正、幾何校正處理,遙感數據狀態良好且無云[16-17]。

1.3 特征參數提取

1.3.1 遙感影像光譜特征提取

針對近地面高分辨率的多光譜數據,通過變量篩選的方法選取重要性程度高的光譜指數,對地面樣點進行分類處理,以減少運算量和冗余信息,提高處理效率。以往的研究基于Sentinel-2數據利用短波區域合成的光譜指數對遙感影像處理,其中枯燃料指數(dead fuel index,DFI)、歸一化差異耕作指數(normalized differential tillage index,NDTI)、簡單耕作指數(simple tillage index)以及歸一化差值指數NDI(x,y)等[18-19]對秸稈覆蓋度估測效果較好。

DFI=100(1-SWIR2/SWIR1)×R/NIR

(1)

NDTI=(SWIR1-SWIR2)/(SWIR1+SWIR2)

(2)

STI=SWIR1/SWIR2

(3)

DNI(X,Y)=(Y-X)/(Y+X)

(4)

式中SWIR1、SWIR2分別為波段B11、B12,R、NIR分別為B4和B8,x,y為遙感影像的不同光譜波段。

1.3.2 遙感影像紋理特征提取

對Sentinel-2影像從不同波段分別獲取灰度共生矩陣(gray-level co-occurrence matrix,GLCM)的8種紋理特征(表1),包括均值(mean)、方差(variance ,Var)、同質性(homogeneity,Hom)、對比度(contrast,Con)、差異性(dissimilarity,Dis)、熵(entropy,Ent)、二階矩(second moment,Sec)、相關性(correlation,Cor)。隨著這些紋理特征的加入,估測模型就可以反映空間特征。

表1 紋理特征表達式

1.4 數據分析方法

1.4.1 灰色關聯-隨機森變量篩選方法

灰色關聯分析(GRA)是一種能夠權衡特征變量與比較數列關聯程度的無量綱統計分析方法,可通過計算變量之間的關聯度,獲得變量的排序情況,進而分析自變量與因變量之間的關系。關聯度較大的參量表明其與比較數列的變化趨勢更為相近[20-25]。隨機森林(random forest,RF)算法屬于一種集成算法,由許多決策樹構成的分支集合而成,眾多決策樹的投票結果能夠共同完成對數據屬性的分類與預測任務,通過對每個特征在決策樹上的平均貢獻率進行評估,獲得特征的重要性排序,同時所采用Bootstrap抽樣法能有放回地隨機生成多個決策樹數據,而且隨機性的引入使得模型不容易陷入過擬合[26-28]。灰色關聯分析能對多目標靈活處理數據,但僅適用于線性關系的分析,隨著數據信息量的增加,其分析過程也將變得復雜。而隨機森林作為機器學習方法,既能實現多特征的非線性分析,也能應對大量的數據信息,在模型構建過程中對不同特征信息進行充分學習,并提供特征重要性排序。因此,本研究嘗試對兩者優勢進行融合。首先運用兩種分析方法各自運算獲得的結果分別進行歸一化處理,然后將特征重要性得分對應加和,獲得特征信息排名。

(5)

(6)

式中,x0(j)為參考因子數列;xi(j)為比較因子數列;α為分辨系數,通常取0.5;i為比較因子的個數;j為數據的組數;用公式5計算關聯系數后求取平均值,獲得關聯度ri。

1.4.2 機器學習算法

本研究應用偏最小二乘、嶺回歸、套索回歸及高斯過程回歸等代表性的4種機器算法,比較分析不同算法在冬小麥秸稈覆蓋度遙感監測中的性能和作用。

偏最小二乘回歸(Partial least squares regression,PLSR)屬于數學統計的一種優化方法,能夠用于構建多個因變量與多個自變量之間的模擬關系,結合試驗參數進行主成分分析,突出對模型貢獻較大的主成分信息,通過對多變量間的相關性檢測,減少多重共線性下的冗余參量,最后進行多元線性回歸分析[29-31]。

嶺回歸(Ridge regression,RR)是一種能夠消除多重共線性所帶來的回歸誤差的方法,是對最小二乘的一種改進算法,最先用來處理樣本量少于輸入特征參數的情況,通過對目標函數引入正則項的方式,使得無解的狀況得到解決,減少了參數量,使得模型更穩定且更符合實際[24,32]。

套索回歸(Least absolute shrinkage and selection operator,LASSO)由Robert Tibshirani在1996年首次提出。該算法集合了RR與最小二乘的優勢,能在建模時自動將不重要回歸系數自動剔除,降低了模型的復雜性即減少總體的回歸系數,能夠實現自動篩選變量的功能,在一定程度上降低共線性的影響[31,33-34]。

高斯過程回歸(Gaussian process regression,GPR)是利用高斯過程對數據進行分析來尋找數據之間內在關聯,在處理非線性問題上具有較好的表現,也適用于解決樣本量小的回歸問題,具有較好的泛化能力與適應性[35-38]。

1.5 精度評估

本研究在多種特征融合基礎上構建機器學習回歸模型,選取70%數據為訓練集,30%數據為驗證集,用10折交叉驗證獲取模型平均得分作為最終評估結果,采用決定系數(coefficient of determination,r2)和均方根誤差(root mean square error,RMSE)來分析模型精度。其中,r2越接近于1,RMSE越接近于0,模型擬合效果越好。用方差膨脹因子(variance inflation factor,VIF)檢測模型變量參數之間是否存在共線性問題,當VIF>10時,則認為變量之間存在共線性問題。

(7)

(8)

(9)

2 結果與分析

2.1 特征變量相關性與GRA-RF的敏感性分析

2.1.1 基于不同數據的特征相關性分析

對光譜波段、光譜指數、紋理特征與CRC進行相關性分析。從相關性由大到小的排序來看,排在前五的遙感光譜波段、光譜指數與紋理特征排序分別依次為B12>B4>B3>B8>B5、DFI>NDTI>STI>NDI(4,11)>NDI(3,11)和Mean_B12>Hom_B3>Sec_B3>Dis_B3>Ent_B3(圖3)。由于不同特征變量之間具有一定的相關性,因而在多元線性回歸模型中需要利用方差膨脹因子(VIF)檢測來消除變量之間的多重共線性問題。基于這些特征變量與CRC線性回歸建模,結果(表2)表明,光譜指數DFI、STI和NDTI的建模效果較好。

表2 CRC線性模型分析

圖3 波段、指數、紋理特征相關系數分析

2.1.2 基于GRA-RF的敏感特征分析

GRA-RF法分別對光譜、指數、紋理特征進行敏感特征篩選,每種特征關聯度較大的前五個特征排序結果與相關性分析結果具有一定的相似性(圖4),即關聯度最高的特征相同。

圖4 不同特征的GRA-RF特征重要性排序

2.1.3 基于機器學習的CRC遙感估測

為探究不同數據特征及其相互組合對CRC模型精度的影響,根據重要性排序結果,結合多種機器學習算法來構建CRC估測模型。結果發現,多個波段特征組合的模型精度較線性模型明顯提升,其中較穩定的模型有LASSO、RR、PLSR模型(表3)。在用光譜指數構建的回歸模型中RR模型較為穩定且與DFI模型精度相近,光譜指數特征及其組合特征在所選機器學習模型中r2均穩定在0.5以上。紋理特征作為GPR模型特征參數時獲得最穩定且精度最高的CRC估測結果。多種特征的融合在不同模型中各有突出的表現。與線性回歸模型相比,運用機器學習算法與特征組合方式使得CRC模型總體估算精度得到了 改善。

表3 多種特征組合回歸模型精度評估

2.2 基于不同光譜特征變量數的CRC遙感估算趨勢分析

為進一步探究特征數量對模型精度影響,基于以上分析結果,通過逐步增加特征數量來觀察不同特征及其組合在機器學習建模過程中的精度變化趨勢。其中,對光譜波段、光譜指數以及紋理特征通過關聯分析選取前10個排序結果,不同特征之間組合各選取前5個作為模型訓練參數,其中模型參數最多的為波段、紋理、光譜三者組合,訓練時最多含有15個變量且初始變量隨機。

通過建模分析繪制CRC模型趨勢圖(圖5),對其進行分析發現,含有光譜指數的所有模型的初始精度較高且整體較為穩定,對CRC具有較好的估算效果。而含有波段特征的精度曲線中,回歸模型隨著特征數的增加,其精度首先迅速提升后趨于平穩,其中在模型趨于穩定前達到最高的兩個特征波段為B12與B11,說明機器學習算法結合敏感變量篩選構建的多元模型可實現小麥秸稈覆蓋度較好估測。紋理特征在前5個特征中估測精度相對不高,但在GPR模型中隨著特征數增加,模型最終趨于穩定且精度優于其他模型。LASSO與RR模型總體趨勢較為相似,僅在少數變量變化中出現較小的上下浮動,而LASSO是基于RR回歸的一種改進算法,隨著變量數的增加,能自動剔除對模型精度貢獻不大的特征。綜合分析后,從兩種算法中可選取精度較好且相對穩定的LASSO構建最優模型。表4為部分特征與LASSO算法建模參數及精度,所有特征變量均通過方差膨脹因子檢驗,模型各參數的VIF均小于10。圖6對應表4中CRC模型在訓練集與測試集的精度評估結果。依據三種模型分析得到研究區CRC的分布狀況(圖7),與實際觀察較為相符。

圖5 CRC模型精度趨勢圖(r2為三角,RMSE為圓點)

a:波段特征;b:波段與紋理;c:光譜指數、波段與紋理特征。

圖7 不同特征組合下LASSO模型估測CRC分布

表4 不同特征與LASSO模型精度及公式

3 討 論

本研究利用不同光譜特征及其組合構建機器學習模型,實現小麥秸稈覆蓋度的估測,依據訓練集與驗證集的決定系數差異最小的原則,篩選穩定性最優的CRC估測模型。從相關性分析結果看,在遙感影像波段特征中B12與小麥CRC敏感性,高于其他光譜波段,主要是因為作物秸稈在2 100 nm處光譜反射率與土壤有較大的區別[11];光譜指數與CRC的相關性優于波段特征和紋理特征,其中利用DFI、STI、NDI(x,y)構建的CRC估算模型具有較好的精度,與已有研究結果相近[18-19]。當前,通過紋理特征實現作物秸稈估測研究較少,與玉米秸稈的紋理特征相比,小麥秸稈更為細長密集且反射面積小,空間分辨率越高,紋理特征可能會越明顯。在紋理特征中Mean_B12與CRC的相關性表現較好,但構建多特征模型時,其他紋理特征對CRC精度的提升優于Mean_B12,這可能是B12的光譜特征或指數特征與其本身的紋理信息存在一定的共線性。在以往的多元線性回歸模型中,隨著變量特征數的增加,模型精度會得到一定的提升,但不同變量特征之間可能存在一定的共線性問題。因此,本研究利用敏感特征篩選和模型趨勢分析,探究機器學習在CRC

估算中最優的模型方法及最佳特征變量。

本研究通過敏感特征篩選,利用排序后的特征進行建模,并分析特征變量的變化對CRC估算精度的影響,結果表明,隨著光譜變量數的增加,機器學習算法模型如PLSR模型對CRC的估測精度沒有實質性的提升,這與前人研究結果相似[15]。LASSO等算法依靠自身具有的正則化約束作用,在一定程度上消除了共線性問題[39]。從特征信息的增加對CRC模型精度的影響看,隨著變量數的增加,利用機器學習算法構建的估算模型的精度有上升或下降,表明不同特征的加入對模型估算精度的影響不同。通過趨勢線分析,經GPA-RF篩選的5個特征在單特征建模中,模型精度不隨變量的增加而增加,且部分特征組合在最高精度具有相一定的相似性。相比僅利用波段特征信息,波段與紋理的組合模型中,隨著紋理信息的加入,GPR、PLSR模型得到穩定,而LASSO與RR模型精度在穩定后得到提升,在光譜指數模型中加入紋理也有相似的表現。在多種特征組合情況,RR與LASSO模型精度趨于穩定甚至整體精度得到提升,而GPR與PLSR模型在個別特征組合中最高精度并無明顯差異,說明建模信息過度冗余,后續需要通過對曲線精度最高點的特征進行提取,在原有基礎上構建新的CRC估測模型以降低模型的復雜性。

本研究通過GRA-RF方法篩選特征變量,再結合多種機器學習算法構建CRC估測模型,相比傳統光譜指數模型,混合光譜特征模型能顯著提高整體精度,為實現大面積小麥CRC估測提供新的研究思路。但本研究僅基于秸稈還田試驗基地,且部分田塊采用輪作的種植方式,故從采集的圖片數據中可以看出,在靜置處理過程中出現新一季作物幼苗,這在秸稈還田試驗中需要考慮,在后續的研究中可以結合作物物候期與多時相遙感數據對研究區秸稈還田時期進行判定。此外,本研究區局部地形的變化對模型影響較小,在大區域尺度進行CRC研究時需考慮不同地區在土壤含水量上的時空分布差異。同時,不同遙感影像在空間分辨率上有所區別,而較高分辨率影像包含更多的紋理信息。相比遙感光譜信息,紋理特征能夠反映影像數據的表觀性質,在CRC估算中能反映秸稈與土壤紋理上的空間差異,彌補了僅利用單一光譜特征對CRC估算的局限性。隨著國產遙感衛星技術的不斷發展,利用較高的空間分辨率與光譜分辨率優勢實現作物秸稈覆蓋度估算具有重要研究意義。綜上所述,在作物秸稈實地研究中,田間場景的復雜程度、地表物質的多樣性以及土壤的含水量與有機質含量等需要進行采樣分析。在后續研究中,將考慮區域范圍更廣、秸稈類型更多、分布更為均勻的野外覆蓋度估測分析,并為不同區域場景構建相應的地物特征庫,進而構建具有普適意義的秸稈覆蓋度模型。

4 結 論

基于Sentinel-2遙感數據,通過GRA-RF方法對波段、光譜指數、紋理特征進行敏感性分析,將不同特征信息的組合并結合多種機器學習算法構建冬小麥秸稈覆蓋度估測模型。結果表明,基于單一特征的模型中,利用光譜指數的估測精度較高,其中DFI表現最好(r2=0.54,RMSE= 10.26%);單一紋理特征對冬小麥CRC的敏感性較差,但利用多個紋理信息構建機器學習估算模型時精度得到改善(r2=0.43~0.46)。通過構建特征變量與精度趨勢變化曲線,對變量變化拐點處的特征進行提取,篩選出小麥CRC最優模型特征,其中3種特征(B11,B8,B4_B11,STI,Ent_B3,Hom_B3,Mean_B2)混合的模型精度最優,r2與RMSE分別為0.65%和9.25%。因此,與單特征變量構建的模型相比,多特征信息的組合顯著提高了小麥CRC的估算精度。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 亚洲伦理一区二区| 日本免费a视频| 久久国产成人精品国产成人亚洲 | 日本a级免费| 婷婷在线网站| 尤物在线观看乱码| 99久久无色码中文字幕| 国产另类乱子伦精品免费女| 无码电影在线观看| 亚洲成人高清无码| 久久久久久午夜精品| 成人国产免费| 国产乱子伦无码精品小说| 日日碰狠狠添天天爽| 在线免费看黄的网站| 国产乱子伦视频在线播放| 国产凹凸视频在线观看| 狠狠v日韩v欧美v| 成人福利一区二区视频在线| 九色91在线视频| 国产福利一区视频| 呦女亚洲一区精品| 国产一级毛片高清完整视频版| 午夜色综合| AV网站中文| 国产三级a| 亚洲成人精品在线| 亚洲另类色| 日本国产精品一区久久久| 亚洲视频色图| 波多野结衣一区二区三区AV| 欧洲欧美人成免费全部视频| 国产在线精品人成导航| 在线观看视频一区二区| 久久特级毛片| 亚洲天堂视频网| 久久久久无码国产精品不卡| 毛片基地美国正在播放亚洲| 亚洲天堂日本| 亚洲码在线中文在线观看| 国产在线观看成人91| 极品尤物av美乳在线观看| 日韩午夜伦| 六月婷婷精品视频在线观看| 亚洲综合色婷婷| 日韩毛片视频| 午夜欧美理论2019理论| 国产视频入口| 国产在线高清一级毛片| 国产在线小视频| 国产精品人成在线播放| 欧美曰批视频免费播放免费| 男女男免费视频网站国产| 日韩 欧美 国产 精品 综合| 国内a级毛片| 露脸一二三区国语对白| 四虎综合网| 国产精品成人AⅤ在线一二三四| 婷婷激情亚洲| 综合亚洲色图| 激情午夜婷婷| 国模私拍一区二区 | 国产人碰人摸人爱免费视频 | 99在线免费播放| 亚洲国产天堂在线观看| 免费看美女毛片| 精品人妻AV区| 国产aⅴ无码专区亚洲av综合网| 国产视频欧美| 欧美性猛交一区二区三区| 沈阳少妇高潮在线| 夜夜操天天摸| 色综合久久无码网| 91麻豆国产在线| 欧美翘臀一区二区三区| 色精品视频| 99久久精品免费看国产免费软件| 成人在线第一页| 国产亚卅精品无码| 国产欧美亚洲精品第3页在线| 亚洲精品欧美日本中文字幕| 国产一区三区二区中文在线|