999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于優化模型耦合的礦業復墾土壤有機質含量估測

2020-04-23 10:09:56楊邵文胡青青張世文
西南農業學報 2020年2期
關鍵詞:模型

楊邵文,沈 強,夏 可,胡青青,張世文*

(1.安徽理工大學測繪學院,安徽 淮南 232001;2.安徽理工大學地球與環境學院,安徽 淮南 232001)

【研究意義】作為地理環境中的重要組成要素,土壤是人類賴以生存的重要自然資源[1]。受長時間采礦的影響,礦業廢棄地土壤污染較為嚴重,而土地復墾是實現環境治理與土壤重構的重要方法,在土壤質量的改善方面具有重要意義。有機質作為土壤中的重要組成部分,對土壤性質的改善有著重要作用,是反應礦區土地復墾成效的重要指標,因此實現礦業復墾土壤有機質含量的快速估測十分重要。高光譜技術估測擁有效率高、成本低等特點,相較于傳統土壤農化分析方法表現出了極大優勢,順應了現代農業發展的迫切需要。因此,建立礦業復墾土壤有機質含量高光譜快速估測模型有著重要的意義。【前人研究進展】國內外學者進行了大量研究,其發展過程由一元線性模型逐漸過渡為多元線性及非線性模型[2]。Shepherd等人研究發現,在光譜的一階微分和二階微分變換下更有利于建立有機質含量估測模型[3];Krishnan等人對光譜數據進行倒數之對數的微分變換后,建立了多元逐步回歸估測模型[4];Gunsaulis等人在利用多元線性回歸建立估測模型時指出660 nm附近的紅光波段是較為有效的敏感波段[5];喬璐等人通過對光譜數據和有機質含量數據進行數學變換后得到了更高精度的有機質估測模型[6];于雷等人在對光譜數據進行數學變換的基礎上,探討了在全波段和顯著性波段的前提下,基于偏最小二乘回歸(Partial Least Squares Regression,PLSR)的建模精度問題[7];紀文君等人則是基于人工神經網絡(Artificial Neural Networks,ANN)和支持向量機(Support Vector Machine, SVM)等非線性模型對光譜的全波段信息進行了深入的探究,最終結合線性模型取得了很好的估測效果[8];陳紅艷等人在光譜一階微分形式下通過多層離散小波分解剔除低頻近似信號和高頻噪聲信號,得到反映土壤理化參數的特征光譜曲線,從而建立了更高精度的有機質估測模型[9];管延龍等人在光譜數據及其數學變換形式下比較了偏最小二乘回歸模型與多元線性模型的估測效果,結果表明偏最小二乘回歸模型具有更好的穩定性與預測精度[10]。【本研究切入點】研究表明基于高光譜的有機質含量快速估測均取得了令人滿意的結果,無論是光譜的預處理,還是波段與建模方法的選取都已經形成了一個較為完善的體系,但鮮有人綜合探究不同建模光譜數據選擇方式和優化模型耦合的二次估測,分析其對土壤有機質高光譜反演效果的影響。【擬解決的關鍵問題】本文以便攜式地物光譜儀獲得的光譜數據為研究對象,采用了3種光譜變換方法和模型建立方法,探討了全波段與顯著性波段2種建模數據獲取方式對有機質含量估測效果的影響,并采用算術平均值二次估測的方法提升現有的估測精度,以期為礦業復墾土壤有機質含量快速監測的實現提供技術參考。

1 材料與方法

1.1 研究區概況

研究區為位于湖北省大冶市的某礦業土地復墾區,主要土壤類型為紅壤。地理坐標為東經114°45′~114°57′, 北緯30°0′~30°6′之間。研究區屬典型的亞熱帶大陸性季風氣候,氣候溫和、濕潤,冬冷夏熱,四季分明;光照充足,年平均氣溫為16.9 ℃,最高氣溫達到40.1 ℃,最低氣溫-10 ℃,年均無霜期261d;雨量充沛,年均降水量為1385.8 mm,年平均降雨日132 d左右,全年日照2000 h。

1.2 數據采集

采用網格和隨機抽樣相結合的方法,共采集土樣48份,采樣深度為0~20 cm。在樣品風干磨碎后、通過100目的均勻尼龍篩網,將每份干燥過篩后的土樣分為兩份以用于光譜數據的獲取和土壤有機質含量的測定,測定方法采用重鉻酸鉀容量法。表1為土壤有機質含量統計特征,數據擁有較好的變異系數。土壤光譜使用ASD FieldSpec4高光譜儀來測定,采集后的數據為范圍在350~2500 nm的土壤樣本光譜曲線。測量時首先要將儀器預熱半個小時,并將處理好的土樣置于直徑 10 cm 深 1.5 cm的培養皿中,裝滿后將土壤表面刮平;選用12 V、50 W的鹵素燈作為平行光源進行光譜測定;采用室內暗室測量方法,基于幾何來布置光路徑,以黑天鵝絨布作背景,且需要保證白板能夠全部覆蓋視場[11],在經過白板校正后,方可進行實測,且每測五個樣品后需要重新進行校正以減小儀器產生的誤差。每個樣品共測量10次,將10次測量值平均后作為最終的光譜數據。

表1 土壤有機質含量統計特征

1.3 光譜預處理

受實驗環境和儀器噪聲產生的影響,光譜曲線的兩端存在較大波動,因此將曲線兩端(350~399 nm, 2401~2500 nm)去除,以減小噪聲對建模的影響。為了進一步去除光譜曲線上存在的細微噪聲,本文通過Savitzky-Golay平滑對剩下的400~2400 nm范圍的曲線進行平滑處理,采用二次多項式以及大小為20的窗口進行平滑。此外,為進一步提升估測精度,還需要對平滑后的原光譜曲線進行數學變換,以尋找更優的估測模型。本文選取了一階微分(First order Differential Reflectance,FDR),二階微分(Second order Differential Reflectance,SDR)以及標準正態變換(Standard Normal Variate,SNV)3種變換方式與原反射率(Raw Spectral Reflectance,R)進行對比。

1.4 建模波段選取

以全波段和顯著性波段為兩種建模數據,探究模型的估測精度的變化。顯著性波段的選擇以光譜數據與對應的土壤有機質含量的相關系數為標準,相關系數絕對值越大表明相關性越強,波段響應能力越強。在R、FDR、SDR、SNV變換形式下,以相關系數曲線中通過P= 0.05水平上的顯著性檢驗的極值點對應的波段作為建模的顯著性波段。

1.5 模型建立與精度評價

采用偏最小二乘回歸(PLSR)、隨機森林回歸(Random Forest Regression,RFR)和支持向量機(SVM)3種方法構建土壤有機質含量反演模型。PLSR作為一種多元統計方法在光譜分析中最為常用,該方法集成了主成分分析、典型相關分析以及線性回歸模型的優點。它實現了數據的簡化,著重處理自變量之間的多重相關性問題,當數據量較小時,該模型在整體上也擁有更好的穩定性以及預測能力[12-14]; RFR主要由多重分類與回歸決策樹組成,即一個包含多個決策樹的組合分類器。其主要原理是在隨機分類技術的支持下通過弱分類器組成的Bootstrap aggregation(Bagging)集成分類器和節點,形成多個回歸決策樹組成隨機森林,最終通過投票的方式選擇出最佳分類結果[15-17];SVM是一種基于核函數的研究方法,該方法使用隱式將數據映射到一個被稱為核函數的高維特征空間上以尋找一個超平面來實現數據的分類。值得指出的是應使建模集中的點距離超平面盡可能的遠以實現更好的分類效果[18-20]。

采用Kennard-Stone(K-S)方法選取建模集與驗證集,樣點比例設為2︰1。K-S方法可以根據光譜變量間的歐氏距離,在特征空間中均勻地選取光譜差異較大的樣本[21]。與傳統的隨機選樣以及根據距離和含量選取樣點相比,K-S選樣可以根據光譜數據的性質來合理劃分樣點,這對于后期的建模十分重要。

模型精度評價采用決定系數(Coefficient of determination,R2)、均方根誤差(Root mean square error,RMSE)以及相對分析誤差(The ratio of prediction to deviation,RPD)3個指標來衡量。其中決定系數用來表征模型的穩定性與擬合程度,均方根誤差則可以體現模型的估算能力,而相對分析誤差衡量的是模型的預測能力。R2與RPD數值越大、RMSE數值越小說明模型的可靠度越高[22]。

數據處理與模型建立是基于Matlab2016、Origin2018以及SPSS20來實現的。

2 結果與分析

2.1 土壤光譜與有機質含量相關分析

針對平滑后的原始反射率及其在一階微分、二階微分、標準正態變換形式下的光譜數據,分別與對應有機質含量進行基于皮爾森系數的相關性分析,得到的結果如圖1所示。

由圖1-a可知,在平滑后的原始反射率形式下相關系數的總體走勢比較平緩,相關系數整體上隨著波長的增加而下降,且原始反射率與有機質含量的相關性從正相關逐漸變為負相關。在通過P= 0.05水平顯著性檢驗的446、1468、1932與2123 nm附近存在波峰與波谷,這些區域都是可以充當顯著性波段的高相關性特征波段;從圖1-b中可以看出在一階微分形式下相關系數曲線的總體走勢起伏程度較大,且相關性較圖1-a有了很好的提升,在940 nm附近的波谷處相關系數絕對值達到了0.7以上;而由圖1-c可知在二階微分形式下圖形走勢起伏程度同樣較大,且波動最為劇烈,整體趨勢與一階導相似,相對于0上下浮動且在可見光與近紅外波段部分區域相關系數絕對值均有提升;由圖1-d可得對光譜數據進行標準化處理后,相關系數曲線整體趨勢與R形式較為接近,在可見光波段530 nm處相關系數提升較高,數值在0.6左右。

在顯著性檢驗的基礎上,選取相關系數曲線中的極值點對應的波段作為顯著性波段,將其用于估測模型的建立。

2.2 全波段與顯著波段的模型建立

由表2可知,在不同的建模波段選取方式下,模型精度存在不同程度的差異,該結果表明波段的選擇方式是模型精度的主要影響因素之一;利用PLSR模型建立8種土壤有機質估測模型,在全波段建模形式下可以看出模型的預測能力整體較差,RPD均未超過2,相對來說一階微分形式下的估測模型較好一些;顯著性波段建模形式下R2與RPD整體相對較高,一階微分形式下的估測模型取得了最好的效果,其R2與RPD分別達到了0.75和2以上,表明該模型在具有較好穩定性的同時具有良好的預測能力。在RFR模型下,基于全波段建立的估測模型R2與RPD數值較好,整體上具有更高的可靠度。在全波段形式下,可以看出較其它幾種數學形式,一階微分下建立的估測模型依舊具有最高的可靠性,其R2、RPD達到了0.76和2.10,表明具有很好的估測能力;而在顯著性波段的建模形式下,基于一階微分建立的模型較其它形式也具有更高的可靠性,R2、RPD達到了0.75和2.06,同樣具有很好的估測能力;從SVM的3項指標可以看出該模型下總體估測結果普遍不是很好,沒有任何一組數據的RPD達到2以上,這表明在4種數學形式下SVM均無法取得較好的效果,且全波段形式下模型可靠性整體要弱于顯著性波段。

a.原始光譜反射率相關系數;b.一階微分相關系數;c.二階微分相關系數;d.標準正態化相關系數a.R correlation coefficient; b.Correlation coefficient in FDR; c.Correlation coefficient in SDR; d. SNV correlation coefficient

綜合分析可得,所有模型的RMSE均介于2~4之間,均擁有很好的估算能力;在一階微分形式下模型擁有更好的估測能力,其中基于顯著性波段建立的PLSR模型具有最好的估測精度,由此可以表明光譜數據進行一階微分變換后可以很好的進一步提升模型精度;同時值得指出的是,在4種光譜形式下,基于全波段和特征波段建立的24種模型整體上估測效果并不是非常好,在除一階微分的其他數學形式下,模型的RPD均未超過2,表明其對應模型存在缺陷,僅能實現有機質含量的粗略估計。

表2 土壤有機質含量的全波段與顯著波段的模型檢驗

表3 土壤有機質含量均值二次估測

2.3 基于優化模型耦合算術平均的二次估測

針對模型精度較低的問題,本文基于相對最優模型的估測結果嘗試多種處理方法,最終選擇二次均值處理。即選取估測能力相對較好的兩個估測模型,將各模型對應的估測值進行算術平均處理以結合多個模型的優勢,使含量估測的精度更高。

如表3所示,在光譜的4種數學形式下經均值處理后,除原始反射率外其余3種變換形式下模型的估測能力均有了一定的提升,對應R2與RPD普遍在0.75和2以上,該現象表明相較于之前各數學形式下的最優模型,進行均值處理后的估測精度在整體上有了較好的提升,尤其是在標準正態形式下,R2、RPD由之前最優模型的0.70、1.90提升到了0.80和2.31。具體估測效果如圖2,橫軸為有機質含量實測值,縱軸為估測值,可以看到圖2 d(標準化形式)中的點位相對于直線y=x離散程度最小,具有最好的估測效果。

3 討 論

研究結果表明,光譜數據與有機質含量之間存在較高的相關性,在對光譜數據進行數學變換后相關性有了進一步提升[23],尤其是在一階微分形式下,由于該變換可以較好的突顯出原曲線的拐點以及波峰對應的波長位置[24],相關性顯著增強,相關系數的絕對值最高達到了0.8左右。且由估測結果的衡量指標可以發現,光譜經一階微分變換后得到的模型展現出了更好的估測效果,這表明該變換可有效降低土壤質地、成土母質等其他因素的影響,建立更優的估測模型[25]。因此嘗試數學變換可以進一步提升光譜數據對土壤有機質含量的估測效果,也表明光譜數據對有機質含量擁有很好的解釋能力,可以作為一種快速估測土壤有機質含量的方法;在全波段和顯著性波段建模形式下,各模型之間存在一定的差異,對于PLSR模型,顯著性波段建模存在一定的優勢,RFR模型則在全波段建模中體現出了更好的估測能力,而SVM模型在本次驗證集估測中整體效果不太理想,且從整體估測結果上可以看出SVM也較于傾向顯著波段建模。上述現象表明,在光譜數據的四種數學形式下,相較于包含大量數據的訓練集,在將去除數據冗余的信息作為訓練集的情況下,PLSR(除SNV形式)、SVM可以擁有較好的估測效果。而對于RFR(除R形式)而言,在將所有波段反射率作為訓練集的情況下,可以更好的識別光譜曲線的特性,擁有更高的識別精度;此外,從基于算術平均值的二次估測結果中可以看出,模型之間的估測結果經平均處理后可以實現相互校正,從而進一步提升估測精度,尤其是標準正態形式下估測精度有了較大提升。值得指出的是,由于土壤反射光譜受多種要素的影響[8],如水分、氧化物與重金屬等,有機質含量的估測精度有待于進一步提高,還需要綜合考慮其它影響因素進行進一步分析和實踐對比。

a.原始光譜反射率; b.一階微分; c.二階微分; d.標準正態化a. R; b. FDR; c. SDR; d. SNV

4 結 論

本文選擇了4種光譜數學形式并采用PLSR、RFR、SVM 3種方法建立土壤有機質估測模型,旨在探討了建模數據選取以及優化模型耦合對土壤有機質估測效果的影響。

(1)對光譜數據進行一階微分、二階微分等數學變換后,在部分波段范圍內相關性可以有明顯提升,尤其是光譜曲線進行一階微分處理的形式下,波段的相關性得到了顯著增強。

(2)建模數據的選取是影響模型精度的重要因素,在PLSR與SVM模型下顯著性波段建模整體上相對更佳,而在RFR模型下全波段建模應是更好的選擇,且PLSR、RFR建模方法下基于光譜的一階微分形式建立的估測模型均體現出了最好的估測能力,其中在PLSR(顯著性波段)、RFR(全波段)模型下R2、RPD均達到了0.75與2以上,可以很好的對研究區土壤有機質含量進行估測,該結果表明針對不同的建模方法,應結合模型特點,確定建模數據的選取方式。

(3)基于兩種相對最優模型的估測結果進行算術平均運算,較原估測值而言,二次估測值的精度在整體上有了一定的提升。3種光譜變換下的二次估測均取得了較好效果,在標準正態形式下,對PLSR(全波段)和RFR(全波段)估測結果進行均值處理后效果明顯,表明該方法可為高光譜土壤有機質含量估測提供一定的參考價值。

由于PLSR模型可以很好的分析自變量之間的相關性,提取主要信息,因此將其與顯著性波段結合是較為廣泛的使用方法。研究結果表明,基于FDR的PLSR顯著波段建模依舊是較為合理的建模方法,而本文中基于算術平均的二次估測較這種傳統建模方法估測能力有了一定提升,結合多種模型進行含量估值具有更好的估測效果。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产美女自慰在线观看| 亚洲国产天堂久久综合| 五月天综合婷婷| 亚洲看片网| 亚洲欧美日韩中文字幕在线一区| 成人福利在线观看| 亚洲区第一页| 中文字幕av无码不卡免费| 国产第三区| 亚洲综合欧美在线一区在线播放| 精品一区二区三区无码视频无码| 欧美日韩一区二区三区四区在线观看| 国产av无码日韩av无码网站 | 一本大道在线一本久道| 成年女人a毛片免费视频| 亚洲av综合网| 一本大道东京热无码av| 国产国产人免费视频成18| 久久精品视频亚洲| 97精品伊人久久大香线蕉| 影音先锋丝袜制服| 亚洲无码91视频| 女人18一级毛片免费观看| 国产精品hd在线播放| 亚洲一区毛片| 精品国产香蕉伊思人在线| 免费久久一级欧美特大黄| 老司机午夜精品网站在线观看| 欧美国产成人在线| 国产精品无码制服丝袜| 最新加勒比隔壁人妻| 欧美成人影院亚洲综合图| 91丨九色丨首页在线播放| 午夜福利视频一区| 免费大黄网站在线观看| 国产精品免费久久久久影院无码| 97久久超碰极品视觉盛宴| 欧美啪啪一区| 国产精品自在拍首页视频8| 三上悠亚一区二区| 亚洲人成网18禁| 国产aⅴ无码专区亚洲av综合网 | 国产视频欧美| 91香蕉视频下载网站| 伊人久久综在合线亚洲2019| 一级全免费视频播放| 五月天在线网站| 911亚洲精品| 亚洲色图在线观看| 欧美三级不卡在线观看视频| 久久无码高潮喷水| 亚洲人成网站日本片| 亚洲视频欧美不卡| 亚洲视频一区在线| 久草网视频在线| 日本高清成本人视频一区| 人妖无码第一页| 国产亚洲高清视频| 黄色在线不卡| a级毛片毛片免费观看久潮| 国产成人一区| 欧美在线一级片| 四虎免费视频网站| 欧美、日韩、国产综合一区| 日韩成人在线网站| 欧洲av毛片| 日本亚洲成高清一区二区三区| 亚洲中文字幕无码爆乳| 国产在线精品99一区不卡| 国产九九精品视频| 在线99视频| 久热中文字幕在线| 99精品免费欧美成人小视频 | 国产精品污视频| 国产成人av大片在线播放| 日韩不卡免费视频| 99在线视频网站| 久久久久人妻一区精品| 国产青榴视频| 色偷偷一区二区三区| 国产va在线| 色悠久久综合|