劉煥軍,鮑依臨,孟祥添,崔 楊,張艾明,劉云超,王丹丹
(1. 赤峰學(xué)院資源環(huán)境與建筑工程學(xué)院,赤峰 024000;2. 東北農(nóng)業(yè)大學(xué)公共管理與法學(xué)院,哈爾濱 150030;3. 中國(guó)科學(xué)院東北地理與農(nóng)業(yè)生態(tài)研究所,長(zhǎng)春 130012)
土壤有機(jī)質(zhì)(Soil Organic Matter,SOM)含量是土壤肥力和土壤安全的重要指標(biāo),實(shí)現(xiàn)快速、精確的SOM空間制圖可以為精準(zhǔn)農(nóng)業(yè)和區(qū)域土地可持續(xù)發(fā)展提供監(jiān)測(cè)依據(jù)[1-2]。高光譜衛(wèi)星系統(tǒng)被設(shè)計(jì)成通過(guò)電磁光譜的可見(jiàn)光-近紅外區(qū)域,將表面光學(xué)性質(zhì)分離成數(shù)百個(gè)光譜分辨率小于10 nm的光譜[3],根據(jù)其在400~2 500 nm波長(zhǎng)范圍內(nèi)的反射率,可以為預(yù)測(cè)土壤的物理、化學(xué)和生物學(xué)特性提供解決方案[4-5]。然而,衛(wèi)星傳感器的周期性偏移,載荷元器件間的電磁干擾以及波段間相互作用產(chǎn)生的噪聲降低了圖像的質(zhì)量,甚至掩蓋數(shù)字圖像中真正的輻射信息[6-7];同時(shí),相比于植被、道路、建成區(qū)等地物,裸土的反射率低,光譜更易受到噪聲影響,因此,對(duì)高光譜衛(wèi)星數(shù)據(jù)的校正及噪聲過(guò)濾是獲取精準(zhǔn)土壤光譜反射率的前提與保證[8]。
高光譜圖像具有高分辨率和光譜間高相關(guān)性的特性,基于低秩的降噪方法成為研究熱點(diǎn)之一[9]。鑒于噪聲同時(shí)存在于空間域和光譜域,孟令軍[10]提出基于高光譜圖像像元光譜間相關(guān)性的光譜域降噪算法,分類精度提高了近8%。然而,其研究數(shù)據(jù)為合成高光譜圖像,包含Cuprite Nevada的部分?jǐn)?shù)據(jù)和Indian Pines,這種數(shù)據(jù)類型并不常見(jiàn),其結(jié)果在指導(dǎo)類似研究時(shí)具有一定的限制。黃冬梅等[11]提出基于多云協(xié)同的遙感圖像降噪方案,將遙感圖像共享給多個(gè)云服務(wù)器,云服務(wù)器根據(jù)改進(jìn)的非局部均值降噪算法在密文域中完成圖像降噪。胡立栓[12]基于信息量和類間可分性的評(píng)價(jià)標(biāo)準(zhǔn),分別提出了最優(yōu)指數(shù)因子法與二進(jìn)制粒子群算法,設(shè)計(jì)了基于該算法的特征選擇和分類器參數(shù)同步尋優(yōu)策略。證實(shí)了降噪算法在降低處理成本、提升分類精度的有效性。Meng等[13]以反射率一階微分為基礎(chǔ),結(jié)合離散小波算法對(duì)高分五號(hào)(GF-5)高光譜影像進(jìn)行降噪處理,使土壤有機(jī)碳的預(yù)測(cè)精度提升了約10%。現(xiàn)有的降噪方法可分為空間域、光譜域和空譜結(jié)合 3種。基于信號(hào)頻率成分的奇異值分解方法隸屬于光譜域降噪方法;離散小波變換可以分離出高頻噪聲信息并保留光譜中的基本成分,屬于空譜結(jié)合的降噪方式[14]。中值濾波是基于排序統(tǒng)計(jì)理論的非線性信號(hào)處理技術(shù),屬于典型的空間域降噪方法,尤其適用于對(duì)椒鹽噪聲的處理[15-16]。
上述降噪方法在圖像及信號(hào)處理中得到了廣泛的應(yīng)用,然而,大部分研究?jī)H應(yīng)用于低維(圖片、音頻、多光譜影像)數(shù)據(jù)類型中。GF-5高光譜衛(wèi)星影像是國(guó)內(nèi)光譜分辨率最高的衛(wèi)星,也是國(guó)際上首次實(shí)現(xiàn)對(duì)大氣和陸地進(jìn)行綜合觀測(cè)的全譜段高光譜衛(wèi)星,它由數(shù)以百計(jì)的波段信息組成,高維的空間信息中夾雜著較多的噪聲;此外,同類像素間的光譜反射率具有較強(qiáng)的一致性,導(dǎo)致同類地物之間的光譜特征相似。由于黑龍江省西部明水縣位于黑土帶中心處,SOM含量空間差異明顯,更具有代表性,因此本文選取明水縣為研究區(qū),利用多種降噪方式對(duì)GF-5影像進(jìn)行降噪處理,評(píng)估不同方式下反射率與SOM含量的相關(guān)性,提取二維光譜指數(shù),運(yùn)用降維方法對(duì)輸入量進(jìn)行篩選并利用隨機(jī)森林算法構(gòu)建SOM反演模型,以提升 SOM預(yù)測(cè)精度,并實(shí)現(xiàn)高精度的SOM土壤制圖,以期為實(shí)時(shí)定量監(jiān)測(cè)土壤肥力變化提供依據(jù)。
明水縣(124°18′~125°21′E,46°44′~47°29′N)位于黑龍江省西南部,松嫩平原西北部,地處高緯度地帶,平均海拔249.2 m,地勢(shì)由中部向東西兩側(cè)逐漸降低,屬中溫帶亞濕潤(rùn)氣候,年平均氣溫約2.9 ℃,年平均降水量約480 mm。明水縣主要包括黑土、黑鈣土、風(fēng)沙土,其中黑土和黑鈣土的面積占總面積 60%以上。黑中含有較多腐殖質(zhì),SOM含量高;風(fēng)沙土中黏粒含量較少,保水保肥能力較差,SOM含量較低。縣域總面積為2 400 km2,其中耕地面積為1 087 km2,草原面積為467 km2,林地面積為360 km2。圖1為明水縣GF-5高光譜影像及采樣點(diǎn)空間位置分布。

圖1 研究區(qū)位置及樣點(diǎn)布置Fig.1 Location of study fields and sampling point distribution
1.2.1 土壤數(shù)據(jù)獲取
2016年5月,在研究區(qū)范圍內(nèi)0~20 cm深度選取采樣點(diǎn)共38個(gè)(圖1),利用GPS記錄采樣點(diǎn)的空間坐標(biāo)。主要選取原則為沿公路兩側(cè),兼顧土壤類型及物理性狀選取開(kāi)闊平坦的非均質(zhì)性區(qū)域作為樣地,樣本間隔約10 km。每個(gè)樣本是1個(gè)復(fù)合樣本,由5~6個(gè)子樣本組成,子樣本在30 m×30 m大小的網(wǎng)格范圍內(nèi)隨機(jī)選取,以確保SOM含量能夠反映該區(qū)域平均水平。將獲取的土壤樣本置于布制土壤袋中存放,帶回實(shí)驗(yàn)室進(jìn)行風(fēng)干處理,并去除結(jié)石,雜草根和其他雜質(zhì),研磨、干燥篩分至≤2 mm,采用重鉻酸鉀法測(cè)定樣品的 SOM 含量。分析38個(gè)采樣點(diǎn) SOM 含量數(shù)據(jù),結(jié)果表明,SOM的質(zhì)量分?jǐn)?shù)介于3.45%~5.53%之間,平均值為4.44%,樣本標(biāo)準(zhǔn)差為4.28%,變異系數(shù)9.6。
1.2.2 高光譜衛(wèi)星影像數(shù)據(jù)獲取及預(yù)處理
研究區(qū)耕地范圍內(nèi)采用傳統(tǒng)播種方式,作物生長(zhǎng)期一般為一年一熟制,從 4月中旬陸續(xù)進(jìn)行播種,此時(shí)土壤直接暴露于表面,地表無(wú)作物植被及秸稈殘留,無(wú)積雪覆蓋,這一時(shí)期被定義為“裸土窗口期”[17]。獲取裸土?xí)r期(2019年 4月 24日)GF-5影像(http://data.cresda.com:90/#/home)。影像獲取日期與土壤樣本采集日期接近,SOM含量不會(huì)發(fā)生明顯變化。GF-5影像數(shù)據(jù)的空間分辨率為30 m,地面覆蓋寬度60 km,包含 330個(gè)波段,其中在可見(jiàn)光近紅外(Visible and Near-infrared,VNIR)范圍內(nèi)共包含150個(gè)波段,光譜分辨率為4.28 nm;在短波紅外(Shortwave Infrared,SWIR)范圍內(nèi)共包含180個(gè)波段,光譜分辨率為8.42 nm。由于傳感器在400~430、900~1 050、2 450~2 500 nm波譜范圍內(nèi)信噪比較低,且在1 350~1 451、1 771~1 982 nm范圍內(nèi)受到大氣中水蒸氣吸收的影響,造成光譜數(shù)據(jù)不連續(xù)。因此,本文選取430~900、1 050~1 350、1 451~1 771、1 982~2 450 nm作為本次研究的光譜區(qū)間。使用ENVI 5.1輻射校準(zhǔn)工具和GF-5數(shù)據(jù)頭文件中的增益和偏差比對(duì)影像數(shù)據(jù)進(jìn)行輻射校準(zhǔn),利用FLAASH大氣校正模型對(duì)遙感影像進(jìn)行大氣校正。
2.1.1 奇異值分解
奇異值分解(Singular Value Decomposition,SVD)可以被看作一個(gè)能夠反映矩陣信息的矩陣代表值。利用奇異值分解的方法確定光譜反射信號(hào)的Hankle矩陣,對(duì)矩陣進(jìn)行奇異值分解,構(gòu)造逼近矩陣對(duì)含噪干涉信號(hào)進(jìn)行降噪處理,奇異值越大時(shí),它代表的信息越多,這一原理與主成分分析相似。假設(shè)Hm是m×z階矩陣,其元素全部屬于域Hm,則存在一個(gè)分解使得Hm=U∑V*,式中U是m×m階酉矩陣;V*即V的共軛轉(zhuǎn)置,是z×z階酉矩陣;Σ是半正定m×z階對(duì)角矩陣。當(dāng)信號(hào)中存在噪聲時(shí),Hm為滿秩矩陣,使該分解的奇異值之間存在如下關(guān)系:

式(1)中σk是SVD獲得的第k個(gè)奇異值,為噪聲信號(hào)中的分界點(diǎn)。因此,k個(gè)奇異值包含信號(hào)能量,隨后的奇異值對(duì)應(yīng)于信號(hào)中的噪聲分量[18],奇異值越大所包含的信息越多,取k前面若干個(gè)最大的奇異值和對(duì)應(yīng)的左右奇異向量,可以基本還原出數(shù)據(jù)本身,因此可用于數(shù)據(jù)降維與壓縮。該降噪方式在Matlab2016a中實(shí)現(xiàn)。
2.1.2 離散小波分解
離散小波分解(Discrete Wavelet Transform,DWT)是以 2的整數(shù)次冪為底對(duì)連續(xù)小波的尺度和平移參數(shù)采樣,包含了信號(hào)分解與信號(hào)重構(gòu) 2個(gè)過(guò)程。依據(jù)信號(hào)的長(zhǎng)度和小波基長(zhǎng)度將原始信號(hào)分解為高頻信號(hào)和低頻信號(hào),其中高頻信號(hào)主要由噪聲信息構(gòu)成,低頻信號(hào)就是小波系數(shù),其后的每一步均分解上一層的低頻信號(hào),迭代進(jìn)行直至分解的最大尺度。在每個(gè)分解層j,建立 1個(gè)第j層的高頻信號(hào)(Dj),因此原始高光譜信號(hào)(S)就等于最終分解層的低頻信號(hào)(Aj)與所有分解層Dj之和,即

小波重構(gòu)過(guò)程是將每層的低頻信息進(jìn)行重構(gòu),從而得到各層的特征光譜。常用于對(duì)高頻噪聲的過(guò)濾,且對(duì)于光譜曲線中的“毛刺”部分的平滑效果顯著[13]。本研究在 Matlab2016a中測(cè)試了大量的母函數(shù),最終選擇‘db4’小波母函數(shù)。
2.1.3 中值濾波
中值濾波(Median Filtering,MF)是基于排序統(tǒng)計(jì)理論的一種廣泛應(yīng)用的平滑噪聲和保持圖像邊緣的非線性濾波方法,其基本原理為:用像素點(diǎn)鄰域灰度值的中值代替該像素點(diǎn)的灰度值,使周圍的像素值接近真實(shí)值從而消除孤立的噪聲點(diǎn)。對(duì)于給定的圖像I(i,j),中值濾波過(guò)程如式(3)所示:

式中(u,v)∈(1,2,…,h)×(1,2,…,l),Imf(u,v)為處理后得到的圖像;h和l是圖像的寬度和高度,r和s代表窗口位移大小,W是方形窗口內(nèi)的坐標(biāo)集。該中值濾波法在取出脈沖噪聲、椒鹽噪聲的同時(shí)能保留圖像的邊緣細(xì)節(jié),在光學(xué)測(cè)量條紋圖像的相位分析處理方法中有特殊作用,是經(jīng)典的圖像平滑噪聲的方法。本研究在Matlab2016a中測(cè)試了不同窗口濾波器,最終選擇 5×5方形窗的濾波器對(duì)影像進(jìn)行降噪處理。
光譜指數(shù)是不同波段反射率的線性或非線性組合形式,光譜指數(shù)的構(gòu)建有助于提高遙感數(shù)據(jù)預(yù)測(cè)SOM含量的精度[19]。本研究探討差值指數(shù)(Difference Index,DI)、比值指數(shù)(Ratio Index,RI)、歸一化指數(shù)(Normalization Index,NDI)[20-21]與SOM之間的關(guān)系,計(jì)算過(guò)程如下:

式中Ro和Rp為波段o和p獲取的光譜反射率。
在900~1 050 nm受到傳感器自身缺陷的影響、且在1 350~1 451、1 771~1 982 nm受到大氣中水蒸氣吸收的影響,光譜數(shù)據(jù)不連續(xù),因此,SOM估計(jì)的最佳光譜波段從 430~900、1 050~1 350、1 451~1 771、1 982~2 450 nm共計(jì)237個(gè)波段內(nèi)選擇。波段選擇在Matlab2016a中實(shí)現(xiàn)。
主成分分析(Principal Component Analysis,PCA)的實(shí)質(zhì)是基于數(shù)據(jù)統(tǒng)計(jì)特征的多維正交線性變化分析,將原有的高度相關(guān)變量的數(shù)據(jù)集轉(zhuǎn)換為一組不相關(guān)變量,各變量間相互獨(dú)立,前幾個(gè)主成分信息可以最大限度地反映原始多個(gè)變量的信息[22]。在本研究中,保留了總光譜方法解釋量>85%的主成分信息作為本研究的輸入量。這一過(guò)程是在Matlab2016a軟件中通過(guò)princomp函數(shù)實(shí)現(xiàn)的。
RF(Random Forest,RF)預(yù)測(cè)模型是一種集成模型,預(yù)測(cè)變量集在每個(gè)分裂點(diǎn)中都是隨機(jī)限制的[23],避免了計(jì)算中樹(shù)與樹(shù)之間的相關(guān)性問(wèn)題,從而實(shí)現(xiàn)高精度的預(yù)測(cè)。RF的性能取決于以下3個(gè)參數(shù)的設(shè)置:生成樹(shù)的數(shù)量(ntree)、葉片最小數(shù)量(nodesize)和每個(gè)節(jié)點(diǎn)處用于分割節(jié)點(diǎn)的預(yù)測(cè)變量數(shù)(mtry)。Ramón等[24]使用更多的樹(shù)的數(shù)量(ntree)可以獲得更穩(wěn)定的估計(jì)變量重要性的結(jié)果,因此使用ntree =500。mtry默認(rèn)值是預(yù)測(cè)因子總數(shù)的1/3,隨后,使用迭代方法以最高預(yù)測(cè)精度確定最佳nodesize值。
研究采用建模集與驗(yàn)證集之比為 2:1的方式建立模型,建模集26個(gè),驗(yàn)證集12個(gè),校準(zhǔn)和驗(yàn)證樣本在研究區(qū)域內(nèi)空間分散。為了檢驗(yàn)不同降噪方法的效果,模型的性能通過(guò)精度度量決定系數(shù)(R2)、均方根誤差(Root-Mean-Square-Error,RMSE)、測(cè)定值標(biāo)準(zhǔn)偏差與標(biāo)準(zhǔn)預(yù)測(cè)誤差的比值(Residual Predictive Deviation,RPD)進(jìn)行評(píng)估。R2越大,RMSE越小,證明預(yù)測(cè)精度越高;當(dāng) 1.5<RPD<2時(shí)表明模型可以對(duì)樣品含量進(jìn)行粗略估測(cè),當(dāng) RPD>2時(shí)表明模型具有較好的定量預(yù)測(cè)能力[25]。
圖2為9個(gè)DWT分解層(L1~L9)的光譜反射率曲線。由L1~L4可見(jiàn),DWT降低了光譜曲線中的噪聲,使曲線變得更加平滑,特別是在2 200~2 450 nm之間較為明顯。整體來(lái)看,L1~L4可以較好地保留原始光譜曲線的特征。在L5~L9中,DWT消除了光譜曲線中大部分的細(xì)節(jié)信息,使得不同SOM含量的土壤除反射率高低的差異外,無(wú)其他明顯差異,因此,過(guò)高的分解層數(shù)不利于光譜細(xì)節(jié)的保留以及SOM預(yù)測(cè)精度的提升。原始光譜曲線中,在2 200~2 450 nm處存在“小毛刺”形狀,這是由于原始反射率噪聲傳遞導(dǎo)致的,DWT可以將這些高頻信號(hào)進(jìn)一步去除,減弱噪聲傳遞現(xiàn)象。將整個(gè)波段范圍反射率與SOM做相關(guān)分析,由于波段信息豐富,表1列出了相關(guān)系數(shù)最高的3個(gè)波段,這3個(gè)波段主要集中在600~700 nm之間。

圖2 不同離散小波分解(DWT)分解層數(shù)下不同SOM含量土壤反射光譜曲線Fig.2 Reflectance spectral curves of soils with different SOM contents under different Discrete Wavelet Transform (DWT) decomposition layers

表1 不同DWT分解層光譜反射率與SOM相關(guān)性最強(qiáng)的前3名Table 1 Top three based on correlation between spectral reflectance of different DWT decomposition layers and SOM
由表1可知,L1~L3均可提升光譜曲線與SOM含量的相關(guān)性,且當(dāng)分解尺度為1層時(shí),反射率與SOM含量的相關(guān)性最高。同時(shí),這些相關(guān)性高的波段出現(xiàn)的位置與原始反射率(給出值)最接近,因此,將高光譜衛(wèi)星影像進(jìn)行1層DWT時(shí),可以實(shí)現(xiàn)較高SOM預(yù)測(cè)精度,下文將選擇1層DWT進(jìn)行SOM反演。
土壤反射率隨SOM含量的增加而降低(圖3),且不同 SOM 含量的土壤反射光譜曲線形狀大體一致。與OR相比,不同的降噪方法均有效降低了光譜曲線中的噪聲,使曲線變得更加平滑。

圖3 不同降噪方法下的土壤反射光譜曲線Fig.3 Soil reflection spectral curves under different noise reduction methods
在600~1 300 nm范圍內(nèi),反射率隨著波長(zhǎng)增加而增加,光譜曲線的形狀差異比較明顯,其中,在 900~1 050 nm間出現(xiàn)1個(gè)反射峰,這個(gè)反射峰是由于2個(gè)傳感器連接處的噪聲較大造成的。在1 450~1 700 nm范圍內(nèi),反射率隨著波長(zhǎng)增加呈現(xiàn)先降低,后升高的趨勢(shì),且能夠較好地保留光譜細(xì)節(jié);在1 950~2 450 nm內(nèi),反射率隨著波長(zhǎng)增加先升高后降低。對(duì)比來(lái)看,SVD及DWT均對(duì)光譜曲線的不同位置進(jìn)行了平滑,有效地實(shí)現(xiàn)了對(duì)高光譜衛(wèi)星影像的降噪;然而,通過(guò) MF降噪下的光譜曲線可知,SOM 質(zhì)量分?jǐn)?shù)處于 3.5%~4.0%與>4.0%~4.5 %的光譜曲線不符合反射率隨SOM含量增加而降低的規(guī)律,此外,該降噪方式縮減了不同SOM含量間光譜曲線的差異,不利于SOM含量的預(yù)測(cè)。
降噪方法可有效地提高反射率與 SOM 之間的相關(guān)性,如SVD及DWT(圖4)。在800 nm附近,不同降噪條件的相關(guān)性由高到低依次為DWT、SVD、OR、MF,與 SOM 含量的相關(guān)系數(shù)依次為 0.625、0.557、0.581、0.481;在1 000~1 750 nm內(nèi),不同降噪方法的差別進(jìn)一步擴(kuò)大;在2 000~2 450 nm內(nèi),SVD、OR與SOM之間的相關(guān)系數(shù)大致相等。

圖4 不同降噪方法下光譜反射率與SOM含量的相關(guān)性Fig.4 Correlation between spectral reflectance and SOM content under different noise reduction methods
圖5展示了不同降噪處理方式下,所選取的光譜指數(shù)(DI,RI,NDI)與SOM之間的相關(guān)關(guān)系。將與SOM相關(guān)性最高的波段組合列于表2,整體而言,與OR相比,基于DWT降噪方式下的光譜指數(shù)的相關(guān)性有所提升,SVD方式下僅RI相關(guān)性有所提升,MF處理下的相關(guān)性均低于OR反射率的相關(guān)性,不具備SOM反演的優(yōu)勢(shì)。

圖5 土壤有機(jī)質(zhì)含量與二維光譜指數(shù)相關(guān)圖Fig.5 Correlation diagram of SOM content and 2-D spectral index

表2 土壤有機(jī)質(zhì)含量與二維光譜指數(shù)相關(guān)性Table 2 Correlation between SOM and 2-D spectral index
每種降噪方式包含237波段信息及3個(gè)二維光譜指數(shù),共計(jì)240個(gè)輸入變量。利用PCA方法提取貢獻(xiàn)率大于 85%的信息進(jìn)行預(yù)測(cè),各種降噪處理下的主成分信息見(jiàn)表3。由表3可知,不同降噪處理下,累計(jì)貢獻(xiàn)率均高于95%。可見(jiàn),不同降噪處理后利用PCA進(jìn)行波段降維,仍能夠保留約95%的原始信息。

表3 基于主成分分析法的輸入量統(tǒng)計(jì)表Table 3 Statistics of inputs based on principal component analysis method
建模集SOM預(yù)測(cè)精度R2為0.62~0.80,RMSE為1.80%~2.35%,RPD為1.63~2.23,其中以DWT降噪方式下模型模擬精度最高(圖6)。驗(yàn)證集SOM的預(yù)測(cè)精度R2約為0.49~0.69,RMSE為2.26%~2.65%,RPD為1.41~1.80。結(jié)合 1:1線比較 SOM 的預(yù)測(cè)值與實(shí)測(cè)值,當(dāng)以O(shè)R和SVD作為輸入量時(shí),SOM預(yù)測(cè)值分布比較集中;以MF作為輸入量時(shí),無(wú)論SOM含量處于較低或較高時(shí),其預(yù)測(cè)值與實(shí)測(cè)值相差較大,說(shuō)明該方式未能對(duì)數(shù)據(jù)進(jìn)行有效的降噪。而使用DWT降噪方法時(shí),其SOM預(yù)測(cè)值擬合曲線與1:1線更為接近,模擬精度更高,誤差更小,且DWT方法與其他降噪方式相比具有更好的降噪效果,能夠?qū)崿F(xiàn)較高的SOM反演精度。
明水縣土壤分布以黑土為主,土壤肥力較高。中部黑鈣土形成于低地貌環(huán)境,受低平原地下水控制,有利于鈣質(zhì)成分聚集,而形成鈣積層,表層土被有充分的成壤條件,使腐殖質(zhì)能夠保存并得以逐漸加厚。西部地區(qū)地勢(shì)較低,以草甸土為主,草甸土通過(guò)土壤侵蝕等作用沉積了較多的土壤養(yǎng)分(圖7)。整體而言,中部漫川漫崗地形,SOM含量高且相對(duì)均一;東南部侵蝕嚴(yán)重,影響了SOM含量的積累。

圖6 基于RF預(yù)測(cè)模型的SOM預(yù)測(cè)結(jié)果Fig.6 Results of SOM inversion based on RF model

圖7 基于GF-5的RF模型明水縣SOM分布Fig.7 Distribution of GF-5-based SOM predicted by RF model in Mingshui County
高光譜衛(wèi)星影像中包含豐富的波段信息,但由于受多種因素影響,影像中包含著大量噪聲信息,不利于進(jìn)行SOM的反演研究。因此,本文選取常見(jiàn)的降噪方法對(duì)高光譜衛(wèi)星數(shù)據(jù)進(jìn)行處理,同時(shí),判斷降噪后的影像信息是否可以提升SOM預(yù)測(cè)的精度。本文從空間域、光譜域和空譜結(jié)合 3種降噪方法出發(fā),分別選取不同降噪原理的方式進(jìn)行SOM預(yù)測(cè)。SVD方法通過(guò)保留影像中權(quán)重大的矩陣信息,實(shí)現(xiàn)光譜數(shù)據(jù)的降維;DWT是基于不同的分解尺度對(duì)高頻信息進(jìn)行過(guò)濾[26];MF則采用象元平均化的方式以“抹平”噪聲。相比于土壤本身的反射率,影像中的噪聲更偏重于高頻噪聲。SVD和DWT降噪方法可以消除光譜數(shù)據(jù)中的冗余信息,增大不同SOM含量之間光譜曲線的差異,有助于實(shí)現(xiàn)高精度土壤屬性的預(yù)測(cè)。對(duì)比來(lái)看,DWT將光譜曲線進(jìn)行不同尺度的分解,得到不同尺度下土壤的光譜特征,使光譜與SOM含量的相關(guān)性得以提升。相比之下,MF這種象元平均化的方式未能有效的消除土壤光譜中的噪聲,且降噪后的光譜與原始反射率相比,其與SOM含量的相關(guān)性有所降低。
利用高光譜遙感進(jìn)行SOM預(yù)測(cè)研究的數(shù)據(jù)降維主要通過(guò)兩方面實(shí)現(xiàn):輸入量和模型[27-28]。偏最小二乘回歸模型適合處理自變量大于樣點(diǎn)數(shù)的數(shù)據(jù),適用于服從于正態(tài)分布的數(shù)據(jù)集,因此不具備普適性。這項(xiàng)研究中,每種降噪方式下均包含大量的波段信息,致使數(shù)據(jù)冗余,不利于模型的計(jì)算及分析。因此,本文采用PCA方法,將高維信息投射到更小維度的子空間中,保留原始數(shù)據(jù)大部分的信息,以縮減計(jì)算機(jī)運(yùn)行時(shí)間,提升SOM預(yù)測(cè)精度[29]。本文利用不同的降噪方法對(duì)GF-5高光譜衛(wèi)星數(shù)據(jù)進(jìn)行降噪處理,為降低高光譜衛(wèi)星影像中的噪聲提供思路,然而,研究未能完全識(shí)別并消除影像中存在的噪聲,在今后的研究中,應(yīng)該與室內(nèi)實(shí)測(cè)數(shù)據(jù)結(jié)合,充分校正數(shù)據(jù)中潛在的誤差信息,將其用作開(kāi)發(fā)其他領(lǐng)域(例如植被和水體)的參考方法。
考慮到高光譜衛(wèi)星數(shù)據(jù)中的噪聲不利于獲取真實(shí)的地物反射光譜曲線,本文基于空間域、光譜域和空譜結(jié)合3種降噪方法,篩選用于GF-5高光譜數(shù)據(jù)的最佳降噪方式,主要結(jié)論如下:
1)奇異值分解(Singular Value Decomposition,SVD),離散小波變換(Discrete Wavelet Transform,DWT)能夠有效降低高光譜數(shù)據(jù)中的噪聲,與未降噪處理的光譜曲線相比,這 2種方法有效地減少了曲線中的“毛刺”部分,使光譜曲線更加平滑。
2)光譜指數(shù)可以提升波段信息與土壤有機(jī)質(zhì)(Soil Organic Matter,SOM)的相關(guān)性,不同降噪方法對(duì)于SOM預(yù)測(cè)的潛力由高到低依次為 DWT、SVD、原始反射率(Original Reflectance,OR)、中值濾波(Median Filtering,MF),與 SOM 含量的相關(guān)性由高到低依次為 0.625、0.557、0.581、0.481。
3)降噪后,采用組成分分析降維,基于隨機(jī)森林構(gòu)建SOM模型。比較各降噪方式,最佳降噪方法為DWT,其驗(yàn)證集R2為0.69,RMSE為2.26%,RPD為1.80。基于DWT降噪方式,采用隨機(jī)森林模型預(yù)測(cè)的明水縣SOM分布與實(shí)際相符,進(jìn)一步證實(shí)了降噪方法應(yīng)用于處理高光譜衛(wèi)星數(shù)據(jù)的可行性,在未來(lái)的研究中,建議使用室內(nèi)實(shí)測(cè)光譜曲線作為高光譜衛(wèi)星影像方法的補(bǔ)充,以更好地模擬不同光譜區(qū)間的噪聲特征,拓展高光譜衛(wèi)星在其他領(lǐng)域中的應(yīng)用。