左雪燕,崔麗娟,*,李 偉,竇志國,蔡 楊,劉志君,雷茵茹
1 中國林業科學研究院濕地研究所,濕地生態功能與恢復北京市重點實驗室,北京 100091 2 北京漢石橋濕地生態系統國家定位觀測研究站,北京 101399
濱海濕地生態系統是介于陸地和海洋之間的過渡帶,具有獨特的生態過程,具備保護海岸線、防止海岸侵蝕、調節氣候、凈化水質、為生物提供棲息地等功能,是全球生物多樣性最豐富、最具價值的生態系統之一[1-6]。但是隨著人類活動和氣候變化的加劇,濱海濕地面臨嚴重威脅,生態系統功能遭到嚴重破壞[7-11]。互花米草的入侵是我國濱海濕地生態系統面臨的嚴重問題之一,因為缺少天敵,且對環境的適應性較強而具有超強的競爭力,在濱海灘涂濕地上逐漸蔓延,造成本土植物多樣性減少,對經濟、社會、生態均產生嚴重危害[12-14]。
植物功能性狀是指與植物獲得、利用和保存資源的能力有關的一系列植物形態生理學性狀[15-17]。功能性狀在器官水平上可以分為:全株性狀、葉性狀、根性狀、莖性狀等;還可以分為形態性狀、生理性狀等[16,18-19]。葉片功能性狀是植物功能性狀的重要組成部分,能夠反映植物的生長策略和適應機制。其中,比葉面積、葉片養分含量等與植物的相對生長速率存在顯著相關關系[17];葉綠素濃度、葉氮、比葉面積、氮磷比等反映的是植物對資源的最大化獲取的生存策略[20-21]。傳統上的實驗室內進行功能性狀的測定方法費時費力,而高光譜數據以其快速、高效且提供的信息量大為解決這些問題提供了有效手段[22-24]。
目前,對于高光譜數據反演植被功能性狀已經取得了很大的進展,但是對于濕地的研究主要集中某一指標(如氮、磷、生物量)的研究[1, 25-34],對互花米草的反演研究則主要集中于葉綠素含量、生物量等方面,對于葉片功能性狀的系統研究比較缺乏。因此,本研究利用ASD FS4 便攜式地物光譜儀來獲取互花米草的光譜數據,基于高光譜數據建立與葉片功能性狀之間的定量模型,最后通過決定系數(R2)以及均方根誤差(RMSE)比較選出最佳反演模型,為實現無損監測互花米草的生長狀況提供理論和技術基礎。
江蘇鹽城濱海濕地,地處32°56′—33°36′N,120°13′—120°56′E(圖1,分類圖來源于MODIS Land Cover Type Product,MCD12Q1)。位于淮河下游,東臨黃海,有582 km海岸線。季風盛行,雨水充沛,冬季盛行來自高緯度陸地的偏北風,夏季盛行來自太平洋的偏南風,全年平均氣溫受到海洋的調節,年、日變化小,該地區屬于弱潮區,潮汐類型為不規則半日潮[35]。鹽城濱海濕地是我國濱海濕地生態系統中類型最為齊全的區域,也是中國最大的動態潮間系統。該研究區為淤長型鹽沼濕地,樣地位于鹽城大豐麋鹿自然保護區。植被以鹽生植被為主,有互花米草(Spartinaalterniflora)、蘆葦(Phragmitescommunis)、白茅(Imperatacylindrica)等[36],其中互花米草自入侵以來,在該保護區不斷擴張,對當地的生態和經濟造成了嚴重威脅。

圖1 研究區位置以及樣點分布
1.2.1高光譜數據獲取
本研究于2019年8月在江蘇鹽城進行試驗數據的采集工作,使用的光譜儀是美國Analytical Spectral Device(ASD)公司生產的便攜式地物波譜儀FS4,光譜范圍為350—2500 nm,采樣間隔為1 nm。平行于海岸線設置3個條帶,每個條帶上采集20個采樣點,采樣點間隔10 m。采樣點植物群落單一,均為互花米草群落,高度為100—175 cm,株數為80—160 株/m2,植被蓋度為60%—80%,土壤質地為砂性土和壤性土。在每個采樣點采集上、中、下部三片生長健康、無病害的葉片,用ASD FS4搭配的葉片夾測量互花米草葉片的中部,每個葉片采集10條光譜數據,測定時避開葉片的主葉脈,將構成樣本的三個葉片光譜反射率值進行平均作為該樣點的葉片光譜反射率。
1.2.2葉片功能性狀測定
在每個采樣選擇3株生長狀況良好的互花米草植株,采集地上植株上中下3個部位的互花米草葉片,4小時內測定葉片的鮮重、葉厚、SPAD以及葉面積后,在105℃下,殺青15 min,之后85℃恒溫,烘干至恒重,得到干重;之后經過粉碎過篩,測定其他指標。總氮和總碳可由元素分析儀同時獲得,通過高溫燃燒使得植物樣品分解,生成混合氣體之后由熱導檢測系統自動測定[37];植物體中的磷以有機態為主,經過H2SO4-H2O2消煮使得有機磷轉化為磷酸鹽,之后利用分光光度計測定,繪制標準曲線,測定總磷含量[38](表1)。

表1 互花米草主要葉片功能性狀測定方法
1.2.3高光譜數據處理
(1)光譜數據轉換
通過ViewSpecPro軟件對互花米草葉片高光譜數據進行處理,導出互花米草葉片反射率(儀器自動重采樣為1 nm分辨率),350—2500 nm共2151條波段,每30條波段取平均作為一個采樣點的光譜反射率值,同時對葉片原始光譜反射率進行一階微分(First derivative,FD)轉換,公式為:
式中,λi為每個波段的波長,FDR(λi)為波長λi處的一階微分光譜值,△λ為波段i到波段i+1的波長值。
(2)主成分分析
高光譜數據的波段數量多、相關性強,存在數據冗余,造成計算復雜。主成分分析是常用的高光譜降維手段,通過主成分分析,將互相關聯的多個變量壓縮為少數不相關的新的成分變量,少數的幾個成分變量包含原始高光譜數據的大量信息。本研究中的主成分分析通過R語言軟件中的psych函數來實現。
1.2.4數據分析處理及模型建立與評價
將通過主成分分析獲得新的主成分作為自變量,構建互花米草葉片功能性狀的預測模型,模型選擇逐步回歸模型(Stepwise regression,SR)、BP神經網絡(BP artificial neural network,BPNN)、支持向量機(Support vector machines,SVM)、隨機森林(Random forest,RF)模型,模型的實現依托于軟件Weka 3.8。基于R語言實現原始高光譜反射率以及一階微分轉換后的光譜數據與互花米草葉片功能性狀的相關性分析,選擇最佳波段,構建預測模型。模型精度由決定系數(R2)、均方根誤差(RMSE)進行評價。最后,通過Origin 2020軟件出圖。
首先對互花米草的功能性狀進行分析,得到表2的結果。從表中可以看出,互花米草的葉片含水率均值為0.66,范圍為0.56—0.74,含水率相對較高;SPAD為41.41,標準偏差為5.17;TC/TN、TN、TP、SLA的均值分別為27.12、1.32 g/kg、0.18 g/kg、41.68,其中SLA的標準偏差較大,達到20.26。功能性狀的取值范圍以及標準偏差的存在說明了互花米草葉片之間的差異,為基于高光譜數據進行功能性狀的反演提供了條件。

表2 互花米草葉片功能性狀統計表
本文通過主成分分析將原始光譜反射率數據以及一階微分數據進行降維,減少自變量個數,提高運算效率。從表3可以看出原始光譜反射率的PC1的貢獻率為0.53,PC2的貢獻率為0.31,前兩個主成分累計貢獻率達到0.84,考慮到PC3的貢獻率達到0.1,因此保留前3個主成分,累計貢獻率達到0.94。從表4可以看出,一階微分光譜主成分分析的第一主成分的貢獻率為0.49,第二主成分的貢獻率為0.18,其余主成分貢獻率均低于0.1,因此選擇了累計貢獻率達到0.8的前4個主成分作為新的變量。

表3 原始光譜反射率主成分分析(PC)結果

表4 一階微分光譜數據主成分分析(FDPC)結果
原始光譜反射率與葉片功能性狀之間的相關性如圖2所示。分析結果表明,葉片含水率在731—828、1365—1608、1742—1901、1977—2426 nm波段內與原始反射率之間顯著相關,與綠色植物的光譜反射率的水分敏感波段相似;SPAD在601—720 nm波段內極顯著負相關(P<0.01),符合植物吸收綠光進行光合作用的原理;TC/TN與原始光譜數據的相關性較弱,在426—448 nm,654—687 nm波段內呈顯著正相關(P<0.05),TN在1378—1572 nm,1762—1891 nm波段內呈顯著正相關,TC/TN與TN與原始光譜數據總體相關性較弱;總磷在1305—1390 nm1509—1836 nm范圍內呈極顯著正相關;SLA與原始光譜數據在720—1142 nm波段內呈極顯著正相關(P<0.01)。根據相關性分析的結果,選擇與互花米草功能性狀顯著相關的敏感波段作為自變量,建立基于原始反射率敏感互花米草功能性狀預測模型。

圖2 原始光譜反射率與葉片功能性狀相關性
一階微分轉換后的高光譜數據與互花米草葉片功能性狀的相關性分析結果如圖3所示。從結果中可以看出,總體上一階微分后的高光譜數據與功能性狀的相關性明顯高于原始光譜反射率,并且相關性更為復雜。首先對于葉片含水率,在541—560、804—967、977—998、1264—1387、1547—1593、1628—1687 nm等波段葉片與一階微分高光譜數據顯著相關(P<0.01);SPAD與一階微分數據在641—675、679—702、711—760 nm波段內極顯著相關(P<0.01);TC/TN在765—775、917—961、1004—1049、1722—1743、2213—2244 nm等波段內顯著相關(P<0.05);TN在1076—1087、1275—1362、1725—1743 nm等波段內與一階微分數據顯著相關;TP與一階微分數據在1461—1542、1678—1712、2055—2127 nm等波段內極顯著相關(P<0.01);SLA與一階微分數據在900—971、1084—1166、1266—1387、1722—1771 nm等波段內呈極顯著相關。根據相關性分析的結果,選擇與互花米草功能性狀顯著相關的敏感波段作為自變量,建立基于一階微分敏感波段的互花米草功能性狀預測模型。

圖3 一階微分數據與葉片功能性狀相關性分析
根據上述表3、表4的結果,分別基于原始光譜、一階微分提取的主成分構建不同功能性狀的SR、BPNN、SVM、RF預測模型。隨機選擇40個樣本用于建模,其余用于驗證,最優模型的確定由決定系數(R2)和均方根誤差(RMSE)來確定。
2.5.1基于主成分分析的葉片功能性狀建模與評價
分別基于原始和一階微分變換的高光譜數據的主成分變量構建SR、BPNN、SVM、RF4種預測模型,建模結果如表5所示。對于兩種數據形式的建模結果,除了TC/TN、TN、SLA三個性狀的極個別模型一階微分的建模效果略低于原始高光譜數據外,其余均明顯優于原始高光譜數據建模,尤其從SR來看,原始光譜數據對TC/TN以及TN的建模精度極低,而一階微分則得到了顯著性的關系結果,雖然精度較低,但也說明一階微分有助于減少建模過程中的不確定性,從而提高建模精度。比較4種模型的建模結果,SR、BPNN、SVM、RF的建模R2依次為0—0.75、0.34—0.89、0.58—1.00、0.98—0.99,雖然SVM的部分建模結果優于RF模型,但是較之于SVM模型,RF模型的穩定性更高,綜合比較可以發現,4種模型的排序為RF>SVM>BPNN>SR,SR模型整體上較差,可能是由于高光譜數據與葉片功能性狀之間的關系是非線性的,因此其建模效果較差。
2.5.2基于敏感波段的功能性狀模型的建立與評價

表6 基于光譜敏感波段的互花米草葉片功能性狀隨機森林模型
通過對互花米草不同葉片功能性狀與原始高光譜以及一階變換后的高光譜數據的相關性分析,針對不同指標得到了不同的相關性分析結果,其中MC主要在紅外區域與高光譜數據存在顯著相關關系,主要是由于在紅外光范圍內,植物的光譜反射率會受到水分的影響,并且該結果也得到了浦瑞良等[22]和哈布熱等[39]研究的證實;與SPAD顯著相關的波段主要集中于可見光的綠光波段,這主要是因為植物主要通過吸收綠光來進行光合作用,該結果在前人的研究中得到了肯定[40-42];TC/TN、TN、TP、SLA與高光譜數據顯著相關的波段主要集中于近紅外和紅外波段,其中TC/TN、TN與原始光譜反射率的相關性較低,與易秋香[43]等以及施潤和等[44]的相關性絕對值達到0.85和0.81相差較大,但是TN與一階微分光譜在675、770、850、1076—1850 nm范圍內與易秋香等[43]的研究結果存在交叉;TP與原始光譜的結果與郭澎濤等[45]的TP在529—578 nm以及699—746 nm與原始反射率顯著相關的結果不同,而TP與一階微分光譜的相關性與其研究結果存在交叉波段;對于以上結果,推斷原因有二,一是由于植物種類的差異,使得光譜以及指標之間都存在差異;二是由于樣本數量的不足,導致相關性水平較低[43]。因此,本研究得到的結果既與前人的研究存在相似之處,又存在一定獨特性,說明不同的植物類型、樣本量以及不同的數據處理方法,會使得功能性狀與高光譜數據之間的相關性分析存在差異。
兩種數據形式與功能性狀的相關性分析結果表明,在相關性水平上以及敏感波段數目上均證明了一階微分光譜數據與葉片功能性狀的相關性水平更高。根據表5、6及圖4中不同模型建模以及驗證精度的結果進一步驗證了一階微分變換的高光譜數據的預測效果優于原始數據。以上結果,與郭超凡等[40]、艾金泉等[42]、余哲修等[46]的結果一致,說明一階微分光譜能夠提高高光譜與功能性狀的相關性,提高功能性狀的反演精度。在本研究中,選擇SR、BPNN、SVM、RF4種回歸模型進行功能性狀的預測,SR模型的建模R2介于0.10—0.75,BPNN建模R2介于0.32—0.89,SVM建模R2介于0.58—1,RF模型的建模R2介于0.98—0.99,與前人的結果相比較,本研究取得的結果是相對準確的(表7)。

圖4 互花米草葉片功能性狀隨機森林驗證集預測值和真實值

表7 模型結果與前人比較
以主成分分析結果為變量,比較4種模型在不同指標上的估算結果發現,逐步回歸模型在MC、SPAD、TP以及SLA的估算精度明顯優于TC/TN和TN(表5);而其他3種模型在不同指標上的結果無較大變化,因此,其他3種模型較逐步回歸模型更加穩定,其中RF模型的結果更加穩定。綜上所述,RF優于其他3種模型,可能是因為RF的建模過程隨機性強,決策樹的節點分裂以及每個節點分割變量的產生都是隨機的,且不需要進行參數調整,也不易出現過擬合現象,因而更加穩定和準確[50,51];SVM和BPNN預測效果不穩定的原因可能是其模型的構建需要較大的樣本量來支撐,而本研究中的樣本量不足以使其穩定,并且在Cui等[52]的研究中發現,RF、SVM、BPNN在不同季節不同指標的反演中均達到了很好的效果,因此排除了采樣時間這一影響因素;而SR模型效果較差的原因可能是由于功能性狀與高光譜之間的關系是非線性的,因而得到的模型準確性差。由于植物種類和性狀指標的差異,模型的適用性會存在差異,本研究中RF模型在現有指標以及現有樣本量情況下都取得了很好結果,而其他模型的效果還有待進一步的驗證。
本研究以江蘇鹽城濱海濕地的互花米草為研究對象,采用室內光譜儀獲得互花米草的高光譜反射率,通過實驗室測定獲得互花米草葉片的相對葉綠素含量、葉片含水率、比葉面積、葉氮、葉磷、碳氮比指標。闡明了不同葉片功能性狀與高光譜數據的相關性,選出了敏感波段;比較了逐步回歸、BP神經網絡、支持向量機、隨機森林4種模型的預測效果,并進一步驗證了隨機森林模型的適用性和準確性,主要結論如下:
(1)不同性狀與高光譜數據對應的敏感波段存在差異,其中,與葉片含水率顯著相關的波段主要位于近紅外和紅外光波段;相對葉綠素含量的敏感波段則位于可見光波段;碳氮比和比葉面積兩個性狀與原始光譜數據的可見光波段高度相關,總氮、總磷則與原始光譜數據的紅外波段高度相關,而對于一階微分光譜數據,相關性比較復雜,敏感波段既存在于可見光波段,又存在于紅外波段,顯著相關的波段遠多于原始高光譜反射率。總體上來說,一階微分變換的光譜數據與功能性狀之間的相關性更強,有助于提高建模精度。
(2)通過對原始光譜數據以及一階微分變換后的高光譜數據進行主成分分析提取新的主成分參數,建立不同功能性狀的預測模型,綜合比較不同性狀不同模型的結果,發現隨機森林模型>支持向量機>BP神經網絡>逐步回歸,其中隨機森林的建模以及驗證精度均大于0.80,逐步回歸模型的建模精度明顯低于其他模型,原因可能是功能性狀與高光譜數據之間的關系是非線性的,因而導致模型結果存在較大差異。
本研究進一步證實了原始光譜數據以及一階微分數據對互花米草不同功能性狀的預測能力,可為大范圍監測互花米草的入侵提供先驗知識以及基礎數據。同時本研究還進一步證實了隨機森林模型的適應性和穩定性,但該結果還需要大量的實驗來進行檢驗和修正。