王佃來,宿愛霞,劉文萍
(1.首鋼工學院,北京 100144;2.中國軟件評測中心,北京 100048;3.北京林業大學信息學院,北京 100083)
植被是陸地生態系統的主體,一定程度上能代表土地覆蓋變化,在全球氣候變化研究中起著指示器的作用[1]。植被動態變化監測和評價一直是生態學研究的重要領域和全球變化研究的熱點[2]。植被變化趨勢分析是植被動態變化研究中的重要一環,其研究方法較多,下面列舉近幾年文獻中應用的幾種主要方法:一元線性回歸法趨勢分析法[3-13]、相關系數法[14]、Mann Kendall法[8,15]、 Sen Slope Estimator法[2,15]和Sen + Mann Kendall法[2,16-17]。
Spearman相關系數可度量變量之間強弱關系,該系數對數據分布無要求、可發現線性和非線性關系且對異常值不敏感,該研究對該方法在植被趨勢分析中的應用進行嘗試,并給出應用實例和與其他方法的對比。
為了促進植被變化趨勢分析算法在該研究領域的應用和發展,該研究將幾種常用的趨勢分析方法從植被趨勢變化程度分類、方法歸類和計算復雜度等方面進行對比和分析?;诒本┑貐^1998—2013年SPOT VEGETATION NDVI數據應用上述幾種方法進行植被變化趨勢分析,并對試驗結果進行對比和分析,以期為該領域的應用研究提供借鑒和參考。
1.1線性回歸分析法回歸分析是研究多個變量之間統計聯系的一種重要方法,是分析植被長時序變化趨勢的重要方法?;跁r間變量x與NDVI因變量y,可使用如下數學模型描述:
y=kxi+εi+a
(1)
式中a,k是未知參數,εi是隨機誤差。利用觀測值(xi,yi)(i=1,2,…,n)可以求出未知參數k。
(2)

(3)
對于NDVI長時序數據,采用最小二乘法線性擬合后得到相應的線性方程,方程的斜率k說明像元NDVI值的多年變化趨勢。k>0,表明植被活動呈上升趨勢;k<0,表明植被活動呈下降趨勢。
關于一元線性回歸的植被變化趨勢變化程度分類主要有3種方法:第1種對基于某種閾值進行分類[5,8,13];第2種使用F檢驗進行顯著性判斷[9,12];第3種是使用NDVI序列與時間序列求二者的相關系數,并進行顯著性檢驗來決定分類[7,10]。
1.2Pearson相關系數法Pearson相關系數是研究2個變量之間相關性的方法,是研究長時序植被覆蓋變化趨勢的重要方法,即以NDVI序列(因變量y)和時間序列(自變量x)相關性表達植被變化的趨勢,其數學表達式見公式(4):
(4)
式中,n為時間序列的長度,rp是自變量x與因變量y之間相關程度度量指標,自變量x代表時間值(年度),y代表NDVI值。rp>0表示正相關,說明植被呈現增長趨勢;rp<0表示負相關,說明植被呈現退化趨勢。
rp統計顯著檢驗,在顯著水平α下(如:α=0.05),如果rp大于臨界值r,則認為自變量x與因變量y之間顯著相關,臨界值r可通過查相關系數顯著性檢驗表得到,其自由度為n-2。
在實際應用中可以結合相關顯著性檢驗對植被變化趨勢程度進行分類:①rp>0,且rp在顯著水平α下顯著,表明植被變化趨勢為明顯改善。②rp>0,且rp在顯著水平α下不顯著,表明植被變化趨勢為輕微改善。③rp<0,且rp在顯著水平α下顯著,則表明植被變化趨勢為嚴重退化。④rp<0,且rp在顯著水平α下不顯著,則表明植被變化趨勢為輕微退化。⑤如果rp接近于0,則認為植被變化無增加或降低趨勢。
1.3Mann-Kendall趨勢分析法Mann-Kendall趨勢檢驗過程如下:對于時間序列Xt=(x1,x2,…,xn),Mann-Kendall檢驗統計量S的計算公式如下:
(5)
式中,n為數據序列長度,sgn(xj-xi)為符號函數,其計算方法如下:
(6)
根據樣本數量的不同,顯著性檢驗有所不同,當n>10時,計算標準正態分布統計量Zs,其計算公式如下:
(7)
式中,Var(S)計算公式如下:
(8)


(9)
如果Qmed>0表明植被活動呈上升趨勢,Qmed<0則植被活動呈下降趨勢??梢越Y合時間序列的趨勢度置信區間進行顯著性檢驗來決定植被變化趨勢是否顯著。具體計算過程如下:
1.5Sen+Mann-Kendall方法將Sen slope estimator方法中的趨勢度與Mann-Kendal方法中的趨勢度檢驗結合,可以形成一種新的長時序趨勢分析方法,該方法已成為判斷長時序數據趨勢的重要方法[13]。其中,趨勢度計算方法見公式(9),趨勢度檢驗量計算方法見公式(8),在指定的顯著水平α下,采用雙邊檢驗,即可以判斷長時序植被變化趨勢。

(10)
式中,n為時間序列的長度。
對rs的顯著性檢驗分為以下2種情況:
(1)當樣本數n>50時,rs的顯著性檢驗可用t檢驗,檢驗統計量見公式(3):
(11)
式中,n為樣本數量,rs為Spearman等級系數。以|t|與由t值表上所查得的自由度為n-2的臨界值t′在相應的顯著水平α比較決定是否顯著。
(2)當樣本數n≤50時,rs的顯著性檢驗可以通過查Spearman秩相關系數臨界值表判斷是否顯著。其中自由度為n-2。
2.1方法歸類與對比從參數檢驗和非參數檢驗的角度來說,上述6種方法可分為2類,其中一元線性回歸法和相關系數法屬于參數檢驗,Mann Kendall檢驗、Sen Slope Estimator檢驗、Spearman相關系數法和Sen + Mann Kendall檢驗屬于非參數檢驗。
參數檢驗是針對某個參數做假設,通常會利用到樣本的總體特征,對樣本和樣本誤差分布要求符合正態分布,對噪聲敏感;非參數檢驗是針對總體分布性的假設,無需樣本的總體分布特征,對樣本初始分布無要求。一般情況下,對于能使用參數檢驗的樣本,首選參數檢驗。需要指出的是當前長時序植被變化趨勢中通常數據組長度比較短,一般不超過30組,大多數情況下十幾組,該數量屬于統計意義上的少數,且在遙感圖像中普遍存在噪聲,從這種意義上來說,非參數檢驗更具優勢。
一元線性回歸法和相關系數法由于計算過程簡單,結果容易解釋,且有廣泛的應用,被認為是植被趨勢分析中的最優方法[18-19]。一元線性回歸法受數據絕對量值的影響較大,特別是數據中存在顯著大于平均值的數據時,對計算結果影響較大。在實際應用中,建議對數據進行歸一化處理,減少極值對計算結果的影響。相關系數是一個沒有量綱的歸一化系數,不受數據絕對量值影響,可直接度量植被變化趨勢而不受NDVI值的影響。
Mann Kendall方法、Sen Slope Estimator檢驗、Spearman相關系數法和Sen + Mann Kendall法屬于非參數檢驗范疇,通過分析計算公式(6)~(10)可看出,Sen Slope Estimator檢驗和Sen + Mann Kendall法受數據絕對量值的影響,而另外2種方法是基于比較大小的方法,因此,不受數據絕對量值的影響。在抗噪聲方面Sen Slope Estimator檢驗和Sen + Mann Kendall檢驗強于Mann Kendall和Spearman相關系數檢驗法。
2.2方法的植被變化程度分類對比文獻中對植被趨勢變化程度的分類不盡相同,樸世龍等[14]使用相關系統法結合統計檢驗方法分類4個等級(顯著減小、減小但不顯著、增加但不顯著和顯著增加);元志輝等[10]使用線性回歸法和F檢驗將植被變化趨勢分為5個等級:極顯著減少、顯著減少、變化不顯著、顯著增加和極顯著增加;宋怡等[5]、丘海軍等[8]使用一元線性回歸法將NDVI序列與時間序列的回歸斜率k使用閾值法分為7等級:嚴重退化、中度退化、輕微退化、基本不變、輕微改善、中度改善和明顯改善;李強等[18]使用Mann Kendall方法將Kendallτ使用閾值法分為8類:極顯著持續退化、較顯著持續退化、顯著持續退化、不顯著持續退化、不顯著持續改善、顯著持續改善、較顯著持續改善和極顯著持續改善;其他等級請查閱相關文獻。
一般情況下,對植被變化趨勢的等級劃分有2種方法:一種是使用閾值對統計量進行細分,該方法對植被變化趨勢等級劃分更為細致,通常可以劃分為7類、8類或更多,另一種是針對一個統計量使用假設檢驗,判斷是否在統計意義上顯著,該類方法一般將植被變化趨勢劃分為4類或5類。雖然使用閾值法可將植被趨勢變化等級劃分得更加細致,但是閾值的選取需要使用者具備更多經驗和進行更多的后期驗證,對應用者提出了更高的要求,并且閾值的選取受使用者主觀影響因素較大,有一定的局限性,較難給出統計意義上的解釋和論證。使用統計檢驗對植被變化趨勢進行等級劃分,受主觀因素影響少,一般可將植被變化趨勢劃分為以下5個等級:顯著退化、退化但不顯著、基本不變、改善但不顯著和顯著改善。由于實際計算中基本不變的等級數據較少,有部分文獻將該類歸于改善但不顯著中變為4類:顯著退化、退化但不顯著、改善但不顯著和顯著改善。通過對比可以發現,雖然使用統計假設檢驗受人為因素的影響小,可對結果給出合理的解釋和科學論證,但是在等級劃分的細致性方面存在一定欠缺,無法進行更細致的劃分,在一些應用場景下也有一定的局限性。
2.3方法的計算復雜度參數檢驗的2種方法(一元線性回歸、相關系數法)時間復雜度為O(n),而非參數檢驗的4種方法Mann Kendall、Sen Slope Estimator、Spearman相關系數、Sen + Mann Kendall時間復雜度均為O(n2)。從計算復雜度上來說一元線性回歸和相關系統最為簡單,而對于非參數檢驗的4種方法雖然時間復雜度均為O(n2),但是在計算復雜度上也差別較大,Mann Kendall 只涉及簡單的比較運算;而其余3種方法均需要對數據進行排序,而Spearman相關系數法需要對數據進行2次排序,并且在計算秩次時也比較復雜。如果從計算和實現復雜度對4種非參數檢驗方法進行從高到低的排序,順序如下:Spearman相關系數法>Sen + Mann Kendall法>Sen Slope Estimator檢驗>Mann Kendall檢驗。一元線性回歸和相關系數法大致相當,且計算量明顯小于上述4種非參數檢驗方法。
2.4各方法在北京市植被變化趨勢中的應用為了直觀地比較上述幾種方法之間的差異,基于1998—2013年北京地區SPOT VEGETATION遙感數據應用上述6種方法進行植被趨勢分析。
試驗結果如圖1和表1所示。圖1中的圖A~F分別是應用一元線性回歸法、相關系數、Mann Kendall法、Sen Slope Estimator檢驗法、Spearman相關系數法和Sen +Mann Kendall法的植被趨勢分析結果。植被變化趨勢共分為5個等級,分別為顯著改善(深綠色)、改善但不顯著(淺綠色)、基本不變(黑色)、退化但不顯著(淺褐色)和顯著退化(褐色)。表1中給出了6種方法在北京地區植被變化趨勢等級所占整個北京市總面積的百分比。上述6種方法均采用統計假設檢驗來驗證是否顯著變化,其中:一元線性回歸法采用F 檢驗判斷變化是否顯著(回歸斜率k>0且統計量f<0.01,則植被變化趨勢為顯著改善;k>0且統計量f≥0.01,則植被變化趨勢為改善但不顯著;k<0且f<0.01,則植被變化趨勢為顯著退化;k<0且f≥0.01,則植被變化趨勢為退化但不顯著;k=0則認為植被變化趨勢為基本不變);相關系數、Mann Kendall和Sen+ Mann Kendall均采用顯著水平α=0.05的假設檢驗判斷植被變化趨勢是否顯著;Sen Slope Estimator檢驗和Spearman檢驗分別參考該研究1.4和1.6節中的顯著性判斷方法。
比較圖1中的圖A~F可發現,圖A與其他5幅圖在空間分布上有較大差異,特別是在植被顯著改善和顯著退化區域,圖B~F中植被顯著改善區域集中在北京市北部,而圖A則不同。此外,圖B~F中植被顯著退化的區域集中在環繞北京市城區的區域,而圖A則不同。從以上分析可看出,在北京地區植被趨勢變化分析中一元線性回歸法與其他5種方法存在較大差異。圖B~F的5種植被變化趨勢等級分布在空間上存在很高的一致性,特別在植被顯著改善和顯著退化的區域表現出驚人的一致。

表1 各方法植被趨勢分析結果

圖1 1998—2013年北京市各方法植被變化趨勢Fig.1 Image results of trend analysis of vegetation cover change for each method in Beijing City during 1998-2013
從表1可看出,6種方法在北京市植被變化趨勢分析結果中基本不變、退化但不顯著和顯著退化3個變化等級中較一致,最大差異不超過2%,顯著退化區域的最大差異僅有1.41%,有較高的一致性。一元線性回歸法與其他5種方法的差異性較大。這一點可從圖1中得到直觀印證。
在植被變化趨勢為顯著改善的區域中,除一元線性回歸法外,其余5種方法的檢測結果主要集中在北京市的北部(圖1)。從表1可知,一元線性回歸法在植被顯著改善的區域僅為8.87%,其余5種方法均超過16.00%,存在較大差異。用6種方法分析植被變化趨勢發現,植被改善(包括顯著改善和改善但不顯著)與植被退化(包括顯著退化和退化但不顯著)的區域均分別在72%與27%左右,差異并不大。因此,一元線性回歸法在植被基于F檢驗進行顯著性判斷時其檢出數據明顯小于其余5種方法,其敏感性低于其余5種方法。此外一元線性回歸法檢出的植被顯著改善區域也與其余5種方法的檢出區域在空間分布有較大不同。
在植被變化趨勢為改善但不顯著的區域中,6種方法的檢測結果在空間分布較為相似。從數據上來看,一元線性回歸最高為64.32%,Spearman相關系數法最低為50.97%,其余4種方法在51%~57%,差異較小。
在植被變化趨勢為基本不變的區域中,Sen Slope Estimator方法和Sen+Mann Kendall方法中檢出的值最多且相等,導致此結果的原因是如果植被的NDVI序列中存在較多相同值時,由公式(9)可知會存在較多的0值,因此上述2種方法的檢測結果出現較多的基本不變區域。此外,Mann Kendall方法中由公式(6)可以看出檢驗統計量S也存在0值可能,從該方法的檢測結果上可看出,約存在0.61%的區域為基本不變區域。一元線性回歸法、相關系數法和Spearman相關系數法的檢測結果幾乎不存在基本不變區域,這一點可通過分析公式(2)、公式(4)和公式(10)得到答案。
在植被變化趨勢為退化但不顯著的區域中,6種方法的檢測結果無論在空間分布上,還是在數據上均一致,數據的最大差異僅為1.84%,該區域主要集中在環北京市城區的區域。
在植被變化趨勢為顯著退化的區域中,除一元線性回歸法外,其余5種方法的檢測結果在空間分布和數據上基本相同,象一個馬蹄形環繞在北京市城區,僅在西北方有一個開口。
(1)參數檢驗中的一元線性回歸法與相關系數法兩者計算量相當,對噪聲敏感,對數據的分布要求滿足正態分布,試驗結果對比顯示兩者的檢測結果在空間分布和數值上存在較大差異,相關系數法與非參數檢驗的4種方法的檢測結果較一致。在噪聲和數據分布相同條件下的植被趨勢變化分析中,植被變化趨勢等級劃分粒度較粗時,推薦使用相關系數法;如果要對植被變化趨勢等級進行細致劃分,則使用一元線性回歸法選擇合適的閾值區間劃分植被變化趨勢等級。
(2)非參數檢驗的4種方法在植被趨勢變化檢測的結果中顯示在空間分布和數值上基本一致,如果數據質量較高且噪聲較少時,推薦使用Mann Kendall法;如果數據中存在較多噪聲,則推薦使用Sen + Mann Kendall法。Spearman等級相關系數法對數據分布無要求、可發現線性及非線性關系和對異常值不敏感的特性,可作為一種有潛力的植被趨勢方法使用。
(3)在長時序遙感植被變化趨勢分析中,受遙感數據集的限制,數據組的長度往往小于30,并且遙感數據集中普遍存在噪聲,非參數檢驗是一種較好的選擇。今后將選擇更多的數據集和區域進行結果驗證,進一步分析上述方法的優劣,為植被變化趨勢分析研究提供借鑒和參考。