徐立晨, 耿 君, 朱璨陽, 徐杰銘, 涂麗麗, 黃建偉
(1.合肥工業大學 土木與水利工程學院,安徽 合肥 230009; 2.安徽農業大學 資源與環境學院,安徽 合肥 230036)
土地利用/土地覆蓋(land use/land cover,LULC)變化是描述人類活動對地表變化影響的最基本和最突出的特征,多用于區域和全球環境變化研究[1]。由于城市化進程的迅速發展,很難實現對城市土地覆蓋變化(land cover change,LCC)的動態監測,衛星遙感技術在監測宏觀LULC變化方面發揮著不可替代的作用[2]。利用遙感技術或數據對LCC的相關研究涉及土地覆蓋的提取、動態變化和驅動力分析。文獻[3]研究Landsat 5 TM和Landsat 7 ETM+遙感圖像,制作了30 m分辨率的全球土地覆蓋分類圖;文獻[4]基于Landsat 8 OLI等衛星遙感影像,實現了2010—2015年中國土地利用變化的動態監測。然而,在上述LCC研究中,大多數采用傳統的費時費力的數據采集和處理方法。
近年來,免費遙感影像云處理平臺谷歌地球引擎(Google Earth Engine,GEE)的出現為地理空間分析提供了新的解決方案[5],它可以避免傳統的衛星圖像處理步驟,如影像下載和預處理,大大提高了大尺度長時間序列LULC監測的效率[6]。快速發展的GEE得到了廣泛的應用。文獻[7]在GEE平臺支持下,使用超過650 000張Landsat影像,繪制了2000—2012年間30 m分辨率的全球森林變化圖;文獻[8]使用2 116幅Landsat 5 TM、Landsat 7 ETM+和Landsat 8 OLI衛星影像,繪制了2015年北京的土地覆蓋類型圖;文獻[9]使用223張Landsat 5 TM、Landsat 7 ETM+和Landsat 8 OLI衛星影像,繪制了過去30年南京土地利用變化分類圖。上述相關研究往往側重于發達城市,對發展中但快速增長的城市研究很少。
進入21世紀以來,合肥市經濟高速增長,不可避免地導致城市擴張和LCC。本文在GEE平臺海量數據資源和交互式大數據計算服務的支持下,利用多景Landsat 5 TM、Landsat 7 ETM+和Landsat 8 OLI影像,繪制合肥市2000—2020年的長時間序列土地覆蓋圖,分析地物時空變化,對研究區20年間的植被覆蓋度(fractional vegetation cover,FVC)變化進行研究,討論社會經濟驅動因素對研究區土地覆蓋類型變化的影響。
合肥是中國安徽省省會(30°57′~32°32′N,116°41′~117°58′E),平均海拔20~40 m,地形以平原和丘陵為主,有9個縣和行政區,總面積約為11 445.1 km2。
Landsat衛星系列提供連續且相對高分辨率的遙感影像,這些影像可以包含在GEE的公共數據檔案中,并用于監控長期動態LCC,本文使用Tier-1 Top of Atmosphere反射率影像數據。同時,為了提高分類精度,使用GEE中的多種輔助數據,包括數字高程模型數據和夜間燈光指數數據,前者如航天飛機雷達地形測繪使命(Shuttle Radar Topography Mission,SRTM) 數據,后者如美國國防氣象衛星計劃衛星搭載的線性掃描業務系統(Defense Meteorological Satellite Program Operation Linescan System,DMSP-OLS)傳感器數據、國家極軌合作/可見紅外成像輻射儀套件(National Polar-Orbiting Partnership Visible Infrared Imaging Radiometer Suite,NPP-VIIRS)傳感器數據。此外,合肥市行政區劃矢量數據來源于中國國家地理信息中心網站(http://ngcc.cn/ngcc/),在合肥市統計局網站(http://tjj.hefei.gov.cn/)上得到土地覆蓋類型變化的主要驅動因素數據。本研究中使用的6個數據集信息見表1所列。

表1 6個數據集的空間與時間分辨率
在本研究中,使用覆蓋研究區研究年份及其前后各1 a的影像,合成無云覆蓋影像。使用“ee.Algorithms.Landsat.simpleCloudScore”函數,將云閾值設置為20,通過為圖像集合中的每個像元分配云分數來開發云掩膜封裝算法。為了消除每年雨季和積雪對分類結果的影響,將日期范圍設定為每年3月1日至6月15日和7月16日至11月31日。基于過濾圖像的可用性,創建5個圖像集合,相應時間節點分別為2000年、2006年、2011年、2016年和2020年,每個研究年份連同前后各1 a的影像合成1期無云覆蓋影像。
監督分類通常需要一定數量的訓練樣本和驗證樣本。傳統的研究方法通常使用人工目視解譯方法來獲得樣本點,工作量很大,工作效率不高;本文采用一種獲取高精度樣本點的方法來減少工作量,該方法包括線上提取和線下檢驗2個部分。
(1) 線上提取。根據研究區間,選擇基于2010年的GlobeLand30和MCD12Q1土地覆蓋產品,在GEE平臺進行分層采樣,得到隨機樣本點。將2幅影像的地物屬性信息重新映射組合為本文所需的地物類型屬性,利用“StratifiedSample”函數對影像進行分層采樣,得到總計1 200 個樣本數據點。
(2) 線下檢驗。在線上提取的樣本點中,會出現個別錯誤像元,需要通過線下Google Earth中的高分辨率遙感影像檢驗來完善樣本數據。在分類過程中,將采集的樣本點中的70%用作訓練樣本點,30%作為驗證樣本點。研究區5個時間節點影像數和樣本點數見表2所列。

表2 研究區5個時間節點影像數和樣本點數
隨機森林(random forest,RF)算法是一種相對較新的機器學習算法;RF分類器是一種優秀的分類器,它使用多棵樹來訓練和預測樣本[10],采用自助式重采樣技術,在生成訓練集時,為每個訓練集構造1個決策樹,在節點中查找要分割的特征,并隨機提取一些特征,然后在特征中找到最優解,將其應用于節點分割。因此,RF算法具有良好的精度,可以有效地用于大型土地覆蓋數據集[11]。
為了提高分類精度,選擇多種特征變量,如多種光譜波段、SRTM數據、DMSP-OLS數據、NPP-VIIRS數據和光譜特征指數,作為RF算法模型的輸入變量數據。光譜特征指數包括歸一化植被指數(normalized difference vegetation index,NDVI)INDV、歸一化水體指數(normalized difference water index,NDWI)INDW、修正歸一化水體指數(modified normalized difference water index,MNDWI)[12]IMNDW和歸一化建筑指數(normalized difference built-up index,NDBI)INDB,添加這些變量可以提高植被、水體和建成區的分類精度,突出特征信息。上述4個光譜特征指數的計算公式如下:
INDV=(ρnir-ρred)/(ρnir+ρred)
(1)
INDW=(ρgreen-ρnir)/(ρgreen+ρnir)
(2)
IMNDW=(ρgreen-ρswir1)/(ρgreen+ρswir1)
(3)
INDB=(ρswir1-ρnir)/(ρswir1+ρnir)
(4)
其中,ρgreen、ρred、ρnir、ρswir1分別為Landsat 5 TM、Landsat 7 ETM+中第2波段至第5波段反射率,同時為Landsat 8 OLI第3波段至第6波段反射率。

(5)
對LCC圖像的處理步驟如圖1所示。

圖1 土地覆蓋制圖和機理分析流程圖
在GEE平臺上使用RF分類器將獲得的復合物分為以下4個土地覆蓋類別:① 植被,包括農田、林地和草地等;② 水體,包括河流、湖泊、水庫、池塘、泥灘和濕地等;③ 建成區,包括城鄉地區、工礦用地和住宅用地等;④ 裸地,主要包括裸地、鹽堿地和裸石礫石地等。
在RF算法模型中,每個節點上用于分割的決策樹和特征的數量對分類結果至關重要。本文采用具有不同決策樹的RF分類器,并將決策樹的數目設置為30;模型輸入參數包括原始光譜波段、多種輔助數據和4個光譜特征指數。
在GEE中使用混淆矩陣的形式計算基于Landsat影像分類結果的精度,包括總體精度、Kappa系數、用戶精度和生產者精度。
5個時間節點研究區地物分類的總體精度和Kappa系數結果見表3所列。

表3 5個時間節點地物總體精度和Kappa系數評估結果
由表3可知,評估分類總體精度在91%以上,Kappa系數在0.85以上。在所有分類地物中,水體的分類精度較高,通過進一步計算分析,得到水體的用戶精度和生產者精度都在95%以上,可見2種水體指數對于分類結果具有較大的影響;與地表水體相比,建成區和裸地的分類精度相對較低,建成區和裸地難以區分是由于它們具有相似的光譜特征,對其分類時會出現較大相互判別錯誤,其分類結果會出現較大偏差。總體而言,各時期分類結果的總體精度較高,表明4種土地覆蓋類型與相應的驗證數據集具有較強的一致性,不同時期影像的分類結果可用于評估區域土地覆蓋格局和分析土地利用變化情況。
利用RF算法生成研究區2000年、2020年土地覆蓋分類圖,如圖2所示。利用ArcGIS 10.2軟件的疊加函數,得到研究區2000—2020年LCC轉移矩陣,見表4所列。

圖2 研究區2000年、2020年土地覆蓋分類結果

表4 2000—2020年研究區LCC轉移矩陣 單位:km2
由圖2、表4可知,合肥地區城市化呈現多核、多中心輻射到周邊地區的結構模式,建成區以不同中心為中心點向外擴散。
近20年來,城市的建成區面積逐漸擴大,由419.72 km2逐漸增加到1 530.20 km2,其中在2000—2006年增長最快,增長率為90.46%;2011—2016年也以35.33%的增長率快速增加;建成區總面積增加1 110.48 km2,增長率約為264.58%。水體面積也在持續增加,增加面積約為415.14 km2,增長率約為39.54%;裸地面積也在不斷增加,增加總面積約為126.94 km2。
根據(5)式計算FVC。由表4可知:81.3%的植被面積(8 062.25 km2)保持不變;4.3%的植被面積(426.97 km2)轉化為水體;12.9%的植被面積(1 279.92 km2)轉化為建成區,這也是植被面積轉化為其他土地特征的最大部分,意味著合肥市建設用地面積不斷增加,城市化進程明顯加快;1.4%的植被面積(142.89 km2)轉化為裸地。總體而言,由于合肥市經濟和城市化的快速發展,近20年來植被面積快速減少(約占植被面積的18.7%)。
合肥市2000—2020年FVC時空分布變化如圖3所示。

圖3 合肥市2000—2020年FVC時空分布變化
城市化的快速擴張不可避免地需要占用郊區或周邊農村地區,導致植被區主要轉化為建成區。為了進一步分析植被覆蓋的時空變化,需要區分合肥市2000年、2020年的邊界。使用描繪邊界的方法繪制2000年、2020年城區的邊界,分別如圖3a、圖3b所示。2000年合肥的城區邊界可以看作是2020年時合肥的老城區邊界(圖3c虛線內的區域),而過去20年的城區擴張區域則為圖3c中虛線和實線之間的區域。
繪制2個區域后,可以看出明顯的FVC時空變化規律如下:
(1) 實線和虛線之間67.9%的區域中FVC變化值小于0,表明該區域的FVC呈現明顯的下降趨勢,這是由于合肥市在2000—2020年期間建設了濱湖新區、高新區和經開區3個新區。其中,濱湖新區位于合肥市東南部,高新區和經開區位于合肥市西南部。
(2) 虛線內部66.1%的區域中FVC變化值大于0,說明合肥老城區FVC呈上升趨勢,表明合肥市中心的生態環境正在恢復和改善。
(3) 總體來看,隨著合肥市的城市化建設,近20年來植被面積明顯減少,而合肥市老城區植被面積和生態承載力明顯增加,意味著在過去20年里,合肥同時經歷了經濟的快速發展和環境保護的改善。
影響LCC的社會經濟因素是復雜的,因此,選擇合適的驅動因素是分析LCC的關鍵[14]。人類經濟活動影響著LCC,人口的增加導致不同土地覆蓋類型的變化。
2000—2020年,合肥市加大戰略性新興產業發展力度,推進產業結構調整,加快轉型步伐,本研究選取5個時間節點年末總人口、GDP、建成區面積和植被面積,進行合肥市LCC變化分析,結果如圖4所示。

圖4 2000—2020年合肥市4個LCC參數變化曲線
近20年來,國家和安徽省先后批準建設合肥濱湖新區、高新技術產業開發區(高新區)和經濟技術開發區(經開區);此外,合肥也被確立為綜合性國家科學中心之一。基于上述政策,合肥正積極加快經濟發展和城市建設。從圖4可以看出,總人口、GDP和建成區面積的總體變化趨勢相似,植被面積變化趨勢則相反。為了定量評估4個參數之間的相關性,計算4個參數曲線之間的相關系數,結果見表5所列。由表5可知,所有相關系數的絕對值均大于0.85。因此,人口增長和社會經濟發展是合肥市土地覆蓋結構變化的2個重要因素。

表5 4個參數曲線相關系數矩陣
經濟發展的高速增長不可避免地導致LCC發生巨大變化,尤其是郊區和農村周圍的植被和水體。合肥市在過去20年中經濟快速增長,本文借助GEE平臺強大的海量數據處理和并行計算能力,基于構建的樣本數據和輔助數據,結合強大的RF算法,利用多景Landsat TM、ETM+和OLI衛星遙感影像,生成具有較強時效性的多年土地覆蓋產品,對合肥市2000—2020年的LCC進行分析研究。結果表明:在過去的20年中,植被面積減少18.7%,大部分植被減少區域集中在合肥市東南部和西南部,這與合肥市在此期間大力建設3個新區密切相關;水體面積增加415.14 km2,增長39.54%。經濟的快速發展和人口的迅速增長是導致植被面積減少和建成區面積擴張的主要驅動力因素。通過分析研究區FVC的時空變化可知,合肥市FVC呈現顯著減少特征,而老城區的FVC呈現增加態勢。本文研究結果可為區域后續的LCC研究以及環境保護政策制定和改善提供基礎數據支持。