黎明 楊征義 江琪



DOI:10.19850/j.cnki.2096-4706.2024.01.038
收稿日期:2023-07-31
摘? 要:為探究山東半島土地利用的動態變化,文章以山東半島為研究區,利用GEE平臺,以Landsat遙感影像、DEM數據、光譜指數數據為基礎,基于隨機森林算法對1991—2021年山東半島7期土地利用分類數據進行提取,并對山東半島1991—2021年土地利用動態變化進行分析。分析結果表明:每期數據的OA指數均超過87%,Kappa系數均在0.85以上,說明隨機森林分類算法分類精度可靠;建設用地、水域兩類用地面積增加,耕地、未利用地、草地三類用地面積減少,林地面積整體變化較小,呈現較穩定的狀態。研究結果有助于優化山東半島的土地利用格局與生態環境保護。
關鍵詞:土地利用變化;隨機森林;山東半島
中圖分類號:TP391? ? ? ? 文獻標識碼:A? ? 文章編號:2096-4706(2024)01-0180-05
Analysis of Land Use Dynamic Changes Based on Random Forest Algorithm
LI Ming1, YANG Zhengyi2, JIANG Qi3
(1.Shandong Province Land Surveying and Mapping Institute, Ji'nan? 250102, China; 2.Zhiyang Innovation Technology Co., Ltd., Ji'nan? 255086, China; 3.Shandong University of Science and Technology, Qingdao? 266590, China)
Abstract: In order to explore the dynamic change of land use in Shandong Peninsula, this paper takes Shandong Peninsula as the study area, and uses the GEE platform, based on Landsat remote sensing images, DEM data, and spectral index data, and extracts seven periods of classified data of land use in Shandong Peninsula from 1991 to 2021 based on the Random Forest Algorithm, and analyzes the dynamic changes of land use in the Shandong Peninsula from 1991 to 2021. The results of the study show that the OA index of each period data exceeds 87%, and the Kappa coefficients are above 0.85, indicating that the classification results of the Random Forest Classification Algorithm are reliable in terms of accuracy. The area of construction land and water area has increased, while the area of cultivated land, unused land, and grassland has decreased. The overall change in forest area is relatively small, showing a stable state. The research results contribute to optimizing the land use pattern and ecological environment protection in the Shandong Peninsula.
Keywords: land use change; Random Forest; Shandong Peninsula
0? 引? 言
土地資源是人類生存和發展的根本,是社會進步的物質基礎[1]。隨著我國城市化進程的加快,人們加速了對土地資源的開發與使用,不僅改變了土地覆被格局,而且深刻地影響著全球生態環境[2]。
隨著全球人口的急劇膨脹,地球資源的快速消耗,如何緩解人類活動與生態環境間的矛盾沖突問題日益重要。而土地利用/土地覆蓋變化(LUCC)正是一項人類社會經濟活動與自然環境互動的研究,因此成為國際上全球變化研究的前沿和熱門課題。近年來,高時空分辨率遙感影像在地表利用分類中的應用,使地表利用產品由原來的千米級向30米甚至更高的空間分辨率發展。歐洲空間局制作了一套哥白尼全球陸地植被數據集CGLS-LC100[3]。在國內,吳炳方等[4]編制了中國2000年和2010年的30米分辨率土地覆蓋產品ChinaCover,并對中國10年間土地利用變化進行了分析。此外宋文杰等[5]以1965—2015年土地利用數據為例,分析了人為因素和政策因素對天山北坡區經濟社會發展的作用。目前,國內外科學家在GEE平臺上取得了一些進展。例如,Kelsey等人利用GEE研究了南卡羅來納州和佐治亞州的薩凡納河在1999、2005、2009和2015四個時期內出現的地表覆蓋類型和分布[6]。Huang等[7]基于GEE平臺,對北京地區的NDVI數據進行了時序分析,得到了2015年城市用地類型。桑國慶等[8]利用GEE云計算平臺,結合Sentinel遙感影像,構建了湖南省高精度的水稻收獲決策樹模型,并在此基礎上,獲取了2017—2020年間的高精度水稻種植格局。朱德海等[9]基于GEE遙感數據,對山東省溫室大棚進行紋理、時域、頻域分析,采用隨機森林方法,得到近30年來山東省溫室大棚的空間分布規律及時空演變規律。
鑒于此,本文利用GEE云計算平臺,以Landsat遙感影像數據為基礎,結合DEM數據和光譜指數,基于隨機森林算法,提取出山東半島1991—2021年7期土地利用分類數據,利用空間分析工具制作空間對比圖,分析山東半島土地利用結構變化、土地利用動態變化、土地利用轉移變化和土地利用景觀格局變化等,對山東半島1991—2021年土地利用時空演變特征進行研究,探討其轉化特征及規律。研究成果可為山東半島城市發展提供數據支持。
1? 研究區概況
山東半島是中國最大的半島,位于中國山東省的東側,三面臨海,西連華北大平原,北緯35°05′~
37°50′,東經119°16′~122°42′。該地區長290千米,寬190千米,總面積6.2萬平方千米。山東半島地形以平原丘陵為主,丘陵海拔多在200米左右。半島東部有數條東北—西南走向的山脈,嶗山為其最高峰,海拔1 130米。
山東半島處在暖溫帶季風氣候區,四季分明,具有明顯的季節性和地域性特征。與同緯度內陸相比,受海洋的影響,氣候更加溫和。年平均溫度變化范圍為11~14 ℃,無霜期從西北向西南遞增。山東半島降水季節分布不均,夏季降雨量集中,約占全年降雨量的70%。山東半島研究區概況圖如圖1所示。
2? 數據來源、處理及研究方法
2.1? 數據來源及處理
本研究基于GEE平臺提供的1991—2021年間的山東半島遙感數據,影像選取了當年5月至10月間Landsat 5 TM、Landsat 7 TM和Landsat 8 OLI影像數據。其中Landsat 5平臺于1984年開始運行,它搭載了主題映射儀(TM)的傳感器,可在不同波段中捕捉地球表面的圖像,包括可見光、近紅外和熱紅外波段。Landsat 7是在1999年發射的衛星,它搭載了一個增強型主題映射儀加(ETM+)的傳感器,可以捕捉地球表面在多個波段上的圖像,范圍從可見光到熱紅外線。相比之下,2013年發射的Landsat 8搭載了兩個傳感器,分別是操作在可見光譜和近紅外波段的OLI(Operational Land Imager)以及操作在熱紅外波段的TIRS(Thermal Infrared Sensor)。這兩個傳感器提供高分辨率、高重復性的數據,使科學家們能夠更好地監測陸地表面的變化。本研究使用的所有Landsat圖像數據均在GEE平臺上直接獲取。預處理的主要任務為影像去云、鑲嵌與裁剪。
2.1.1? 影像去云
本研究從Landsat數據集中選擇了SR表面反射率產品,并基于GEE平臺對其進行去云處理。該處理方法主要采用QA波段,結合QA波段的位運算對像素值篩選。同時,我們還選取了GEE平臺提供的Landsat上層大氣反射率產品中的TOA數據,可以直接調用地球引擎中定義的ee.Algorithms.Landsat.simpleComposite()函數來進行去云處理。
2.1.2? 鑲嵌與裁剪
本研究區域范圍較廣,需要對各期圖像進行鑲嵌。在通過GEE平臺調用mosaic()函數進行圖像鑲嵌的過程中,通常會遇到了兩個問題:首先,在對遙感圖像進行去云處理后,可能會出現“空洞”。為了解決這個問題,可以通過線性插值法填補丟失影像數據。其次,由于不同圖像之間存在重疊區域,因此可能會出現部分區域重疊不連續的情況??墒褂胢edian()函數計算出圖像集的中位數,并選擇與中位數相差最小的圖像進行鑲嵌處理。我們根據山東半島的邊界矢量,調用clip()函數裁剪掉研究區以外的圖像區域,最終得到遙感圖像預處理的結果。
2.2? 研究方法
2.2.1? 分類樣本集構建
依據土地利用分類標準,將山東半島土地利用類型劃分為草地、耕地、建設用地、林地、水域和未利用地。在不同時期,不同土地利用類型成像具有明顯不同的特征[8]。遙感影像分類的精度不僅受制于遙感影像質量,還與樣本數據的選取質量直接相關。樣本的選擇應遵循均勻分布、隨機選擇的原則,同時考慮地形、氣候等影響,盡量避免有云霧和陰影的地區。本研究在GEE平臺上,選取1991、1996、2001、2006、2011、2016年和2021年高分辨率遙感影像為研究對象,按照分類標準選擇6類土地利用類型,構建7個時段的分類樣本集。對樣本數據進行格式轉換和賦值處理后,輸入到GEE平臺。在獲得初步分類結果后,可以根據分類結果進一步增減樣本點,反復迭代直至達到滿意的精度。
2.2.2? 多維分類特征集構建
在進行遙感圖像分類時,僅使用原始光譜波段進行分類可能會出現偽影,如森林地區,可能會導致相當雜亂的分類結果。所以需要進行數據變換再提取光譜指數,根據修改后的光譜指數來輔助分類。然而,利用單一光譜特性進行分類存在一定的缺陷,并且會受到同譜異物和異譜同物的影響。為了克服這些問題,提高圖像的分類精度,本研究引入了紋理特征和地形特征,構建一套多維分類特征作為隨機森林分類器的輸入,從而獲得更可靠的分類結果。
對于多光譜波段特征,本研究考慮可見光波段中地物的判別特性以及各波段中不同地物反射率的差異。因此,選擇多個波段作為圖像的分類特征。此外,引入光譜指數,來更好地反映地物的波譜特性,從而提升地物分類的準確率。在遙感圖像的分類中,紋理是區分物體的一個重要特征,反映圖像的結構特征。通過考慮不同地形類別的紋理特征,可以有效地幫助圖像分類。目前,提取方法主要包含統計法、基于原始紋理分析的結構法、基于模式的方法和信號處理法四類。在地物紋理特征提取中,灰度共生矩陣是地物紋理特征提取中最常用且效果最好的方法之一。山東半島的地形主要以丘陵和平原為主。在本研究中,調用USGS/SRTMGL1_003數據的ee.Algorithms.Terrain()函數,選取坡度和高度作為地形特征參與影像分類。表1為本研究的分類特征集。
2.2.3? 基于隨機森林算法分類
隨機森林(Random Forest, RF)是一種高效、準確、穩定的集成學習算法模型[10]。相較于其他傳統分類方法,RF算法有著許多優點,首先它可以減少過擬合問題,并提高模型的泛化能力;其次,隨機森林可以處理高維數據,避免了數據稀疏性和維度災難問題;最后,隨機森林可以評估變量的重要性,并在特征選擇上起到了一定作用。此外,它還能夠處理高維數據,在遙感圖像分類領域擁有廣泛應用和巨大優勢。分類示意圖如圖2所示。
3? 結果與分析
3.1? 分類精度分析
本研究基于隨機森林算法對山東半島6種土地利用類型進行分類,將分類結果與剩下30%的樣本進行混淆矩陣的精度分析,通過混淆矩陣分析來驗證隨機森林算法在分類中的效果。分類結果如表2所示。
山東半島1991、1996、2001、2006、2011、2016年和2021年7期分類結果的總體精度OA指數分別為87.09%、90.85%、87.73%、91.48%、91.77%、93.59%和94.84%,Kappa系數分別為0.86、0.88、0.86、0.89、0.90、0.92和0.93均在0.85以上。2021年的OA指數和Kappa系數最大,分別為93.84%和0.92,OA指數均高于87%,1991年的OA指數和Kappa系數最小,分別為87.09%和0.85??傮w而言,基于GEE平臺的隨機森林算法的分類效果良好。
3.2? 土地利用動態變化分析
為了分析山東半島1991—2021年土地利用動態變化情況,基于土地利用數據,計算出各類土地在1991—2021年的動態變化值,根據表3和圖3可得,山東半島的不同土地利用類型均發生了顯著變化。
按照面積總變化量從大到小排序為耕地、水域、建設用地、未利用地、林地、草地,主要表現為:
1)建設用地、水域兩類用地面積增加:30年間建設用地面積增加了2 725 km2,其比重上升了4.39%,水域面積增長顯著(增加3 041 km2),增長范圍主要集中在山東半島西北部黃河三角洲附近。
2)耕地、未利用地、草地三類用地面積減少:30年間耕地面積減少3 042 km2,面積比重由1991年的63%下降至58.11%,其次是未利用地,面積由1 921 km2下降至654 km2,面積比重降低2.04%。草地下降較為明顯,由3.08%下降至1.61%,面積減少907 km2。
3)林地面積整體變化較小,呈現較穩定的狀態,變動幅度不大,占比在15.7%~14.83%浮動。
3.3? 土地利用時空變化分析
基于山東半島七期土地利用現狀圖,分析山東半島在1991—2021年的土地利用時空分布變化的情況。
由圖4至圖7可知,山東半島的耕地主要分布在中部、南部和西北部,集中于東營、濰坊中北部和青島中西部等平原區域。林地主要分布在東北部、西南部和東南部,集中于煙臺、威海、濰坊南部和青島北部等丘陵區域。草地則比較分散,分布范圍較廣。山東半島的水域包括大沽河、峽山水庫、產芝水庫、膠萊河以及沿海人工魚塘等,分布區域相對零散。建設用地主要集中于山東半島各城鎮區域,分布范圍廣泛。未利用地主要分布在北部沿海地區。
4? 結? 論
本研究在GEE環境下完成了土地利用分類樣本集的構建。采用隨機森林算法對山東半島6種土地利用類型進行分類,得到了1991—2021年7期土地利用分類數據,并進行了土地利用動態變化變化分析。研究發現,在這30年間,建設用地、水域兩類用地面積增加,耕地、未利用地、草地三類用地面積減少,林地面積整體變化較小,呈現較穩定的狀態,變動幅度不大。山東半島的耕地主要分布在中部、南部和西北部,林地主要分布在東北部、西南部和東南部,草地與水域則比較分散,分布范圍較廣。建設用地主要集中于山東半島各城鎮區域,未利用地主要分布在北部沿海地區。
參考文獻:
[1] 周鴻翔.基于3S技術開展土地利用動態監測綜述 [J].測繪與空間地理信息,2019,42(6):56-57+63.
[2] 黃寶華.基于遙感的山東省土地利用時空變化和驅動力分析 [J].農學學報,2021,11(4):62-67.
[3] BUCHHORN M,LESIV M,TSENDBAZAR N,et al. Copernicus Global Land Cover Layers—Collection 2 [J/OL].Remote Sensing,2020,12(6):1044(2020-03-24)[2023-06-26].https://doi.org/10.3390/rs12061044.
[4] 吳炳方,苑全治,顏長珍,等.21世紀前十年的中國土地覆蓋變化 [J].第四紀研究,2014,34(4):723-731.
[5] 宋文杰,張清,劉莎莎,等.基于LUCC的干旱區人為干擾與生態安全分析——以天山北坡經濟帶綠洲為例 [J].干旱區研究,2018,35(1):235-242.
[6] CHEN B Q,XIAO X M,LI X P,et al. A mangrove forest map of China in 2015: Analysis of time series Landsat 7/8 and Sentinel-1A imagery in Google Earth Engine cloud computing platform [J].ISPRS Journal of Photogrammetry and Remote Sensing,2017,131:104-120.
[7] HUANG H B,CHEN Y L,CLINTON N,et al. Mapping major land cover dynamics in Beijing using all Landsat images in Google Earth Engine [J].Remote Sensing of Environment,2017,202:166-176.
[8] 桑國慶,唐志光,毛克彪,等.基于GEE云平臺與Sentinel數據的高分辨率水稻種植范圍提取——以湖南省為例 [J].作物學報,2022,48(9):2409-2420.
[9] 朱德海,劉逸銘,馮權瀧,等.基于GEE的山東省近30年農業大棚時空動態變化研究 [J].農業機械學報,2020,51(1):168-175.
[10] BREIMAN L. Random Forests [J].Machine Learning,2001,45(1):5-32.
作者簡介:黎明(1981—),男,漢族,北京人,副研究館員,碩士,研究方向:地理信息成果及檔案管理;通訊作者:楊征義(1997—),男,漢族,山東濟寧人,前端開發者,碩士,研究方向:地理信息系統應用;江琪(1999—),女,漢族,安徽安慶人,在讀碩士,研究方向:地理信息系統應用。