譚秋焰 吳彩燕 賈菊桃 朱新婷 廖軍
摘要:為實現滑坡遙感影像的自動提取,以貴州省水城縣為研究區,運用GF-1遙感影像數據,剔除明顯非滑坡地物后,應用云變換計算樣本區影像像元亮度值,統計得到聚類中心值和聚類個數,結合快速廣義模糊C-均值聚類算法進行像元聚類,提取出128處準確滑坡,kappa系數達0.752,總體精度達0.880。該方法可自動提取出滑坡范圍,減少工作量和主觀影響,提高了基于遙感影像進行滑坡識別的效率和精度。
關鍵詞:滑坡遙感影像快速廣義模糊C-均值聚類算法云變換
中圖分類號:P237;P642.22文獻標志碼:A文章編號:1671-8755(2023)01-0054-07
Abstract:Inordertorealizetheautomaticextractionoflandslidefromremotesensingimages,ShuichengCounty,GuizhouProvince,wastakenastheresearcharea.UsingtheGF-1remotesensingimagedataandremovingtheobviousnonlandslidefeatures,theimagedigitalnumberinthesampleareawascalculatedbycloudtrasforation,andtheclustercentervalueandclusternumberwereobtainedstatistically.AndcombinedwiththefastgeneralizedfuzzyC-meansclusteringalgorithmforpixelclustering,128accuratelandslideswereextracted.Thekappacoefficientwas0.752,andtheoverallaccuracywas0.880.Thismethodcanautomaticallyextractthelandsliderange,reducetheworkloadandsubjectiveinfluence,andimprovetheefficiencyandaccuracyoflandsliderecognitionbasedonremotesensingimages.
Keywords:Landslide;Remotesensingimages;FastgeneralizedfuzzyC-meansclusteringalgorithm;Cloudtransformation
滑坡屬于我國最常見的地質災害類型之一,分布廣泛,發生率高,威脅著人類的生命和財產安全[1]。傳統的滑坡調查是依靠人力現場調查,在易發生滑坡的山區中,往往因災害造成的交通堵塞而不能及時到達現場。遙感技術具有成像快、范圍廣的優勢,能夠快速準確地獲取滑坡災害的位置、數量、大小等信息,現已作為調查滑坡的基本手段被廣泛應用[2]。通過目視解譯對遙感影像上的目標地物進行提取耗時耗力且易有主觀誤差。
自1976年Kettig[3-5]首次對遙感影像分割進行了簡單闡述以來,國內外學者對其進行了更加深入的研究,并將遙感影像分割引入到滑坡提取的應用中[4-5]。模糊聚類作為一種多元分析方法,可根據對象間的模糊關系將其自動分類,在具有模糊性和不均勻性的遙感影像上,能夠抑制噪聲,更好分割影像[6]。該方法被廣泛運用到滑坡災害相關的研究中,如監測滑坡變形[7-8]、調查滑坡影響因素和破壞機制[9]、滑坡敏感性評價[10]等。
對高分辨率遙感影像進行面向對象分割,可以更好地提取地物,Cai等[11]提出應用快速廣義模糊C-均值聚類算法(FastgeneralizedfuzzyC-meansclusteringmodel,FGFCM)可利用影像中局部區域像素間的灰度信息和距離關系定義一個新的線性加權和影像,能準確反映影像包含的空間結構信息,在該影像灰度直方圖上進行影像聚類,可得到抗噪能力強的影像分割成果。在FGFCM算法中,選擇的聚類中心初始值和聚類數目一般是由經驗決定的,主觀因素會對結果產生較大影響。而針對影像分割,云變換作為一種可轉換定性定量信息的算法,可以很好兼顧影像信息的模糊性與算法的穩定性,彌補傳統“硬分割”算法無法處理不確定性問題的缺點[12-13]。
本文以貴州省水城縣為研究區,基于高分1號(GF-1)影像,運用逆云變換算法計算滑坡影像像元亮度值的聚類初始中心值和聚類數目,以克服人為選擇該值的主觀影響,結合FGFCM聚類算法進行影像分割,提取該區的滑坡信息,可為當地防災減災工作提供參考依據。
1研究區概況及數據來源
1.1研究區概況
1.1.1地理位置
水城縣隸屬于貴州省六盤水市,位于滇東高原向黔中丘原和廣西丘陵的過渡地帶,地處烏蒙山脈東北段之東南,境內總體地勢是北西高、南東低。全縣南北長97km,東西寬69km,總面積3605km2,總人口86萬人。
1.1.2滑坡發育情況
研究區因水系切割,地形以山地為主,受地殼層運動的影響,區內經歷多次間歇性掀斜抬升,形成了多級夷平面,地形起伏較大。研究區地質構造復雜,巖體內片理和裂隙普遍發育,抗風化能力弱,結構松散,地質災害易在褶皺密集和斷裂交匯等構造部位發生。境內采礦活動突出,山體裂縫常直達地表,導致一些原本平穩的邊坡成為不穩定的斜坡。降水集中的6-8月,暴雨容易造成土石層飽水、滑體重量增加、巖土層抗剪強度降低,最終導致滑坡。
水城縣地質災害分布如圖1。主要類型包括:崩塌、滑坡、不穩定斜坡、地裂縫、地面塌陷、泥石流等,其中滑坡155處,占該縣地質災害總數的53.82%。研究滑坡自動提取方法對提高滑坡識別效率具有重要意義。
1.2數據來源
高分一號(GF-1)影像數據具有大面積、高精度、時效性強等特點。本文選取2018年5月份6景GF-1遙感影像融合成的2m分辨率遙感影像,包含水城縣大部分區域。水城縣滑坡災害點是通過遙感影像目視解譯、野外排查驗證得到的可信數據。
2研究方法
2.1FGFCM算法
模糊集理論是通過對傳統非此即彼分類的集合理論中加入過渡區間,使針對單體分類的間斷過程變成對區間分類的連續狀態。由Ruspini[14]提出的FCM(模糊C均值)算法是依據最小二乘原理,通過迭代對目標函數進行優化,從而對數據集進行模糊劃分。將FCM算法引入影像分割,需要把影像的像素灰度值視為數據集的樣本點,將影像分割問題轉換為FCM目標函數優化問題。
FGFCM算法針對FCM算法計算復雜度高的問題,通過利用原始影像中局部區域像素間的灰度信息和距離關系定義一個新的線性加權和影像,在該影像灰度直方圖上進行聚類,可大大減少計算量,且最終能得到抗噪能力強、精度高的影像分割成果。
該算法將局部區域像素間的灰度信息和距離關系以相似度量值轉為線性表達,這一步驟使該算法對噪聲具有魯棒性,其公式為[15]:
通過引入云變換,將樣本影像的定量信息轉換為定性概念,能更科學地計算出FGFCM聚類時使用的聚類參數。
2.3基于云變換優化的FGFCM聚類
使用遙感影像像元亮度值(Digitalnumber,DN),即地物的灰度值作為基本單元,可將不同類別地物在遙感影像上的像元亮度頻率以不同云變換表示,每一個云視為一類,將遙感影像視為云共同疊加組成的[17]。本文通過統計滑坡候選物的影像DN值進行逆云變換計算,得出滑坡地物的初始聚類中心值與聚類個數,算出單個或組合的DN值對每個聚類中心的隸屬度,然后進行聚類,實現影像分割,提取滑坡范圍。
3滑坡提取及精度驗證
本文重點在于通過基于云變換優化的FGFCM聚類方法在GF-1影像上提取滑坡信息,主要步驟為:(1)剔除水體、植被、道路、建筑物等非滑坡地物;(2)選擇訓練樣本,應用云變換計算聚類參數,通過FGFCM聚類提取滑坡信息;(3)使用kappa系數進行精度驗證。
3.1提取滑坡候選物
在提取滑坡信息前對具有明顯影像特征的非滑坡地物進行剔除,可避免后期將其誤分為滑坡,對提高滑坡識別的整體精度有很重要的作用。本文基于eCognition軟件,選取NDVI、光譜特征、形狀特征、紋理特征等作為對非滑坡地物提取的主要特征信息,剔除了水體、植被、道路、建筑物4類非滑坡地物。
(1)水體。水體提取主要依靠在該方面具有優勢的紅外波段,通過調整閾值范圍,設置紅外波段值小于27提取水體,除部分河道兩旁的陰影容易被誤分外,提取效果理想,如圖2(a)所示。
(2)植被。植被對歸一化植被指數NDVI及綠色波段具有較高的敏感度,結合兩者設置閾值測試得出,NDVI參數值為0.5~1.0、綠波段均值為50~110范圍的植被能基本被提取出來,如圖2(b)所示。
(3)道路。基于道路在遙感影像上寬度均勻、與周圍地物色差大等特征,本文選取亮度值范圍[120,255]、坡度<30、橫向系數≥1.5、長寬比≥4、形態參數0.3進行道路提取。除部分因植被陰影影響斷裂或與相鄰建筑物合并的情況,整體效果較為理想,如圖2(c)所示。
(4)建筑物。基于建筑物在遙感影像上幾何形狀分明、集中的特征,通過控制變量法選取分割參數,最后選擇藍波段均值85~165、分割面積35、形狀因子1.5~3.5、緊致度0.8對建筑物進行提取,最終提取效果理想,如圖2(d)所示。
對水體、植被、道路、建筑物進行剔除后就能得到滑坡候選物的影像,從而進行基于FGFCM算法的樣本訓練和滑坡提取。
3.2基于FGFCM的滑坡自動提取
剔除非滑坡地物后,在滑坡候選物區域選擇滑坡樣本訓練和滑坡識別。本文將水城縣劃分為27個格網,選擇其中發生滑坡數量較多的兩個格網作為樣本區。
提取流程為:在ENVI系統中導入樣本區滑坡候選物的影像,提取影像DN值,獲取單個DN值的個數和出現的頻率。應用云變換計算可得出樣本區滑坡候選物影像DN值的聚類中心值和聚類個數。隨后在MATLAB軟件中導入實驗區滑坡候選物影像,基于云變換算法得出的樣本區聚類參數,應用FGFCM聚類算法進行像元聚類,實現影像分割和滑坡提取。
基于云變換改進FGFCM聚類方法的實現步驟如下:
(1)統計像元的亮度值頻率。以影像的亮度級數為x軸,各亮度級在影像中出現的頻率為y軸,生成數據分布函數f(x)。
(2)尋找數據分布函數曲線f(x)的波峰值位置T。設定一個鄰域范圍W,以點T為中心將影像中DN值落在(T-W,T+W)范圍內的所有數據點利用逆向云發生器算法生成云模型C(Ex,En,He)表示的定性概念,并用式(10)計算云模型的分布函數fi(x):
y=e-(x-Ex)22En2(10)
從f(x)中減去該云模型的數據分布fi(x),得到新的數據分布函數f′(x)。
(3)重復步驟(1)、步驟(2),直至波峰值小于頻率閾值ε時停止,最后得到云模型的期望值,也就是初始化聚類中心值,分別為0,22,47,86,105,141,181和223,得到共8個云模型的數據分布函數。聚類過程主要是通過計算分析每個像元的空間位置與周圍像元所示地物在紋理、光譜上的差異性,賦予每個像元屬于每個聚類中心的隸屬度,最后合并隸屬度最相近的像元,得到滑坡提取結果。圖3為提取滑坡結果示意圖,圖中藍線為自動提取的滑坡邊界,紅線為目視解譯的滑坡邊界,橙色為漏提取邊界,綠色為過提取邊界。
3.3滑坡提取的精度驗證
如圖3所示,本文提出的自動提取方法所提取出的滑坡區域與準確災害點數據所顯示的滑坡區域基本一致,在具體面積上存在過提取和漏提取的問題。這是因為人類開采礦物或進行建筑修建時造
成的裸地易被誤提取為滑坡,或一些較早發生的滑坡表面已被植被覆蓋,影像特征弱化而未被識別出。
本文對滑坡正確提取、漏提取和過提取的面積進行了統計。實地調查統計得到的滑坡共152處,總面積1664432m2。自動提取統計得到的滑坡共157處,面積1714671m2。128處滑坡提取面積與準確災害點數據基本一致;漏提取滑坡12處,面積共136863m2;過提取滑坡17處,面積共187102m2。
kappa系數在評價遙感分類方面應用廣泛,本文用于分析基于FGFCM自動提取的滑坡信息和已有滑坡數據的一致性。通過建立如表1所示的自動提取結果和滑坡數據的轉換矩陣,根據式(11)計算得到kappa系數值。
式中:a表示滑坡自動識別和災害數據相一致的面積;b表示滑坡漏提取面積;c表示滑坡過提取面積;d表示非滑坡類型提取結果和災害數據相一致的面積,n為總數。P0表示兩者相一致的概率,即總體精度,Pe表示兩者偶然相一致的概率。
kappa指數評價一致性通常可以分為5個級別[17],0.61~0.80范圍則為高度一致,本文將滑坡面積統計相關的數據帶入表1,計算得到kappa系數達0.752,總體精度達0.880,可見基于云變換優化的FGFCM滑坡自動提取方法可以滿足實際應用的要求。
4結論
本文以高分1號(GF-1)為主要數據源,通過云變換優化的FGFCM方法對貴州省水城縣的滑坡進行提取,對結果進行評價,得出以下結論:(1)在進行滑坡提取前對明顯非滑坡地物的剔除,提高了對目標地物提取的精度,加快了計算聚類參數及聚類過程的運算速度。(2)應用云變換算法計算FGFCM聚類中要使用的聚類中心值和聚類數目,避免了主觀對該聚類參數選擇的影響,使最終提取結果更有效可靠。(3)滑坡提取結果經計算驗證,kappa系數為0.752,總體精度為0.880,與實地調查統計結果高度一致,因此通過該方法可以快速準確識別滑坡及其范圍,有效提高遙感解譯的效率和精度。
本文使用的滑坡自動提取方法準確提取了整體滑坡位置,可應對實際應用需求,但在單體滑坡面積精度上存在誤差,有待改善。在算法方面,對模糊聚類算法還可以基于自適應濾波、局部空間限制、鄰域加權等方法進行改進。在數據處理方面,本文是在剔除了其他明顯非滑坡地物后的高分影像上進行滑坡提取,易漏提取植被覆蓋的滑坡,可以采用激光雷達等技術獲取穿透植被的地表信息數據,從而對植被覆蓋密度較大的古滑坡進行提取,彌補傳統方法的不足。
參考文獻
[1]朱新婷,吳彩燕,譚秋焰,等.基于熵權法的滑坡危險性評價——以貴州省晴隆縣為例[J].桂林理工大學學報,2022,42(1):100-108.
[2]徐濤,張峰,張桂林,等.基于GIS的玉林-鐵山港公路地質災害危險性評價[J].桂林理工大學學報,2012,32(1):55-62.
[3]WILKINSONGG.AreviewofcurrentissuesintheintegrationofGISandremotesensingdata[J].InternationalGeographicalInformationSystems,1996,10(1):85-101.
[4]TAVAKKOLIPS,SHAHABIH,JARIHANIB,etal.Landslidedetectionusingmultiscaleimagesegmentationanddifferentmachinelearningmodelsinthehigherhimalayas[J].RemoteSensing,2019,11(21):2575.
[5]陳婷,李百壽,康弋,等.基于遙感陰影與財產密度的城市房屋滑坡災害風險評估方法——以廣西梧州市為例[J].桂林理工大學學報,2017,37(1):154-162.
[6]路彬彬,賈振紅,何迪,等.基于新的遺傳算法的模糊C均值聚類用于遙感圖像分割[J].激光雜志,2010,31(6):15-17.
[7]LEIT,XUED,LVZ,etal.Unsupervisedchangedetectionusingfastfuzzyclusteringforlandslidemappingfromveryhighresolutionimages[J].RemoteSensing,2018,10(9):1381.
[8]鄧勇,張正祿,謝年生,等.模糊聚類及其在滑坡監測中的應用研究[J].測繪科學,2010,35(4):163-165.
[9]ALIMOHAMMADLOUY,NAJAFIA,GOKCEOGLUC.EstimationofrainfallinducedlandslidesusingANNandfuzzyclusteringmethods:acasestudyinSaeenSlope,Azerbaijanprovince,Iran[J].Catena,2014,120:149-162.
[10]LIY,WANGH,CHENJ,etal.DebrisflowsusceptibilityassessmentintheWudongdedamarea,ChinabasedonrockengineeringsystemandfuzzyC-meansalgorithm[J].Water,2017,9(9):669.
[11]CAIW,CHENS,ZHANGD.FastandrobustfuzzyC-meansclusteringalgorithmsincorporatinglocalinformationforimagesegmentation[J].PatternRecognition,2007,40(3):825-838.
[12]姚紅.多步逆向云變換算法在圖像分割中的應用[J].電腦知識與技術,2015,11(12):202-205.
[13]孟暉,王樹良,李德毅.基于云變換的概念提取及概念層次構建方法[J].吉林大學學報(工學版),2010,40(3):782-787.
[14]RUSPINIEH.Anewapproachtoclustering[J].InformationandControl,1969,15(1):22-32.
[15]王小鵬,張永芳,王偉,等.基于自適應濾波的快速廣義模糊C均值聚類圖像分割[J].模式識別與人工智能,2018,31(11):1040-1046.
[16]孫鴻鵠,程先富,倪玲,等.基于云模型和熵權法的巢湖流域防洪減災能力評估[J].災害學,2015,30(1):222-227.
[17]王軍.Kappa系數在一致性評價中的應用研究[D].成都:四川大學,2006.