張洪吉,趙 錚,陳建華,甘先霞,謝華偉,譚小琴
(1.四川省自然資源科學研究院,四川 成都 610015; 2.成都理工大學 地球物理學院,四川 成都 610059)
滑坡災害的頻發每年給人類帶來巨大的生命和財產損失,據全國地質災害通報統計,2019年共發生地質災害6 181起,其中滑坡4 220起,占地質災害總數的68.27%,其中特別是伴隨著強降雨和地震過后的山區城鎮極易發生山體滑坡[1]。滑坡危險性評價是研究區域滑坡發生的空間概率[2]。因此,高精度的滑坡危險性評價對于滑坡災害的空間預測具有重要意義。
目前,國內外學者使用大量的機器學習方法應用于滑坡危險性評價,其中包括支持向量機[3-4]、信息量模型[5-6]、隨機森林[7]、決策樹[8-9]、人工神經網絡[10-11]等,上述機器學習方法能夠較好地挖掘自變量與因變量的非線性關系來模擬滑坡影響因子與滑坡類別(滑坡或非滑坡)之間的復雜關系[12],并且取得了較高的預測精度。但是其通過直接對輸入數據進行分類并不能從其中獲取更具代表性的特征來提高分類效果[13],同時也存在物理含義不明確等缺陷。
為了應對上述問題,近年來深度學習中的卷積神經網絡(Convolutional Neural Network,CNN)深受研究人員的青睞,卷積神經網絡方法被大量地應用于模式識別[14]、圖像處理[15-17]、地學研究[18-19]等領域。卷積神經網絡因其多層網絡結構而具有強大的數據表征能力,在模型擬合和學習能力上具有顯著的能力。但到目前為止,卷積神經網絡方法還未在滑坡危險性評價中取得充分的應用。因此,本文提出一種深度一維卷積神經網絡方法,針對四川蘆山地區開展滑坡危險性評價方法研究,期望獲得更優的評價效果,為滑坡危險性評價提供有力的評價方法。
蘆山縣位于四川盆地西緣,雅安市東北部。占地面積約為1 166.39平方公里,人口為119 886人。由于2013年蘆山發生7.0級地震,震源深度13 km,地震使得山體斜坡內部受力發生改變,從而導致山體容易發生大面積滑坡。因此實驗選擇蘆山縣作為研究區(圖1)。

圖1 研究區范圍Fig.1 Research area overview
滑坡危險性評價模型的性能主要取決用于訓練的滑坡數據[20]。經調查顯示2016年蘆山縣共有346個歷史滑坡點,最大滑坡面積為16 000 m2,最小滑坡面積為200 m2,滑坡多發生于路網、水系兩側。為了開展實驗,通過各種途徑獲取了基礎數據集,如:從中國地震臺網獲取了蘆山縣2016年地震數據,由蘆山縣自然資源和規劃局提供了水系數據,從地理空間數據云獲取了30 m數字高程模型數據等。
滑坡的影響因子有上百種之多,合理地選擇滑坡影響因子對于構建模型至關重要[21-22]。滑坡的影響因子可以分為以下幾類:地理位置、地形地貌、地質構造、氣候與水文、人口與交通等。通過對蘆山區域環境條件的分析,選擇了坡度、坡向、巖性、土地利用、植被覆蓋度、降雨量、高程、人口密度、距斷層距離、距路網距離、距水系距離、距震中距離共計12個滑坡影響因子(表1)。

表1 影響因子Table 1 Evaluation factors
結合研究區評價尺度和方法,參考地質災害評價標準,蘆山縣屬于面級、地方級、大比例尺的評價類型,結合遙感影像等相關數據資料,選定30 m×30 m的規則格網單元作為區域滑坡危險性的評價單元[24],最終將整個研究區劃分成大小為1 323 696個格網單元。
實驗為了驗證因子之間的相關性,采用多重共線性檢驗對因子進行相關性分析[25]。一般認為,當方差膨脹系數(Variance Inflation Factor,VIF)大于10時,因子之間線性相關。實驗結果如表2所示。由表2可知,其VIF最大為高程因子,其值為5.907,故所選因子之間不存在相關性,可全部用于模型訓練和測試。

表2 影響因子方差膨脹系數Table 2 VIF of evaluation factors
由于評價因子數據類型的多樣化,包括描述性數據及數值型數據,因此實驗需要對因子數據進行分級處理,以便后期參與模型的訓練及驗證。實驗結合滑坡數據分布特征,研究區范圍、各評價因子的數據特征等多個方面將評價因子的相關數據進行分級,其對應的評價因子分級圖如圖2所示。



圖2 蘆山縣滑坡危險性評價因子分級圖Fig.2 Classification maps of landslide risk assessment factors in Lushan
卷積神經網絡是一種深度學習方法,本質上仍是一種類似人工神經網絡的多層感知器,一個基本的卷積神經網絡結構包括輸入層、卷積層、最大池化層、全連接層和輸出層。它能夠對輸入的數據進行隱式的并行學習,分層的特征提取,不需要事先定義輸入和輸出間的精確數學映射關系,具有強大的表征學習能力,能夠提取更多隱含特征。近年來被廣泛應用于模式識別和圖像分類領域。典型的CNN結構如圖3所示。

圖3 卷積神經網絡結構Fig.3 General structure of convolutional neural networks
在滑坡危險性評價中,研究區構成的輸入數據可以視為一幅圖像,圖像中的每一個像素包含對應的滑坡影響因子。因此輸入數據中的每一格網單元可以被視為長度為影響因子數量的一維向量,該向量中的每一個元素對應一個滑坡影響因子。基于此,實驗構建出一維卷積神經網絡(Convolutional Neural Network with One Dimension,CNN-1D),該網絡結構由卷積層、最大池化層、全連接層組成。假設有n個滑坡影響因子構成的長度為n的一維向量,經過N個大小為m的卷積核卷積之后得到圖層為N個大小為(n-m+1)維的特征向量,特征向量中的每一個元素都對應輸入數據中m×1的鄰域。假設最大池化層的大小為c,其輸出圖層為N個長度為(n-2m+1)/c+1的向量。具有k個神經元的全連接層來表達池化層中所提取分離的特征信息。最后,實驗使用輸出層中兩條神經元來表達二分類問題,即滑坡或非滑坡。由于實驗中選擇了12個滑坡影響因子,故該網絡結構的參數為n=12,m=5,N=52,c=4,k=13。其網絡結構及訓練參數如圖4所示。

圖4 一維卷積神經網絡結構Fig.4 Structure of CNN-1D
實驗采用受試者特征工作曲線(Receiver Operating Characteristic Curve,ROC)和總體精度來驗證模型的性能。ROC曲線能夠總體評價模型的性能[22],以橫軸表示滑坡危險性由高到低的面積累計百分比,縱軸表示對應危險性指數下滑坡點數量的累計百分比,繪制成功率曲線并計算其線下面積值(Value of the Area Under the Curve,AUC)作為精度評價指標,曲線形狀越彎曲靠近圖像左上部則AUC值越大,也就說明滑坡危險性評價結果越好。
在上述實驗數據處理的基礎上,通過統計分析研究區內歷史滑坡點之間的距離,最終選擇在歷史滑坡點500 m以外的區域,利用創建隨機點工具產生與滑坡點等量的非滑坡點,則構成了數量為692個的總樣本數據集。按照8:1:1的比例將總樣本集分層隨機抽樣分為訓練集、驗證集和測試集三部分用于實驗。利用CNN-1D、支持向量機(Support Vector Machine with Radial Basis Function,SVM-RBF)、加權信息量模型(Information Value Method,IVM)對全區數據進行評價,利用GIS軟件生成滑坡危險性評價圖,采用自然斷點法將滑坡危險性劃分為高、中、低。實驗為了驗證CNN-1D模型的高精度特性,將使用性能良好的支持向量機模型、傳統統計理論方法信息量模型與其對比。其模型參數的設置如表3所示。

表3 模型參數設置Table 3 Parameter settings of models
實驗采用CNN-1D和對照實驗組中的SVM-RBF、IVM進行滑坡危險性評價實驗,通過模型來評價全區1323696個格網單元的滑坡危險性概率,并在GIS軟件中繪制滑坡危險性評價圖。圖5(a)、(b)、(c)為相同實驗數據集下針對CNN-1D和SVM-RBF、IVM模型預測的滑坡危險性評價圖。圖6為3種方法對應的滑坡危險性高中低面積占比。從圖5中可以看出:滑坡高危險性區域主要集中在路網、水系處,圖5(a)中低危險性區域最多、中危險次之、高危險最少,其危險性區域面積占比分別為68%、18%、14%,符合實際情況。而圖5(b)中的低危險性區域和中危險區域面積大小均為40%,而高危險性區域接近20%,如此危險性分級圖使得在對應區域的居民無法生存,不太符合實際情況。圖5(c)中的低、中、高危險性面積占比分別為51%、33%、16%,其危險性分級圖以及危險性面積占比相較SVM-RBF較為合理,但是其高危險區域主要分布在蘆山縣域中下部,且危險性分布較為密集,不太適合居民生活。從圖中可知,基于徑向基核函數的支持向量機模型對應的預測結果呈現出大面積的中危險區域,使得低危險性區域較少,覆蓋范圍廣,大面積的覆蓋居民城鎮等地,其評價效果較差。而加權信息量模型中下部呈密集高危險性區域,其評價效果較差。因此,就危險性評價圖可知,CNN-1D模型的評價效果優于SVM-RBF、IVM。就總體精度而言,CNN-1D和SVM-RBF的精度分別為0.9015和0.842,CNN-1D的總體精度遠高于SVM-RBF,因此在精度指標上考慮,CNN-1D的評價精度更值得信服。綜合滑坡危險性面積占比、總體精度等評價指標,從整體評價效果上看,SVM-RBF、IVM模型效果低于CNN-1D模型。

圖5 蘆山地區滑坡危險性評價分級圖Fig.5 Classification maps of landslide risk assessment in Lushan

圖7為相同實驗數據集下3種方法對應的ROC曲線。其ROC曲線線下面積表示的是AUC值。從圖中可知,CNN-1D、SVM-RBF、IVM的AUC值分別為0.888、0.876、0.818,說明在ROC曲線評價中,CNN-1D模型的預測能力表現得比SVM-RBF、IVM更好,其模型結果優于SVM-RBF、IVM。因此,從總體精度、ROC曲線和分級區劃圖結果可知,一維卷積神經網絡模型表現優于支持向量機模型以及傳統的信息量模型方法,從模型應用上來講,論文提出的一維卷積神經網絡模型可有效應用于相關滑坡危險性評價研究中。
論文提出了一種面向滑坡危險性評價的深度一維卷積神經網絡方法,針對四川蘆山地區開展滑坡危險性評價結果是比較有效的,可以應用于其它類似特征的區域。通過ROC曲線及總體精度進行對比,支持向量機、信息量模型的AUC值低于深度一維卷積神經網絡,深度一維卷積神經網絡的滑坡危險性評價總體精度明顯高于支持向量機模型、信息量模型。
相比支持向量機模型及信息量模型,在全區危險性評價分級結果圖上,深度一維卷積神經網絡在蘆山地區危險性評價方面更符合實際情況,在模型的擬合和效果上優于支持向量機、信息量模型。表明:相比于傳統機器學習方法,深度一維卷積神經網絡由于其能夠挖掘更多更具代表性的特征信息,因此能夠取得更優的模型性能。
致謝:感謝蘆山縣自然資源和規劃局、蘆山縣公安局、蘆山縣交通運輸局、雅安市公共氣象服務中心、四川省地質調查院、中國地震臺網、地理空間數據云網、美國地質調查局、歐空局提供了實驗所需的各類數據。感謝秦宇龍先生在實驗中提供的支持。