999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

信息量法耦合機器學習模型的西山煤田滑坡易發性評價

2024-02-21 02:35:02李凱新蘇巧梅張瀟遠范錦龍白東升
無線電工程 2024年2期
關鍵詞:評價模型

李凱新,蘇巧梅*,張瀟遠,范錦龍,白東升

(1.太原理工大學 礦業工程學院,山西 太原 030024;2.國家衛星氣象中心,北京 100081;3.山西地質集團有限公司,山西 太原 030006)

0 引言

滑坡是一種地質災害類型,它分布范圍廣、突發性強且破壞性大,嚴重影響地區社會經濟發展[1-2]。區域地質環境是滑坡孕育的基礎條件,人類工程活動、降雨等是滑坡的誘發因子,精準的滑坡易發性評價一直是滑坡風險評估管理的研究熱點[3]。滑坡易發性是指在考慮各類滑坡致災因子的綜合作用下,區域發生滑坡的可能性或空間概率,對區域防災減災、科學規劃管理和決策具有重要意義[4]。

滑坡易發性評價方法分為定性和定量2種類型[5]。定量統計分析方法主要有證據權、信息量、頻率比、概率法和熵指數等[4]。隨著遙感和地理信息技術的快速發展,各種機器學習模型在滑坡易發性評價中廣泛應用。常用的機器學習模型有隨機森林(Random Forest,RF)、邏輯回歸(Logistic Regression,LR)、神經網絡和支持向量機(Support Vector Machine,SVM)等[6],每種模型都有自己的優缺點。不同區域的地理位置、地質條件和氣候環境等自然環境條件不同,滑坡致災因子也不同,影響到滑坡易發性評價結果,因此,不同區域有不同的滑坡易發性評價模型。

統計分析方法無法解釋各類致災因子的非線性關系,機器學習模型學習能力強,但容易過擬合[5],一些學者嘗試使用統計分析耦合機器學習模型來評價滑坡易發性,結果證明可以有效提高滑坡易發性評價的精度[7-9]。栗澤桐等[10]在研究青海沙塘川流域的滑坡易發性時,對比了單一信息量、邏輯回歸模型以及二者耦合模型的結果,發現耦合模型的準確率較單一模型有了很大提高。郭子正等[11]以三峽庫區某區為研究區,利用證據權法和優化后BP神經網絡模型對研究區進行滑坡易發性區劃,結果顯示耦合模型預測精度高。徐勝華等[12]使用熵指數耦合LR和SVM模型研究滑坡易發性,預測結果精度較高。

山西省是我國重點采煤區,區內采空區面積所占比例較大,采煤過程破壞地表環境,引發一系列地質災害。西山煤田是典型的煤礦開采區,煤礦開采活動使得區內滑坡災害比較嚴重。以西山煤田為例,選擇可以解決多源數據差異性的信息量(Information Value,IV)法,耦合不受主觀因素影響的LR模型、具有高泛化能力的RF模型和計算效率高的SVM模型3種機器學習模型進行建模,為研究區防災減災提供可靠依據。

1 研究區概況

西山煤田是山西省六大煤田之一,地理坐標為(37°24′N~38°02′N,111°52′E~112°31′E),地處山西省中部,太原市區西部,東南部為太原市區和清徐縣,中部大部分為古交市,西部主要是文水和交城縣。研究區內地勢西南高、東北低,地貌類型復雜,盆地、山地和丘陵都有分布,地貌分區有呂梁山區、晉中盆地、黃土丘陵以及山間谷地,屬于構造剝蝕成因的低、中高山地貌。氣候為北溫帶季風氣候,春冬干旱少雨、夏季濕熱多雨,寒暑、晝夜溫差大,干濕季分明,年平均氣溫為7~9 ℃,年平均降雨量為410~500 mm。區域內礦區主要包括古交、西山和清交礦區,地下采空區分布廣泛,在突發性地質災害誘發因子作用下,極易造成地質災害。西山煤田地理位置及區內地質災害點位置空間分布如圖1所示。

圖1 西山煤田地理位置及區內地質災害點位置空間分布Fig.1 Geographical location of Xishan Coalfield and spatial distribution of geological hazard locations in the area

2 滑坡數據及環境影響因子

2.1 數據源

根據山西省地質災害調查編目數據,研究區內地質災害點有崩塌205處、滑坡109處、泥石流33處、地裂縫25處、地面塌陷98處和不穩定斜坡44處。以廣義滑坡定義下的崩塌、滑坡和泥石流災害點作為滑坡樣本數據,收集研究區其他遙感、基礎數據和文獻數據,數據源、精度及用途如表1所示。

表1 數據信息

2.2 環境影響因子

滑坡的發生和發展受地質條件和外界環境因素共同影響,地質條件包括地貌、構造和巖性等,外界環境因素包括水文環境因子、人類工程活動等[13]。在區域滑坡易發性評價過程中,合理地選取環境評價因子是非常關鍵的一步[14]。對西山煤田區域進行了充分的野外調查,盡可能收集完善的環境因子數據,結合前人已有研究成果,選取了高程、坡度、坡向、平面曲率、剖面曲率、地形起伏度、地表粗糙度、地形濕度指數(TWI)[15]、徑流強度指數(SPI)[16]、巖土體、距斷層距離、地震峰值加速度[17]、距河流距離、歸一化植被指數(NDVI)、歸一化建筑指數(NDBI)、改進的歸一化差異水體指數(MNDWI)[18]、轉換型植被指數(TVI)、土地利用類型、距道路距離和距采空區距離共20個環境影響因子進行滑坡易發性評價,西山煤田的20個環境影響因子如圖2所示。

(a)高程

3 滑坡災害易發性評價模型

3.1 IV法

IV法是一種基于信息論進行區域滑坡易發性評價的有效方法,適用于中小比例尺的滑坡易發性評價[19-20]。滑坡受多種影響因素的影響,各個因素的作用機理和影響程度不盡相同[10],IV法利用滑坡發生的概率或密度來反映不同評價因子的影響程度,計算各個影響因子不同區間對滑坡貢獻的IV值[21]。一般情況下,IV的計算可以用滑坡發生的頻率來代替條件概率,IV值計算方法[22]如下:

(1)

式中:IV(i,j)表示第i個環境影響因子在第j個分級區間的IV值,A(i,j)表示第i個環境影響因子在第j個分級區間內的滑坡數量,A表示研究區內的滑坡總數,B(i,j)表示第i個環境影響因子在第j個分級區間內的柵格單元數量,B表示研究區柵格總數。

3.2 機器學習模型

3.2.1 LR模型

LR模型屬于線性回歸方法,模型基于二項分類,能夠對定性變量的準確性進行有效的分析[22]。利用邏輯回歸模型進行滑坡易發性評價時,將單個環境影響因子的數據作為自變量,因變量為是否發生滑坡災害[10,23]。其中,滑坡發生值為1,滑坡未發生值為0[24]。一般情況下,LR模型的方程如下:

(2)

式中:p和1-p分別為滑坡發生和不發生的概率,L(P)為滑坡發生概率的目標函數,C0為一個常數,指在無任何因素影響時,p與1-p比值的對數;[x1,x2,…,xn]為自變量影響因素集,[C1,C2,…,Cn]為邏輯回歸系數,即[x1,x2,…,xn]的估計參數。

3.2.2 RF模型

RF模型是基于多個決策樹的模型,基本原理是對不同的因子數據集,創建多個決策樹,使用多個決策樹對樣本進行訓練和測試,然后對多個決策樹得到的結果進行投票,得到RF模型的最終結果[25]。RF模型在訓練集隨機選擇以及分裂屬性隨機選取,能夠防止模型過擬合,提高穩定性[26]。RF模型的運行流程如圖3所示。

圖3 RF模型運行流程Fig.3 Running flowchart of RF model

3.2.3 SVM模型

SVM模型是統計分析方法下,源于風險最小化的新一代算法[27]。SVM的基本原理是通過核函數(非線性映射),將輸入向量數據(非線性可分)映射到更高維度的特征空間中,然后在這個空間中尋找能將二類數據高效分開的分類最優超平面[28]。SVM是一種集成了核函數、最大區間超平面技術的二分類監督分類,適用于小樣本、非線性和高維度的數據分類[29]。SVM在處理二類分類問題時,訓練樣本集Xi(i=1,2,…,n)分為2類,表示為Yi=±1。SVM要尋找一個以最大間隔區分二類數據的n維超平面(平面或曲面),且要求分開的數據點到超平面的距離最大[30]。超平面H的數學表達式及約束條件分別見式(3)和式(4):

(3)

Yi((H·Xi)+a)≥1,

(4)

(5)

假設L對于H和a的偏導數均為0,得到式(6)和式(7):

(6)

(7)

將式(6)和式(7)帶入式(5),得到式(8):

(8)

式中:λi大于0。

3.3 IV耦合機器學習模型

IV耦合機器學習模型是利用已知的滑坡點和隨機選取相同數量的非滑坡點來提取不同因子各區間的IV值,這樣,不僅考慮了不同因子對滑坡發生的貢獻權重,而且兼顧了不同因子各區間致災效應的大小,進而對滑坡易發性進行評價[31]。在滑坡災害易發性評價中,IV法耦合機器學習模型的基本思想是利用IV模型計算各個環境影響因子的IV值,以此作為LR、RF和SVM模型的輸入變量,建立用于滑坡易發性評價的耦合模型。將IV法與LR、RF和SVM這3種基于Python的機器學習模型耦合,構建西山煤田滑坡易發性評價模型,分別記作IV-LR、IV-RF和IV-SVM模型。

4 西山煤田滑坡易發性評價

4.1 IV計算

在計算IV值之前,用自然間斷點分級法對各環境影響因子進行重分類,各個影響因子的分級標準、IV值和IV值排序計算結果,各影響因子的IV值如表2所示。

表2 各影響因子的IV值

由表2可以看出,IV值最小的因子為地形起伏度因子為0~150 m區域,IV值最大的因子為土地利用類型中的人造地表類型。各環境影響因子的權重可通過利用單個因子各區間的IV值和區間內滑坡災害的數量來計算并標準化,單一因子權重數值及標準化計算如下:

(9)

(10)

式中:Wi為第i個環境因子的權重值,j為因子分級區間,ni為第i環境因子的分級數量,IV(i,j)、A(i,j)分別為第i個環境影響因子在第j分級區間的IV值、滑坡數量,Wmax、Wmin分別為所有環境因子權重值中的最大、最小值,Si為標準化后的因子權重值。各評價因子標準化權重指數值計算結果如表3所示。

表3 各評價因子標準化權重指數值計算結果

由表3可知,TVI權重指數最小,距道路距離權重指數最大。

4.2 數據準備與處理

對西山煤田滑坡易發性進行評價,首先要獲得研究區滑坡災害數據和各類環境影響因子數據。滑坡預測單元的空間分辨率為30 m,整個西山煤田全區共有柵格單元226.114 6萬個。針對滑坡易發性評價建模中非滑坡點的構建,依據滑坡點與非滑坡點比例為1∶1、非滑坡點與滑坡點的距離大于400 m以及任意2個非滑坡點之間的距離大于200 m這3項條件[32],在ArcGIS平臺上生成滑坡負樣本點。滑坡正、負樣本點分別賦值0、1,以此為模型的輸出變量,將環境因子原始值重新賦值為IV值,作為模型的輸入變量。將滑坡樣本點數據按7∶3的比例隨機劃分為訓練集和測試集,把整個研究區內20個影響因子的IV值輸入模型中,預測結果根據自然間斷點法劃分為易發性極低、低、中、高和極高5個區間。

4.3 滑坡易發性評價結果

構建了3種信息量法耦合機器學習模型,分別為IV-LR模型、IV-RF模型和IV-SVM模型。針對不同的模型,滑坡易發性劃分有不同的分級標準,西山煤田滑坡易發性分級標準如表4所示。

表4 西山煤田滑坡易發性分級標準

將3種信息量法耦合的機器學習模型計算得到滑坡易發性指數結果導入ArcGIS軟件中,得到西山煤田滑坡易發性分區結果,不同模型滑坡易發性預測結果如圖4所示。

(a)IV-LR模型滑坡易發性分區

由圖4可以看出,不同耦合模型的預測結果具有一定的相似性,滑坡易發性分區圖具有以下特點:

① 高、極高滑坡易發區主要分布在距離水系300 m左右的區域內,水系對河岸坡體的軟化和沖刷作用會降低巖體強度,有利于滑坡災害的發育形成。

② 極低和低滑坡易發區主要分布在研究區的中西部地區,但不同模型預測面積不同,IV-SVM模型預測下極低、低易發區面積最大,IV-LR模型次之,IV-RF模型預測面積最小。

③ 各信息量模型結果中,西山煤田大部分區域為中、高和極高等級易發區,低和極低易發區面積較小,研究區內采空區分布廣泛,有利于滑坡災害的發育。

④ IV-LR模型、IV-RF模型和IV-SVM模型預測結果在研究區東北部的一塊區域有明顯不同,該區域地處太原市萬柏林區和晉源區。IV-LR模型預測該區域滑坡易發性等級大部分極低,有一小塊地區分級為高或極高等級,而在IV-RF模型下這一區域分級為中、高等級,在IV-SVM模型下分級為低、中等級易發區。

根據不同IV法耦合模型的預測結果,統計滑坡易發性等級區間的柵格數目及所占比例、落入各區間內的訓練集滑坡數及所占比例,不同模型各等級易發區比例統計結果如表5所示。

表5 不同模型各等級易發區比例統計

由表5可以看出,IV-LR模型和IV-RF模型隨著滑坡易發性等級的升高,分級區間內滑坡點的數目逐漸增加,而IV-SVM模型結果不同于前2種模型,其中等滑坡易發區內的滑坡數大于高滑坡易發區。IV-LR、IV-RF和IV-SVM模型落入模型高—極高易發區的滑坡災害點比例分別為67.72%、76.08%和57.06%,超過半數以上的滑坡災害點都發育在高—極高易發區內,而低—極低易發區內滑坡點數量顯著減少,與西山煤田實際滑坡災害發育情況相吻合,3種信息量耦合模型都可以有效評價西山煤田滑坡災害易發性。IV-SVM模型預測結果與IV-LR、IV-RF模型區別明顯,極低易發區面積占比最大,高易發區面積最小。

4.4 建模結果不確定性分析

4.4.1 精度評價

計算各IV法耦合機器學習模型在測試集上的預測準確率,模型的準確率是指評價模型分類結果中分類正確的樣本個數占測試集樣本總數的比例,計算如下:

(11)

式中:TP表示正樣本被評價模型分類正確的個數,即真正例;TN表示負樣本被評價模型分類錯誤的個數,即真反例;FP表示正樣本被評價模型分類錯誤的個數,即假正例;FN表示負樣本被評價模型分類錯誤的個數,即假反例。經計算,IV-LR、IV-RF和IV-SVM模型在測試集上的預測準確率分別為76.67%、74.62%和78.57%,模型的預測準確率差別不明顯,但都大于70%,都可以有效評價西山煤田滑坡易發性。

利用廣泛使用于滑坡易發性模型精度評價中的受試者工作特征(Receiver Operating Characteristic,ROC)曲線和曲線下面積(Area Under Curve,AUC)值對評價模型的精度進行對比分析,AUC值越大,模型的分類正確率越高、精度越好[30]。IV法耦合機器學習模型的ROC曲線如圖5所示。

圖5 信息量法耦合機器學習模型的ROC曲線Fig.5 ROC curves of information value method coupled machine learning model

由圖5可以看出,IV-LR、IV-RF和IV-SVM模型的AUC值分別為0.86、0.83和0.84。將3種耦合模型的ROC曲線進行對比,AUC值表明,3種模型的建模精度相差不大,均在0.8以上,模型預測結果良好,其中IV-LR模型預測結果最好,IV-SVM模型次之,IV-RF模型AUC精度最差。

4.4.2 滑坡易發性指數分布規律

計算各耦合模型預測下滑坡易發性指數的平均值(Mean)和標準差(Standard)來分析模型預測的不確定性。IV-LR模型、IV-RF模型和IV-SVM模型預測下,滑坡易發性指數分布結果不相同,不同模型的滑坡易發性分布如圖6所示。

(a)IV-LR模型

由圖6可以看出,IV-LR、IV-RF和IV-SVM模型下易發性指數Mean分別為0.426、0.425和0.440。從易發性指數分布離散情況來看,IV-LR模型離散程度最高,然后是IV-SVM模型,IV-RF模型離散程度最低。IV-LR模型預測的Standard最大,Mean和最小的0.425相差無幾,模型AUC值最高,所以IV-LR模型對西山煤田的滑坡易發性區分度較好,能夠很好地反映不同柵格單元的滑坡易發性指數差異性。IV-RF模型預測易發性指數Mean和Standard都是3個模型中最小的,結合其驗證精度和AUC值也是最小,表明該模型對研究區滑坡易發性的區分度較IV-LR和IV-SVM模型差一些。IV-SVM模型預測的易發性指數數值普遍偏大,在極低易發區分布較少,離散度居中。

5 結論

通過3種信息量法耦合機器學習模型對西山煤田的滑坡易發性進行評價,結論如下:

① 西山煤田高、極高滑坡易發區主要分布在距離水系300 m左右的區域內,極低和低滑坡易發區主要分布在研究區的中西部地區,區內大部分區域為中、高和極高等級易發區,低和極低易發區面積較小。研究區內不同耦合模型的預測結果具有一定的相似性,但在區內東北部部分區域滑坡易發性分布有明顯不同。

② IV-LR模型和IV-RF模型結果顯示,隨著滑坡易發性等級升高,區間內滑坡點的數目逐漸增加。各信息量耦合模型中半數以上的滑坡點都在高—極高易發區,低—極低易發區內滑坡點很少,與實際滑坡災害情況相吻合,說明各模型均可有效評價西山煤田滑坡災害易發性。

③ IV-LR、IV-RF和IV-SVM模型的驗證精度分別為76.67%、74.62%和78.57%,AUC值分別為0.86、0.83和0.84,再結合不同模型的滑坡易發性指數Mean及分布情況表明,IV-LR模型對西山煤田的滑坡易發性分區效果最好,模型分類精度最高,能很好地反映不同柵格的滑坡易發性差異。

猜你喜歡
評價模型
一半模型
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
中藥治療室性早搏系統評價再評價
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
基于Moodle的學習評價
關于項目后評價中“專項”后評價的探討
保加利亞轉軌20年評價
主站蜘蛛池模板: 国产在线无码av完整版在线观看| 成人福利在线视频免费观看| 欧美黑人欧美精品刺激| 欧美在线综合视频| 亚洲精品无码AV电影在线播放| 日韩午夜福利在线观看| 尤物在线观看乱码| 亚洲VA中文字幕| 国产呦视频免费视频在线观看| 日韩国产一区二区三区无码| 亚洲国产理论片在线播放| 国产流白浆视频| 18禁黄无遮挡免费动漫网站| 欧美性久久久久| 欧美精品xx| 就去色综合| 久久久精品国产亚洲AV日韩| 日韩无码真实干出血视频| 狠狠色狠狠综合久久| 高清不卡一区二区三区香蕉| 老司机久久99久久精品播放| 国产成人毛片| 国产在线拍偷自揄观看视频网站| 欧美激情视频一区二区三区免费| 国产成人精品无码一区二| 亚洲欧美人成电影在线观看| 伊人久久影视| 亚洲动漫h| 欧美成人手机在线观看网址| 无码福利视频| 91亚瑟视频| 为你提供最新久久精品久久综合| 91成人免费观看| 女高中生自慰污污网站| 91探花在线观看国产最新| 国产黄网永久免费| 午夜国产精品视频黄| 99久久精品国产精品亚洲| 69综合网| 国产精品久久久久久搜索| 久久精品人人做人人| 国产免费黄| 精品国产成人三级在线观看| 欧美精品亚洲二区| 色亚洲成人| 日本不卡在线视频| 国产精品视频观看裸模| 另类欧美日韩| 久久久久亚洲精品成人网| 日本午夜精品一本在线观看| 欧美影院久久| 国产成人在线小视频| 午夜视频www| 中文天堂在线视频| 国内精品手机在线观看视频| 国产香蕉一区二区在线网站| 精品亚洲国产成人AV| 日韩欧美国产三级| 日韩av在线直播| 国产在线精品美女观看| 国产三级韩国三级理| 中美日韩在线网免费毛片视频 | 丁香六月激情婷婷| 国产精品片在线观看手机版| 国产成人久久综合777777麻豆 | 爆操波多野结衣| 91麻豆久久久| 国产欧美日韩精品第二区| 国产91熟女高潮一区二区| 亚洲最新在线| 特级毛片8级毛片免费观看| 亚洲国产一区在线观看| 日韩无码视频播放| 99久久国产综合精品2020| 五月婷婷中文字幕| 国产一区二区三区在线观看视频| 91精品专区国产盗摄| 亚洲国产成人精品青青草原| 免费一级无码在线网站| 国产精品妖精视频| 久久一本精品久久久ー99| 日本黄色不卡视频|