999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于PCA和SVM算法的滑坡穩定性分析研究

2015-04-18 11:19:08蔣廷耀
科技視界 2015年14期
關鍵詞:因素分析

雷 鵬 蔣廷耀

(三峽大學計算機與信息學院,湖北 宜昌 443002)

0 引言

由于滑坡地質條件形成過程、誘發因素的多樣性及其變化的隨機性和復雜性,導致滑坡運動信息極難預測,加之滑坡動態監測技術的不完整、不成熟和滑坡預報理論的不完善,滑坡災害嚴重威脅與危害人民群眾的生命財產安全。因而科學、準確的進行滑坡穩定性研究,及時預測預報滑坡對減災防災具有重要意義。

從人們意識到滑坡的危害開始,地質學研究人員就一直試圖建立一種預報準確、可操作性強的滑坡預報模型[1-6],總結前人的滑坡預報模型的主要類型及對應的預報方法,可把滑坡的預報模型分為定性和定量兩大類[7]。

定性分析方法能綜合考慮影響邊坡穩定性的各種因子,并可快速地對邊坡的穩定狀況和發展趨勢做出綜合評價,主要方法有:工程地質分析法、邊坡穩定性分析數據庫和專家系統法及圖解法等。定量分析方法是想通過力學原理對滑坡的穩定性進行分析,但嚴格地講,滑坡穩定性分析還沒有達到完全的定量這一階段,目前只能算是一種半定量半定性的分析方法。滑坡穩定性定量分析目前大概可以分成三種方法:解析法,數值方法和概率法。

國內外學者利用多種方法對滑坡穩定性做了研究。例如:意大利學者 Carrara[8]、西班牙學者 Jiménez-Perálvarez[9],利用地理信息系統及空間分析進行過滑坡易發性評價與制圖;美國學者Nandi[10]、中國學者李雪平和唐輝明等[11]利用統計模型進行過滑坡易發性評價。但是,這些方法都需要地形、地質、水文和人類工程活動等多種數據,涉及到的評價指標從幾個到幾十個不等,而要在這眾多的評價指標中科學、合理地確定模型評價指標體系是一個非常棘手的問題,也是在許多相關研究中沒有解決的關鍵問題。

1 影響滑坡穩定性的因素分析

影響滑坡穩定性因素有很多,主要包括滑坡巖性、地質結構、軟弱地層狀況、河流作用等。除此以外,還有巖石風化狀況、地面變形情況、降雨、地震、植被覆蓋率及人類工程活動等[12]。這些因素綜合起來可分為兩大類,即內在因素和外在因素。內在因素包括:滑坡巖性,巖土體結構、滑坡軟弱地層等。外在因素包括:水文地質條件及降雨,巖石風化狀況,地面變形情況,植被覆蓋率,地震以及人為因素等。內在因素是主要因素,對滑坡穩定性起決定性作用,它們決定滑坡變形破壞的形式和規模的大小。外在因素則是輔助因素,只有通過內在因素才能對滑坡的穩定性起到促進作用,導致滑坡變形破壞的發生。但是外在因素如果變化頻繁,其作用有時不可小視,甚至能成為滑坡破壞的直接原因。

目前所擁有的212組實際滑坡數據,每組數據有24個屬性,并運用SVM算法對提取主成分前后的數據進行檢驗,比較兩種數據的算法準確度。本文根據滑坡穩定狀況,將滑坡分為三類:滑坡、易滑坡和穩定。

滑坡穩定狀態的分類依據現場的影響因素所計算出的穩定系數,按照穩定系數的大小分為四類,結果見表1[13]。

表1 滑坡穩定狀況分類

2 PCA和SVM方法介紹

2.1 主成分分析

主成分分析(Principal Component Analysis,PCA)于1933年由Karl.Pension提出的,他是在研究非隨機變量引入的,隨后Harold Hotelling將此方法推廣到隨機向量的情形。PCA的主要思想是降維,在保留大部分原始數據信息的前提下,將多個冗余的指標轉換為少數幾個綜合指標,稱為主成分[14]。

2.1.1 主成分分析的基本原理

主成分分析是將含有多種指標的問題在準確度不大幅降低的情況下,轉化為少數幾個關鍵指標的一種重要的統計方法,它是一種將高維空間運算的問題降低到低維空間中運算的方法,從而簡化運算的復雜度,使問題變得簡介、直觀。提取的少數幾個關鍵指標之間互不相關且包含原有指標大部分的信息。

運用PCA對數據進行降維,不僅降低數據系統的維度,還能使數據的數字特征簡化。PCA在對數據簡化的同時,還能提供很多數據的特征,比如數據的重心位置,數據變化的最大方向,以及數據點群的分布情況。

2.1.2 主成分分析的主要步驟

PCA有如下五個步驟:

(1)將原始數據標準化;

(2)計算相關系數矩陣;

其中rij(i,j=1,2,…,p)是原始數據變量xi和xj的相關系數,其表達式為

(3)求出特征值和特征向量;

(4)求出每個主成分的貢獻率及主成分的累積貢獻率;

(5)計算主成分;

PCA不需要附加信息或者先驗知識,就能有效地分析和處理不精確、不完整和不一致等各種不完備數據,將含有多種指標的問題在準確度不大幅降低的情況下,轉化為少數幾個關鍵指標。它最大的特點是可對數據進行信息約簡,獲得數據的核心知識,以降低人們對復雜系統的空間認知復雜性,為研究滑坡等復雜系統提供有力工具。

2.2 支持向量機

支持向量機(SVM)是基于VC理論的機器學習方法,是繼神經網絡之后的新一代學習算法,它利用核函數將原始線性不可分數據轉換為高維空間線性可分的數據模式,既能有效地處理非線性數據,又能限制過學習,特別適合于小樣本集的數據處理。

SVM兩個突出的優點是:一是基于結構風險最小原則,這優于傳統的經驗風險最小原則;二是通過求解受限的二次型保證了其性能。但同時發現,SVM在對數據處理中的優勢也是其劣勢所在。假如小樣本集合中存在異常點或數據屬性眾多且相互影響,則對小樣本預測的結果會產生很大影響。因為支持向量機不能確定數據中哪些是重要的、核心的,哪些數據是冗余的、干擾的。而PCA所具有的特點正好能夠解決這些問題,若將二者相結合應用于滑坡分析,尋找區域滑坡災害發生的內在規律應該是完全有效的。

3 PCA和SVM在滑坡穩定性分析中的應用

3.1 數據的采集

本文利用了200多組邊坡穩定性的實際情況數據。在這些數據中,影響邊坡穩定性的因素包括斜坡類型、地層時代、容量、地層傾向、內摩擦角、地震烈度、微地貌、地下水類型、相對河流位置、坡高、坡寬、坡長、坡角、坡向、土地利用、坡面形態、裂隙組數、斜坡結構類型、全風化帶深度、土質名稱、粘聚力、下伏基巖埋深、伏基巖傾角、伏基巖傾向等,通過計算邊坡的穩定系數,按照表1的數據,將滑坡穩定狀況分為三類:滑坡、易破壞和穩定。

3.2 數據的標準化

由于24個屬性的取值不屬于同一個數量級,輸入變量差異較大,因此,在建立模型之前,先對輸入的數據進行歸一化處理,將同一屬性的數據歸一到-1至1的范圍之內。

3.3 PCA 提取主成分

主成分的數目可以根據相關系數矩陣的特征根來判定,而方差是變量數據蘊涵信息的重要判據之一。根據λ值決定主成分數目的準則有三條:

(1)只取λ>1的特征根對應的主成分

取主成分特征值對應的λ值都大于1,這意味著這三個主成分得分的方差都大于1。在實際情況中,可以將方差值減小為0.8,本例正是根據這條準則提取主成分的。

(2)前q個主成分的累計百分比達到80%左右的的λ值對應的主成分

所選取的主成分對應的λ值累計百分比達到80%,這表明目前所選取的主成分信息量已經夠了。

(3)根據特征根變化的突變點決定主成分的數量。

運用PCA提取主成分后的數據見表2。

表2 全部解釋方差

在表2的初始特征根中,給出了按順序排列的主成分得分的方差,在數值上等于相關系數矩陣的各個特征根λ,因此可以直接根據特征根計算每一個主成分的方差百分比。由于全部特征根的總和等于變量數目,即有m=∑λi=24,故第一個特征根的方差百分比為λ1/m=3.949/24=16.445%, 第二個特征根的百分比為 λ2/m=2.719/24=11.329%,其余依此類推。然后可以算出方差累計值。

按照上文提及的三個提取主成分的條件,在λ>1的情況下,主成分的累積貢獻率只有61.095%,達不到80%左右的條件,故將λ的值減小到0.8,此時主成分的累積貢獻率達到79.455%,基本滿足前兩個條件。而第3個條件,根據特征根變化的突變點決定主成分的數量如圖1所示:

圖1 特征根數值衰減折線圖

為了找出選取的前12個主成分和具體影響因素之間的關系,將各主成分所對的特征向量分別與滑坡影響因素進行相關分析,找出與該主成分相關性最大的影響因素。為了能夠準確地描述變量之間的線性相關程度,可以通過計算相關系數來進行相關分析。相關系數是衡量變量之間相關程度的一個統計量。相關系數的取值范圍為[-1,1],用r來表示相關系數,如果大于 0.5,則兩個變量相關性很強。現采用Pearson簡單相關系數計算變量之間的相關性:

表3是個主成分分別于滑坡影響因素進行相關分析得到的相關系數,與該主成分相關系數大的即可認為是該主成分所對應的影響因素。

表3 主成分與滑坡影響因素相關系數表

由表中Z1,Z2,…… ,Z12為前12個主成分,可以看出第一主成分與內摩擦角、裂隙組數和伏基巖傾角的相關系數為0.868、0.724和0.881,即第一主成分為內摩擦角、裂隙組數和伏基巖傾角有較強的正相關,同理提取的其它9個最強相關的因素為地層年代、容量、相對河流位置、坡高、坡寬、坡角、坡面形態、粘聚力和伏基巖傾向。所以認為這12分影響因素可以代替原始的24個影響因素進行滑坡穩定性的分析。

3.4 SVM核函數的選取

在訓練SVM時應該考慮核函數及相關參數對模型性能的影響,這里采用高斯徑向基函數(RBF)核函數:

首先利用交叉驗證方法尋找最佳的參數C(懲罰因子)和參數σ2(RBF核函數中的方差),選擇最佳的參數訓練模型。當模型的性能相同時,為了減少計算時間,優先選擇懲罰因子C比較小的參數組合,這是因為懲罰因子C越大,最終得到的支持向量數越多,計算量越大。通過實驗選擇參數后,選取核函數中的參數C=64,RBF核函數中的方差σ2=0.012。

4 結果分析

所擁有的212組數據中,滑坡類型數據有22個,易滑坡類型數據有155個,穩定類型數據有35個。利用5折交叉檢驗的方式對212組數據分別進行分析。采用5折交叉驗證來測試分類結果和驗證模型的正確性:將初始數據集隨機劃分成5個互不相交的子集,即,每個子集的大小基本相同。學習和測試分別進行5次。在第i次迭代,用作測試集,其余的子集都用于訓練分類器。取5次迭代正確分類數除以初始數據中的樣本總數的平均準確率作為最終評估的結果。

為了與其他預測方法進行對比,實驗中采用了相同的樣本數量和分析變量,利用Matlab和libsvm支持向量機方法,抽取其中1/5的數據進行預測,其余的數據進行支持向量機模型訓練。如此進行5次迭代,得到的提取主成分前后的對比結果如表4和表5所示。

表4 提取主成分前滑坡穩定性分析結果

表5 提取主成分后滑坡穩定性分析結果

將SVM分類算法運用在PCA降維前后,由表4和表5可得到如下結論:

(1)運用PCA提取主成分后滑坡穩定性分析的結果較提取之前有小幅度的上升;

(2)降維前變量之間的關系有24*24=576組,而將為后只有12*12=144組,且提取的12個主成分之間互不相關,從而避免了影響滑坡穩定性的因素之間的相互影響;

(3)運用PCA提取主成分之后,SVM算法在滑坡穩定性分析的精確度只有2.5%的上升,但是在提取12個主成分之后,滑坡監測的工作量將大大降低,運用在滑坡監測的成本也會大幅度減少,這在經濟上還是有積極意義的。

5 結論

為了對滑坡穩定性進行分析,并實現實際滑坡預警,運用了PCA和SVM算法對實際采集到的數據進行分析,實驗結果證明兩種算法結合之后的算法精確度有所提高,可以在判斷滑坡的穩定性上得出比較可靠的結論。在條件允許的情況下,可以考慮用多種分類算法來進行綜合評價,以減小損失,提高準確度。

[1]曾凡雷.滑坡地質災害變形預測及同步性預警機制研究[D].河北工程大學,2012.

[2]賀小黑,王思敬,肖銳鏵,等.Verhulst滑坡預測預報模型的改進及其應用[J].Rock and Soil Mechanics,2013.

[3]付杰.卡爾曼濾波在滑坡變形預測中的應用研究[D].中國地質大學,2013.

[4]李炯.基于馬爾可夫鏈模型的滑坡位移預測研究[D].中國地質大學,2012.

[5]Khai-Wern L,Tien T L,Lateh H.Landslide hazard mapping of Penang island using probabilistic methods and logistic regression [C]//Imaging Systems and Techniques(IST),2011 IEEE International Conference on.IEEE,2011:273-278.

[6]Gao W.Predication of Landslide Based on Grey System and Evolutionary Artificial Neural Networks[C]//System Science,Engineering Design and Manufacturing Informatization(ICSEM),2010 International Conference on.IEEE,2010,2:64-67.

[7]黃光東.基于智能算法的滑坡穩定性建模與分析[D].北京:中國地質大學,2011.

[8]Carrara A,Pike R J.GIS technology and models for assessing landslide hazard and risk[J].Geomorphology,2008,94(3):257-260.

[9]Jiménez-Perálvarez J D,Irigaray C,El Hamdouni R,et al.Building models for automatic landslide-susceptibility analysis,mapping and validation in ArcGIS[J].Natural hazards,2009,50(3):571-590.

[10]Nandi A,Shakoor A.A GIS-based landslide susceptibility evaluation using bivariate and multivariate statistical analyses[J].Engineering Geology,2010,110(1):11-20.

[11]李雪平,唐輝明.基于 GIS的分組數據 Logistic模型在斜坡穩定性評價中的應用[J].吉林大學學報:地球科學版,2005,35(3):361-365.

[12]黃光東.基于智能算法的滑坡穩定性建模與分析[D].北京:中國地質大學,2011.

[13]郭社鋒.基于范例推理的黃土高邊坡穩定性評價方法研究[D].西安:長安大學,2006.

[14]張鵬.基于主成分分析的綜合評價研究[D].中國優秀碩士學位論文全文數據庫,2004.

猜你喜歡
因素分析
腹部脹氣的飲食因素
中老年保健(2022年5期)2022-08-24 02:36:04
四大因素致牛肉價小幅回落
今日農業(2021年17期)2021-11-26 23:38:44
食品安全的影響因素與保障措施探討
群眾路線是百年大黨成功之內核性制度因素的外在表達
當代陜西(2021年12期)2021-08-05 07:45:46
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
短道速滑運動員非智力因素的培養
冰雪運動(2016年4期)2016-04-16 05:54:56
《流星花園》的流行性因素
劍南文學(2015年1期)2015-02-28 01:15:15
中西醫結合治療抑郁癥100例分析
主站蜘蛛池模板: 试看120秒男女啪啪免费| 亚洲黄色激情网站| www.精品国产| 在线国产资源| 风韵丰满熟妇啪啪区老熟熟女| 午夜限制老子影院888| 丝袜美女被出水视频一区| 欧美国产成人在线| 亚洲欧洲天堂色AV| 伊人精品成人久久综合| 亚洲日韩欧美在线观看| 国产美女无遮挡免费视频| 久久精品电影| 亚洲欧美在线精品一区二区| 亚洲女同欧美在线| 91色在线观看| 99久久精品免费观看国产| 自慰网址在线观看| 久久综合九九亚洲一区| 九色最新网址| 麻豆国产在线观看一区二区| 中文成人无码国产亚洲| 欧美激情第一区| 日韩在线永久免费播放| www欧美在线观看| 麻豆国产在线观看一区二区| 亚洲国产精品成人久久综合影院| 久久精品午夜视频| 精品国产91爱| 色婷婷天天综合在线| 91av成人日本不卡三区| 91在线中文| 欧美在线中文字幕| 欧美日韩资源| 亚洲日本www| 久久亚洲国产视频| 国产成人1024精品| 国产精品免费电影| 久久黄色小视频| 国产高清在线丝袜精品一区| 91在线无码精品秘九色APP| 国产黄网站在线观看| 久草国产在线观看| 久久国产V一级毛多内射| 精品少妇人妻一区二区| 男女性午夜福利网站| 人妻21p大胆| 国产99精品久久| 国产精品免费久久久久影院无码| 激情综合五月网| 亚洲看片网| 手机精品福利在线观看| 强奷白丝美女在线观看| 亚洲精品国产首次亮相| 日本精品视频一区二区| 国产网站一区二区三区| 日韩在线视频网站| 久久永久视频| 2019国产在线| 久爱午夜精品免费视频| 国产真实乱子伦视频播放| 免费国产黄线在线观看| 超级碰免费视频91| 亚洲性视频网站| 又大又硬又爽免费视频| 国产精品七七在线播放| 一级毛片免费观看久| 国产区91| 狼友av永久网站免费观看| 亚洲最黄视频| 亚洲色偷偷偷鲁综合| 亚洲人成影视在线观看| 最新国产精品第1页| 18黑白丝水手服自慰喷水网站| 日本人妻丰满熟妇区| 日韩中文精品亚洲第三区| 国产亚洲精品在天天在线麻豆| 免费一级全黄少妇性色生活片| 情侣午夜国产在线一区无码| 97se亚洲综合在线天天| 国产精品99在线观看| 久久人人爽人人爽人人片aV东京热 |