楊念江,樊方濤
(湖南省水利水電勘測設計研究總院,湖南 長沙 410007)
邊坡穩定性預測是工程研究領域的熱點問題,邊坡穩定性受自身物質組成、沉積形成過程和外界環境多種因素的影響,一般很難通過確定性的數學模型來表達[1]。位移作為邊坡巖土體在變形破壞演化過程中反饋出的重要信息,通過實際監測的邊坡位移序列來預測邊坡未來變形,便可以判斷邊坡的穩定性。目前用于邊坡位移預測的方法很多,主要有時間序列模型[2~3]、灰色模型[4~5]、神經網絡模型[6~7]等方法。但這些方法都存在著理論或應用上的不足,如時間序列分析法的應用前提是假設監測數據為非平穩時間序列,灰色理論則需要假設時間序列中與歷史時序吻合的模式,即假定在數據系列中該模式可以在時間上再現,然而這種假設往往與時間不符;而人工神經網絡也存在著一定的缺陷,在學習樣本數量有限時,精度難以保證,當學習樣本的維數很高時,其高維空間中往往存在眾多差異較大的局部極值,會使學習結果呈現出較大的隨機性[8]。
近年來,支持向量機[9](support vector machine,SVM)被廣大學者應用于邊坡的穩定性評價中[10~12]。支持向量機是以結構風險最小化原理為基礎的算法,具有良好的數學性能,如解的唯一性、不依賴輸入空間的維數等。而最小二乘支持向量機[13](LS-SVM)是支持向量機的一個變種,解決了大樣本訓練過程中計算速度變慢的問題。和其他學習算法一樣,其性能依賴于學習機的參數,然而到目前為止,還沒有指導LS-SVM 參數選擇的系統方法。
本文采用混沌遺傳算法參數優化應用于LS-SVM預測模型,將混沌運動的遍歷性和遺傳算法的高效并行計算能力相結合,并隨著尋優次數的增長動態縮減尋優區間,在一定程度上克服了傳統尋優方法存在早熟收斂、非全局收斂以及收斂速度慢的弱點。并將之應用于實際工程的分析與預測,以驗證這種變尺度混沌遺傳算法參數優化的LS-SVM 模型在邊坡變形預測領域應用的效果。
最小二乘支持向量機(LS-SVM)是Suykens 等提出的一種改進的SVM 算法。LS-SVM 將標準SVM 中的不等式約束改為等式約束,以誤差平方和作為訓練樣本的損失函數,從而將2 次規劃問題轉化為求解線性方程組問題。
訓練集可以表示為:(xi,yi)li=1,其中yi是目標值,xi是輸入向量,l 為樣本個數,對于線性回歸問題采用線性函數f(x)=ω·x+b 來擬合,函數估計問題可以描述為求解以下問題:

約束條件:

其中φ(xi):Rn→Rnh是核空間映射函數,權矢量ω∈Rnh,誤差變量ξi∈R,b 是偏差量,γ 是懲罰參數。核函數可以將原始空間中的樣本映射為高維特征空間中的一個向量,以解決線性不可分的問題,用拉格朗日法求解這個優化問題:

其中φ(·):Rn→Rnh,αi,i=1,2…l,是拉格朗日乘子。根據優化條件:


可得:

其中x=[x1,…xl],y=[y1,…yl],α=[α1,…αl],核函數K(xk,x1)=Φ(xk)TΦ(xl),是滿足Mercer 條件的對稱函數。
最小二乘支持向量機回歸估計為:

通常情況下,最小二乘支持向量機的核函數選用高斯核函數。定義為:

其中懲罰參數γ 和高斯核參數σ 直接影響到LSSVM 模型的預測效果。
為了提高LS-SVM 模型的預測準確率,本文采用變尺度混沌遺傳算法對LS-SVM 中的參數σ 和懲罰參數γ 進行優化。
目前,關于LSSVM 的參數優化的方法,主要有混沌優化[14]、遺傳算法[15]和粒子群算法[16]等。但這些方法都存在一定的不足。例如,混沌優化算法因為其遍歷性,其尋優速度相對較慢,遺傳算法和粒子群算法存在早熟及局部收斂的問題。為了彌補其不足,本文將混沌優化和遺傳算法結合起來。混沌運動的遍歷性避免了遺傳算法的早熟及局部收斂的不足,遺傳算法的并行處理方法彌補了混沌遍歷所需時間。該改進算法具有收斂速度快,不易陷入局部最值點的特點。本文采用常用的一維logistic 映射[17]為:

其中,0≤x1≤1;k 是迭代次數,k=1,2,…;μ 是控制參量,當μ=4 時系統完全處于混沌狀態,此時xk在[0,1]的范圍內變化。
其主要步驟如下:
1)初始化LS-SVM 參數并對其進行二進制編碼,產生遺傳算法的初始群體,選擇樣本均方根誤差(RMSE)作為適應度函數值。LS-SVM 模型需要優化的參數為σ 與γ,其優化區間分別為[a1,b1]、[a2,b2],碼串中包括兩個參數的二進制碼。
2)將長為m 的位串按照參數σ 與γ 分成兩段,分別映射到[0,1]的區間,如

其中,dec(β)是二進制位串β 的十進制數值;v 是位串β 的長度。
3)利用式(11)迭代得到兩個[0,1]區間的新值,分別將其逆映射為長度是p、q 的位串,組合成長度為m的新二進制位串,產生一組新的種群。并利用訓練集運行LS-SVM 算法,計算適應值f1(σ,γ)。
4)按照遺傳算法對參數映射種群進行選擇操作。
5)按照遺傳算法對參數映射種群以概率pc進行交叉操作。
6)按照遺傳算法對參數映射種群以概率pm進行變異操作。
7)利用變異后的個體計算新的適應值f2(σ,γ),如果f2(σ,γ)<f1(σ,γ),則根據遺傳算法對參數映射種群進行復制運算接受新個體,并標記性能最好的個體。
8)重復步驟(2~6)的操作,如果種群最優值在一定步數內保持不變,則將最優個體記做pi*(i=1,2)。
9)進行變尺度操作,縮小變量搜索范圍,如

其中,λ∈(0,0.5),r 是縮小搜索方位的操作次數。為使變量落入正確取值區間內,做出以下界定:若air+1<air,則令air+1取值air;若bir+1>bir,則bir+1取值bir。
10)按照縮小了的搜索范圍內產生新種群,執行步驟(2~8)。若最優值在若干次內保持不變,則結束尋優操作。得到的pi*(i=1,2)對應于參數σ 與γ 優化值。
解空間的搜索空間越大,優化方法的搜索精度越低,且失效的可能性越大,且在相同區間內盲目的重復搜索,會降低優化效率。該優化算法首先在較大范圍內進行粗搜索,確定參數的次優值,然后利用變尺度混沌優化方法縮小搜索范圍,在其縮小的范圍內進行細搜索以確定參數的最優值,加快了搜索速度和精度。
本文采用Matlab 語言編制了基于混沌遺傳算法參數優化的最小二乘支持向量機邊坡位移預測程序,為本文研究作為基礎。
將該模型應用于某水利水電工程左岸巖質邊坡EL1885~EL1960 的位移觀測點中,以2007 年10 月18日到2008 年07 月03 日時間段實測監測數據作為模型的訓練數據和檢驗數據,共40 個監測數據,如表1所示,前30 個數據用于對邊坡變形監測時序進行回歸建模,后10 個數據用于預測驗證。

表1 用于構建訓練數據集的實測位移
本文首先對數據進行歸一化處理,以將數據控制在(0,1)的范圍。這樣可以有效減小預測誤差,所用歸一化公式如下:

選擇均方根誤差(RMSE)作為適應度函數值:

利用建立起來的LS-SVM 模型對后10 個時間段的位移數據進行預測,并與使用標準遺傳算法對LSSVM 參數優化預測模型做個比較,詳細結果如表2 所示,可以看出基于CAG 優化的LS-SVM 模型的預測值均方根誤差為0.21,最大相對誤差為0.057,明顯小于基于SGA 優化的模型預測的0.32 和0.076。從表2 可以更加直觀的看到基于CAG 優化的LS-SVM 模型具備更好的預測性能,且預測效果令人滿意。

圖1 LS-SVM 模型的兩種參數優化算法的收斂性比較

表2 兩組參數優化LS-SVM 模型的預測結果
1)針對工程邊坡位移變化的復雜性,采用最小二乘支持向量機(LS-SVM)建立邊坡位移預測模型,對邊坡位移進行短期預測,考慮到參數選擇對模型預測的重要影響,提出了基于變尺度混沌遺傳算法的聯合優化的模型方法(CGA-LSSVM)。
2)采用混沌遺傳算法(CGA)對LS-SVM 的參數進行優化,其參數尋優速度比普通遺傳算法(SGA)有了明顯的提高,同時在一定程度上克服了遺傳算法易陷于局部最優的缺陷,加強了對最優解的局部搜索能力,因此搜索效率及其預測精度都有了進一步的提高。
3)將其模型應用到某水利水電工程左岸巖質邊坡體邊坡位移時間序列的預測中,顯示了良好的預測效果,表明本文提出的CGA-LSSVM 模型在邊坡非線性時間序列預測中有較好的普適性和實用價值。