張育鋒 李圖南
(陜西省土地工程建設集團,陜西 西安710075)
城市地鐵線路總體上會穿過城市交通擁擠、人口密集、建筑物林立、地下管線復雜的路段,在施工過程中會引起周邊巖土的變形,從而給地表建筑物、地下管線的運營帶來安全隱患,因此地鐵建設過程中沉降監測預報顯得尤為重要。近年來,對變形數據分析與預報方面的方法很多,有回歸分析、時間序列分析法、灰色系統理論、BP神經網絡法、卡爾曼濾波、小波分析等[1]。由于地鐵沉降預測的復雜性,單一模型只能描述其局部的變化規律,預測精度時高時低,不穩定。因此對單一模型進行改進或建立組合預測模型成為提高地鐵沉降預測精度的重要途徑,孫景領提出了灰色神經網絡地鐵沉降組合預測模型[2];王新洲等提出基于小波變換和支持向量機的大壩變形監測[3];潘國榮等提出小波神經網絡變形監測數據組合預測模型[4]。組合模型繼承了單一模型的優點,預測效果較好。
灰色預測在時間序列預測中是一種非常有效的方法,但近年來研究表明灰色模型存在一些理論缺陷,原始離散數據序列的光滑度、模型的背景值、初始值等會使預測結果會出現較大誤差[5]。支持向量機(SVM)是一種機器學習算法,是在統計學的VC維理論和結合風險最小化原理的基礎上形成的,具有強大的泛化能力,能夠很好地解決小樣本數據、非線性和局部極小點等問題,避免出現過學習這種現象[6]。本文將灰色預測和支持向量機相融合,通過灰色預測將沉降數據累加產生具有單調遞增的新序列,弱化原始數據序列中隨機因素的影響,增強其規律性,采用區間滾動的方式將最新的沉降的數據作為部分輸入值,使用支持向量機對數據進行訓練預測,最后對預測值累減還原,從而構建灰色支持向量機組合預測模型。通過實際測試,取得了較好的結果。
設通過監測得到的地鐵原始沉降時間序列X(0)={x(0)(1),x(0)(2),…,x(0)(n)} ,通過一次累 加 形 成 新 的 1-AGO 序 X(1)={x(1)(1),x(1)(2),…,x(1)(n)} ,其 中 x(1)(k)=
對X(1)建立一階灰色模型微分方程:
其中,a為系統發展灰數,b為系統內生控制變量。對式(1-1)離散化處理,得到:
Y=BP
根據最小二乘法可得:
解微分方程建立預測公式:
累減還原的預測值為:
支持向量機回歸的目的是通過訓練樣本,找出相對穩定的函數逼近樣本集輸入與輸出之間的關系,并且對新的輸入也能給出準確的輸出。支持向量機回歸分析分為線性回歸和非線性回歸,通常樣本呈非線性情況,隨著Vapnik的ε不敏感損失函數的引入,它已經成功擴展為解決非線性回歸估計問題,展現了極好的學習推廣性。對于非線性情況,SVM 模型可以有效地實現對基于小樣本的高維非線性系統精確擬合,并且采用結構風險最小原則,具有很好的泛化性。已知一組訓練數據集 (xi,yi) ,xi∈Rn,yi∈R,i=1,2,…,m,利用非線性映射φ把數據集從輸入空間映射到高維特征空間,以使輸入空間中的非線性擬合問題變成高維特征空間中的線性擬合問題。高維特征空間的線性回歸函數為:
其中,w和b為權值系數和偏差,φ(x)為特征特征空間。根據結構風險最小化原則,f(x) 等價于求下面的最優化問題:
為了尋找w和b,這里需要引入松弛變量ξi,ξi*求解,(2-2)式就變等價于求解下面的優化問題:
約束條件為:
式(2-2)中,m是訓練樣本,ε是不敏感系數常量。上面的約束優化問題是一個典型的二次規劃問題,上述問題可用拉格朗日乘子法求解,得到原問題的對偶問題,該二次規劃問題對偶問題為
約束條件為
通過二次優化方法控制參數C和ε就可以控制SVM的泛化性,式(2-6)中αi*和αi是拉格朗日乘子,(αi*-αi) 非零值對應的數據就是支持向量。根據Mercer定理,引入核函數K解算得到支持向量機回歸方程的估計式為
支持向量機的特點在于不直接計算復雜的非線性變換,而是計算非線性變換的點積,即核函數,采用的不用的核函數可以構造實現輸入空間中不同的非線性回歸學習方法。SVM目前常用的核函數主要有多項式核函數、徑向基函數(RBF)和Sigmoid核函數等[7]。圖1顯示了支持向量機結構示意圖。
考慮到地鐵沉降數據是一維時間序列,同時SVM多輸入單輸出結構和不具備根據實際情況動態調整預測值的能力,對原始數據序列可以采用區間滾動預測的方法將其轉換成多維時間序列,即從左向右移動該區間,區間內最左的數據從定長區間移動出去,則從區間右側相應地會有新數據加入,使得區間內的數據始終保持在p個。具體做法:設有時間序列 {x(1),x(2),…,x(n)},取i(i<n)個作為支持向量機的訓練樣本,(n-i)個樣本作為測試集,將輸出值反饋到輸入端作為下一次輸入值的一部分。圖2采用區間滾動構成支持向量機的訓練樣本集的輸出與輸入。
其中,p是步長。由于不同的時間序列前后數據關聯程度很不同,選取不同的數據長度其預測結果也大不相同,將最小平方誤差步長為p的xi-p,xi-p+1,…,xi-1作為支持向量機的輸入數據,xi作為預測輸出量。
利用灰色生成弱化原始數據序列隨機性,增強其規律性的特性,然后利用支持向量機擬合非線性數據能力的優勢對新序列建立預測模型,最后將預測結果進行累減還原得預測值。具體的建模步驟如下:
(1)對原始沉降數據進行一次累加生成新的序列,由于新生成的序列最大值最小值之間差異較大,因此對樣本進行了歸一化處理,將大小控制在[0,1]之間。
(2)滾動預測
將處理后的地鐵沉降樣本數據分為兩部分:訓練集和測試集,訓練集用來訓練數據從而得到最優模型,選定最佳模型后對測試集進行預測。采用滾動預測的方式對數據進行處理確定訓練集和測試集的輸入量和輸出量。
(3)參數的確定
目前,參數的選擇沒有統一的理論指導[8]。本文采用最常用的ε-不敏感損失函數作為損失函數,選擇徑向基函數(RBF)為模型核函數,ε通過控制回歸逼近誤差管道的大小,從而達到控制支持向量的個數和泛化能力。對于一個基于RBF為核函數的支持向量機而言,其性能由C(懲罰參數)和g(RBF核參數)決定,懲罰因子C用于控制模型復雜度和逼近誤差的折中;核參數g決定了映射函數和樣本特征子空間分布的復雜程度,C和g取值不當都會影響SVM的學習效果。本文利用網格參數尋優找到最佳參數C和g,即讓C和g在一定的范圍內取值,為了避免“過學習”和“欠學習”的現象,將訓練集利用K-折交叉驗證法[9]訓練,取交叉檢驗下平均分類均方根誤差最小的那組C和g的值
(4)累減還原
訓練樣本集經過訓練得到最優回歸模型,將測試集代入到模型中得到預測值,對預測值反歸一化處理,生成的新序列累減還原就得到了原始地鐵沉降數據的預測值。
(5)為了方便評價預測模型的準確度,本文選用平均絕對誤差(MAE)、平均相對誤差(MRE)和均方根誤差 (RMSE)作為評價指標。
根據文獻[10]某點實測地鐵隧道施工累積沉降數據建立灰色支持向量機滾動預測模型。本文采用 Matlab編程調用LIBSVM工具箱[11]實現組合模型。將2009/4/13~2009/5/24這42期作為樣本數據,用前31期的數據作為訓練集,后11期作為測試集并將其預測結果與實際值進行比較。經過網格參數尋優得到灰色支持向量機主要參數值如下:取滾動預測的數據步長為6,K=3,C=128,g=0.0313。圖1顯示了網格參數尋優的三維視圖,其中log2c取[-1,7],log2g取[-8,0],MSE表示的是K=3折交叉驗證法平均分類均方根誤差。
現分別用灰色預測模型、支持向量機、灰色支持向量機對后11期進行預測并對三種預測模型精度進行比較,結果如表1所示。

表1 2009/5/14-2009/5/24地鐵沉降預測值及精度比較
從表1可以灰色模型的精度最低,支持向量機預測精度明顯優于前者這也體現了機器學習方法泛化性好的優點,組合模型的預測精度最高,這主要是因為灰色預測模型獨特的數據生成方式增強了數據的規律性,加上支持向量機良好的泛化性從而提高了預測精度。是灰色模型、SVM模型和灰色SVM組合模型預測值和實測值比較曲線(如圖4所示)。
支持向量機作為一種機器學習方法,具有強大的非線性逼近能力,相對人工神經網路而言SVM能夠很好地解決小樣本數據、非線性和局部極小點等問題,避免出現過學習這種現象。灰色預測模型獨特的數據生成方式可以削弱數據序列的趨勢性,增強數據的規律性。本文將二者結合起來,充分利用兩者的優勢對地鐵沉降數據進行預測,取得了較好的預測效果,可以將此方法借鑒到建筑物、大壩等工程項目中,具有一定的實用價值。