王江榮,袁維紅,趙 睿,任泰明
(1.蘭州石化職業技術學院 信息處理與控制工程系,甘肅 蘭州 730060;2.蘭州石化職業技術學院 土木工程系,甘肅 蘭州 730060)
基于分位數回歸的冪多項式在數據分析中的應用
王江榮1,袁維紅2,趙 睿1,任泰明1
(1.蘭州石化職業技術學院 信息處理與控制工程系,甘肅 蘭州 730060;2.蘭州石化職業技術學院 土木工程系,甘肅 蘭州 730060)
針對路基沉降與觀測時間存在非線性關系,且傳統最小二乘參數估計精度不高的問題,建立具有較強逼近能力的冪多項式路基沉降預測模型,并用分位數回歸估算模型系數。工程實例表明,基于分位數回歸估計的冪多項式預測模型具有較高的精確度,優于最小二乘估計的冪多項式預測模型和多變量灰色預測模型,為沉降預測提供一種新方法。
高速公路;路基沉降;冪多項式函數;分位數回歸;沉降量預測
高速公路在施工期和工后運營期均存在著路基沉降問題,利用現場沉降觀測量準確預測后期沉降量,對于公路施工質量監管、道路安全、公路維護等具有重要的實現意義,同時為公路管理等部門提供科學的決策依據。現有的沉降預測方法主要采用回歸分析模型、統計模型、組合模型[1-5]、神經網絡[6]和灰色理論[7]等,這些模型的參數估計大多采用了最小二乘估計法,該估計法要求模型的隨機誤差服從獨立同分布且呈正態分布,但在實際沉降問題中,受多因素影響[8-9],估算出的參數并非最優,得到的模型穩健性較差,預測精度不高。與傳統最小二乘回歸相比,分位數回歸是一種非常穩健的參數估計方法[10-12],模型參數的估計結果不會受異常觀測數據的影響,且對模型的隨機誤差項無任何要求,克服了最小二乘估計法的不足。另外,用最小二乘法建模時只能得到一個回歸方程,容易丟失數據信息,致使所建模型難以對預測量進行準確預測;用分位數回歸估算模型參數時在不同分位點上估算出的模型參數往往不同,因而可以得到多個不同的回歸方程,從而在不同的分位點上預測結果不同,為決策者提供了多種選擇,以便選出符合實際的回歸方程。由于沉降觀測數據列具有非線性特征,而冪多項式函數具有良好的數據適應能力和實際曲線逼近能力。基于此,本文建立基于分位回歸估計的冪多項式模型,并對建模以外的路基沉降觀測量進行預測分析,結果表明該模型具有較強的預測能力和更高預測精確度。
分位數回歸方法最早由Koenker和Bassett提出[13],該方法是一種全面數據分析方法,具有很強的抗干擾能力和穩健性。
設FY|X(y)為在隨機變量X下Y的條件分布函數,則Y的第τ∈(0,1)個條件分位數為
(1)
其中,inf(?)表示下確界函數。

(2)

式(2)的估計式等價式(3):
(3)
可見,分位數回歸是通過最小化樣本觀測值與樣本擬合值的加權誤差絕對值之和來估算模型參數的;而傳統最小二乘回歸則是通過最小化誤差平方和來估算模型參數值。
用分位數回歸建模時得到不同分位點的回歸
方程,決策者從中選擇最能反映實際問題的回歸方程,解決問題更具靈活性。
2.1 冪多項式模型及線性化
軟基路基沉降的基本特征:初期階段沉降逐漸增加,中期階段沉降加速發展,后期階段沉降變緩并趨近于一個定值(進入穩定狀態)。因此,沉降量S與時間t呈非線性關系,進而知S-1與t-1也呈非線性關系。因多項式函數具有較強的數據適應能力和實際曲線逼近能力,所以可選用多項式函數對路基沉降量進行擬合預測。由于冪多項式對觀測數據無過多要求,因此本文采用冪多項式來逼近S-1,即建立模型:
(4)

(5)
線性化后的模型(5)可方便地利用分位數回歸估計其參數β0,β1,…,βn。
2.2 模型參數的分位數回歸估計
依據分位數回歸的基本原理,構造模型損失函數:
(6)
式中:m為建模數據列長度,
Si為第i個觀測沉降量,則模型的參數估計值
3.1 數據來源
數據源自京哈(G102線)軟基公路長春至德惠路段的K1144+240斷面上的某監測點,觀測以15天為1個周期,所得觀測數據見表1[15]。

表1 數據資料[15]
表1給出的數據資料中,等間隔(對非等間隔本文模型依然適用)的實際觀測次數共12 次,在12個周期的累積沉降數據序列中取1~9次的沉降S-時間t數據估算模型的參數β0,β1,…,βn;取10~12次的沉降S-時間t數據來檢驗模型預測值的準確性。作出1~9次的S-1-t-1的散點圖,如圖1所示。

圖1 S-1-t-1關系圖
圖1表明S-1與t-1為非線性關系,可用以t-1為自變量的多項式逼近S-1,經線性化后用條件分位數估算模型參數。經分析比較選用4次冪多項式為擬合預測模型,即
(7)
從而
(8)
3.2 模型參數估計
利用Matlab2014a軟件編寫分位數回歸法程序并結合表1中1~9次的沉降S-時間t數據來估算模型參數β0,β1,…,β4。這里選用5個不同分位點τ=0.1,0.3,0.5.0.7,0.9估計模型系數。由于數據量較少,計算時選擇單純性算法。通過計算,得到的估計結果見表2。

表2 不同分位點下模型系數的估計值


表3 不同分位點下模型的擬合優度值
表3中數據表明5個模型的擬合優度都比較高,說明回歸的效果是顯著的,可以用所建模型對后續沉降進行預測分析。τ=0.7時回歸方程的擬合效果圖如圖2所示。
圖2表明τ=0.7對應的回歸方程擬合效果很好,其他分位點對應的回歸方程擬合圖略去。
3.3 預測分析
根據表2中的模型參數及式(8)得到τ=0.3,0.5,0.7時預測模型如下:

圖2 分位點為0.7的回歸方程擬合效果圖
1)τ=0.3,
2)τ=0.5,
3)τ=0.7,
利用τ=0.1,0.3,0.5,0.7,0.9的模型對表1中序號10~12的測試數據進行預測分析,結果見表4。采用最小二乘回歸法估算出的模型系數為(-0.034 612,22.788 91,-2 585.586,125 419.8,-203 562 7),對測試數據的預測值及誤差見表4第3列。文獻[15]的預測結果見表4最后一列。

表4 不同分位點對應的路基沉降量預測值 mm
從表4可以看出,基于分位數冪多項式模型對軟基高速公路沉降量的預測精度高于基于最小二乘參數估計的冪多項式預測模型(誤差絕對值之和的平均值為1.543 2),也高于文獻[15]多變量灰色預測模型MGM(1,3)(誤差絕對值之和的平均值為1.046 7),尤其以0.7分位數冪多項式模型的預測精度最高(誤差絕對值之和的平均值為0.366 3)。因此,選取0.7分位數回歸的冪多項式模型作為最終的預測模型。
文獻[15]還提供了另外兩個觀測點上的12個數據,采用本文建模方法均取得理想效果,綜合分析表明,將分位數回歸用于路基沉降量預測分析完全可行,能夠滿足工程需要。
1)最小二乘估計只有在模型的隨機誤差項服從正態獨立同分布時才能得出參數的無偏差估計,但在實際問題中這些條件往往難以滿足,因而使參數估計值偏離理想值,導致模型精度下降。分位數回歸估計拓展了最小二乘估計方法,按不同分位點可得多組估計量,從而得到多個回歸方程,使得在進行沉降量預測時對預測模型有更多選擇。由于分位數回歸時對模型的隨機誤差項不做任何假設,同時具有很強的數據適應能力,對少量樣本也能取得理想效果。
2)冪多項式模型結構簡單,對數據質量要求不高,具有很好的數據逼近和擬合能力,且容易線性化,非常適合用分位數回歸估算其參數。另外,利用Eviews軟件和MATLAB軟件可方便地完成冪多項式模型的建立和最終模型的選取。工程實例表明,基于分位數回歸的冪多項式模型預測精度優于基于最小二乘估計的冪多項式模型,也優于多變量灰色時間序列模型MGM(1,3)的預測結果,為路基沉降數據分析研究提供一種新思路、新方法。
3)不同的分位點(可分為低分位和高分位)代表不同的路基沉降發展水平,按施工期和工后期的不同狀態選擇不同分位數下的預測模型,會更符合實際,效果會更佳,對此需要進一步研究。另外,冪多項式建模的通用性有待論證。
[1] 鄭建國,王婷,張繼文.黃土路基沉降量預測方法的研究[J].巖土力學,2010,31(1):321-326.
[2] 甄京山.曲線擬合法在軟土路基沉降預測中的應用[J].公路交通科技,2012(11):195-197.
[3] 張濤,蔡國軍,劉松玉.基于Weibull模型的軟土路基沉降預測方法[J].巖土工程學報,2013,35(增2):212-216.
[4] 陳善雄,王星運,許錫昌,等.路基沉降預測的三點修正指數曲線法[J].巖土力學,2011(11):3355-3360.
[5] 陳威,唐德燕,張屆.三點法-灰色GM(1,1)組合模型在鐵路路基沉降預測中的應用[J].測繪科學,2015,40(7):37-40.
[6] 辛大鵬,田林亞,沈哲輝.小波分解AR-BP網絡模型在大壩垂直位移預測中的應用 [J].測繪工程,2015,24(12):53-54.
[7] 盧辰龍,匡翠林,陳曉林,等.基于TLS的多變量灰色模型在大壩變形預報中的應用[J].測繪工程,2015,24(12):53-54,48-52.
[8] 崔曉如.高填方路基沉降變形分析與預測及其控制標準研究[D].長沙:長沙理工大學,2010.
[9] 梅源.濕陷性黃土高填方地基處理技術及穩定性試驗研究[D].西安:西安建筑科技大學,2013.
[10] 陳雪蓉.復雜數據下分位數回歸建模及其應用[D].昆明:云南大學,2012.
[11] 姜成飛.分位數回歸方法綜述[J].科技信息,2013(25):185,240.
[12] 彭良玉.分位數回歸在時間序列中的應用[D].天津:天津大學,2010.
[13] PAREN E. Quantile Probability and Statistical Data Modeling[J].Statistical Science,2004,19(4):625-662.
[14] 朱志鐸,周禮紅.軟土路基全過程沉降預測的Logistic 模型應用研究[J].巖土工程學報,2009,31(6):969-969.
[15] 向一鳴,吳輝.基于多變量灰色模型的路基沉降預測[J].交通科技,2013(5):58-60.
[16] 楊曉松,張雙成.基于灰色二階模型的深基坑變形監測分析[J].交通科技與經濟,2015,17(6):122-124.
[17] 謝文國,高俊強,徐東風.時間序列在地鐵隧道變形監測數據處理中的應用[J].交通科技與經濟,2015,17(4):114-116.
[責任編輯:李銘娜]
本刊鄭重聲明
近來,在一些搜索引擎上,經常充斥一些假冒網站、機構及個人以《測繪工程》雜志社名義征稿、組稿、代發論文,收取審稿費、代寫費、版面費,欺詐投稿人,嚴重損害了我刊名譽。據查其刊名及國內統一刊號、國際標準刊號純屬盜用;發給作者的用稿通知上所蓋公章純屬偽造。
所謂的征稿行為已涉嫌侵權、詐騙、偽造企事業單位公章等多項犯罪,本刊已向公安機關報案。
本刊敦促相關網站及個人立即停止這一嚴重損害我刊名譽的侵權行為,本刊將依法保留追究有關人員法律責任的權利。特此聲明!
獲取在線投稿平臺地址郵箱:chgc2008@vip.com,咨詢電話:0451-88028906
(本刊編輯部)
Application of power polynomial based on Quantile Regression to data analysis
WANG Jiangrong1,YUAN Weihong2,ZHAO Rui1,REN Taiming1
(1. Dept. of Information Processing and Control Engineering,Lanzhou Petrochemical College of Vocational Technology, Lanzhou 730060, China;2.Department of Civil Engineering, Lanzhou Petrochemical College of Vocational Technology, Lanzhou 730060, China)
According to the nonlinear relationship between subgrade settlement and observation time, the accuracy of the traditional least squares parameter estimation is not high, so a power polynomial subgrade settlement prediction model with strong approximation ability is established, of which the model coefficients are estimated by quantile regression. Engineering example shows that the prediction based on the quantile regression estimates of power polynomial model has high accuracy, which is better than the least squares estimation of power polynomial prediction model and multi variable grey forecast model. This model can provide a new method for settlement prediction.
highway; subgrade settlement; power polynomial function; quantile regression; prediction of settlement
引用著錄:王江榮,袁維紅,趙睿,等.基于分位數回歸的冪多項式在數據分析中的應用[J].測繪工程,2017,26(4):43-46,52.
10.19349/j.cnki.issn1006-7949.2017.04.008
2016-01-22
蘭州市科學技術局計劃項目(蘭財建發[2015]85號);蘭州石化職業技術學院科技資助項目(院發〔2015〕69號)
王江榮(1966-),男,教授,碩士.
TV196;U416
A
1006-7949(2017)04-0043-04