摘要:為了提高公路貨運量預測的能力,應用基于結構風險最小化準則的標準支持向量回歸機方法來研究公路貨運量預測問題。在選擇適當的參數和核函數的基礎上,通過對成都公路貨運量時間序列進行預測,并與人工神經網絡#65380;線性回歸分析等方法進行了對比,發現該方法能獲得最小的訓練相對誤差和測試相對誤差。
關鍵詞:公路貨運量;支持向量回歸機;人工神經網絡;預測
中圖分類號:U492.313; TP391文獻標志碼:A
文章編號:1001-3695(2008)02-0632-02
公路貨運量預測是反映公路貨物運輸需求的一項重要指標,它的研究和分析具有較強的實際和理論意義。正確預測公路貨運量對國家的交通發展和資源配置優化,以及各物流企業的投資#65380;經營管理有重要作用。傳統公路貨運量預測方法(如線性回歸分析#65380;貨運強度法#65380;彈性系數法#65380;灰色GM(1,1)模型[1]#65380;組合預測法等)可以預測一段時間內貨運量變化的大致趨勢,但在處理大規模#65380;高維度#65380;含有非線性關系#65380;非正態分布的貨運量時間序列數據時,其效果不理想,且其指標的主觀隨意性較大,而且需要事先知道各種參數, 以及參數在什么情況下應如何修正。近十來年,人們用人工神經網絡方法[2,3]來預測貨運量。但是,ANN主要依靠的是經驗風險最小化原則,容易導致泛化能力的下降且模型結構難以確定。在學習樣本數量有限時,學習過程誤差易收斂于局部極小點,學習精度難以保證;學習樣本數量很多時,又陷入維數災難,泛化性能不高。支持向量回歸機[4]則很好地解決了上述方法面臨的問題,并在實際應用中有很好的性能。
筆者利用以結構風險最小化原理為基礎的標準支持向量回歸機,通過在回歸機中定義損失函數,以成都公路貨運量為例,建立了時間序列預測模型。引入了不敏感系數ε;采用折交叉驗證的方法優化選擇參數和核函數。本文選擇的是多項式核函數進行仿真實驗。
1支持向量回歸機
以統計學習理論為基礎的支持向量機(support vector machine,SVM)由Vapnik等人提出,在20世紀90年
代中后期得到了全面深入的發展,現已經成為機器學習和數據挖掘領域的主要工具[5]。下面介紹解決回歸問題的支持向量回歸機。
3仿真結果及分析
針對上述的公路貨運量時間序列SVR預測模型, 在MATLAB 6.5環境下進行訓練與測試的仿真實驗。SVR的核函數和參數采用折交叉驗證方法進行優化選擇,為K(xi,xj)=[(xi·xj)+1]4,ε=0.001,C=35。對于標準BPANN,采用三層神經網絡,以連續三年的數據來預測第四年的數據,用快速BP算法訓練前向網絡,輸入層神經元為3個,隱含層神經元為4個,輸出層神經元1個,最大訓練次數1 500,期望誤差為0.001,初始學習率為0.01;最后用線性回歸方法對成都市公路貨運量進行了時間序列預測。它們的仿真結果如表3所示。
由表3可以看出,總體上說,在三種方法對公路貨運量預測中,對訓練樣本的預測比對測試樣本的預測精度高,所獲得的預測相對誤差在一定程度上均能反映公路貨運量的時間序列預測。用線性回歸方法得出的結果比其他兩種方法得出的結果更差,說明公路貨運量預測問題是一個非線性問題。不論是訓練相對誤差方面還是測試相對誤差方面,基于SVR的方法又明顯比BPANN小,說明了SVR有更強的泛化性能。
4結束語
本文將SVR方法應用于公路貨運量時間序列預測研究,采用ε-insensitive損失函數,選用多項式核函數建立了SVR網絡,其實際結果有相當理想的精度,能滿足預測要求。與標準的BPANN和線性回歸方法比較表明,SVR對公路貨運量數據有更好的預測效果,有很強的學習性#65380;自適應性,且收斂快#65380;準確性高,說明SVR預測模型是可信的。但是,核函數#65380;參數和損失函數的選取沒有確定的方法,主要靠使用者的經驗,難以找到全局最優解,只能找到滿意解,對此問題還需要進一步研究;另外,由于訓練樣本的重要性是相對測試樣本而言的,每次對新的測試樣本進行回歸估計時,就需要重新計算各訓練樣本的重要性指標,并重新進行訓練,使得該方法一般應用于對實時性要求不是很高的場合。
參考文獻:
[1]蓋春英,裴玉龍.公路貨運量灰色模型—馬爾可夫鏈預測方法研究[J].中國公路學報,2003,16(3):113-116.
[2]張擁軍,葉懷珍,任民.神經網絡模型預測運輸貨運量[J].西南交通大學學報,1999,34(5):602-605.
[3]趙闖,劉凱,李電生.基于廣義回歸神經網絡的貨運量預測[J].鐵道學報,2004,26(1):12-15.
[4]VAPNIK V.An overview of statistical learning theory[J].IEEE Trans on NN,1999,10(3):988-999.
[5]CRISTIANINI N,SHAWE-TAYLOR J.支持向量機導論[M].李國正,王猛,曾華軍,譯.北京:電子工業出版社,2004.
[6]成都市統計年鑒[K].2005.
[7]夏國恩,曾紹華,金煒東.支持向量回歸機在鐵路客運量時間序列預測中的應用[J].計算機應用研究,2006,23(10):180-182.
[8]趙闖, 劉凱,李電生.支持向量機在貨運量預測中的應用研究[J].鐵道學報,2004,26(4):10-14.
[9]ITO K,NAKANO R.Optimizing support vector regression hyperpara-meters based on cross-validation[C]//Proc of International Joint Conference on Neural Networks.2003:2077-2082.
[10]VAPNIK V N.The nature of statistical learning theory[M].New York:SpringerVerlag,1995.
[11]LIN Chun-fa,WANG Sheng-de.Fuzzy support vector machines[J].IEEE Trans on Neural Networks, 2002,13(2):464-471.
[12]TOY F E H,CAO L J.Descending support vector machines for financial time series forecasting[J].Neural Processing Letters,2002,15(2):179-195.
[13]TOY F E H,CAO L J.Modified support vector machines in financial time series forecasting[J].Neuro Computing,2002(48):847-861.
[14]GUNN R G.Support vector machines for classification and regression[R].Southampton:University of Southampton,1998.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”