張蕾 孫德山 張文政 王玥

摘 要 采用基于灰色關聯分析的支持向量機對鐵路貨運量進行預測.首先利用灰色關聯分析法對影響鐵路貨運量的因素進行分析處理,然后利用基于高斯核函數的支持向量回歸機建立了鐵路貨運量預測模型.通過分析預測結果可以發現,經過灰色關聯分析后的支持向量機模型對復雜的鐵路貨運量數據有較好地處理能力,且預測相對誤差較小.特別地,由于支持向量機的適應性,該模型具有較高的泛化能力,對影響因素較為復雜,樣本數量小的預測問題可以提供一定參考.
關鍵詞 鐵路貨運量預測;灰色關聯分析;支持向量機
中圖分類號 O213 文獻標識碼 A
Abstract Using the method of support vector machine which is based on grey correlation analysis to predict railway freight volume. Firstly, using the gray correlation analysis method to analyze the influencing factors of railway freight volume, Secondly using the support vector regression which is based on the Gauss kernel function to establish the prediction model of the volume of railway freight. By analyzing the prediction results, we can find that the support vector machine model which is analyzed by the gray correlation analysis method can process the complex date of the volume of railway freight well, and the relative error of the prediction is relatively smal. Especially, due to the adaptability of support vector machine, the model has a high ability of generalization, and it can provide a reference for the prediction problems with complex factors and small sample size.
Key words applied mathematics; forecast of railway freight volume; grey relational analysis; support vector machine
1 引 言
隨著我國國力日漸強盛,交通運輸能力也有了巨大的提升,運輸方式逐漸增多,傳統運輸方式受到猛烈沖擊,這種情況在鐵路貨運市場尤為明顯.自2010年起,鐵路貨運量開始逐漸下滑.2011年,我國鐵路貨運量為393263億噸,占全國總貨運量的10.63%,而到了2015年,鐵路貨運量為335801億噸,同比降低10.53%,幾乎跌至6年前的水平.面對越來越嚴峻的貨物運輸市場,鐵路貨運在面臨著巨大的挑戰的同時也充滿了新的機遇.鐵路貨運管理部門如果想要抓住機遇,煥發生機,就需要更加準確掌握鐵路貨運未來的發展趨勢.
影響鐵路貨運量的因素萬縷千絲,這些因素對貨運量的作用機制又很難用精確的數學語言來表示,這就使數學預測模型難以建立.傳統的預測方法有:線性回歸法、時間序列法、狀態空間法和指數平滑法等;后來也發展出許多其他預測方法,如:灰色系統法、神經網絡法等.國內很多學者對此進行過研究,劉夢婷和喻建龍(2015)[1]借助時間序列分析軟件 Eviews,建立了基于SARIMA的我國鐵路貨運量預測模型,并對我國的鐵路貨運量進行了短期外推預測;楊新(2015)[2]在建立貨運量預測的模糊時間序列分析模型的基礎上,以湛江港鐵路分公司為實例求解模型并得出預測結果,并就此提出提高貨運量的措施;黃勇和徐景昊(2009)[3]運用多變量灰色 MGM( 1,4) 模型,找出影響鐵路貨運量的主要因素,對其后四年的鐵路貨運量進行了預測分析;溫愛華和李松(2010)[4]使用GRNN模型與混沌BP神經網絡模型分別對鐵路貨運量進行預測,通過比較發現,GRNN模型具有良好的收斂性和較高的精度;宋蘇民和曠文珍等(2017)[5]建立了RBF神經網絡模型對全國鐵路貨運量進行詳細分析和預測并對灰色預測、BP神經網絡預測和RBF神經網絡預測模型進行仿真實驗,表明RBF神經網絡預測方法的預測精度比另外兩種預測方法高;王寧和徐志禹(2013)[6]將指數平滑、乘冪、一元回歸以及灰色模型進行組合,得到比單項模型更精確的組合模型對我國 2011~2015 年的鐵路貨運量進行預測;李彥(2008)[7]用數據挖掘的方法建立了鐵路貨運量預測的三種算法: 線性回歸、BP 神經網絡、支持向量回歸機,并通過實例驗證比較了算法的有效性;遲騁和袁志明等(2015)[8]提出了基于聚類—隨機期望值的鐵路貨運量預測研究方法,使得鐵路貨運量研究預測方法更加完善.這些傳統方法在事先知道許多不同參數的情況下可以對短時間內的鐵路貨運量的大致情況進行預測,但需要根據不同的情況對不同的參數進行調整.灰色系統預測其本質是一種指數增長預測,可以預測中長期數據.該方法要求原始時間序列是單調非負的,但是這個條件一般不能完全滿足.神經網絡方法結構較為復雜,同時相對于小樣本數據需要估計的參數較多,容易陷入局部極小值,影響預測結果.
支持向量機(Support Vector Machine,簡稱SVM)是建立在統計學習理論的VC維理論和結構風險最小原理基礎上的一種新型理論,它在解決小樣本、非線性及高維模式識別等問題中表現出許多特有的優勢,在很多情況下可以克服維數災難問題.該方法目前已經在模式識別、函數逼近和金融時間序列等方面都取得了成功.王治(2010)[9]利用遺傳算法確定支持向量機中的訓練參數,以得到優化的支持向量機預測模型,并利用支持向量機在小樣本、非線性中優越的預測性能對鐵路貨運量進行預測。耿立艷和梁毅剛(2012)[10]通過灰色預測模型中的灰色序列算子,弱化原始數列隨機性,挖掘數列中蘊含的規律,再利用最小二乘支持向量機進行預測,得到了適用于鐵路貨運量的短期預測.由于支持向量機中訓練樣本的選擇對其預測效果有著比較大的影響,因此選用灰色關聯分析法來分析全國鐵路貨運量的影響因素.灰關聯分析方法是灰色理論的重要組成部分.它是根據因素之間發展趨勢的相似或相異程度作為衡量因素間關聯程度的一種方法,相對于傳統的因素分析,灰色關聯分析具有對樣本要求低 、計算量小等優點,已經成功地用于經濟 、生態、農業等不確定系統 .綜上,論文采用將關聯程度比較高的指標帶入支持向量機,以期達到更好效果.
將灰色關聯度結果排序,選擇關聯度高的前10個因素作為相關因素序列,分別為鐵路貨運量、水運貨運量、年末總人口、國內生產總值、第二產業增加值、第三產業增加值、社會消費品零售總額、糧食產量、國家財政收入、粗鋼產量.
3 基于灰色關聯分析的支持
向量機對鐵路貨運量的預測
3.1 數據的預處理
根據鐵路貨運量影響因素的灰色關聯分析,選取主要因素,建立支持向量機模型對鐵路貨運量進行預測,把1975~2014年的鐵路貨運量,水運貨運量,年末總人口,國內生產總值,第二產業增加值,第三產業增加值,社會消費品零售總額,糧食產量,國家財政收入,粗鋼產量共10個因素作為支持向量機的輸入,把1976~2015年的鐵路貨運量作為的輸出.由于模型樣本數據偏大,所以繼續采用歸一化處理.消除各個因子間由于單位和量綱的差別產生的影響.
3.3 模型建立與驗證
由于數據可構造樣本共40組,將前37組數據作為訓練樣本,將后3組數據作為測試樣本后,利用建立的最優模型對1976~2013年的鐵路貨運量數據進行擬合,然后帶入2013~2015年的鐵路貨運量進行驗證,檢驗模型的泛化能力.結果見圖1.
圖中橫軸為具體年份,縱軸為鐵路貨運量歸一后的數值.為檢驗模型的有效性,將選取的20個影響因素直接作為輸入變量重新構建支持向量機模型,與優化后模型進行對比.由于數據是經過歸一處理的,因此將2013~2015年的鐵路貨運量的真實值與預測值進行還原,并計算相對誤差,結果見表2.
由表2可以看出,使用灰色關聯分析優化后的模型效果明顯好于支持向量機模型,且由于經過灰色關聯分析的支持向量機模型輸入變量較少,計算時間明顯小于輸入全部變量的支持向量機模型.通過以上的實際分析,此模型在我國鐵路貨運量的預測方面具有一定優勢.
4 結 論
結果顯示基于灰色關聯分析的支持向量機預測的鐵路貨運量的精度較高,對于鐵路貨運量的預測可以采用該模型來完成.且通過此方法,我國政府和相關經濟工作者可以獲得鐵路貨運量較精準的預測值.甚至可以通過調整鐵路貨運量的影響因素,進行更深一步的研究,以振興我國鐵路貨運發展.同時,該方法不僅可以用于鐵路貨運量的預測,還可以用于其他有類似數據特征的問題預測,即時效性較強,影響因素多,樣本小.該模型的另一個突出的優點是具有較強的泛化能力.在對具有很多影響因素的復雜問題預測時,該方法更具全面性,因為該方法可以突破時間序列的約束,把橫向的多因素引入模型,把縱向的時間序列拓寬,這既是非線性時間序列模型的改進也是時間序列模型的拓展.
參考文獻
[1] 劉夢婷,喻建龍.基于SARIMA模型的我國鐵路貨運量預測分析[J],貴州師范學院學報:2015,32(12):44-47.
[2] 楊新.基于模糊時間序列的港口鐵路貨運量預測[J],科技創新與應用,2015(30):5-6.
[3] 黃勇,徐景昊.關于鐵路貨運量預測研究[J],鐵道運輸與經濟,2010,32(4):86-89.
[4] 溫愛華,李松.基于廣義回歸神經網絡的鐵路貨運量預測[J],鐵道運輸與經濟,2010,33(2):88-91.
[5] 宋蘇民,曠文珍,許麗等.RBF神經網絡在鐵路貨運量預測中的應用[J],計算機應用,2017,26(1):47-51.
[6] 王寧,徐志禹.組合預測模型在鐵路貨運量預測中的應用[J].交通科技與經濟,2013,15(5):78-81.
[7] 李彥.基于數據挖掘的鐵路貨運量預測方法[J].鐵道貨運,2008(5):20-22.
[8] 遲騁,袁志明,周茵.基于聚類—隨機期望值的鐵路貨運量預測研究[J].公路交通科技,2015 (4):250-252.
[9] 王治.基于遺傳算法—支持向量機的鐵路貨運量預測[J].計算機仿真,2010,27(12):320-322.
[10]耿立艷,梁毅剛.基于灰色自適應粒子群LSSVM的鐵路貨運量預測[J]西南交通大學學報,2012,47(1):144-149.
[11]李瑞,代明睿,李鳳姿.基于灰色關聯度的鐵路貨運量關鍵影響因子選取方法研究[J].鐵道貨運,2015(11):11-14.
[12]中華人民共和國國家統計局,http://www.stats.gov.cn/.