999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量回歸機的鐵路貨運訂車數預警方法

2016-04-10 00:45:56殷瑋川何世偉黎浩東何必勝
中國鐵道科學 2016年6期
關鍵詞:鐵路方法

殷瑋川,何世偉,黎浩東,何必勝

(1.北京交通大學 城市交通復雜系統理論與技術教育部重點實驗室,北京 100044;2.北京交通大學 交通運輸學院,北京 100044;3.西南交通大學 交通運輸與物流學院,四川 成都 610031)

隨著鐵路貨運改革的不斷深入進行,貨運市場需求的波動變化也越來越受到重視。如何及時有效地應對貨運需求波動造成的影響,是鐵路決策管理部門需要科學規劃的關鍵問題。鐵路貨運訂車數反映了鐵路貨運的需求,直接影響著鐵路貨運量的大小以及鐵路貨運能力緊張與否。因此,對鐵路貨運訂車數進行預警,為鐵路相關部門提前做好應對措施提供依據,從而及時有效地滿足貨主的運輸需求。目前,與鐵路貨運訂車數預警相關的定量研究方法并不多,定性研究方法有鐵路貨運預警評價方法[1]和鐵路有關的監測預警系統[2-4]等,但這些研究中存在主觀性強、誤差較大等問題。而在采用均勻取值法[1-2,5]和非均勻取值法[3,6]研究預測或預警警報區間劃分方法的文獻中缺乏對這2種劃分方法的比較分析。并且這些研究中的預警方法[1-6]只是一種事后的評判,還沒有達到實時預警的效果。隨著近年來鐵路貨運量呈下降或波動的趨勢,傳統的一些預測或預警方法并不適應這些非線性的數據樣本。

支持向量回歸機(Support Vector Regression,SVR)方法是一種處理小樣本的機器學習方法,能夠很好地處理非線性回歸問題,已經在財務預警[5]、網絡輿情預警[6]等多個行業的預警研究中得到應用,而在預測方法上的應用最為成熟,如鐵路貨運量的預測[7]、鐵路列車晚點時間預測[8]、短時交通流預測[9]、高速鐵路路基沉降預測[10]、電力負荷預測[11-12]等。核函數作為支持向量回歸機方法的重要核心部分,對其的研究也越來越多。文獻[13]研究了不同核函數的支持向量機財務預測方法,文獻[14]研究了不同核函數的參數選取方法,文獻[15]構造了混合遺傳算法求解不同核函數的參數。構造性能優良的支持向量回歸機預警方法,關鍵在于選擇適合其應用領域的核函數,并且確定相關參數[16]。

因此,本文首先確定預警指標、警報級別,采用2種區間劃分方法確定警報區間和警報值,由此構建出2個樣本數據集;采用這2個樣本數據集與多項式核函數、高斯徑向基核函數和Sigmoid函數組合成6種條件,分別進行支持向量回歸機(SVR)訓練;根據訓練的預警效果提出基于均勻取值法和高斯徑向基核函數的SVR鐵路貨運訂車數預警方法。以2016年3—6月的鐵路貨運訂車數為實例進行預警分析,驗證該方法的適用性和有效性。

1 預警指標選取

鐵路貨運訂車數受鐵路發展規劃、社會經濟發展水平、國家調控政策和相關大宗商品交易量等多種因素的影響。因此,借鑒文獻[7]的指標選取規則,同時考慮指標值是否可以通過鐵路總公司信息中心的統計數據、國家統計局[17]和交通部官方網站中獲取,選取訂車數以及與其關聯度較高的26個指標作為預警備選指標,如圖1所示。

圖1 預警指標

由于備選指標在反映信息程度上有重疊、未來某些指標也有數據缺失的可能性,從而增加了預警的難度,因此,利用SPSS12.0軟件,采用主成分分析法,對圖1所示的備選指標進行降維。由于鐵路貨物運輸受到季節和節假日等因素影響,因此選取指標的月均數據可以較好避免這些因素的影響。取2013年1月至2015年2月間26個月的數據對備選指標進行分析,得到前3個主成分,其方差累計貢獻率為86%,已經滿足選取主成分數目的要求(不低于閾值85%);取各個主成分內部系數占比前4的變量作為預警指標,共得到訂車數、裝車數、貨運量、貨運周轉量、鐵礦石總運量、鐵路日均運煤量、鋼材總產量、鋼材總銷量、國家財政收入、國內生產總值、國家固定資產收入和居民消費價格共12個預警指標,詳見圖1。

2 預警基本原理

2.1 警報級別、警報區間和警報值的確定

本文將警報的級別分為4種:無警,低警,中警,高警。“無警”代表鐵路貨運訂車狀況正常,“低警”代表鐵路貨運訂車狀況略差,“中警”代表鐵路貨運訂車狀況較差,“高警”代表鐵路貨運訂車狀況很差。警報區間是將警報級別由定性分析轉換為定量分析的量值區間;由于目前還沒有較好的警報區間劃分方法,因此本文分別采用均勻取值法和非均勻取值法將0~1數據區間劃分為4段,作為對應4個警報級別的警報區間。警報值是警報級別定量轉換后的數值量;以每個警報區間的中間值作為對應警報級別的警報值。由此劃分的警報級別、警報區間和警報值詳見表1。

表1 警報級別、警報區間和警報值

2.2 支持向量回歸機原理

將由訂車數及其他11個預警指標值構成的多維訓練樣本數據集作為SVR的輸入,則SVR的輸出為預測的與輸入預警指標值對應的警報值,可表示為

yn+1=fSVR(x1,…,n+1,y1,…,n|θSVR)

(1)

式中:yn+1為輸出的與第n+1組預警指標值xn+1對應的預測警報值;x1,…,n+1為前n+1組多維的預警指標值;y1,…,n為與前n組預警指標值對應的警報值;fSVR(x1,…,n+1,y1,…,n|θSVR)為在SVR方法中輸入與輸出的映射關系;θSVR為需要在SVR方法中被標定的參數。

根據結構風險最小化原則,SVR可以將樣本數據集在高維特征空間進行回歸變換,得到的優化目標函數[14]為

(2)

式中: ‖ω‖2為歐拉范數;ε為不敏感系數;|f(xi)-yi|ε為不敏感系數ε的損失函數。

(3)

s.t.

yi-ωφ(xi)-b≤ε+ζii=1,…,n

(4)

(5)

(6)

(7)

s.t.

(8)

(9)

由此,原始問題變為凸二次規劃問題。通過求解該凸二次規劃問題,即可獲得原問題的最優解為

(10)

式中:K(xi,x)為核函數,滿足Mercer條件[17]且K(xi,x)=φ(xi)φ(x);x為測試數據變量,對應式(1)中待預警指標值xn+1。

核函數的作用就是使樣本投影到一個高維的空間中,將其轉化為一個線性回歸問題,從而解決了因非線性映射φ未知而ω無法顯示表達的問題。可見:核函數的選取直接影響了模型的泛化能力;不同的研究問題,所需的核函數是不一樣的。因此,選擇恰當的核函數類型及支持向量回歸機相關參數是支持向量回歸機理論研究的核心問題。本文選取如下3種核函數,通過對比分析其預警效果,確定其中最優的核函數。

(1)多項式核函數,其形式為

K(xi,x)=[γ(xi,x)+fP]d

(11)

式中:d為多項式的階;γ為核函數的半徑;fP為偏執系數。當d=1,fP=0,γ=1時,多項式核函數即為線性核函數。

(2)高斯徑向基核函數(Gaussian Radial Basis Funciton,RBF),其形式為

K(xi,x)=exp(-γ‖xi,x‖2)

(12)

(3)Sigmoid函數,是一種特殊的半正定核函數,其形式為

K(xi,x)=tanh[γ(xi,x)+fP]

(13)

由此可見,懲罰函數C、不敏感系數ε和核函數是影響支持向量回歸機回歸效果的主要因素;同時,d,γ和fP這3個參數又是核函數的主要參數,因此,將C,ε,d,γ和fp統稱為SVR的關鍵參數,即θSVR。

3 基于支持向量回歸機的鐵路貨運訂車數預警方法

3.1 預警步驟

鐵路貨運訂車數預警方法流程框圖如圖2所示。具體預警步驟如下。

步驟1:樣本數據的準備。獲取某一時間段12個預警指標的值;采用專家判定法確定預警指標的警報級別,即專家根據1組樣本中訂車數的值,并綜合考慮同組樣本中其他11個預警指標的值,給出該組訂車數的警報級別;根據表1確定其對應的警報值;由于各預警指標的量綱不統一,故對其值進行無量綱歸一化處理,然后再將處理后的12個指標的值和對應的警報值作為樣本數據集;對應2種警報區間劃分方法,則得到2個樣本數據集。

步驟2:最優的警報區間劃分方法和核函數的確定。采用2個樣本數據集、3種核函數(多項式核函數、Sigmoid核函數和RBF核函數)組合成6種回歸條件,在6種條件下分別對SVR進行訓練(對各核函數SVR中的關鍵參數尋優),如圖3所示,采用K-折交叉驗證法并結合網格搜索算法,獲取當前SVR關鍵參數的最優值。將樣本數據集中的預警指標值作為測試數據集中的指標值代入SVR中,預測出6種條件下測試數據集中的警報值,將這些警報值對照表1轉換成測試數據集的警報級別,并將其與樣本數據集的警報級別進行對比,選出警報級別誤差最小的那1種條件,其對應的就是最優的警報區間劃分方法和核函數。

圖2 預警方法流程框圖

步驟3:基于最優的警報區間劃分方法和核函數的SVR貨運訂車數預警。用步驟2得出的最優警報區間劃分方法確定樣本數據集中預警指標值所對應的警報值,將警報值代入最優核函數SVR中進行訓練。將測試數據集盅的指標值更換為待預警數據的指標值,待預警數據的指標值可以是未來的預警指標值;也可以是當前實際的預警指標值,用訓練好的最優核函數SVR對測試數據集中待預警數據的指標值進行預測,當SVR快速收斂得到關鍵參數的最優值時,則可得到對應待預警數據的警報值,然后根據表1將其轉換成警報級別,即完成了鐵路貨運訂車數的預警。

由于SVR訓練速度和收斂速度都很快,對于短期或實時產生的待預警數據都可以快速給出警報結果,即輸入待預警數據就可以輸出預測的警報結果。因此,基于支持向量回歸機的鐵路貨運訂車數預警屬于實時預警。

圖3結合K-折交叉驗證法和網格搜索算法的SVR關鍵參數尋優框圖

3.2 最優核函數和警報區間的確定

采用LIBSVM軟件中的支持向量回歸機包[18],計算機運行環境為CPU 2.3Ghz,RAM 4G,通過Java平臺實現上文提出的支持向量回歸機方法。選取2013年1月至2015年2月間共26個月的12個指標的值(每個指標取其月均值),共26組指標數據,采用專家法確定每組指標數據對應的警報級別,按照表1將其轉換為2種警報區間劃分方法下的警報值,將26組指標數據及其警報值分別作為樣本數據集和測試數據集;應用3種不同核函數SVR方法進行鐵路貨運訂車數預警測試,并將測試結果與樣本數據集進行誤差分析。測試程序運行時間均小于5 s,SVR的最優參數見表2。預警結果的精度對比分析見表3,同時分別對2種警報區間劃分法下的3種核函數的SVR預警結果進行數據擬合,分別如圖4和圖5所示。

表2 不同區間劃分法不同核函數時SVR的最優關鍵參數

表3 不同區間劃分法不同核函數時SVR預警精度的對比

圖4 均勻取值方法下3種核函數SVR預警結果擬合圖

由預警結果可知:采用RBF核函數時,在2種警報區間劃分方法下SVR的預警精度均很好,準確率均達到100%,且RBF核函數的SVR對測試樣本的整體均方根誤差也遠小于其他2種核函數SVR的均方根誤差,說明RBF核函數對于非線性數據樣本的預警有良好的適應性;而采用多項式核函數SVR和Sigmoid核函數時,SVR對于預警樣本數據的擬合度大部分較好,警報級別預警準確率都在92%及其以上,只有2014年4月和7月的樣本預警準確率最低,僅為92%,原因是預警樣本的數據是非線性變化的,當數據序列出現拐點時,即訂車數驟減或者驟加時,預警誤差就會增大;采用均勻取值法劃分警報區間時,3種核函數的警報值預測均方根誤差均小于采用非均勻取值法時,說明采用均勻取值法劃分警報區間時的預警效果更好。

圖5 非均勻取值方法下3種核函數SVR預警結果擬合圖

由此可知,采用均勻取值法劃分警報區間、選用RBF核函數時,SVR的預警精度最好。因此,建議采用基于均勻取值法和RBF核函數的SVR進行鐵路貨運訂車數的預警。

4 應 用

采用本文的基于均勻取值法和RBF核函數的SVR鐵路貨運訂車數預警方法,選用文獻[8]中預測方法得出2016年3—6月訂車數并進行預警,結果見表4,可見,2016年4月和5月的訂車數為中警,6月的訂車數為高警。根據此預警結果,鐵路運營管理部門可以有針對性地分析警報原因,提前做好運力資源調配方案。

表4 鐵路貨運訂車數預警實際應用結果

5 結 語

提出的基于均勻取值法和RBF核函數的SVR鐵路訂車數預警方法收斂快,預測精度高,可以實時定量預警,解決了傳統預警研究中預警判斷時效性低的問題。該方法已在中國鐵路貨運營銷輔助決策系統預警模塊中開發應用,能夠及時有效地為決策部門提供理論支持。但是,該方法中預警指標的選取、基于專家法對警報級別的判定存在一定人為因素的誤差,因此,預警指標的選取方法和相關非結構化指標數據的獲取方法都是今后研究的方向。

[1]張伶婉, 丁宏飛, 陳彥瑾.基于熵權模糊綜合評價的鐵路危險貨物運輸預警[J].中國安全科學學報,2012,22(5):119-125.

(ZHANG Lingwan, DING Hongfei, CHEN Yanjin. Study on Early Warning for Railway Transport of Dangerous Goods Based on Entropy Weight Fuzzy Comprehensive Evaluation[J]. China Safety Science Journal, 2012, 22(5): 119-125. in Chinese)

[2]孫平, 宋瑞. 鐵路運營監測預警系統的構建[J].中國安全科學學報,2006,16(7): 92-97.

(SUN Ping, SONG Rui. Establishment of Early-Warning System in Railway Operation[J]. China Safety Science Journal, 2006,16(7):92-97. in Chinese)

[3]吳艷華, 何峰林, 王富章,等. 基于災害風險評估模型的鐵路災害監測預警系統研究[J]. 中國鐵道科學,2012,33(1):121-125.

(WU Yanhua, HE Fenglin, WANG Fuzhang, et al. Research on Railway Disaster Monitoring and Warning System Based on Disaster Risk Assessment Model[J]. China Railway Science, 2012, 33(1):121-125. in Chinese)

[4]孫漢武, 佘振國, 李成輝. 鐵路安全監督管理信息系統[J].中國鐵道科學,2009, 30(5):116-122.

(SUN Hanwu, SHE Zhenguo, LI Chenghui. Railway Safety Supervision and Management Information System[J]. China Railway Science, 2009, 30(5):116-122. in Chinese)

[5]郎凡. 基于遺傳算法的改進支持向量機財務預警研究[D]. 北京:北京交通大學,2008.

(LANG Fan. Research of Financial Early-Warning Model on Evolutionary Support Vector Machine Based on Genetic Algorithms [D]. Beijing: Beijing Jiaotong University, 2008. in Chinese)

[6]張艷巖. 基于支持向量機的網絡輿情危機預警研究[D]. 南昌:江西財經大學, 2013.

(ZHANG Yanyan. Study on Internet Public Opinion Crisis Pre-Warning Based on Support Vector Machine[D]. Nanchang: Jiangxi University of Finance and Economics, 2013. in Chinese)

[7]耿立艷, 張天偉, 趙鵬. 基于灰色關聯分析的 LS—SVM 鐵路貨運量預測[J]. 鐵道學報, 2012, 34(3): 1-6.

(GENG Liyan, ZHANG Tianwei, ZHAO Peng. Forecast of Railway Freight Volumes Based on LS-SVM with Grey Correlation Analysis[J]. Journal of the China Railway Society, 2012, 34(3): 1-6. in Chinese)

[9]CASTRO-NETO Manoel, JEONG Young Seon, JEONG Myong Kee, et al. Online-SVR for Short-Term Traffic Flow Prediction under Typical and Atypical Traffic Conditions[J]. Expert Systems with Applications, 2009, 36(3): 6164-6173.

[10]馮勝洋, 魏麗敏, 郭志廣. 基于最小二乘支持向量機的高速鐵路路基沉降預測[J]. 中國鐵道科學, 2012, 33(6):6-10.

(FENG Shengyang, WEI Limin, GUO Zhiguang. Settlement Prediction of High-Speed Railway Subgrade Based on Least Squares Support Vector Machine[J]. China Railway Science, 2012, 33(6):6-10. in Chinese)

[11]FAN Shu, CHEN Luonan. Short-Term Load Forecasting Based on an Adaptive Hybrid Method[J]. IEEE Transactions on Power Systems, 2006, 21(1): 392-401.

[12]HONG Wei Chiang. Hybrid Evolutionary Algorithms in a SVR-Based Electric Load Forecasting Model[J]. International Journal of Electrical Power & Energy Systems, 2009, 31(7/8): 409-417.

[13]MIN Jae H, LEE Young Chan. Bankruptcy Prediction Using Support Vector Machine with Optimal Choice of Kernel Function Parameters[J]. Expert Systems with Applications, 2005, 28(4): 603-614.

[14]ELISSEEFF Andre, WESTON Jason. A Kernel Method for Multi-Labelled Classification[J]. Advances in Neural Information Processing Systems, 2002, 14:681-687.

[15]WU Chih Hung, TZENG Gwo Hshiung, LIN Rong Ho. A Novel Hybrid Genetic Algorithm for Kernel Function and Parameter Optimization in Support Vector Regression[J]. Expert Systems with Applications, 2009, 36(3): 4725-4735.

[16]鄧乃揚,田英杰.支持向量機:理論、算法與拓展[M].北京:科學出版社,2009.

[17]國家統計局.2014年國民經濟和社會發展統計公報[EB/OL]. (2015-03-10)[2015-10-10]. http://www.stats.gov.cn/tjsj/tjgb/ndtjgb/.

[18]CHANG Chih Chung, LIN Chih Jen. LIBSVM: A Library for Support Vector Machines[J]. ACM Transactions on Intelligent Systems and Technology, 2011, 2(3): 389-396.

猜你喜歡
鐵路方法
鐵路是怎么發明的
沿著中老鐵路一路向南
云南畫報(2021年12期)2021-03-08 00:50:54
學習方法
鐵路通信線路維護體制改革探索與實踐
無人機在鐵路工程建設中的應用與思考
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
GSM-R在鐵路通信中的應用
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
夢想在鐵路人心中流淌
中國火炬(2015年7期)2015-07-31 17:40:05
主站蜘蛛池模板: 在线a视频免费观看| 亚洲人精品亚洲人成在线| 欧美亚洲一区二区三区在线| 国产三级国产精品国产普男人| 91小视频在线播放| 91精品国产91久无码网站| 99久久精品久久久久久婷婷| 女人av社区男人的天堂| 亚洲男人在线| 日本不卡在线播放| 亚洲第一区在线| 中文字幕无码制服中字| 国产全黄a一级毛片| 久久不卡国产精品无码| 91在线视频福利| 亚洲精品桃花岛av在线| 日韩a在线观看免费观看| 亚洲动漫h| 国产91丝袜在线观看| 亚洲永久精品ww47国产| 国产精品不卡永久免费| 九九热视频在线免费观看| 漂亮人妻被中出中文字幕久久| 亚洲天堂网2014| 免费A级毛片无码无遮挡| 亚洲欧美日韩另类| 久久亚洲综合伊人| 亚洲aaa视频| 成人精品免费视频| 亚洲欧美极品| 亚洲欧美国产五月天综合| 日韩成人在线一区二区| 亚洲伊人电影| 韩国自拍偷自拍亚洲精品| 成人免费午夜视频| 国产一国产一有一级毛片视频| 永久免费精品视频| 国产白浆在线| 在线观看视频99| 精品国产三级在线观看| 久久国产亚洲欧美日韩精品| 波多野结衣AV无码久久一区| 国产精品久久久久久久伊一| 亚洲第一黄色网址| 99er精品视频| 亚洲综合色婷婷| 凹凸精品免费精品视频| 欧美亚洲国产精品久久蜜芽| 国产成人亚洲无吗淙合青草| 天天干天天色综合网| 广东一级毛片| 又污又黄又无遮挡网站| 亚洲天堂久久| 欧美国产菊爆免费观看 | 国产精品毛片一区视频播| 精品一区二区三区中文字幕| 欧美一区精品| 国产在线一区视频| 国产女人爽到高潮的免费视频| 成人午夜天| 国产一级精品毛片基地| 亚洲成人黄色在线观看| 亚洲AⅤ无码日韩AV无码网站| AV片亚洲国产男人的天堂| 国产日韩欧美视频| 波多野结衣亚洲一区| 激情成人综合网| 欧美A级V片在线观看| 91偷拍一区| 狠狠五月天中文字幕| 在线高清亚洲精品二区| 一本久道久久综合多人| 国产区91| 又粗又大又爽又紧免费视频| 欧美a在线| 国产制服丝袜91在线| 18禁黄无遮挡免费动漫网站| 97免费在线观看视频| 亚洲欧洲免费视频| 好紧好深好大乳无码中文字幕| 亚洲天堂视频网站| 国产福利不卡视频|