摘要:針對現階段物流系統樣本量少的具體狀況,從神經網絡的非線性預測分析入手,建立物流量預測非線性支持向量機模型并在廊坊市應用,與其它預測方法進行比較,證明采用支持向量機用于區域物流量預測的正確性、可行性并具有較高精度。
關鍵詞:支持向量機;物流;預測;核函數
中圖分類號:F127文獻標識碼:A文章編號:1002-3100(2007)09-0020-04
Abstract: Starting with the analysis of nonlinear prediction using artificial neural networks model, we establishes the nonlinear prediction model of support vector machines about regional logistics amount for there are not enough samples in logistics system now. The application has been done in Langfang city of China. Through the error comparison, the model using SVM has the most precision. The result shows its correctness and feasibility.
Key words: support vector machines(SVM); logistics; prediction; kernel function
引言
物流預測作為物流系統規劃、管理的重要基礎工作,預測精度和偏差直接影響到物流系統的分析建模、規劃布局、管理、決策等工作的有效性和合理性,選擇具有較高精度的預測方法成為工作的首要步驟[1]。傳統物流量定量預測方法有因果關系分析法、時間序列分析法、彈性系數法等,這些方法都存在一定的局限性,主要表現為:一是這些預測模型表示線性關系,對物流量與預測影響因素的高度非線性無法辨識,對于一些模糊等不確定性因素無法處理,造成預測結果的嚴重失真[2];二是在實際預測時,由于受到各種客觀條件的影響,特別是我國處于現代物流發展的起步階段,各種標準尚未完善,統計口徑還不統一,資料不太齊全,無法取得足夠多的樣本,使得樣本較少,無法保證預測的精度。
針對第一種局限,目前廣泛采用以神經網絡方法、模糊、小波分析、粗糙集理論等智能方法來彌補其非線性與不確定性,并在此基礎上進行了大量的各種形式的改進,如采用BP、徑向基(RBF)、廣義回歸神經網絡[3]、實時遞歸學習(RTRL)[2]等進行物流量預測。所有這些方法同樣要求有足夠多的樣本,使得問題最終歸結為尋找到小樣本預測方法上。支持向量機(Support Vector Machines, SVM)就是針對社會經濟系統中小樣本問題的一種非線性模型,目前已經應用于電力系統負荷、地下水位、天氣預報、企業管理等系統中[4]。在物流系統中,唐偉鴻等采用基于時間序列的SVM進行物流量預測[5],但時間序列SVM預測現樣本數據的下一年物流量時精度高,對未來10多年后的規劃年物流量預測精度較差,無法滿足在物流系統規劃與布局時未來規劃年的預測需要。基于此,本文從神經網絡的非線性預測入手,建立區域物流量非線性支持向量機預測模型,并在廊坊市具體應用。
1神經網絡物流量預測
該高度非線性模型,需要采用神經網絡的BP等算法確定權重,通過工作、學習來對具體物流量進行預測。另一種為時間序列預測,用非線性多變量函數描述:
其中ytt=N,N-1,…,n+1是給定時間序列樣本值,f是高度非線性函數,若為線性時使用傳統AR模型進行預測即可。
2支持向量機非線性預測模型
2.1基本思想
SVM就是通過內積函數定義的非線性變換將輸入空間轉化到一個高維空間,從而在高維空間中尋找輸入向量和輸出變量之間的非線性關系,實現在有限樣本情況下的機器學習方法。與人工神經網絡相比,SVM不存在容易陷入局部最優等問題,提高泛化能力;SVM有嚴格的理論基礎,是基于結構風險最小化原則的方法,明顯優于傳統的基于經驗風險最小化原則的常規神經網絡方法;SVM算法是一個凸二次優化問題,保證找到的解是全局最優解,能較好地解決小樣本、非線性、高維數等實際問題。采用非線性SVM進行物流量預測實際上就是尋找回歸函數:
2.3算法與預測步驟
求解算法是一個經典的二次規劃問題,可應用現成的優化軟件求解。具體步驟為:
(1)解二次規劃:
3廊坊市物流量預測
3.1影響因素與樣本的選擇
將2中理論方法應用于河北省廊坊市物流系統規劃的物流量預測中。廊坊市是1989年成立的地級市,統計資料僅從1989年開始到2005年為止17年,不符合一般傳統預測方法中大樣本數量要求;對物流系統預測指標,本研究采用貨運量來說明;考慮到廊坊市具體產業結構,在仿真例子中采用年末總人口、國內生產總值(GDP)、消費品零售額、工業總產值、農業總產值指標5個影響因素,具體樣本數據見表1,其中,單位分別為萬人、億元、萬噸。
3.2各種預測結果比較分析
采用傳統預測方法中的時間序列和多元線性回歸、BP神經網絡時間序列和多元非線性回歸、SVM核函數分別為多項式和徑向基共六種方法的擬合進行測試誤差比較,Matlab編程實現。取1989~2002年的數據共14個樣本為訓練數據,2003~2005年數據為檢驗數據,所有數據在訓練過程中均進行歸一化處理。同時,對預測效果進行評價的指標采用預測結果的絕對誤差AE、相對誤差E、均方誤差MSE和平均絕對百分比誤差MAPE。
多項式核函數SVM中階數為d=4,C=50,ε=0.001,經過訓練得到測試數據的實際值與預測值的絕對誤差,見圖1;徑向基SVM中比較優化選擇核函數參數為σ =0.5,C=5,ε=0.00001經過訓練得到測試數據的實際值與預測值的絕對誤差見圖2,表2為測試數據的實際值與預測值的誤差。圖1、圖2和表2中的數據均為歸一化后的數據。
采用各種預測方法相對誤差比較結果見表3,顯然可以得出:
(1)BP神經網絡和SVM不需要設計任何數學解析模型,只靠過去的經驗來學習,可處理非線性、模糊與含有噪聲的數據。實例表明,基于神經網絡的預測方法具有一定的優點,但是數據量較少可能會減弱網絡的推廣能力和預測的精度。
(2)對于BP神經網絡,時間序列預測模型訓練數據的誤差比較小,而推廣能力比較弱,主要原因是神經網絡需要大量的數據、隱層神經元個數比較少和存在過擬合現象;而多元回歸預測模型訓練誤差比較大,也就是精度比較低而推廣能力比較強。
(3)SVM預測模型,采用徑向基核函數模型比多項式核函數模型具有更好的擬合能力和推廣能力,這是因為核函數參數的選擇對于預測的精度和推廣能力具有及其重要的影響。
(4)相比較而言,SVM預測模型具有更好的擬合和推廣能力,這是因為物流系統是一個復雜巨系統,大量樣本現階段很難取得,而SVM是針對小樣本提出的統計學習算法,不存在過擬合現象,可避免神經網絡需要大量樣本數據的問題。SVM算法的本質是一個求解二次規劃問題,算法簡單,可以推廣應用。
3.3預測結果
采用具有較好擬合和極強推廣能力的徑向基SVM預測模型,取1989~2005年的數據共17個樣本為訓練數據,預測出規劃特征年的貨運量:2010年為7 193萬噸;2015年為7 792萬噸;2020年為10 413萬噸。
4結束語
從神經網絡的非線性預測入手,建立非線性SVM物流量預測模型,并在廊坊市應用。通過與傳統時間序列、多元線性回歸、BP神經網絡時間序列與多元非線性回歸進行比較,證明采用SVM用于區域物流量預測比其他方法具有更高的預測精度,能對不同年份都做出較為精確的預測,是一種更有潛力的新方法,尤其適用于我國現階段的具體情況。
參考文獻:
[1] 高自友,孫會君. 現代物流與交通運輸系統[M]. 北京:人民交通出版社,2003.
[2] 魏連雨,龐明寶. 基于神經網絡的物流量預測[J]. 長安大學學報:自然科學版,2004,24(6):55-59.
[3] 趙闖,劉凱,李電生. 基于廣義回歸神經網絡的貨運量預測[J]. 鐵道學報,2004,26(1):12-15.
[4] 王景雷,吳景社,等. 支持向量機在地下水位預報中的應用研究[J]. 水利學報,2003(5):122-128.
[5] 唐偉鴻,李文鋒. 基于時間序列的支持向量機在物流預測中的應用[J]. 物流科技,2005,28(3):8-11.
[6] Vapnik V, et al. Support Vector Method for Function Approximation, Regression Estimation and Signal Processing[J]. In Advances in Neural Information Processing Systems, 1997,9:281-287.
[7] Pontil M, et al. Properties of Support Vector Machines[J]. Neural Computing, 1998,10:955-974.
[8] Suykens J A K. Least Squares Support Vector machines for classification and nonlinear modeling[J]. Neural Network World, 2000,10(1):29-48.
[9] V.David Sanchez A. Advanced Support Vector Machines and Kernel Methods[J]. Neural Computing, 2003,55:5-20.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”