孫遜


[摘 要]文章基于支持向量機模型對物流園區物流需求進行預測,相較于傳統的網格式搜索對支持向量機參數尋優,使用遺傳算法對支持向量機參數尋優,能在實數集內連續地尋找最優參數組合,構建出GA-SVM物流需求預測模型。并通過成都市實例驗證了GA-SVM預測模型的有效性。
[關鍵詞]物流需求;預測;支持向量機;遺傳算法
[DOI]10.13939/j.cnki.zgsc.2017.15.252
1 引 言
物流園區是構造良好物流環境的重要基礎設施,物流園區的需求預測是物流園區規劃體系中十分關鍵的環節,它是進行物流園區功能布局研究的前提和補充。國內外學者對物流需求預測方法研究大致分為以下兩個階段:第一階段主要采用的方法是基于傳統統計學的預測方法,主要包括:灰色模型[1]、線性回歸模型[2]及時間序列模型[3]等。第二階段在第一階段的方法中引入人工智能技術,以改善預測模型的性能,主要包括:神經網絡模型[4]和支持向量機模型[5]等。
在實際應用過程中,第一階段的預測模型在處理高維度、非線性數據時,無法獲得優質結果;而神經網絡模型在學習樣本數量有限時,學習過程誤差易收斂于局部極小點,預測精度難以保證;學習樣本變量很多時,又容易陷入維數災難。由于影響機制復雜,考慮到支持向量機是建立在結構化風險最小化原則之上,可以有效地減少經驗風險帶來的影響,不僅對小樣本數據表現出良好的擬合精度,還對獨立的測試集表現出較小的誤差,在一定程度上對學習機的泛化能力有所提升,而且支持向量機算法是一個凸優化問題,在物流需求預測方面具有較明顯的優勢,本文采用基于支持向量機學習理論的物流園區需求預測方法對成都市貨運量進行預測。
支持向量機參數的選取直接影響模型的預測精度,傳統的網格搜索參數組合已經無法滿足對區域物流需求預測的精度要求,本文采用遺傳算法對支持向量機進行參數尋優,構建GA-SVM區域物流需求預測模型,并對成都市物流需求進行預測,結果證明GA-SVM預測模型的預測精度要優于傳統的SVM預測模型。
2 GA-SVM預測模型的算法設計
2.1 支持向量機
支持向量機(Support Vector Machine,SVM),是Vapnik在20世紀90年代中期以統計學為基礎提出的一種新型機器學習方法,作為統計學理論中比較年輕和實用的理論,已經在實際應用中得到很大的發展,尤其是在小樣本、非線性及高維分類和回歸問題中表現出了比較出色的效果。
相較于多項式核函數和Sigmoid核函數,徑向基核函數在先驗知識不足的情況下,擁有更好的預測精度。因此,本文GA-SVM預測模型采用徑向基核函數作為預測模型的核函數。則SVM模型的待優化參數有:核函數參數σ、不敏感函數參數和懲罰參數C。核函數參數σ是映射函數的參數,通過改變函數關系來影響映射的特征空間,表示映射規律的復雜程度;不敏感函數參數ε表示所能容忍的最高誤差,影響支持向量的個數;懲罰參數C是在確定的特征空間中調節學習機器的置信范圍和經驗風險的比例,對模型的泛化能力有很大影響。為了控制GA-SVM模型的誤差容忍范圍,在后續試驗中,本文將不敏感函數參數ε確定為0.001。
2.2 遺傳算法
遺傳算法(Genetic Algorithm)是由Holland教授模擬達爾文生物進化理論的自然選擇和遺傳學機制的生物進化過程而創造出的計算模型,是一種通過模擬自然進化過程搜索最優解的方法。遺傳算法以它的實用、高效和魯棒性強等特點深受國內外學者的青睞。
與其他傳統方法不同的是,遺傳算法并不依賴梯度信息和其他任何外部信息,而是通過模擬自然進化過程來搜索最優解,以適應度函數作為搜索方向的引導,用選擇算子選擇親代和子代,用交叉和變異算子保證種群的多樣性。遺傳算法作為啟發式算法的一種,具有對可行解表示的廣泛性和不易陷入局部最優解的特點,同時采用自然進化的原理來表示復雜的現象,能夠快速可靠地解決非常困難的問題。隱含的并行性也使算法在計算上的時間大大縮短。本文正是借助遺傳算法的這些特點,通過全局優化能力來對支持向量機的參數進行優化。
2.3 GA-SVM預測模型算法實現
將遺傳算法與支持向量機算法相結合,提出一種基于GA-SVM的預測模型。支持向量機算法的核函數采用徑向基核函數(RBF),利用二進制編碼對支持向量機模型的參數進行編碼,通過遺傳算法的迭代尋優得出最優解,從而確定最優的懲罰函數C、核函數參數σ,最后通過支持向量機模型得到最后的預測結果。
具體的模型實現步驟如下:
(1)確定支持向量機參數的取值范圍。
(2)確定遺傳算法運行參數的大小。
(3)以二進制編碼方式建立N×L矩陣作為種群,并隨機生成初始種群。
(4)將初始種群中的每個個體,利用支持向量回歸機程序進行計算,將輸出結果與原數據進行對比,計算出訓練樣本的預測精度,從而得出每個個體的適應度大小。
(5)如此循環N次,直到每個個體都計算出相應的適應度。
(6)對整個種群進行遺傳操作(選擇、交叉、變異),獲得新種群。
(7)當滿足終止條件時(達到最大進化次數或適應度連續系帶沒有變化),停止計算;否則轉到步驟(4),直到結果滿足終止條件。
(8)滿足終止條件獲得的輸出就是最優解的懲罰函數C、核函數參數σ。將最優參數輸入支持向量回歸機,對數據樣本進行預測。
具體算法流程如圖1所示。
3 實例分析
為了驗證GA-SVM算法的預測精度,本文使用MatlabR2013a作為編程工具對GA-SVM算法進行了實現。同時選擇臺灣大學林智仁教授(Chih-Jen Lin)等開發的支持向量機軟件Libsvm-2.88來做實驗結果的比對。
本文采用成都市貨運量作為被解釋變量,根據主成分分析法,選擇出相應的指標體系:第一產業產值、第二產業產值、第三產業產值、社會消費品零售總額、進出口貿易總額、城鎮居民可支配收入、農村居民可支配收入、成都市貨運量。以1996—2010年的數據樣本作為訓練數據,以2011—2014年的數據樣本作為測試數據進行實驗。為了提高測試結果的可信程度,本文分別用兩種方法對數據樣本進行多次實驗和比對。
為了避免經驗風險帶來的預測誤差,本文通過調節懲罰函數C、核函數參數σ兩參數的范圍多次測試獲取預測精度較高的參數范圍:CE[0.1,100],6E[0.01,1000]。最終預測結果如表2所示。
根據表2可知,GA-SVM模型在2013年貨運量的預測中達到最低的相對誤差-0.231%,在2012年、2013年、2014年的相對誤差都在10%以內達到了較高的預測精度。反觀SVM模型,除了2014年的相對誤差在10%以內,其余各年份都超過了這個標準,在2011年的預測中達到了最高的-61.807%,很明顯GA-SVM的預測精度要優于SVM的預測精度,如圖2所示。
4 結 論
本文主要針對物流園區物流需求預測問題,設計了GA-SVM的預測模型。為了驗證所建模型的有效性,論文以成都市為案例對模型進行實證分析,其研究結果與臺灣大學林智仁教授(Chih-Jen Lin)等開發的支持向量機軟件Libsvm的參數尋優函數進行了對比,結果證明GA-SVM預測模型在預測精度上要優于傳統SVM預測模型。
參考文獻:
[1]鄒欣,張夢芩.基于灰色GM(1,1)模型的四川省物流需求預測[J].物流技術,2015(5):166-169.
[2]方威,肖衡,任湘郴.基于線性回歸模型的物流需求預測分析[J].生產力研究,2009(12):100-101,116.
[3]曾鳴,程文明,林磊.狀態空間時間序列的區域物流需求預測研究[J].計算機工程與應用,2014,50(15):7-12.
[4]Gutierrez R. S.,Solis A. O.,Mukhopadhyay S..Lumpy Demand Forecasting Using Neural Networks[J].International Journal of Production Economics,2008,111(2):409-420.
[5]陳善學,楊政,朱江,等.一種基于累加PSO-SVM的網絡安全態勢預測模型[J].計算機應用研究,2015,32(6):1778-1781.