耿立艷,郭 斌
物流需求預測在制定物流發展整體規劃、整合物流資源、進行有效物流管理中起到非常重要的作用。物流需求是社會經濟活動的派生需求,主要受到經濟發展整體水平、產業結構、技術進步等眾多因素的影響,而且各因素之間的關系復雜,導致物流需求與其影響因素之間具有難以用精確數學模型描述的復雜非線性關系。
目前,物流需求預測模型主要包括時間序列分析模型、回歸分析模型、灰色預測模型、粗糙集理論、神經網絡法、支持向量機等,但這些方法在物流需求預測中尚存在一定問題,難以獲得理想的預測效果。最小二乘支持向量機[1](Least Squares Support Vector Machines,LSSVM)是一種改進型SVM,以等式約束替換SVM中的不等式約束,將求解二次規劃轉化為求解線性方程組,降低了計算復雜性,提高了運算速度,在物流需求預測中得到應用[2,3]。LSSVM的預測精度取決于其參數的選擇,目前對LSSVM參數的選取沒有統一的規則,主要依賴于經驗與試算,在一定程度上限制了LSSVM的推廣與應用。為解決這一問題,智能算法,如遺傳算法[4]、蟻群算法[5]、粒子群算法[6]等,被引入到LSSVM參數優化中,一定程度上改善了LSSVM預測效果。
粒子群優化(Particle Swarm Optimization,PSO)算法以其算法簡單、有效的特點,被廣泛用于選擇LSSVM最優參數。但標準PSO算法存在收斂速度慢、易于陷入極值等缺陷,限制了其尋優能力的提高。近年來,許多學者對影響標準PSO算法的兩個關鍵參數——慣性權重和加速系數進行了改進,提出了不同的改進PSO算法。在加速系數改進PSO算法中,獲得廣泛認可的有時變加速系數粒子群優化(Time Varying Acceleration Coefficients Particle Swarm Optimization,TVACPSO)算法[7]和動態加速系數粒子群優化(Dynamic Acceleration Coefficients Particle Swarm Optimization,DACPSO)算法[8]。文獻[9]利用時TVACPSO算法選擇LSSVM最優參數,并通過區域物流需求數據,驗證了其有效性。目前有關DACPSO算法選擇LSSVM最優參數的研究很少,因此,DACPSO算法選擇LSSVM最優參數的有效性有待驗證。
本文提出一種LSSVM結合DACPSO算法的物流需求預測模型,利用LSSVM的非線性映射能力預測物流需求量,同時采用DACPSO算法優化選擇LSSVM的最優參數。利用我國的物流數據,根據所選用的評價指標評價模型的有效性。結果表明,與其他模型相比,本文模型在物流需求預測方面具有更好的性能。
設一個給定的樣本集 (xk,yk),k=1,2,...,N ,xk∈Rd為d維輸入向量,yk∈R為相應一維輸出變量,利用內積定義的非線性映射函數?(·)將樣本集從原始輸入空間映射到高維特征空間中,然后在這個高維特征空間中利用如下線性函數擬合樣本集:

基于結構風險最小化原理,回歸問題可轉化為以下優化問題:

約束條件:

其中,ω和b分別為LSSVM的權向量和偏差值,γ為懲罰參數,ek為誤差。為求解上述帶約束優化問題,引入拉格朗日乘子αk,定義拉格朗日方程:

根據KKT優化條件,可得到以下線性方程組:

其中,IN為N階單位矩陣,1N為由N個1組成的列向量,y=[y1,…,yN]T,α=[α1,…,αN]T為拉格朗日乘子矩陣,Ωkj=?(xk)T?(xj),k,j=1,2,...N.。
根據Mercer條件定義核函數:

解出α和b后,可得到LSSVM的回歸模型為:

標準PSO算法已成功應用于函數優化、極值優化、多目標優化等領域,但在某些問題優化方面,標準PSO算法在搜索初期粒子缺乏多樣性,容易落入局部最優值,在搜索后期收斂速度減慢。而DACPSO算法通過動態調節加速系數的自適應能力,實現算法的多樣性,避免陷入局部最優值。
設在D維搜索空間中,粒子的群體規模為m,每個粒子代表所優化問題的一個潛在解。設第i個粒子的速度和位置分別為Vi=(vi1,vi2,…,viD)和Si=(si1,si2,…,siD)。每個粒子根據前一次迭代中的個體最優位置Pibest=(pi1,pi2,…,piD)和粒子群的全局最優位置Pgbest=(gi1,gi2,…,giD)變換自身的搜索方向尋找最優解。每個粒子的位置對應一個適應度值,粒子的優劣由適應度值度量。每個粒子的速度和位置根據以下公式更新:


其中,wmax與wmin分別為最大、最小慣性權重,tmax為最大迭代次數。
c1與c2為加速系數,分別表示粒子的個體經驗信息和其它粒子經驗信息對該粒子尋優路徑的影響。尋優過程中,在搜索初期,應有大的c1值和小的c2值,使粒子進行全局尋優、避免陷入局部極值;在搜索后期,應有小的c1值和大的c2值,使粒子不受其它粒子影響,增加粒子的多樣性,提高收斂速度和搜索精度。為達到該目的,在迭代過程中,將兩加速系數設為隨粒子的適應度值不斷更新:

其中,c1(t)∈[0,4],c2(t)∈[0,4]。fa(t)為當前粒子的平均適應度值,fg(t)為當前粒子群最優位置對應的適應度值。由式(12)可知,在迭代初期,fa(t)與 fg(t)差異較大,c1(t)值較大、c2(t)值較小,有利于全局尋優;在迭代后期,fa(t)與fg(t)差異較小,c1(t)值較小、c2(t)值較大,有利于提高收斂速度和搜索精度[8]。
LSSVM的形式決定于核函數的選擇,選擇不同的核函數可形成不同的LSSVM模型。常用的核函數中,徑向基(Radial Basis Function,RBF)函數具有較強的泛化能力,應用最為廣泛,若選取RBF函數為核函數:

其中,σ2為核參數,則LSSVM回歸模型轉化為:

為獲得較好的性能,需調整LSSVM參數(γ,σ2),一般采用交叉驗證法,但該方法比較耗時,且帶有一定的主觀性和隨意性,難以獲得最優解,在一定程度上影響LSSVM的預測精度和建模速度。
LSSVM-DACPSO模型將LSSVM的構建及預測步驟嵌入到DACPSO算法尋優過程中,利用DACPSO算法搜索LSSVM參數(γ,σ2)。基本思想是,每個粒子在γ和σ2構成的二維空間中搜索全局最優解,將LSSVM的預測誤差設為適應度函數,計算每個粒子的位置對應的適應度值,通過適應度值來尋找粒子的全局最優位置。具體設計如下:
①數據標準化處理。對原始數據樣本進行標準化處理,將其轉化為[0,1]之間的無量綱數據,標準化公式如下:

②初始化粒子群。設定群體規模數m,最大、最小慣性權重wmax、wmin的值,以及最大迭代次數tmax。在二維搜索空間中隨機產生一組參數(γ,σ2)作為粒子的初始速度和位置。
③定義適應度函數。將適應度函數定義為均方根誤差:

④粒子進化。根據式(16)計算每個粒子的適應度值,在迭代過程中,搜索每個粒子的最優位置Pibest和粒子群的全局最優位置Pgbest。根據式(8)、式(9)更新粒子的速度和位置,根據式(10)計算慣性權重,根據式(11)、式(12)計算加速系數。
⑤終止條件判斷。若最大迭代次數滿足要求,則停止計算,此時全局最優位置Pgbest即為LSSVM最優參數值;否則t=t+1,轉到步驟③。
⑥LSSVM模型建立。將最優參數(γ*,σ2*)代入式(5)求解出α和b,根據式(14)建立LSSVM模型并進行預測,再對預測值進行反標準化處理,最終得到原始數據的預測值。
物流需求包括質量和數量兩個方面,質量方面指物流活動提供的物流服務水平;數量方面指物流活動中運輸、儲存、裝卸、包裝、流通加工等物流作業量的總和,即物流需求規模。相應的,物流需求的量化指標分為兩類:物流需求質量指標和物流需求規模指標。物流需求質量指標主要有物流時間、物流費用、物流效率,在定量預測中很少使用該類指標。物流需求規模指標主要有社會物流總費用、社會物流總額、貨運量及貨物周轉量。社會物流總費用是一定時期內社會物流活動中各項支出的總費用,它從物流成本角度衡量物流需求,其變化反映了物流需求的變化趨勢,是比較準確的物流需求量化指標;社會物流總額是一定時期內全社會物流物品的價值總額,它從價值量角度衡量物流需求,其變化能在一定程度上反映物流需求的變化趨勢;貨運量及貨物周轉量從貨運規模角度衡量物流需求,物流活動中除了貨物運輸環節外,還包括儲存、包裝、流通加工等多個緊密相關的環節,所以貨物運輸量不能完全代表物流作業量。綜上分析,本文選取社會物流總費用作為物流需求的量化指標。
物流需求的影響因素廣泛且復雜,可概括為以下幾個方面:(1)國家經濟發展水平。物流需求作為經濟活動的派生需求,與國家經濟發展水平密切相關。國家經濟發展水平及速度對物流需求產生直接影響,經濟發展水平越高、發展速度越快,對物流的需求就越大。(2)產業結構。各產業對物流的需求程度不同,第一產業和第二產業的產品產量是物流運輸的主要對象,它的多少直接反映了物流需求的大小;第三產業以服務業為主,對物流的依賴程度較小。但隨著我國產業結構的調整與升級,尤其是第三產業比重的快速增長將會帶動批發零售業和運輸業的發展,從而帶動物流的需求的快速增長。(3)固定資產投資總額。固定資產投資總額是固定資產投資的外在表現形式,固定資產的投資將轉化為下一時期的生產能力,促使物流需求相應增加。(4)貨物進出口總額。國內外貿易能夠促進社會商品的流通,商品的流通要依賴于物流的支持,從而對物流需求起拉動作用。隨著貨物進出口總額的增長,物流需求不斷增長。(5)社會消費品零售總額。社會消費品零售總額的大小,直接反映一個國家的商品產銷和配送的發展水平,是衡量物流需求直接表現的指標,社會消費品零售總額的增長將加快物流需求的增長。(6)居民消費水平。居民消費水平直接決定了企業的生產和銷售活動,從而對物流需求產生影響。居民消費水平的提高會促使企業生產和銷售新產品,推動物流的需求,反之,則會抑制物流的需求。(7)信息技術。信息技術的發展可以提升物流需求的服務質量和范圍,進而增加對物流的需求。郵電業務總量在一定程度上可以反映一個國家的信息技術發展水平,可作為信息技術的衡量指標。(8)物流運輸需求。運輸是實現貨物位置轉移的重要環節,物流運輸需求在物流需求中占較大比重,對物流需求產生重要影響,物流運輸需求的增長將引起物流需求的增長。
綜上所述,依據指標的可量化性和數據的可得性,選取以下11項指標為物流需求的影響因素:國內生產總值、固定資產投資總額、第一產業總產值、第二產業總產值、第三產業總產值、郵電業務總量、貨物進出口總額、社會消費品零售總額、居民消費水平、貨運量,以及貨物周轉量。以我國1991~2011年相關數據為樣本進行實例分析。
首先將數據樣本標準化到[0,1]區間,然后將整個數據樣本分為兩部分:1991~2005年的數據作為訓練樣本訓練模型,2006~2011年的數據作為檢驗樣本驗證模型的預測能力。
LSSVM-DACPSO中,DACPSO算法的自身參數作如下設置:粒子群規模m設為10;最大迭代次數tmax設為30;最大、最小慣性權重分別設為wmax=0.9,wmin=0.1,加速系數c1(t)和c2(t)依賴于粒子群的適應度值,這里無須設置。DACPSO算法尋優過程中,為減少隨機性對LSSVM參數選擇的影響,選取連續運行10次中獲得的最優參數(γ*,σ2*)建立LSSVM模型,然后進行向前一步預測。
為驗證本文模型的預測性能,同時利用TVACPSO算法、標準PSO算法、交叉驗證法(Cross Validation,CV)選擇LSSVM最優參數并建立預測模型預測物流需求,分別記為LSSVM-TVACPSO模型、LSSVM-PSO模型、LSSVM-CV模型,其中,TVACPSO算法的自身參數設為:m=10;wmax=0.9,wmin=0.1;c1,ini=2.5,c1,fin=0.5,c2,ini=0.5,c2,fin=2.5;tmax=30。PSO算法自身參數設為:m=10;wmax=0.9,wmin=0.1;c1=c2=2。CV方法采用5折交叉驗證法確定LSSVM參數。四種算法搜索的最優參數及所用時間如表1所示。

表1 最優參數及搜索時間
DACPSO算法、TVACPSO算法和PSO算法搜索LSSVM最優參數的時間均明顯少于5折交叉驗證法,其中,DACPSO算法有效的局部與全局搜索能力使得尋優所用時間最少,僅為20.5765秒,而基于5折交叉驗證法的尋優過程計算工作量很大,所用時間達到138.7785秒。

圖1 預測結果比較
表2和圖1分別給出四種模型的預測結果和相對預測誤差。LSSVM-DACPSO模型的預測精度明顯優于其他三模型,預測出的社會物流總費用較其他三模型更接近于實際值。LSSVM-DACPSO模型預測期內的最大、最小相對預測誤差僅為2.92%和0.66%,其他三模型的最大、最小相對預測誤差較大,分別為3.68%和1.33%、3.69%和0.97%、3.64%和0.87%。

表2 相對預測誤差比較
采用均方根誤差(Root Mean Squared Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、平均相對誤差(Mean Percentage Error,MPE)、西爾統計量(Theil)共 4項指標評價模型的預測能力,指標定義如下:

其中,n為檢驗樣本個數,yl和分別為社會物流總費用的實際值與預測值。以上指標值越小,模型的預測能力越好,結果如表3所示。

表3 預測能力比較
由表3可知,LSSVM-DACPSO模型的預測能力優于其他三模型,其RMSE、MAE、MPE、Theil值均明顯小于其他三模型的對應值,這主要是由于DACPSO算法通過使加速系數隨適應度值不斷變化,保障粒子的多樣性和算法的收斂性,進而提高了LSSVM的預測能力。TVACPSO算法通過使加速系數隨迭代次數不斷變化,增加粒子的多樣性及收斂性,搜索性能較標準PSO算法有所改善,因而LSSVM-TVACPSO模型的預測能力介于LSSVM-DACPSO模型與LSSVM-PSO模型之間;而LSSVM-CV模型由于5折交叉驗證法的主觀性與隨意性,預測能力在四模型中最差。
本文提出一種基于DACPSO算法的LSSVM物流需求預測模型,并以我國物流需求為研究對象,通過最優參數搜索時間、相對預測誤差和預測性能評價指標RMSE、MAE、MPE、Theil驗證模型的有效性。結果顯示,LSSVM-DACPSO模型的相對預測誤差值和四個預測性能評價指標值均小于LSSVM-TVACPSO、LSSVM-PSO及LSSVM-CV模型的對應值,且DACPSO算法搜索LSSVM最優參數的時間小于TVACPSO算法、PSO算法及CV方法。因此,從提高預測能力與建模速度角度,LSSVM-DACPSO模型是一種有效的物流需求預測方法,為物流需求預測提供有益參考。
[1] Suykens J T,Van G I.Least Squares Support Vector Machines[M].Singapore:Singapore Word Scientific,2002.
[2] 龐明寶,謝玲,郝然等.基于偏最小二乘支持向量機回歸區域物流量預測[J].河北工業大學學報,2008,37(2).
[3] 梁毅剛,耿立艷.基于核主成分-最小二乘支持向量機的區域物流需求預測.鐵道運輸與經濟,2012,34(11).
[4] 許桂梅,黃圣國.應用LS-SVM的飛機重著陸診斷[J].系統工程理論與實踐,2010,30(4).
[5] 王娟,劉明治.蟻群算法滾動優化的LS-SVM預測控制研究[J].控制與決策,2009,24(7).
[6] 陳如清,俞金壽.基于粒子群最小二乘支持向量機的軟測量建模[J].系統仿真學報,2007,19(22).
[7] Chaturvedi K T,Pandit M,Srivastava L.Particle Swarm Optimization With Time Varying Acceleration Coefficients For Non-Convex Eco?nomic Power Dispatch[J].Electrical Power and Energy Systems,2009,(31).
[8] 紀震,廖惠連等.粒子群算法及應用[M].北京:科學出版社,2009.
[9] Geng L Yan,Dong Q T.Forecast of Regional Logistics Demand Us?ing KPCA-Based LSSVMs Optimized By PSOTVAC[J].Advanced in Information Sciences and Services Sciences,2012,4(19).