金 淳,曹 迪,王 聰,李文立
(大連理工大學 系統工程研究所,遼寧 大連 116024)
汽車零部件第三方倉儲物流企業在運營中面臨的一個重要問題是:在經營環境存在眾多不確定性影響因素、汽車零部件的需求變得越來越多樣化的條件下,如何分配合理的倉儲存儲能力來提高服務質量、降低運營成本[1]。為此,建立準確有效的存儲需求量預測模型具有重要的現實意義。
汽車零部件第三方倉儲需求量預測問題屬于需求量預測模型的范疇,該類模型的構建方法可分為定性預測和定量預測兩大類。定性預測主要包括市場調查、菲爾德法、頭腦風暴法、類推法和意見匯總法等[2];定量預測是最常用的方法,如指數平滑法、ARIMA 模 型、馬 爾 科 夫 法、SVM 和RBF 等[2-5]。定量預測方法中,除BRF外的方法均是基于需求量歷史數據本身趨勢的預測。實踐表明,對于處于顯著動態變化環境的汽車零部件需求預測而言,只用歷史數據來預測經常會失敗,因為這種預測假設過去的需求模式會發生在將來,而這種假設有時并不成立[6]。為此,需要獲取更多的信息才能從動態變化的環境中找到與需求量相關的影響因素及其影響模式,從而提高預測精度[7]。
RBF神經網絡是一種非線性統計性數據建模工具,常用來對輸入和輸出間復雜的關系進行建模,或用來探索數據的模式。當需求受到眾多因素影響且影響程度難以確定時,可以采用其進行預測。神經元個數的多少直接影響RBF神經網絡的預測效果,神經元個數過少時的預測效果會很差,而過多時則會造成過度擬合的情況。選擇神經元個數的研究大多依賴樣本數據的選擇和數據數量,需通過不斷地嘗試和確定[8]。汽車零部件的歷史數據有限,同時汽車零部件的種類可多達幾千件,甚至上萬件,眾多影響因素的變化對這些零件需求的影響程度很可能是不同的。通過確定每一種零部件最優的神經元個數,從而建立神經網絡進行預測是不現實的。
近年來,研究表明,組合預測模型正在成為預測模型的發展趨勢,它通過對不同的定量模型、定性模型或對定量模型、定性模型進行綜合集成來提高預測的精度[9]。汪壽陽等[10]基于TEI@I方法論的匯率預測模型采用經濟計量模型、人工神經網絡和文本挖掘進行預測,最后利用支持向量回歸技術對上述各部分進行非線性集成;沈國江等[11]提出利用模糊邏輯方法綜合卡爾曼濾波模型和人工神經網絡模型的智能組合模型來預測短時交通流量;徐蘭等[12]基于神經網絡集成的質量預測模型。
綜上所述,對于具有眾多不確定動態外部環境的汽車零部件第三方倉儲需求預測而言,構建基于組合模型的預測模型對于其提高預測精度十分必要,但目前的相關研究還很少。因此,本文利用RBF神經網絡優異的非線性特性,并結合其他預測方法構建汽車零部件第三方倉儲物流需求量預測的集成化預測模型。此模型并不過分追求神經網絡的神經元選擇的最優性,而是通過與其他預測模型的組合來彌補可能造成的預測精度的降低,從而提高模型的綜合預測精度、運行效率和行業適用性。
汽車零部件第三方倉儲企業一般面向汽車整車或零部件生產企業提供產前物料供應服務,或面向區域零部件服務中心及4S店進行成品汽車的零部件備品供應服務。不論何種情況,倉儲需求量預測問題都十分復雜,主要是由于外部環境、供應方和生產方的各種不確定,以及時滯性的變化影響了零部件的需求量變化,由此造成需求量的短、中、長期預測變得十分困難,故在構造集成化預測模型之前,有必要首先了解需求量的影響因素。
調研表明,汽車零部件需求量具有一定的季節性周期性變化趨勢[13],但受到各種內、外部因素的影響。其中,內部影響因素主要有供貨提前期、庫存周期、存儲和裝卸成本、物流需求量、缺貨量和產品價值[14-17];外部影響因素主要有季節因素、距離因素、政治因素、經濟因素、區域競爭和行業因素,可將其具體分為汽車銷售淡/旺季、倉庫與供貨商的距離、國家宏觀政策、車輛限行政策、經濟危機、油價的漲跌、第三方物流企業的增加、倉儲作業技術革新、倉儲成本降低、汽車生產技術革新和汽車制造企業增加11種因素。
在內部影響因素中,供貨提前期、存儲和裝卸成本以及產品價值對不同零部件的需求量具有決定性作用,但是這些影響因素在長時間內是保持不變的,所以就單一零部件而言,從其需求量波動變化的角度,庫存周期、缺貨量和物流需求量對倉儲需求量的影響較大。但需求量與這些內部影響因素之間的關系比較復雜,很難用線性函數來定量分析。
同時,外部影響因素對需求量的影響具有較強的不確定性。有時外部因素的突然變化甚至會使需求量產生非常大的波動,但外部影響因素的特點是往往很難進行量化,故難以進行定量分析。因此,將定量預測和定性預測相結合可以更好地解決汽車零部件第三方倉儲需求量預測問題。
RBF神經網絡模型可以考慮不確定因素的影響方式和程度,建立其復雜的非線性因果關系,以此預測由于內部影響因素引起的非線性波動趨勢[5]。
一個具有n個輸入、m個輸出的RBF神經網絡結構如圖1所示。其中,輸入X n=[x1,x2,…,x n]為n維矩陣,x i為X n中第i行,表示第i個影響因素;輸出Y為一維矩陣;N r為隱含層神經元數量;ωi(i=1,2,…,Nr)為連接權值。

圖1 含有n個輸入的RBF神經網絡
本文選取4個內部影響因素作為RBF 神經網絡的輸入參數,即輸入X4=(x1,x2,x3,x4),各參數分別為:物流需求量、庫存周期、缺貨量和在庫量的歷史數據。則RBF 神經網絡模型可實現如下映射:

式中:ω0為偏置量;Ci(1≤i≤N r)為RBF的中心,可以采用隨機選取、基于監督學習的方法和最近聚類算法等確定;Φ(X4-Ci)為基函數,本模型使用高斯函數,如下式所示:

Horink[18]證明了僅有一個隱含層的前饋神經網絡具有一定精度的無窮逼近能力,即RBF神經網絡可以進行良好的非線性預測。RBF 神經網絡的精度是建立在神經元的選擇之上的。本文采用一種零件汽車零件——左前置支架作為預測對象進行試驗,以2010年每周的歷史數據建立神經元從1~52的RBF神經網絡,并利用這52個神經網絡預測其2011年的倉儲需求量。并且,采用平均相對誤差MAPE和均方根相對誤差RMSE 兩個誤差指標進行比較,MAPE和RMSE的計算公式為:

式中:X t為預測結果;M t為實際數據;N3為預測數據個數。
上述52個神經網絡的MAPE、RMSE 誤差指標的變化趨勢如圖2所示。由圖2可以看出,對于左前置支架需求量的預測,隨著神經元個數的增加,其預測精度變高。當N r=52時,即神經元個數等于輸入數據個數,誤差幾乎趨近于0。但在實際的預測過程中,不會把預測數據個數作為神經元的個數,這樣會造成過度擬合的情況;同時,這也是犧牲預測效率帶來的結果,在實際應用中是不適用的。當N r>20時,其預測效果就已經很好。因此,為了滿足企業的實際需求,本文在建模時,將N r設定為一個固定值。

圖2 RBF預測誤差隨神經元的變化圖
在此條件下,為保證整體預測模型的額精度,本文選擇另一種定量預測方法與RBF結合,來提高在基于歷史數據進行定量預測時的精度。ARIMA 模型是線性預測模型,可較好地預測變量的季節性趨勢,將ARIMA 模型和RBF 神經網相結合,既可以考慮汽車生產季節性周期性的特點,又可以考慮定量因素對庫存需求量造成的波動。
但是,對于外部不能量化的因素則需要采取定性方法進行分析。專家打分法是一種常見的定性分析方法,可以對非量化的影響因素進行定性分析,同時,根據相關領域專家的經驗預測未來的趨勢變化。

圖3 SIF模型的基本結構
因此,本文提出了綜合集成預測模型——SIF預測模型。SIF 模型可以利用ARIMA、RBF 神經網絡及專家打分法3個模型的各自優勢進行預測,同時,通過其動態集成效果來彌補各模型的不足。SIF模型的思路及基本結構如圖3所示。首先,SIF模型利用歷史需求量數據,通過ARIMA 模型預測其季節性變動趨勢;在此基礎上,通過RBF 神經網絡模型建立內部影響因素與需求量的非線性關系,來預測影響因素的變化造成的需求量的趨勢波動變化;然后,再通過專家對外部影響因素的打分,得到定性因素造成的趨勢變化,從而對定量預測結果進行修正;最后,將三部分預測結果進行動態集成,得到綜合集成預測結果。
ARIMA 模型可根據數據重復出現的周期性季節變動指數,將非平穩時間序列轉化為平穩時間序列;然后,利用因變量對其滯后值和隨機誤差項的現值進行回歸建立預測模型,可以更好地預測需求量的季節性變動趨勢。
設已知需求量歷史數據為Zt(t=1,2,…,N),其中t為時間間隔(周、月等),將Zt分為兩部分:

以Z1t作為ARIMA 模型的輸入數據,Z2t為校正數據及RBF神經網絡的輸入數據。如果Z1t為非平穩時間序列,對Z1t進行差分,經d次差分后得到平穩序列Δd Z1t,則Δd Z1t可表示為如下形式[19]:

式中:φp(B)為自回歸參數;θq(B)為移動平均參數;p、q為整數;d為差分次數;εt是零均值、方差σ2的白噪聲序列;B為后移算子。然后,利用BIC 準則確定最佳的p、q值,根據p、q值確定其他參數φp、θq、σ2。最后,確定需求量所滿足的季節性趨勢模型ARIMA(p,d,q)。
假設集成預測需要根據已知的N(N=N1+N2)個歷史數據預測Zt未來N3個時間間隔的需求量,則需要利用ARIMA模型根據歷史數據前N1個數據Z1t預測后的N2+N3個數據,預測結果用Ft(t=1,2,…,M)表示。ARIMA 預測結果分為兩部分,Ft={F2t,Fst},其中,F2t(t=1,2,…,N2)作為RBF神經網絡的輸入數據,Fst(t=1,2,…,N3)作為為集成預測的輸入數據。
在本集成預測模型中,以ARIMA 預測結果中的F2t與實際數據Z2t的誤差序列e t(t=1,2,…,N2)作為輸出目標來建立RBF神經網絡,即

則RBF神經網絡模型可實現如下映射:

利用最近鄰聚類學習算法選取RBF 的中心Ci,確定ωi、ω0,建立RBF 神經網絡模型。利用已建立的RBF神經網絡預測未來N3個時間間隔的修正誤差,用est(t=1,2,…,N3)表示。
定性預測模型采用專家打分法進行。專家打分法即可簡單快速地進行定性分析,又可減少單個專家的偏見影響[20]。在此按菲爾德法和意見匯總法進行實施。用前文提取的f1~f11這11種因素進行問卷設計,根據不同的預測周期長度,通過專家對這些影響因素進行打分,打分時考慮:這11種因素的影響權重及其發生的概率以及專家對該領域的熟悉程度,通過計算該影響因素對序列的平均影響程度。最后,將各個影響因素的平均影響程度綜合。同時,利用效度系數法確認這11種因素構成的指標體系的有效性[21],即當專家組對同一因素打分得出的數據差異較大時剔除該因素。
本文構建的基于專家打分的影響程度計算方法如下式所示:

式中:T為預測區間長度,可按半年或1年為一個區間進行打分;E為預測區間的個數;Ne為專家人數;Nf為所考慮的定性因素的個數,本文中Nf=11;Pijr為第i個專家認為第j個事件在第r個預測區間發生時對需求量影響程度的判斷結果,Pijr的取值范圍為(-1,1)。當Pijr=0時無影響,當Pijr>0時,事件j發生,使需求量呈正向增長趨勢,反之呈負向下降趨勢。W ijr為第i個專家認為第j個事件在第r個預測區間發生的概率,取值范圍為[0,1];Rij為第i個專家對第j個事件所處的知識領域的熟悉程度,取值范圍為[0,1]。為方便起見,本文取Rij={0,0.25,0.5,0.75,1.0},分別表示很不熟悉、不太熟悉、一般了解、比較熟悉、很熟悉。
式(8)的計算結果V r是一個修正系數,其范圍為(-1,1)。對于不同預測區間,本文利用專家分別根據外部影響因素的發展趨勢進行打分,得到對應不同區間的V r,這樣會提高針對不同區間的預測的準確性。同時,本文認為,專家打分法對于預測對象從近期到遠期的修正作用是逐漸加強的。為描述這種漸進性,本文用一個線性遞增公式表示V r的漸進變化。最后,獲得N3個修正系數,用V st(t=1,2,…,N3)表示,即

如果Vst是負數,表示這11種因素的變化會造成相應的預測區間內需求量的降低,需對定量預測結果向下方修正;反之,需對定量預測結果向上方修正。這樣,實現了在不同預測周期對于定量預測結果的動態調整。
本文建立的綜合集成預測模型SIF的結構及流程如圖4所示。

圖4 SIF模型的流程
SIF模型中,需求量集成預測值St(t=1,2,…,N3)的表達式為

式中,p為預測權重,進行短期預測時,定量預測在集成中所占權重較大,即p≥0.5;進行長期預測時,需求量的趨勢因受到外界因素變化所造成的波動,影響增大,定性預測在集成中所占權重增大,即p≤0.5。這使得模型更加符合短期、中期和長期零部件第三方倉儲需求量預測的實際特點。
式(11)所示的SIF 模型的集成原理如圖5所示。各模型的集成過程:
(1)以第I部分的歷史數據Z1t為輸入量,用ARIMA 模型預測需求量可基于量化因素的線性變化趨勢Fst;
(2)利用ARIMA 預測結果F2t及第II部分的歷史數據Z2t的誤差e t作為輸出目標建立RBF神經網絡,預測其基于量化因素影響造成的非線性變化趨勢est;

圖5 SIF模型的集成預測示意圖
(3)通過專家打分的定性分析結果V st考慮相應的預測區間內不可量化因素對歷史數據變化趨勢的影響,獲得定性預測結果;
(4)通過式(11)對定量預測和定性預測的結果進行動態集成,得到綜合考慮內、外部因素影響的集成預測結果St,St的變動趨勢如圖5中第III部分所示。
本實例為某3PL倉儲服務企業,為汽車發動機生產廠提供產前零部件供貨服務,涵蓋各類零部件上千種。本預測任務是基于零部件的歷史需求量及其他相關數據,預測其未來的存儲需求量。本文分別采用需求趨勢有明顯變化的曲軸總成(data1)和需求趨勢基本保持不變的氣門彈簧(data2)兩種零部件進行預測,它們的歷史需求數據如圖6 所示。其中以曲軸總成為例做詳細的試驗說明。

圖6 歷史需求量數據
首先以2010-01~2011-12 共104 周的曲軸總成實際在庫量數據及相關定量因素的歷史數據進行預測。以2010-01~2010-12的數據作為歷史數據,建立SIF 模型進行需求預測;然后以2011-01~2011-12的數據作為檢驗數據,對SIF 模型的預測效果進行檢驗和評價。
3.2.1 ARIMA(p,d,q)模型的建立 首先以2010年1~26周的數據作為輸入數據建立ARIMA(p,d,q)模型,數據的ACF圖和PACF圖如圖7、8所示。

圖7 ARIMA 模型的ACF圖

圖8 ARIMA 模型的PACF圖

圖9 曲軸總成需求預測結果
由圖7、8觀察ARIMA(p,d,q)模型的參數p、q小于4,利用BIC準則確定其為ARIMA(2,1,1),其參數值如表1所示。
利用ARIMA(2,1,1)模型預測2010年27~52周及2011年1~52周的數據,預測結果如圖9(b)所示。

表1 ARIMA(2,1,1)的參數估計值
3.2.2 RBF 神 經 網 絡 模 型 的 建 立 以2010 年27~52周需求量、庫存周期、缺貨量和在庫量的歷史數據作為RBF 神經網絡的輸入、以ARIMA(2,1,1)模型預測的2010年27~52周的需求量與實際需求量的誤差作為輸出建立訓練集,建立神經網絡,其中神經元個數N r=20。利用所建立的RBF NN模型預測2011年52周的誤差數據,修正ARIMA的預測結果,修正后的數據如圖9(c)所示。
3.2.3 定性預測模型的建立 專家打分部分的修正系數分為4 個區間,對應的修正系數分別為:V1=-0.30,V2=-0.50,V3=-0.50,V4=-0.20,再利用式(10)獲得每周的修正系數。
3.2.4 模型的集成 最后,利用式(11)求得SIF模型的集成預測結果,其中,對于前26周的預測,p=0.75;對于后26周的預測,p=0.5。圖9(d)為SIF模型的預測結果及其與實際數據以及各個步驟預測結果的比較。
由圖9可以看出,由于ARIMA 模型根據2010年歷史數據進行預測,其預測的需求量的趨勢較實際數據有較大偏差,這是由于2011年需求量的變化趨勢較2010年發生了明顯的變化,而ARIMA 模型僅根據歷史數據進行預測,故誤差較大。通過RBF神經網絡的修正,預測效果有所提高,證明本文所選擇的影響因素對需求量預測的修正作用。經過定性分析的修正,預測結果在需求量突然變化的時間點較RBF模型的預測有所改善。由圖9可以初步看出,SIF模型能夠有效預測需求量的變化,具體的單一模型及SIF模型的誤差比較將在下面詳述。
對于氣門彈簧的預測過程如圖10所示。由圖10可以看出,SIF 模型的預測效果優于ARIMA 模型、及ARIMA 模型與RBF 神經網絡組合預測的效果。

圖10 氣門彈簧需求預測結果
本文比較了4種模型,即各單一定量預測模型、ARIMA 模型與RBF 神經網絡組合模型以及本文提出的SIF模型,所預測的曲軸總成和氣門彈簧需求量的效果如表2 所示,分別為上述模型在短期(1~13周)、中期(1~26周)和長期(1~52周)范圍的預測誤差MAPE、RMSE。由表2 可以看出:①進行短期預測時,4種模型方法的預測效果都比較好,但SIF集成模型的預測誤差最小;②進行中期預測時,ARIMA 與RBF組合模型、SIF集成模型的預測效果比較好,其中,SIF集成模型的預測誤差最小;③進行長期預測時,SIF 集成模型預測效果最好,尤其對于需求趨勢有明顯變化的曲軸總成的預測要明顯優于其他模型。這說明了在需求量預測中SIF 模型優于各個單一預測模型以及ARIMA與RBF組合預測模型。

表2 單一模型與組合模型的誤差
本文的SIF集成預測模型同樣可應用于具有類似特點的需求量預測問題,此時應注意:
(1)對于不確定內部因素引起的非線性因果關系部分,以對應實際問題的非線性要素個數作為RFB網絡的輸入參數個數n。
(2)對于具有周期性波動部分,采用ARIMA模型。歷史數據的個數N1、N2以及預測數據個數N3根據問題的實際要求決定。
(3)對于外部影響因素部分,利用專家打分法求出影響程度作為對上述預測結果進行修正、調整。所考慮的因素個數Nf依據實際問題而定。
為解決動態多變環境下的汽車零部件第三方物流倉儲需求量預測問題,本文在考慮各種內、外部影響因素的基礎上,建立了由RBF神經網絡、ARIMA及定性方法相結合的綜合集成預測模型SIF。研究結論如下:
(1)SIF模型可以提高RBF神經網絡當數據過少或對預測效率要求較高而無法確定最優的神經元個數時的預測精度,其預測效果優于傳統的ARIMA、RBF 神經網絡單獨使用或ARIMA 與RBF神經網絡組合使用時的預測精度;
(2)SIF 模型通過3 種模型的組合,可以發揮各自模型的優勢,克服各自的缺點,使之適合于汽車零部件第三方倉儲物流需求量的短、中、長期預測。
(3)SIF模型對于汽車零部件倉儲需求量發生突然的趨勢變化時的預測準確性更高。
本文為解決構建考慮眾多復雜影響因素的汽車零部件需求預測模型問題提出了新途徑。今后的研究將進一步探索合理確定各影響因素的影響程度的方法并提高模型的智能化水平。