付 潔,黃 洪
(西南交通大學 信息科學與技術學院,成都 611756)
鐵路運輸因運量大、速度快、安全性高等優點,一直被人們作為長途出行的優選交通工具,但由于成本造價的影響,若不能及時掌握客流動態,極易出現運能緊張、成本浪費等問題[1]。合理精確的客運量預測能夠實現成本最小化和利益最大化[1]。一個地區鐵路客運量的影響因素多種多樣,涵蓋經濟、人口、地理、旅游、國家政策甚至重大事件等[2]。不同因素對客運量的影響程度不同,且二者間存在復雜的非線性關系[3]。
鐵路客運量預測的主要模型有GM(1,1) 模型、Verhulst 模型、SCGM 模型、BP 神經網絡和RBF神經網絡等。目前,科研人員已經針對多種單一模型對客運量進行預測研究[4-6],但單一模型往往精確度較低,為彌補誤差過大的不足,組合模型應運而生。灰色- 回歸組合模型[7-9]、GM- 馬爾科夫鏈組合模型[10-11]、GA-BP 組合模型[12]等都已成功應用于客運量預測領域。
本文通過灰色關聯法定量分析四川省鐵路客運量的影響因素,確定關聯度,找出主要影響因子,并研究一種簡單可行的Verhulst-RBF 神經網絡組合預測模型。
四川省鐵路客運量與眾多影響因素緊密相關,其中,部分影響因素可定量分析,其余因素由于數據獲取難或無法獲取只能定性分析。本文選取地區生產總值、人均地區生產總值、第一產業總產值、第二產業總產值、第三產業總產值、居民消費水平、年末常住人口、鐵路營業里程、鐵路旅客周轉量、進出口總額、建成區面積共11 項可量化因素作為客運量的影響因子。
筆者從國家統計局官方網站上獲取了四川省2004—2017 年(共14 年)鐵路客運量及相關影響因子的數據,經整理匯總,部分匯總數據如表1所示。

表1 四川省鐵路客運量及相關影響因子統計數據表
灰色關聯度分析是灰色系統理論的一部分,由鄧聚龍教授首先提出,通過確定不同數據列的發展趨勢和相似性,來判斷數據列的關聯程度[13]。灰色關聯分析法適用性很強,受數據量不足或信息不確定等情況的影響較小[13]。其主要計算步驟如下[13-16]:
(1)確定因素序列和特征序列;
(2)對原始數據進行無量綱化處理;
(3)求差序列;
(4)求關聯系數;
(5)計算關聯度。
將鐵路客運量數據分別與上述11 項影響因素的數據進行灰色關聯度分析,分析結果如表 2 所示。
根據關聯度分析結果可知:(1)四川省鐵路客運量受鐵路旅客周轉量、建成區面積、第一產業總產值和鐵路營業里程的影響程度最大,影響程度都在0.9 以上;(2)年末常住人口和居民消費水平影響程度位于0.8 ~0.9 ;(3)第三產業總產值、人均地區生產總值、地區生產總值和第二產業總產值影響程度位于0.7 ~0.8 ;(4)影響最弱的為進出口總額,但其影響度仍然在0.6 以上。由此可見,表2 中顯示的影響因子與鐵路客運量都有較為顯著的相關性,為保證后續預測模型具有更高的精確度,本文選取影響度在0.8 以上的6 項因素作為主要影響因素,即鐵路旅客周轉量、建成區面積、第一產業總產值、鐵路營業里程、年末常住人口和居民消費水平。

表2 影響因子灰色關聯度分析結果列表
Verhulst 模型是灰色系統模型的一種,它能對無序離散的序列進行研究,具有所需信息量少、保持原始序列特點等優點,其主要計算步驟如下[17-19]。
(1) 設原始序列為X(0)=(X(0)(1),X(0)(2),…,X(0)(n))。
(2)通過公式(1)對X(0)進行一次累減生成,得到序列X(1)=(X(1)(1),X(1)(2),…,X(1)(n))。

其中,k=2,3,…,n;X(1)(1)=X(0)(1)。
(3)通過公式(2)對X(0)進行緊鄰均值生成,得到序列Z(1)=(Z(1)(1),Z(1)(2),…,Z(1)(n))。

其中,k=2,3,…,n;Z(1)(1)=X(0)(1)。
(4)Verhulst 模型的方程式如公式(3)所示,其白化方程如公式(4)所示。

其中,a為發展系數;b為作業量;a、b為待求解參數。
根據X(1)和Z(1)得到矩陣B和Y

求解a、b,得到公式(5):

(5)公式(6)為模型的時間響應式,以X(1)(1)=X(0)(1) 為初始值,將所求得的a、b代入公式(6),即可得到最終預測序列H。

其中,k=1,2,…,n。
RBF 神經網絡[20-22]是一種性能良好的基于徑向基函數的3 層前向網絡。RBF 神經網絡的3 層結構分別為輸入層、隱含層和輸出層。其中,輸入層的節點個數一般為影響因子的數目;隱含層節點數目由聚類算法隨機生成;輸出層的節點數為預測結果數。
RBF 神經網絡的學習過程[20-22]主要分為訓練和測試兩個階段。在訓練階段根據輸入樣本決定隱含層各節點徑向基函數的中心和方差。在隱含層的各個參數決定后,測試階段利用最小二乘原則,求出隱含層和輸出層的權值。RBF 神經網絡結構如圖1 所示。

圖1 RBF神經網絡結構圖
GM-RBF 組合模型已被應用于股票價格等的預測分析中, 文獻[23]中提出了一種可行的GM(1,1)與RBF 神經網絡結合的方式,它使用GM(1,1) 模型,對原始序列進行預測得到預測序列,再將預測序列作為RBF 神經網絡模型的輸入序列,從而得到最終預測結果。本文結合Verhulst 模型原理和RBF 神經網絡原理,在文獻[23]的基礎上,提出的組合模型基本思路如下[23]。
(1)將原始序列X(0)使用Verhulst 模型預測得到預測序列H;
(2)對H序列進行累減生成和緊鄰均值生成,得到累減生成序列X(1)和緊鄰均值序列Z(1);
(3)將X(1)和Z(1)用RBF 神經網絡進行預測,得到新的累減生成序列X*(1)和緊鄰均值序列Z*(1);
(4)將X(0)、X*(1)和Z*(1)再次代入Verhulst 模型進行預測,得到最終預測序列Y。
本文基于表1 中的統計數據,并以表2 中的灰色關聯度分析結果為基礎,對單一的Verhulst 模型、RBF 神經網絡模型和本文提出的Verhulst-RBF 神經網絡組合模型進行了測試。使用Matlab 2017a 版本建立模型,將2004—2014 年的數據作為訓練數據,2015—2017 年的數據作為測試數據,對2015—2017年的鐵路客運量進行預測,并對比預測結果。在進行RBF 神經網絡模型預測時,還利用了Matlab 自帶的mapminmax 函數,對數據進行歸一化與反歸一化,以防止出現過擬合現象,造成預測不準。
3 種模型的預測結果如表3 所示,單一Verhulst模型預測的平均誤差為7.27%,RBF 神經網絡模型預測的平均誤差則為8.9%,而本文提出的組合模型預測的平均誤差為6.93%。相對單一RBF 神經網絡模型而言,精確度提高了1.97%,與單一Verhulst 模型比較,精確度提高了0.34%,且組合模型在兼顧了多種影響因子與客運量的關系的同時保留了RBF 神經網絡容錯性強的特點。

表3 實驗結果對比
圖2 和圖3 分別表示RBF 神經網絡模型和Verhulst-RBF 神經網絡組合模型的迭代誤差。從中可得出,相比于RBF 模型,組合模型的誤差收斂速度也得到了提升。

圖2 RBF神經網絡迭代誤差圖

圖3 Verhulst-RBF組合模型迭代誤差圖
綜上所述,Verhulst-RBF 神經網絡組合模型的預測精確度更高,且具有誤差收斂速度快、容錯性強等特點。針對四川省鐵路客運量預測具有較好的應用效果。
本文針對傳統預測方法在非線性、不確定、時變系統預測上的不足,以及單一預測模型精確度低、擬合能力弱等特點,提出了Verhulst-RBF 神經網絡組合模型。該模型結合Verhulst 模型少樣本情況下精度較高和RBF 神經網絡非線性擬合能力強的特點,在影響因素相同的條件下,對3 種模型的預測效果進行對比,證明該組合模型有效地提高了預測精度。但本文所提出的Verhulst-RBF 組合模型在構建網絡時,對網絡參數的處理僅僅采用默認值進行測試,并沒有對網絡參數進行充分的調整分析,這將是接下來研究工作的重點。