陳會如 逯兆友 劉孝輝 李洪濤 侯玉寧 李浩雅
(1.東北林業大學交通學院,黑龍江 哈爾濱 150040; 2.東北林業大學信息與計算機工程學院,黑龍江 哈爾濱 150040; 3.東北林業大學機電工程學院,黑龍江 哈爾濱 150040)
客運量的預測服務于旅客運輸中車輛調度及線路規劃。準確的預測有利于軌道交通營運路線及車輛數目的規劃,為國家對市場出租車保有量的宏觀調控提供數據依據。使居民出行更加方便、舒適,減少因車輛配置不合理而出現的各種運輸不合理現象,造成物質、時間資源的浪費。在長途運輸方面,除了對車輛數目和線路的規劃外,準確的客運量預測對運輸結構的規劃管理起到了數據支撐的作用,運輸經營者可以通過預測客運量對運輸結構進行調整,以便適應不同旅客的不同運輸需求[1-3]。因此,保證客運量預測的準確度至關重要。
預測模型的選擇則是保證客運量預測準確性的前提。目前,在客運量的預測上通常選用灰色預測模型,如桂文毅等人運用灰色線性回歸模型對哈爾濱鐵路樞紐客運量進行預測,預測評價檢驗結果為優,預測結果可靠[4]。灰色預測模型的應用很廣,在工程領域內對某些數據隨時間變化的序列進行預測,從而做出更精準的調節和建設。如鄭旭東等人將灰色預測模型應用于大壩的實際水平徑向位移預測中[5];陳朝鋒等人運用改進的灰色預測模型對中長期煤礦電力系統負荷進行預測[6];此外國內外學者還將灰色預測模型應用于風電功率預測[7,8]。
但是,灰色預測模型在某些情況下精度會下降,需對其進行改進以提高其估測精度。如:付建飛等人在針對鐵路分品類貨運量預測時,發現對數據序列波動性大的品類預測運用灰色預測模型效果一般,采用指數平滑法對灰色預測的結果進行修正,提高了總體預測效果[9]。王淵等人提出改進的GM(1,N)非線性優化方法,并將其應用于邯鄲市2010年—2015年地下水礦化度的擬合預測中,結果表明改進的非線性GM(1,N)模型擬合精度較好[10]。
本文將利用遺傳算法對灰色預測模型中的參數計算進行優化,以期提高預測精確度。
灰色預測是根據系統內各因素之間的不同變化狀態,通過關聯性分析,找到系統變化發展的趨勢,生成具有一定規律性的預測數據序列,再通過建立相關微分方程模型,對未來數據進行分析預測,得到相應數據序列的預測序列[4]。在進行灰色預測時,要進行灰色量白化的過程,使看似雜亂的數據序列表現出一定的規律性,從而建立模型得出預測結果。白化過程如下:
X(0)=(x(0)(1),x(0)(2),…,x(0)(n))
(1)
式(1)為原始的隨時間變化的數據序列,通過對原始數據的直觀觀察可以看出客運量的總體變化趨勢是遞增的,但是規律性不強,因此在進行灰色預測前要對數據序列進行灰生成。
X(1)=(x(1)(1),x(1)(2),…,x(1)(n))
(2)


(3)
該方程的解為:
x(1)(k+1)=[x(0)(1)-b/a]e-ak+b/a
(4)
在GM(1,1)模型中,當發展系數a為負時,系統的變化速度與其絕對值正相關;當a為正時則呈現負相關。內生灰作用量b反映了數據變化的關系。對參數a和參數b的求解是灰色預測的關鍵,傳統的灰色預測模型求解這兩個參數時使用的是最小二乘法(下文將對這部分進行優化),其原理如下:

(5)
Y=[x(0)(2),x(0)(3),…,x(0)(n)]T,在python3.6中進行編程,運行得到a=-0.052 8,b=2.446 5。
將a,b代入式(6):

(6)
當后驗差比值大于0.35或者準確度小于0.95時,灰色預測不適用。
傳統的灰色預測求解參數a和參數b的方法是最小二乘法,但是當矩陣接近退化時,最小二乘法的精確度降低,使得預測值誤差增大。因此,優化GM(1,1)模型求參數a和參數b的過程,有利于提高預測準確度。本文采用遺傳算法取代最小二乘法來對模型進行優化。
首先,隨機產生參數的初始種群,初始種群的范圍對算法的效率影響很大,因此要使種群的范圍更加精確,提高計算速度。通過最小二乘法計算確定初始參數值a0,b0,種群的范圍應包含初始解且其邊界在初始解附近,則令a∈(0.8a0,1.2a0),b∈(0.8b0,1.2b0)。
在參數a和參數b的種群中,評價其適應度的目標函數為種群中每個個體所求預測值的精度累加之和,目標函數越小則適應度越大,函數如下:

(7)
在程序運行的過程中,遺傳算法每一次迭代得到的種群個體都要代入灰色預測中進行計算,將計算結果與真實值進行精確度分析,在編寫代碼時適應度函數要調用整個灰色預測函數,將種群個體傳入其中,省略了每一步中灰色模型的最小二乘法計算的過程。
與其他預測模型相比,GM(1,1)模型所需的樣本數量小,數據的分布不需要有規律性。數據按照時間序列排列,易于預測未來中長期的數據,精度高的同時,定量分析的預測結果和定性分析的結果一致[11]。鐵路客運量數據類型與GM(1,1)模型所需數據類型一致,因此在進行預測時選擇GM(1,1)模型得到的預測結果精度較高。
本文中對應的是1990年—2017年的全國鐵路客運量(數據源自中華人民共和國國家統計局《中國統計年鑒》)如表1所示。

表1 原始數據序列
選取1990年—2012年的客運量作為訓練集,2013年—2017年的客運量作為測試集。基于GM(1,1)模型預測結果如表2所示。
后驗比C=0.213,但是準確率P=0.870,此時灰色預測在預測時表現得并不理想。
種群個體采用二進制編碼,用隨機遍歷抽樣的方式進行個體選擇,以默認概率Pc=0.8進行單點交叉,變異概率為Pm=0.01,最大迭代次數設置為10 000。優化過程如圖1所示。

表2 灰色預測結果

得到參數a和參數b的收斂情況如圖2所示。

得到的最優參數值為a=-0.041,b=84 243.205。得到解的情況如表3所示。

表3 改進后的預測結果
本文通過遺傳算法來改進傳統GM(1,1)預測模型中計算發展系數和內生灰作用量的最小二乘法,以提高預測精度,所得主要結論如下:
利用遺傳算法對GM(1,1)預測模型進行優化能夠提高鐵路客運量預測模型精度。通過GM(1,1)預測模型進行預測得到的預測結果與真實結果的平均誤差率為0.259。利用遺傳算法對GM(1,1)預測模型進行優化,使得模型預測結果平均誤差率為0.073。相對而言平均誤差率減小了0.186。