范容君,胡 維
(合肥工業大學 機汽學院,合肥 230009)
目前汽車總量預測的典型方法主要有時間序列預測法、線性回歸法、灰色預測法、BP神經網絡法等,這幾種方法各具特色和優勢,但是各有各的局限性。選擇何種方法去預測必須進行具體分析。時間序列預測簡單易行,便于掌握,但誤差比較大,目前已不提倡采用。線性回歸模型是通過尋求預測對象和影響因素之間的統計規律來建立相應的函數關系方程式,并依據該方程進行預測,本文關于某些數據的預測選取的是二元回歸法,但只能進行短期預測,而且需要較大的樣本數據。灰色預測法可以在數據不充足的樣本條件下,從數據本身去挖掘有用信息,適用于中長期預測,但其缺點是只適用于指數增長情況下的預測,對波動性不好的數據預測效果比較差。人工神經元網絡具有較好的非線性和自適應能力、學習能力和映射能力,能夠實現非線性關系映射,但容易陷入局部最小值。本文通過具體分析提供了關于汽車總銷量預測的具體相關模型。
通過查閱2010中國統計年鑒、2010國民經濟、社會發展統計公報和2010年公路水路運輸發展統計公報,得知1996~2010年的15個統計樣本,如表1所示,其中城市道路長度和城市道路面積2010年底的數據,由于資料有限,還需額外預測。總體預測過程分四步:①建立預測模型;②城鎮人口數、城鎮居民人均可支配收入、城市化率、公路里程的BP滾動預測;③城市年末實有道路長度和城市年末實有道路面積的二元回歸預測;④汽車年末銷量預測。
道路交通和城市化進程對汽車總量的影響是全方位多角度的,一方面由于道路建設的速度加快和水平提高為汽車運行環境提供了良好條件,勢必影響汽車市場。另一方面城市化進程不斷加快,城市規模不斷擴大,誘發了更多的出行需求。因此綜合考慮上述因素,本文選取待預測的城鎮人口數、城鎮居民人均可支配收入、城市化率、城市年末實有道路長度、城市年末實有道路面積、公路里程6個因素作為汽車總量的主要影響因素。

表1 汽車年末銷量及相關因素統計
將上述6個影響因素作為輸入信息,可確定網絡輸入層結點數為15。目前,網絡隱含層結點個數的選取尚缺少統一而完整的理論指導,原則上應大于輸入層結點。關于隱含層的層數,通過trainlm訓練函數反復試算,最終采用節點數為15的單隱含層網絡結構[1]。輸出層含1個結點,即網絡的輸出為,與6個影響因素同年的汽車銷量。隱含層與輸出層均采用tansig型函數作為傳遞函數。形成拓撲結構為15-1的神經網絡作為汽車總銷量的預測模型,設為ANN1。若目標預測年份為t,且已知第t年之前的n年數據,則將第t-n到第t-1年的數據作為ANN1的訓練集合,即n年中每年的6個影響因素作為輸入集合,相對應的同年汽車銷量作為導師集合。待網絡經訓練穩定后,就可對第t年汽車總銷量進行預測。
根據汽車銷量BP預測模型的特點,在預測2011年的出租汽車保有量之前,必須先確定同年的6個影響因素組成的輸入向量。建立BP神經網絡ANN2及ANN3可用于預測同年的城鎮人口數、城鎮居民人均可支配收入、城市化率和公路里程且精度較高。而對于其他二個影響因素來說,BP網絡因無法或很難收斂而另選其他模型。城市年末實有道路長度、城市年末實有道路面積經回歸模型預測和灰色模型預測精度對比,優選回歸模型。
ANN2、ANN3輸入層分別11、8個結點,輸出層有1個結點。第一種ANN2是將第2011年之前連續3年的某一影響因素的數據作為輸入樣本,以第4年的數據作為導師樣本,對網絡進行訓練。達到精度后可用目標年之前3年的數據作為輸入集合,得到該影響因素的預測值;第二種ANN3是將第2011年之前連續4年的某一影響因素的數據作為輸入樣本,以第5年的數據作為導師樣本,對網絡進行訓練。
根據收斂效果,城市化率選取ANN2,城鎮人口預測、城鎮人均可支配收入、公路里程選取ANN3。應用訓練完畢的ANN2、ANN3分別對4個影響因素進行預測,并運用Matlab軟件工具包,通過編程調試,取得最終計算結果,如表2所示。

表2 2011~2015年汽車銷量影響因素預測
2.3.1 回歸計算
根據城市道路面積、城市人均可支配收入、城市化率的原始數據,畫出散點圖。①目標變量:城市年末實有道路面積;解釋變量:城市人均可支配收入、城市化率。②目標變量:城市年末實有道路長度;解釋變量:城市人均可支配收入、城市化率。本文只分析城市道路面積的預測過程,城市年末實有道路長度同理可預測。通過作圖發現城市道路面積與城市人均可支配收入、城市道路面積與城市率之間存在線性趨勢,沒有發現明顯的異常值。因變量與各自變量之間存在線性關系,符合建立線性回歸的數據要求。使用SPSS統計軟件,采取二元線性回歸分析方法得出計算結果[3]。
2.3.2 模型檢驗
模型方差分析表、系數檢驗表可以表明模型的擬合效果,顯示在模型中相關系數R為0.991,而決定系數R2為0.983,校正的決定系數為0.980,F=315.336??梢?,模型的擬合優度非常好。各個系數的檢驗結果(T檢驗),由于是二元回歸,因此對系數的檢驗包含對常數項的檢驗與兩個自變量系數的檢驗。
由此可以得到相關性模型:Y1=1.631X2+0.861X1-42.108 Sig=0,在0.05水平上該回歸模型達到顯著性水平,同理可得:Y2=0.198X1+0.762X2-11.847。
2.3.3 模型預測
將數值代入預測回歸方程,得到城市年末實有道路面積、城市年末實有道路長度2010~2015年預測值。如表3所示。

表3 回歸預測表
取誤差 ε≤0.5×10-10,以 1996~2010年的影響因素作為輸入,汽車量作為導師信息,對ANN1進行訓練。經過近422次的訓練后,網絡誤差達到精度要求。
應用訓練完畢的ANN2、ANN3分別對5個影響因素進行預測,其結果如表2、表3所示。
將上述所得影響因素值作為輸入向量,運用訓練完畢的ANN1對2011~2015年的汽車總量進行預測,結果如表4所示。

表4 汽車銷量預測值
1)本文通過對現有數據的檢測,證明運用BP神經網絡模型預測汽車銷量是可行的。與傳統方法相比,神經網絡因其在非線性系統建模等方面的優勢,在汽車總量問題預測方面具有較高的預測精度,因此具有廣泛的應用前景。
2)各種算法是從歷史數據中找出預測對象的演變規律,而并未考慮到政策對汽車銷量的影響,所以在道路交通、城市化進程、汽車產業發展政策突然變動的情況下,該模型會受到一定的限制。
[1]袁曾任.人工神經元網絡及其應用[M].北京:清華大學出版社,1999:6~10.
[2]張際先.神經網絡及其在工程中的應用[M].北京:機械工業出版社,1996:39~40.
[3]劉大海,等.SPSS15.0統計分析從入門到精通[M].北京:清華大學出版社,2008.