李 吟,田亞平,李朝奎,周新邵,3
(1.湖南科技大學 煤炭資源清潔利用與礦山環境保護湖南省重點實驗室,湖南 湘潭 411201;2.衡陽師范學院 資源環境與旅游管理系,湖南 衡陽 421008;3.湖南城市學院 計算機科學系,湖南 益陽 413000)
基于主成分和BP神經網絡方法的湖南省汽車保有量預測
李 吟1,田亞平2*,李朝奎1,周新邵1,3
(1.湖南科技大學 煤炭資源清潔利用與礦山環境保護湖南省重點實驗室,湖南 湘潭 411201;2.衡陽師范學院 資源環境與旅游管理系,湖南 衡陽 421008;3.湖南城市學院 計算機科學系,湖南 益陽 413000)
汽車保有量預測對城市交通的發展方向、城市交通的控制管理、城市道路的建設情況等都有直接的參考意義。本文通過分析影響城市汽車保有量的因素,通過參考部分參考文獻,城區人口總數人均GDP、公路客運量等8個指標,首先采用主成分分析法將8個因素進行分析,然后建立BP神經網絡模型對湖南省2006到2008年汽車保有量進行預測,預測結果分別為98.93萬輛、122.18萬輛、137.03萬輛,與汽車保有量實際值94.64萬輛、121.72萬輛、142.67萬輛很接近,預測精度比較高。這表明BP神經網絡具有很強的學習與泛化能力,用于汽車保有量預測的可行性與有效性。
汽車保有量;主成分分析;BP神經網絡;預測
汽車保有量預測是交通規劃的一項基礎性工作,對于城市交通的發展方向,城市交通的控制管理,城市道路的建設情況等都有直接的參考意義。國外早在20世紀40年代就己經開始了這方面的研究[1]。到目前為止,很多不同的汽車保有量預測模型被開發出來。許多汽車保有量模型主要是從城市經濟、人口路網容量、土地利用狀況以及停車設施供給條件等宏觀因素出發,預測汽車保有數量。國內關于汽車保有量預測的問題也早有一些研究成果。我國目前主要的汽車保有量預測方法大致有時間序列預測、回歸分析預測、分形理論預測、熵值法[2-5]。這些方法都不能描述出汽車保有量與其他因素之間的復雜關系,在本文中筆者選擇了與汽車保有量有關的影響因素進行分析,對影響因素利用主成分分析法,獲得主要因素,將這些因素利用BP神經網絡建立與汽車保有量的預測關系,對湖南省2006到2008年汽車保有量進行預測,以便為湖南省汽車保有量預測對湖南省城市交通的發展、控制管理、城市道路的建設等都有直接的參考意義。
影響汽車保有量的因素較多,且因素間的相關性大,信息重疊多。在汽車保有量預測建模中,隨著考慮因素的增多,其神經網絡的結構變得更加復雜,網絡性能下降。針對這個問題,本文將通過主成分分析法對變量指標進行特征分析,獲得一個主要綜合因子作為神經網絡的輸入,從而簡化網絡結構。這種方法考慮了汽車保有量與其他因素之間的相互關系,更科學、更據說服力。
主成分分析(Principal Component Analysis,PCA)可以把多變量進行降維處理(唐守正,1986),其機理是根據變量間的相關性大小把變量進行分組,使同組變量之間相關性較高,而不同組變量間相關性較低,使較多的原始指標被綜合為較少幾個綜合指標,即公因子或主成分。公因子或主成分的貢獻率大小基本上反映了原始指標的信息程度,當累積貢獻率80~90%以上時,公因子的代表性較強,其原理為:

式(1)中,對于組合系數uij有:同時zx1是x1,x2,…,xp的所有線性組合中方差最大者;zx2與zx1不相關,且在x1,x2,…,xp的一切線性組合中方差最大;依此類推,zxp與zx1,zx2,…,zxp-1均不相關,且在x1,x2,…,xp的一切線性組合中方差最大。
X=(x1,x2,…,xp)T的協方差陣Σ>0(λ1≥λ2≥…≥λp≥0,其中λi是Σ的非零特征根ui為對應于λi的特征向量(單位化的)。
第i主成分ZXi=Ui′X(i=1,2,…,p),稱為主成分ZXk的貢獻率為主成分zx1,zx2,…,zxs的累積貢獻率,通常累積貢獻率越大,丟失的數據信息就越少。選取主成分的個數取決于主成分的累計方差貢獻率,一般累計方差貢獻率大于85%所需的主成分能夠代表p個原始變量所能提供的絕大部分信息。
人工神經網絡(Artificial Neural Network,簡記為ANN)是一種包含許多簡單的非線性計算單元或連接點的非線性動力系統,而BP網絡是其中應用得最廣泛的一種。BP神經網絡是一種誤差后向傳播網絡,一般采用三層網絡型式,即由輸入層、隱含層和輸出層3層神經元組成,各層神經元的作用都是不同的,其結構如圖1所示。BP網絡的學習過程由正向信號傳播和反向誤差傳播兩階段組成,即輸入信息從輸入層經隱含層(1層或多層)傳向輸出層,如果在輸出層得到的實際輸出與所期望得到的輸出不一致,則轉入反向傳播,將誤差信號(實際輸出與期望輸出之差)沿原來通路返回,通過學習來修改各層神經元之間的連接權值,從而最后使誤差達到最小。

圖1 BP網絡結構圖
將以上兩個步驟結合,進行主成分分析,找出主成分,將其作為神經網絡模型的輸入,取得主要的因素之后,將影響因素作輸入向量,汽車保有量為唯一的輸出向量,建立汽車保有量的神經網絡預測模型。本文采用的三層BP神經網絡結構,隱含層的數目根據n1=2n+1[6]確定,其中,n為輸入單元數,多應用于三層網絡BP神經網絡中。
湖南省政府門戶網站統計顯示湖南汽車產業區域布局上,形成了以“長株潭”為核心,衡陽、邵陽、常德、永州相呼應的格局,2008年,全省231家汽車制造規模工業企業中,長沙100家、株洲16家、湘潭6家,3市企業數占全省的52.8%,企業主營業務收入占全省的63.7%;其他4市企業數占全省的36.8%,主營業務收入占全省的31.3%。隨著城鄉居民收入的增加,城市化水平的提高以及交通環境的改善,近幾年湖南汽車消費市場持續活躍。2001—2008年年均增加12.07萬輛,其中“十五”時期年均增加7.33萬輛,2006—2008年年均增加19.97萬輛。2008年底,每千人汽車保有量為20.8輛,是2005年的1.7倍。用此對湖南省汽車保有量預測對城市交通的發展方向,城市交通的控制管理,城市道路的建設情況等都有直接的參考意義。
通過參考部分參考文獻,最后確定湖南省城鎮居民人均可支配收入,人均GDP,市區人口總數,公路客運量,公路貨運量,每萬人擁有的公交車,人均道路面積,人均住宅面積8項指標作為影響湖南汽車保有量的主要因素,從湖南省統計年鑒(1995—2008)中查得1995年至2008年歷年數據如表1所示。

表1 汽車保有量及影響汽車保有量的主要因素統計表
取1995—2008年的觀測數據訓練神經網絡,預測2006—2008年的汽車保有量數據,在分析過程中,為了使各變量間具有可比性,用SPSS17.0進行主成分分析,計算相關系數矩陣的特征值、貢獻率、累計貢獻率。
因為涉及到8個元素,為了得到更好的分析結果,本文采用主成分分析法將上面因子進行分析。將表1的數據導入到SPSS中,利用主成分分析法進行處理,所得的結果如表2所示,即前2個主成份就可以很好的代表其他的因素。湖南省城鎮居民人均可支配收入、人均住宅面積、人均道路面積、市區人口總數、公路客運量、公路貨運量在第一個主成分上的載荷大,每萬人擁有的公交車在第二個主成分上的載荷大,如表3,這8個因子能對數據充分概括,他們的累積貢獻率達96.223%,因此在下面的BP神經網絡預測分析的時候,本文采用的是這8個因子作為分析的輸入因素。

表2 各主成分對應的特征值和方差貢獻率

表3 主成分載荷矩陣
本例輸入層有8個神經元,隱含層的數目根據n1=2n+1[7]確定,有17個神經元,輸出層有一個神經元即汽車保有量,利用Matlab中的神經網絡工具箱進行處理,其中,選擇的newff、init、train、sim 分別進行網絡的建立、初始化、訓練和模擬。網絡訓練過程中,誤差變化曲線如圖2所示。所創建的函數是 net=newff(threshold,[17,1],{'tansig','logsig'},'traingdx');

圖2 BP神經網絡訓練誤差變化圖
由于BP神經網絡本身的特性及其對輸入數據的要求,對輸入數據進行預測處理,以提高神經網絡的泛化能力(即對未學習數據的正確應答能力),一般可將各輸入量歸一化到[0,1]區間,具體方法如下:
令maxx=Xmax,則Xmax為第i個樣本第j個指標中的最大值;minx=Xmin,Xmin為第i個樣本第j個指標中的最小值。則指標j的所有xi轉化為無量綱的x'i為:X'i=0.1+0.8*(xi-Xmin)/(Xmax-Xmin)[2]i=1,2,……,n運用上面介紹的關于對實際數據進行歸一化處理的方法,對表1中的數據的預處理如表4所示:

表4 原始數據歸一化處理
最后在預測中產生的輸出數據是歸一化后的指標,因此還必須按反向規則進行變換以求出具體的數據。即:實際預測值 =(Oi-0.1)/0.8*(Xmax-Xmin)+Xmin,式中:Oi——神經網絡訓練后的輸出值。
由圖2可以看出,當訓練迭代至133步時,網絡性能達標。利用上面訓練的網絡,進行預測,所得到的預測結果輸出2006年的為0.574 3,2007年的為0.747 4,2008年的為0.858 0按反向規則進行變換以求出具體的數據如表5,2006年2007年2008年的預測值分別為98.93萬輛,122.18萬輛,137.03萬輛,與現實值雖然存在誤差,但總體趨勢是一致的,因此可以用BP神經網絡對汽車保有量進行預測。

表5 現實值與預測值
本文通過分析影響城市汽車保有量的因素,確定城市人口、人均GDP、公路客運量等8個指標,利用主成分和BP神經網絡的預測模型首先對原始指標進行主成分分析,對相關性大指標進行篩選,然后利用BP神經網絡對湖南2006年到2008年汽車保有量進行預測。研究表明:預測值與實際統計數據相差不大,在顧及模型誤差后,兩者是一致的。采用主成分和BP神經網絡方法預測汽車保有量是一種可信的方法,能為相關部門決策提供可靠的、科學的參考依據。
[1]于俊梅,劉欣.基于BP神經網絡的城市汽車保有量預測[J].煙臺職業學院學報,2007,13(3):53-57.
[2]黃志剛,湯洪,丁勝春.基于BP人工神經網絡的湖南省汽車保有量預測[J].山西科技,2005(2):106-107.
[3]蔣艷梅,趙文平.Logistic模型在我國私人汽車保有量預測中的應用研究[J].工業技術經濟,2011(11):99-104.
[4]郭權廣,欒媛媛.分形理論預測汽車保有量方法研究[J].齊齊哈爾職業學院學報,2008,2(3):38-41.
[5]王琦,王花蘭.基于熵值法的城市汽車保有量組合預測[J].交通科技與經濟,2009(6):53-55.
[6]韓亮,王衛亞,陳克鵬,等.中國轎車近期市場預測方法研究[J].西安公路交通大學學報,1999,19(2):89-93.
[7]康志堅,蘇瑞霞,郭建勝.烏拉特前旗水土流失造成的危害及防治對策[J].生態建設,2006(4):90-91.
A Prediction of Vehicle Possession in Hunan Province Based on Principal Component and BP Neural Network
LI Yin1,TIAN Ya-ping2*,LI Chao-kui1,ZHOU Xin-shao1,3
(1.Clean Use of Coal Resources with Mining Environmental Protection Laboratory in Hunan Province,Hunan University of Science and Technology,Xiangtan Hunan 411201,China;2.Deparment of Resoources,Environment and Tourism Management,Hengyang Normal University,Hengyang Hunan 421008,China;3.Department of Computer Science,Hunan City University,Yiyang Hunan 413000,China)
Prediction of car ownership has a direct reference significance for the the development of urban transportation and construction of urban roads.By analyzing the impact factors of urban auto possession,this paper first analyzes 8indicators such as urban population,GDP,road passenger traffic and so on determined by some references,then establish BP neural network model to predicts the vehicles possession in Hunan Province from 2006to 2008.The figures of prediction is 989,300,1,221,800and 1,370,300respectively in 2006,2007and 2008,which is very close to the real ownership of 946,400,1,217,200and 1,426,700respectively.It shows the prediction is very accurate.This suggests that the BP neural network has very strong learning and generalization ability and can be employed in prediction of vehicle possession effectively.
vehicle possession;principal component analysis;the BP neural network;prediction
F570
A
1673-0313(2011)06-0122-05
2011-09-22
湖南科技大學研究生創新基金(S100130)
李吟(1986-),女,湖北荊州人,研究生,從事地理信息的應用研究.
*通訊作者:田亞平(1958-),女,河北盧龍人,教授,博士。主要從事自然地理學教學與研究.