朱智雄,鐘一兵
(肇慶學院 數學與統計學院,廣東 肇慶 526061)
深圳市交通事故預測的灰色神經網絡模型
朱智雄,鐘一兵
(肇慶學院 數學與統計學院,廣東 肇慶526061)
道路交通系統的運行具有較強的非線性和隨機性,現采用灰色關聯分析方法找出交通事故的主要影響因子;運用灰色系統與BP神經網絡模型,結合交通事故主要影響因子進行組合建模,對深圳市的交通事故進行預測.結果表明,組合預測模型的預測精度優于單一灰色GM(1,1)模型.
深圳交通;灰色神經網絡;事故預測
我國已成為世界上最大的汽車生產和消費國,安全高效的交通系統對我國國民經濟的穩定發展具有深遠的影響.深圳市是我國改革開放的先鋒,同時也是我國擁有汽車最多的城市之一,其交通系統安全高效地運行對社會的穩定發展具有十分重要的意義.通過比較圖1和圖2可知,在有關部門對交通環境的科學治理下,近年來深圳市在地少車多的情況下仍能保持較低的交通事故發生率.各地交通管理部門應加強對深圳市交通安全管理現狀的分析研究,借鑒其科學有效的管理經驗,不斷提高所在地的交通治理水平.

圖1 北京、上海、深圳歷年交通事故年發生次數

圖2 北京、上海、深圳交通事故造成的直接經濟損失
當前預測交通事故模型常用的方法有統計回歸分析方法,其中倫敦大學史密德R.J教授的Smeed模型較為典型.當前較為前沿的方法有神經網絡模型、灰色系統模型以及組合預測模型等[1].
GM(1,1)灰色新陳代謝模型是一種少數據、信息不確定性問題的研究方法.該方法通過挖掘、提取研究對象內“部分”有價值的已知信息,有效實現對研究對象的運行與演化機制的描述和控制.人工神經網絡是人工智能的重要分支,其具有強并行處理、容錯性、魯棒性、自適應及自組織能力,并且在復雜的非線性系統中具有較高的建模能力,對數據也具有比較優秀的擬合能力[2].
綜上可知,人工神經網絡在非線性數據處理方面具有明顯的優勢,而GM(1,1)灰色新陳代謝模型在貧數據、短時間序列的預測方面擁有獨特的優勢,故本文試圖運用BP人工神經網絡與灰色系統模型進行組合建模,以期能有效提高交通事故預測模型的穩定性和準確性.
1.1灰色新陳代謝模型的建立
第1步:對于原始數列中同類數據進行累加生成,形成新的序列.
設序列X(0)=(x(0)(1),x(0)(2),…,x(0)(n)為某一類原始數據序列,其中x(0)(k)≥0,k=1,2,…,n;x(1)為x(0)的1次累加生成序列,x(1)=(x(1)(1),x(1)(2),…,x(1)(n),其中即

依此類推可得新序列.

第3步:確定預測值:由GM(1,1)模型時間響應式,可解出


1.2模型檢驗
1.2.1事前檢驗
要確保模型具有較高的精度,在建立模型前可先對原始數據序列進行可行性分析.設原始序列x(0)=(x(0)(1),x(0)(2),x(0)(3),…,x(0)(n),檢驗原始數據數列所有點的級比是否都落在區間內.只有當級比ζ(t)落在該區間內,灰色模型才有意義.
1.2.2模型精度檢驗
檢驗模型精度的常用3種方法為相對誤差檢驗法、關聯度檢驗法和后驗差檢驗法.
1)相對誤差檢驗法.
2)關聯度檢驗法.
設原始序列為X(0)=(x(0)(1),x(0)(2),x(0)(3),…,x(0)(n),預測值序列為Y(0)=(y(0)(1),y(0)(2),y(0)(3),…,y(0)(n);則關聯系數定義為
3)后驗差檢驗法.
設x(0)為原始序列,x~(0)為相應的預測模擬序列,ε(0)為殘差序列,則分別為x(0)的均值和方差;分別為殘差的均值、方差,并稱c=s2/s1為后驗差比值.對于給定的c0>0,當c<c0,稱該模型為均方差比合格模型.顯然均方差c越小越好,s2小而s1大,即殘差方差小,原始數據方差大,說明殘差集中,原始數據分散.P=P(||ε(k)-ε-<0.674 5s1)稱為小誤差概率,對于給定的P0>0,當P<P0時,稱模型為小誤差概率合格模型,其中小概率P越大越好.
常用的精度等級見表1[3],可供檢驗模型參考(1級精度效果最好).

表1 預測精度等級檢驗表
1.3灰色新陳代謝模型構建
隨著時間的推移,新產生的影響因素對整個灰色系統的影響程度,要大于初始時間相關影響因子的影響程度,因此,有必要在預測過程中不斷用新數據代替原序列中的歷史信息.具體操作方法是將通過GM(1,1)灰色預測模型得到的最新預測值,代入原預測序列x(0)=(x(0)(1),x(0)(2),x(0)(3),…,x(0)(n)中,并去掉該序列中第1個數據x(0)(1),從而得到新的預測序列將其代入GM(1,1)灰色新陳代謝預測模型,得到最新的預測值,依此規則依次替換至完成目標預測.
1.4灰色新陳代謝模型的實證分析
本文中,筆者首先以深圳市交通事故次數作為預測目標,表2是深圳市2001—2012年的交通事故次數[4].

表2 2001—2012年深圳市交通事故次數
實踐表明,當觀測值大于4時模型預測精度較好.運用表2數據,將2010—2012年的數據作為預測目標值,選取5~9個觀測值,運用灰色新陳代謝的方法進行預測.下面以5個觀測值為例:
1)以2005—2009年的事故次數建立原始序列,X(0)=(7 068,4 836,3 384,2 471,1 927);
2)將X(0)序列代入GM(1,1)模型,并計算出序列中第6個值y(X(0),即2010年的交通事故數值;
3)在原序列末尾加入最新的預測值y(X(0),并去掉原序列中第1個數值,得到新的預測序列X(1),則X(1)=(4 836,3 384,2 471,1 927,y(X(0));
4)將X(1)作為新的預測序列代入GM(1,1)中,得到新的預測值y(X(1),將其作為2011年的交通事故預測值;
5)重復3)中的替換步驟,得到新的預測序列X(2),并求解2012年預測值y(X(2);
6)對照原數據中的真實值,并計算預測值的相對誤差;
7)6個觀測值的預測值之初始序列選擇2004—2009年的數據,7~9個觀測值的預測序列依次類推,并重復1)~6)步驟.依據上述步驟,得到實驗結果,詳見表3.

表3 5~7個觀測值交通事故次數預測精度表格
通過簡單比較上述實驗結果易得,當觀測值達到7個時數據的預測誤差已較小,故可取7個觀測值作為灰色新陳代謝模型預測序列.同時從表3可得,隨著時間推移,其預測誤差明顯增大.
1.5BP人工神經網絡構建
通過查詢深圳市統計局的相關數據,我們選取了2001—2012年深圳市交通系統的相關統計指標:生產總值指數、道路照明燈盞數、深圳戶籍機動車數輛、大型汽車數輛、小型汽車數輛、摩托車數輛、機動車總量數輛、交通違法總數量、機動車交通違法數量等共19個統計量.由于樣本過多,我們用樣本指標對交通事故次數進行灰色關聯測試,取得了關聯度比較高的樣本:生產總值指數(x1)、行人交通違法(x2)、交通違法總和(x3)、道路照明燈盞數(x4)、粵港駕駛員違法(x5)、貨車超載(x6)、公共交通客流量(x7)、暫扣機動車(x8)、本地駕駛員違法(x9)、機動車交通違法(x10),詳情如表4所示.

表4 統計指標的灰色關聯度
上述指標與深圳市交通事故發生次數的關聯度均大于0.670,這說明以上統計量與交通事故的發生具有較明顯的關聯性.
利用GM(1,1)灰色新陳代謝模型預測方法分別對上述10個指標進行5~9個觀測值的灰色預測,并得到2010—2012年的對應預測值,結果如表5所示.由于“暫扣機動車(x8)”這一指標5~9個觀測值的預測值都無法保證灰色預測檢驗的精準度,為了保證預測結果的準確性,該指標在后續實驗中予以剔除,只保留9個統計指標.

表5 最優預測值
調用MATLAB R2014a中的“nntool”工具箱作為BP神經網絡實驗平臺[5],選取2001—2009年上述9個指標的相應數據作為BP神經網絡模型訓練的輸入樣本,以對應時段的交通事故次數作為輸出樣本,對神經網絡進行訓練.通過多次測試選擇,得到要獲得較好的預測精度,需滿足如下條件:網絡的隱含層神經元個數為9個;訓練函數Training function選取“TRAINSCG”,Adaption learning function函數選取“LEARNGDM”,隱層轉換函數選擇“TANSIG”,輸出層轉換函數選擇“TANSIG”.此時其總體輸入與輸出擬合效果較好,總體可決系數R=0.968 82.
將表5的9組GM(1,1)預測值作為已經訓練好的BP神經網絡的輸入值,預測2010—2012年深圳市交通事故次數的預測結果,并與單純用GM(1,1)灰色新陳代謝模型預測得到的相應數值預測值進行對比,詳情如表6所示.

表6 預測值與組合模型預測值比較
上述實證實驗表明,運用灰色關聯分析方法可以準確找出深圳市交通事故的影響因素,在預測短期交通事故次數的數值時,單純采用GM(1,1)灰色新陳代謝模型的誤差程度并不明顯,但是隨著時間跨度的增大,其預測精度大大減低.而通過GM(1,1)灰色新陳代謝模型與BP神經網絡進行組合預測,則可以明顯提高預測精度,且能避免上述灰色系統的缺陷,達到較為穩定的預測精度.
[1]劉海申.基于和神經網絡的組合模型對甘肅省交通事故的分析與預測[D].蘭州:蘭州商學院,2011.
[2]韓敏.人工神經網絡基礎[M].大連:大連理工大學出版社,2014:1-63.
[3]劉思峰,楊英杰,吳利豐.灰色系統理論及其應用[M].北京:科學出版社,2014.
[4]深圳市統計局.深圳統計年鑒2013[M].北京:中國統計出版社,2012.
[5]MATLAB技術聯盟,劉冰.MATLAB神經網路超級學習手冊[M].北京:人民郵電出版社,2013:79-193.
The Grey Neural Network in Predicting for the TrafficAccident of Shenzhen
ZHU Zhixiong,ZHONG Yibing
(School of Mathematics and Statistics,Zhaoqing University,Zhaoqing,Guangdong 526061,China)
ractSince the road traffic system runs with strong nonlinearity and randomness,the paper uses the grey correlation analysis to find out its main effect.A combination forecast model has been established to predict the traffic accidents in Shenzhen,combining the grey system and BP neural networks with the main effects.The result shows that the forecast precision of this combination forecasting model is superior to the single gray metabolism grey metabolism model.
ordsTrafficAccident of Shenzhen;grey neural network model;the prediction of accident
TK514
A
1009-8445(2016)02-0004-05
(責任編輯:陳靜)
2015-12-18
廣東省大學生科技創新培育專項基金資助項目(pdjh2015b0575)
朱智雄(1992-),男,廣東韶關人,肇慶學院數學與統計學院2012級學生.
鐘一兵(1972-),男,湖南邵陽人,肇慶學院數學與統計學院副教授,博士.