王當利 呂雪 王雪佳 高如江
摘要:
為提高水上交通事故的預測精度,將引入弱化算子序列的灰色模型和支持向量回歸模型的預測結果進行組合,進而構建基于IOWA算子的組合預測模型。以全國和長江某流域水上交通事故歷史數據為預測樣本,將組合預測模型的預測結果與其他預測模型的預測結果進行對比。結果顯示:組合預測模型的預測精度更高,能更好地反映水上交通事故的發展趨勢。
關鍵詞:
事故預測;灰色模型;支持向量機;IOWA算子
中圖分類號: U698
文獻標志碼: A
Abstract:
In order to improve the prediction accuracy of waterway traffic accidents, the prediction results of the grey model based on weakening operator sequence and the support vector regression model are combined, and a combined prediction model based on the IOWA operator is constructed. Based on the historical data of waterway traffic accidents in China and a certain basin of the Yangtze River, the prediction results of the combined prediction model are compared with those of other prediction models. The results show that the combined prediction model is of higher prediction accuracy and can better reflect the development trend of waterway traffic accidents.
Key words:
accident prediction; grey model; support vector machine; IOWA operator
0引言
近年來,水上交通事故得到了相應的控制,但仍然是水上交通安全保障面對的較為突出的問題。水上交通事故數量是評價水上交通安全的重要指標,也是衡量水上交通管理水平的重要因素。水上交通系統較為復雜,受通航環境、船員、船舶等多因素的影響,事故發生又具有一定的偶然性和模糊性。因此,通過建立有效的預測模型對水上交通事故發生趨勢進行定量分析,對控制水上交通風險、保證船舶航行安全具有重要意義[1]。
目前,對水上交通事故預測方法的研究主要是基于灰色模型進行的,在此基礎上結合其他模型進行優化,進而建立精度更高的預測模型[2]。陳咫宇等[3]將分形理論用于水上交通事故的預測,利用分形插值方法對離散的時間序列數據進行處理,構建了基于給定時間序列的預測模型。趙佳妮等[4]在GM(1,1)模型預測的基礎上,運用馬爾科夫模型對預測結果進行優化,進而建立了灰色馬爾科夫預測模型。牛佳偉等[5]運用灰色系統理論和加權灰色關聯原理對船舶交通事故進行分析,通過建立事故總數預測模型,對不同水域未來的交通形勢進行了預測;陳海山等[6]引入灰色Verhulst預測理論,建立了水上交通事故灰色Verhulst模型;李鈴鈴等[7]先運用灰色模型對水上交通事故數量進行預測,將預測結果與原始數據進行對比,計算出殘差,再運用BP神經網絡模型對殘差進行修正,得到最終預測結果。實踐表明,單一的預測方法都有其自身的特點和缺陷,因此組合預測方法成為預測水上交通事故的新思路[89]。本文在預測方法適用性研究的基礎上,先分別建立引入弱化算子的灰色模型和支持向量回歸模型,再選用IOWA算子將這2種預測模型的預測結果進行組合,建立組合預測模型。預測結果表明,本文提出的基于IOWA算子的組合預測模型能夠有效地提高預測精度,增強預測的合理性和有效性[10]。
1水上交通事故預測單一模型
1.1改進的灰色模型
水上交通系統因其復雜性可將其視為一個灰色系統。眾多學者利用灰色系統的思想進行水上交通事故的預測,并將傳統的灰色模型加以改進。本文根據弱化算子理論和GM(1,1)的原理,構造一種改進的灰色模型。引入弱化算子對數據進行弱化處理可以更好地克服數據的波動性,從而使模型的預測效果更好。建模過程[1112]如下:
設水上交通事故的原始數據序列為
X(0)=(x(0)(1),x(0)(2),…,x(0)(n))
式中:x(0)(k)≥0,k=1,2,…,n。
引入一階弱化算子D,作用于原始數據序列,得到X(0)D。
X(0)D=(x(0)(1)d,x(0)(2)d,…,x(0)(n)d)
x(0)(k)d=ni=kx(0)(i)x(0)(n)n-i+1,
k=1,2,…,n
對X(0)D進行累加處理,可得
X(1)=(x(1)(1),x(1)(2),…,x(1)(n))
式中:x(1)(k)=ki=1x(0)(i)d, k=1,2,…,n。
X(1)的緊鄰均值生成序列為
Z(1)=(z(1)(2),z(1)(3),…,z(1)(n))
式中:z(1)(k)=12(x(1)(k)+x(1)(k-1)),k=2,3,…,n。
X(1)為呈近似指數變化的序列,其白化方程為
dx(1)(t)dt+ax(1)(t)=b
其中a、b為待定系數。用最小二乘法求解可得
=(a b)T=(BTB)TBTY
式中:
Y=(x(0)(2)x(0)(3)…x(0)(n))T
B=
-z(1)(2)1-z(1)(3)1
-z(1)(n)1
預測模型為
x(1)(k+1)=x(0)(1)-bae-ak+ba(1)
經過累減還原,得
x(0)(k+1)=x(1)(k+1)-x(1)(k)
1.2支持向量回歸模型
支持向量回歸(SVR)是支持向量機(SVM)在非線性回歸估計和曲線擬合中廣泛應用而發展起來的[13]。其基本思想是:利用非線性變換,即確定適當的核函數,將需要解決的實際問題轉到高維特征空間,進而進行線性估計構造最優線性決策函數。
給定訓練數據集T={(xi,yi),i=1,2,…,l},xi∈Rm,yi∈R。若可以用Rm上的線性函數f(x)=wx+b來推斷x所對應的y值,可將回歸問題轉化為如下的優化問題:
minw,b,ξ12
w2+Cli=1(ξi+ξ*i)
s.t.
yi-(wxi+b)≤ε+ξ*i
(wxi+b)-yi≤ε+ξi
ξi,ξ*≥0,i=1,2,…,l
式中:C為懲罰函數;ξi、ξ*i為松弛變量;ε為不敏感函數閾值。
采用Lagrange乘子法,引入它的對偶問題:
min12li,j=1(a*i-ai)(a*j-aj)(xi·xj)+
εli=1(a*i+ai)-li=1yi(a*i-ai)
s. t.
li=1(a*i-ai)=0
0≤ai≤C, 0≤a*i≤C, i=1,2,…,l
對于a*i-ai≠0的訓練樣本,Lagrange乘子為支持向量機,得到回歸估計函數:
f(x)=li=1(a*i-ai)K(xi,x)+b
2基于IOWA算子的組合預測模型
2.1組合預測理論
1969年Bates等人首次系統闡述了組合預測的概念。組合預測能夠最大限度地利用各種單一預測模型的信息,比單一預測模型更系統、全面。先根據數據特征,運用多種單一預測模型進行預測,選擇其中預測精度最高的預測方法;鑒于不同的預測方法有其各自的特點和優勢,將不同的單一預測模型進行合理組合,形成組合模型。組合預測模型的一般流程見圖1。
2.2IOWA算子
IOWA算子的定義如下:設有m個二維數組
(v1,a1),(v2,a2),…,(vm,am),滿足
fw((v1,a1),(v2,a2),…,(vm,am))=
mi=1wiav_index(i))
則fw是由v1,v2,…,vm所產生的m維誘導有序加權平均算子,記為IOWA算子,其中:vi為ai的誘導值;av_index(i)為v1,v2,…,vm按從大到小順序排列的第i個數所對應的a值;W=(w1,w2,…,wm)T是IOWA算子的加權向量,其中
mi=1wi=1, wi≥0
設實際值為xt(t=1,2,…,N),共有m種單一預測方法進行預測,xit為第i種單一預測方法第t時刻的預測值。若
ait=
1-(xt-xit)/xt,(xt-xit)/xt<1
0,(xt-xit)/xt≥1
(2)
則稱ait為第i種單一預測方法在第t時刻的預測精度,同時滿足ait∈[0,1]。預測精度ait視為預測值xit的誘導值,第t時刻m種單一預測方法的預測精度和其相應的預測值就構成了m個二維數組
(a1t,x1t),(a2t,x2t),…,
(amt,xmt)。
2.3基于IOWA算子的組合預測模型建立
在傳統的組合預測模型中,各單一預測模型在整個時間序列區間上賦權系數不變,但組合預測模型中單一預測模型在不同時點的預測精度可能不同,IOWA算子能夠彌補不同單一預測模型在不同時點預測精度不同的這一局限。
設W=(w1,w2,…,wm)T為各單一預測方法在組合預測中的有序加權平均向量,將m個單一預測方法在第t時刻的預測精度a1t,a2t,…,amt按從大到小的順序排列,根據上述定義可得組合預測模型的預測值公式為
fw((a1t,x1t),(a2t,x2t),…,(amt,xmt))=
mi=1(wixa_index(it))(3)
實際上各種單一預測方法的預測精度不同,因此組合預測的權重系數與單一預測方法時間序列上不同時刻預測精度的大小有關。
設ea_index(it)=xt-xa_index(it),N期組合預測誤差的總的平方和為
S=Nt=1xt-mi=1wixa_index(it)2=
mi=1mj=1wiwj
Nt=1ea_index(it)ea_index(jt)(4)
則新的基于IOWA算子的組合預測模型可表示為
min S
s. t.
mi=1wi=1, wi≥0
2.4評價準則
需要對預測模型進行評價以驗證其合理性。按照整體評價預測方法的原則和慣例,一般采用5項指標進行評價。實際值序列為(xt,t=1,2,…,N),預測值序列為(x^t,t=1,2,…,N)。根據組合預測效果評價的原則,采用平方和誤差、均方誤差、平均絕對誤差、平均絕對百分誤差、均方百分誤差這5項誤差指標對預測模型進行評價,其計算公式分別為
ESS=Nt=1(xt-x^t)2(5)
EMS=1NNt=1(xt-x^t)2(6)
EMA=1NNt=1xt-x^t(7)
EMAP=1NNt=1xt-x^t/xt(8)
EMSP=1NNt=1(xt-x^t/xt)2(9)
3實例分析
以2001—2014年我國水上交通事故數據為原始數據(見表1),分別建立2個單一預測模型和基于IOWA算子的組合預測模型,進行水上交通事故分析和預測。通過與前人所構建的灰色Verhulst模型和灰色馬爾科夫模型的對比,證明基于IOWA算子的組合預測模型的預測精度更高。對長江某流域2012—2016年水上交通事故進行預測,驗證本文所構建的組合預測模型的合理性及普遍性。2004—2016年長江某流域水上交通事故數據見表2。
由圖2可知,改進的灰色模型的預測結果能滿足水上交通事故預測的要求,并且較好地克服了傳統灰色模型數據離散、隨機等缺點,預測精度更高。根據式(10)對2014年全國水上交通事故數量進行預測,得到2014年的事故數量為252起。同理,按照改進的灰色模型的計算步驟,以表1中2001—2007年的數據為原始數據對2008—2013年的事故數量進行預測,結果見表3。
3.1.2支持向量回歸模型
支持向量回歸模型通常運用MATLAB進行編程。本文選用LibSVM軟件包進行預測數據處理和數值計算。LibSVM是一個簡單的、易于使用和快速有效的模式識別與回歸的軟件包,對所涉及的參數調節相對比較少,提供了很多的默認參數。
以表1中2001—2007年的數據為訓練數據集,以2008—2014年的數據為測試數據集,模型預測過程如下:
(1)利用FormatDataLibsvm.xls將原始訓練數據集和原始測試數據集轉化為所需要的格式。
(2)利用LibSVM對數據進行歸一化處理,消除變量間的量綱關系,使數據具有可比性。
(3)利用gridregression.py函數進行參數尋優。參數主要有懲罰函數C、核函數g和損失函數ε。
(4)利用svmtrain對最優參數進行模型訓練。
(5)利用svmpredict對測試數據集進行預測。
通過上述5步最終確定,這個模型采用徑向基函數為核函數時的回歸效果最佳,其中C=2.2, g=2.8,ε=0.01,預測結果見表3。
3.1.3基于IOWA算子的組合預測模型
根據式(2),計算改進的灰色模型和支持向量回歸模型對2008—2014年我國水上交通事故數量的預測精度,結果見表3。
設x^t為基于IOWA算子的組合預測模型的預測值,根據式(3),則有
x^t=fw((a1t,x1t),(a2t,x2t))=
w1xa_index(1t)+w2xa_index(2t), t=1,2,…,7(11)
將表3中計算得到的預測值代入式(11),得到
x^1=w1×348+w2×335, x^2=w1×352+w2×344,
x^3=w1×338+w2×342, x^4=w1×301+w2×305,
x^5=w1×274+w2×286, x^6=w1×264+w2×269,
x^7=w1×252+w2×269
將上述公式代入式(4),整理得到基于IOWA算子的組合預測模型。
min S=min(102w12+832w22+352w1w2)
s.t.
w1+w2=1
wi≥0, i=1,2
將上述公式利用MATLAB最優化工具箱求解,得到w1=0.982 2,w2=0.017 8,將其代入式(11),可得到基于IOWA算子的組合預測模型的預測值。
為驗證本文所建立的組合預測模型的預測精度,選用灰色Verhulst模型和灰色馬爾科夫模型對2008—2014年我國水上交通事故數量進行預測,將預測結果與組合預測模型的預測結果進行對比。
3.2灰色Verhulst模型
灰色Verhulst模型建模過程如下:(1)取X(1)=(342,359,331,298,270,262,260),見表1中2008—2014年我國水上交通事故數量歷史數據。(2)對X(1)進行累減得到X(0)=(342,17,-28,-33,-28,-8,-2)。(3)對X(1)做緊鄰均值生成,則Z(1)=(350.5, 345.0, 314.5, 284.0, 266.0, 261.0)。(4)x(0)+az(1)=b(z(1))2為灰色Verhulst模型,求解方程為
x^(1)k+1=ax(0)1bx(0)1+(a-bx(0)1)eak
根據MATLAB求得
=(0.145 40.000 3)T,x^(1)k+1=49.730.102 6+0.042 8e0.145 4k。(5)取x(1)0=x(0)1=342,根據上述公式得到灰色Verhulst模型的預測值。
3.3灰色馬爾科夫模型
用2001—2007年全國水上交通事故的歷史數據預測2008—2014年全國水上交通事故數量。灰色馬爾科夫模型建模步驟如下:
(1)建立GM(1,1),經過檢驗后得a=0.115 3,b=842.785 6。白化方程的解為
x(1)(k+1)=x(0(1)-bae-ak+ba
y=x(1)(k+1)-x(1)(k)=814.524 3e-0.115 3k
(2)狀態劃分。根據2007年的擬合值來修正2008年的預測值,計算得到2001—2009年全國水上交通事故數量的相對殘差分布區間為(-11%,5%]。將擬合序列按照相對殘差值劃分為4個狀態N1~N4,其分別對應殘差值區間(-11%, -7%]、(-7%, -3%]、(-3%, 1%]、(1%, 5%]。各年全國水上交通事故所處的狀態見表4。
2007年全國水上交通事故所處的狀態為N3,因此經過一年的狀態轉移,可以認為2008年的全國水上交通事故最可能處于狀態N1或N4。根據x(0)(k)=x^(0)(k)1-ω(0)(k),求得2008年的全國水上交通事故數量為353起。
將2001年的事故數量去掉并加入2008年的事故數量求得2009年的事故數量,其他年份的求解步驟同上,預測值見表5。
由表5可知,以改進的灰色模型和支持向量回歸模型預測值為結果而構建的基于IOWA算子的組合預測模型預測精度較高,相對誤差小,數據波動性相對較小,擬合效果更好,證實了基于IOWA算子的組合預測模型預測效果優于單一預測模型和傳統的預測模型的預測效果,能更為全面真實地反映水上交通事故的發展趨勢。
3.4長江某流域水上船舶交通事故的組合預測
為驗證本文所建立的組合預測模型的普遍實用性,以長江某流域2004—2009年的水上交通事故歷史數據為原始數據對2010—2016年的交通事故數量進行預測。各模型的預測值見表6。
3.5模型評價
根據上述預測的結果,對全國及長江某流域水上交通事故預測中所選用的3種預測模型的預測誤差進行比較,對各模型預測結果的準確性進行檢驗。
根據組合預測效果評價的原則,按照式(5)~(9)分別計算各預測模型的5項誤差指標,結果見表7和8。
從5項誤差指標結果看:本文建立的基于IOWA算子組合預測模型的5項誤差值均小于灰色Verhulst模型和灰色馬爾科夫預測模型的5項誤差值;全國水上交通事故預測的效果優于長江某流域水上交通事故預測的效果。全國與長江某流域預測效果的差別與數據的波動性不同存在一定的關系,但綜合比較其他的預測方法,本文建立的組合預測方法在整個預測過程中預測性能最佳。
4結論
較為準確地預測水上交通事故數量對水上交通風險的防控具有重要的指導作用。灰色模型能夠反映水上交通事故的整體發展趨勢,再通過引入新的弱化算子降低原始數據序列的波動性,其適用性更好。支持向量機能從未知分布的小樣本中抽取最大的有用信息,解決樣本空間中的高度非線性分類和回歸等問題,利用回歸做預測能取得很好的預測效果。本文通過構建基于誘導有序加權平均(IOWA)算子的組合預測模型,克服了傳統的組合預測模型中各單一預測模型在整個時間序列區間上賦權系數不變的局限。通過對全國和長江某流域水上交通事故數量的預測,進行全局和局部實例分析,證實本文所構建的組合預測模型能有效降低預測誤差,可作為水上交通事故預測的一種新方法。
參考文獻:
[1]WU Chaozhong, MA Lili, ZHANG Baogang, et al. Study on indicators choosing for navigation safety assessment of Three Gorges Reservoir Areas based on Delphi method[C]//2009 AsiaPacific International Conference on Information Processing, 2009(2): 282285.
[2]BEZUGLOV A, COMERT G. Shortterm freeway traffic parameter prediction: application of grey system theory models[J]. Expert Systems with Applications, 2016, 62: 284292.
[3]陳咫宇, 胡甚平, 郝嚴斌. 基于分形理論的水上交通事故預測[J]. 上海海事大學學報, 2009, 30(3): 1821.
[4]趙佳妮, 吳兆麟. 基于灰色馬爾可夫模型的水上交通事故預測[J]. 大連海事大學學報, 2005(4): 1720.
[5]牛佳偉, 李連博. 灰色加權理論在海損事故分析與預測中的應用[J]. 中國航海, 2016, 39(3): 6367.
[6]陳海山, 危強. 灰色Verhulst模型在水上交通事故預測中的應用[J]. 中國航海, 2013, 36(2): 6769.
[7]李鈴鈴, 仇蕾. 基于灰色神經網絡組合模型的水上交通事故預測[J]. 交通信息與安全, 2014, 32(3): 111113. DOI: 10.3963/j.issn.16744861.2014.03.022.
[8]孫軼軒, 邵春福, 計尋, 等. 基于ARIMA與信息粒化ARIMA組合模型的交通事故時序預測[J]. 清華大學學報, 2014, 54(3): 348353. DOI: 10.16511/j.cnki.qhdxxb.2014.03.004.
[9]薛明浩, 端木京順, 甘旭升, 等. 基于DS證據理論的飛行事故預測模型[J]. 安全與環境工程, 2015, 22(3): 117121. DOI: 10.13578/j.cnki.issn.16711556.2015.03.022.
[10]劉香云. 基于灰色關聯度的道路交通事故組合預測方法研究[D]. 北京: 北京交通大學, 2015.
[11]陳昌源, 戴冉, 馮紀軍, 等. 改進灰色模型在海上交通綜合安全指數預測應用[J]. 中國航海, 2017, 40(1): 5863.
[12]陳昌源, 戴冉, 牛佳偉, 等. 改進的灰色理論在海上交通事故預測中的應用[J]. 船海工程, 2016, 45(6): 6771. DOI: 10.3963/j.issn.16717953.2016.06.015.
[13]CHEN Yibo, TAN Hongwei. Shortterm prediction of electric demand in building sector via hybrid support vector regression[J]. Applied Energy, 2017, 204: 1363137.
(編輯趙勉)