李素蘭 張謝東 李紅偉 孫 琳
(武漢理工大學交通學院1) 武漢 430063) (武漢市橋梁維修管理處2) 武漢 430015) (河海大學土木與交通學院3) 南京 210098) (武漢市交通科學研究所4( 武漢 430015)
天氣是影響高速公路運行的重要因素.數(shù)據(jù)表明,雨雪天氣交通事故比晴天多25%[1-2].我國是高速公路通車里程最多且災(zāi)害天氣頻發(fā)的國家,災(zāi)害天氣下高速公路交通安全風險分析尤為重要.
風險評估方法包括專家調(diào)查法、故障樹分析、事件樹分析、數(shù)據(jù)包絡(luò)分析法、層次分析法、模糊綜合評判法、貝葉斯網(wǎng)絡(luò)、Logit模型.專家調(diào)查法[3]簡單直觀,但調(diào)查時間較長,受專家主觀影響較大.故障樹分析[4]表達直觀,邏輯性強,可用于定量、定性分析,缺點是復(fù)雜系統(tǒng)故障樹的設(shè)計過程較復(fù)雜,且僅考慮正常和失效兩種狀態(tài).事件樹分析[5]能明確危險擴大的原因及危險發(fā)生概率,隨著復(fù)雜系統(tǒng)失效因素的增加,產(chǎn)生大量的冗余分支.層次分析法[6]可靠性高、誤差小,但很難處理因素眾多的問題,評估結(jié)果主觀性較強、且判斷矩陣難以滿足一致性要求.模糊綜合評判法[7]適宜于評價因素多、結(jié)構(gòu)層次多的系統(tǒng),但不能解決評價指標間相關(guān)造成的評價信息重復(fù)問題.貝葉斯網(wǎng)絡(luò)[8]能解決復(fù)雜問對于一些簡單的問題,只是貝葉斯網(wǎng)絡(luò)的建造偏復(fù)雜.基于Logit回歸的風險評估模型[9-11]簡單,自變量不需要滿足正態(tài)分布,評估精度較高,是目前風險評估的主流方法.Logit模型使用時要求自變量相互獨立;自變量數(shù)目不能太多.高速公路交通安全風險評估建模時自變量種類和數(shù)量較多,自變量之間存在相關(guān)關(guān)系.風險評估的因變量是風險等級,具有離散、非連續(xù)且存在邏輯大小順序的特性,因此,選擇累計Logit模型作為原始模型.
本文對累計Logit模型進行改進,利用主成分分析降低自變量數(shù)量,使得自變量之間相互獨立,使新的自變量符合累計Logit回歸模型的使用條件.
主成分分析將多個存在相關(guān)性的自變量化成少數(shù)互不相關(guān)的綜合自變量,在一組變量中尋找方差,由原始變量線性組成新自變量[12]用不相關(guān)且數(shù)量較少的新變量包含絕大部分原始自變量的信息來處理原始自變量共線問題,,以滿足Logit模型對自變量數(shù)量少和相互獨立性的要求.主成分轉(zhuǎn)換見式(1).
Fi=ai1X1+ai2X2+···+aipXp
(1)
式中:Fi為第i個主成分,i=1,2,…,m;a=(ai1,ai2,…,aip)為第i個特征根λi對應(yīng)的特征向量,a為單位向量;Xj為原始變量,j=1,2,…,p,p為原始變量的數(shù)量.
研究者用累計方差貢獻率選擇主成分的數(shù)量,當前m個主成分的累計方差貢獻率接近或大于80%時,主成分分析可實現(xiàn)保留絕大部分信息的自變量降維和獨立的目的和[13].
本文數(shù)據(jù)來自滬寧高速無錫段的實測數(shù)據(jù).為保證模型適用范圍的廣泛性,變量取值時,首先參考國家或地方政府的標準規(guī)范,當沒有相關(guān)標準時,根據(jù)實測數(shù)據(jù)統(tǒng)計結(jié)果確定取值范圍.
因變量為運行速度,為保證方法使用的廣泛性,結(jié)合文獻[14],將因變量分為四級,見表1.

表1 高速公路交通安全風險評估變量及取值
自變量包括天氣、交通流與交通標志三類.
1) 天氣 包括天氣等級、天氣持續(xù)時間和覆蓋率.由于數(shù)據(jù)調(diào)查地點為江蘇省境內(nèi),因此按照江蘇省氣象局發(fā)布的《氣象災(zāi)害預(yù)警信號等級以及防御指南》確定天氣等級的取值[15];根據(jù)災(zāi)害天氣持續(xù)時間,將持續(xù)時間分為4個等級;霧天、雨雪結(jié)冰存在不能覆蓋整條道路的情況,因此將覆蓋率分為2個取值區(qū)間.
2) 交通流 包括流量、車型比例和車頭時距.根據(jù)24 h交通流數(shù)據(jù)變化特征,將交通量分為3個等級;大型車比例集中在20%~50%,大型車比例帶入速度與安全U形曲線,將大型車比例分為2個區(qū)間;根據(jù)車輛安全距離計算公式計算車頭時距[16],將車頭時距分為三個區(qū)間.
3) 交通標志 包括標志的清晰度和可視度.清晰度表示標志自身的文字、顏色等要素的清晰程度;可視度表示在能見度的影響下,看清交通標志信息的可視程度.按照影響程度,將清晰度和可視性分為三級.各變量取值見表1.
表2中指標變量的KMO測度值大于0.600,可以進行主成分分析;Bartlett統(tǒng)計量的顯著性水平Sig.值小于0.05,表明球形假設(shè)被拒絕,變量之間并非獨立,因此,樣本適合做主成分分析.

表2 KMO和Bartlett的檢驗
主成分可以解釋原有自變量,見表3.由表3可知,當主成分數(shù)量為3個時,累計方差貢獻率達到77.941%,信息被大部分保留,表明此時接近80%的原有變量信息被保留.所有的主成分個數(shù)為3,初始特征根:λ1=2.746,λ2=1.865,λ3=1.624,主成分貢獻率:γ1=34.323,γ2=23.312,γ3=20.306.

表3 主成分分析的解釋總方差
旋轉(zhuǎn)后的因子載荷矩陣見表4.第一主成分是交通流,第二主成分是標志;災(zāi)害天氣為第三主成分.交通量與車型比例正相關(guān),與車頭時距負相關(guān);標志標線的清晰度和可視性兩個變量正相關(guān);災(zāi)害天氣的等級和持續(xù)時間是最主要的兩個變量,且負相關(guān).

表4 主成分分析的特征向量矩陣
由特征向量矩陣得到主成分表達式分別為F1,F(xiàn)2,F(xiàn)3.
F1=-0.075x1+0.043x2-0.143x3-0.342x4-
0.318x5-0.345x6-0.003x7-0.007x8
(2)
F2=-0.032x1+0.076x2-0.147x3-0.029x4-
0.032x5+0.064x6+0.496x7+0.506x8
(3)
F3=0.501x1-0.524x2+0.199x3+0.052x4+
0.174x5-0.047x6-0.111x7-0.057x8
(4)
式中:Fj為第j個主成分,j=1,2,3,分別為交通流、標志和天氣;xi為第i原始自變量,i=,1,2,…,8.
表5為累計Logit的參數(shù)估計及檢驗值,由表5可見,模型參數(shù)的Sig值和擬合度的Sig值均小于0.05,建模完成.

表5 累計Logit的參數(shù)估計及檢驗值
回歸統(tǒng)計得到累計概率模型見式(5)~(8).
p=(y≤1|F)=
(5)
p=(y≤2|F)=
(6)
p=(y≤3|F)=
(7)
p=(y≤4|F)=1
(8)
由累計概率模型推斷出獨立概率模型即可得到災(zāi)害天氣條件下高速公路交通安全風險分析模型,如式(9)~(12).
p1=p(y=1|F)
(9)
p2=p(y=2)=P(y≤2|F)-P1(y=1|F)
(10)
p3=p(y=3)=P(y≤3|F)-P1(y=2|F)
(11)
p4=p(y=4)=1-P(y≤3|F)
(12)
累計Logit模型的參數(shù)估計的結(jié)果說明,天氣因素對交通安全風險等級起主要影響作用,交通流對交通安全風險等級的影響比交通標志的影響的大.天氣等級增大和交通流量增加后,交通安全風險等級也隨著增大.這些數(shù)據(jù)展現(xiàn)的結(jié)果與真實情況相符,因此,本文提出的主成分累計Logit模型是有效的.
對所建模型進行整體顯著性檢驗、回歸系數(shù)的顯著性檢驗和擬合優(yōu)度評價,驗證模型有效性.
1) 對數(shù)似然比檢驗 當p值小于給定的顯著性水平,認為第j個回歸系數(shù)顯著不為零,否則,認為第j個回歸系數(shù)顯著為零.Hosmer-Lemeshow檢驗結(jié)果見表6,認為模型從整體上看是顯著的.

表6 累計Logit的對數(shù)似然比檢驗
2) Wald檢驗 參數(shù)估計及檢驗值見表5,Wald統(tǒng)計量的概率p值小于給定的顯著性水平,拒絕原假設(shè),認為整體模型顯著,即回歸系數(shù)估計正確.
3) 擬合優(yōu)度檢驗 擬合優(yōu)度檢驗的-2Loglikelihood,考克斯-斯奈爾(cox-Snell)R2統(tǒng)計量和內(nèi)戈爾科(Nagelkerke)R2統(tǒng)計量見表7.由表7可知,cox-Snell統(tǒng)計量和Nagelkerke統(tǒng)計量的計算值解釋了被解釋變量60%以上的變動,模型的擬合優(yōu)度比較高.

表7 累計Logit的擬合優(yōu)度檢驗
利用寧滬高速無錫段采集的數(shù)據(jù)建立基于主成分分析的累計Logit模型. 用相同的數(shù)據(jù),對比分析改進模型和累計Logit模型對災(zāi)害天氣下高速公路風險評估的準確性.對比分析結(jié)果見表8.
1) 風險等級為I級時,評估精度最高;風險等級為II級、III級時評估精度居中,且二者相同;風險等級為Ⅳ時,評估精度最低.由于風險應(yīng)急主要針對I,II,III級風險,所以本文建立的模型滿足使用要求.
2) 累計Logit模型評估精度明顯小于主成分累計Logit模型.主成分累計Logit模型系數(shù)顯著為零,累計Logit模型顯著性系數(shù)為0.12,說明災(zāi)害天氣下,主成分累計Logit模型比累計Logit模型更適合做為高速公路風險評估模型.

表8 改進累計Logit方法的驗證結(jié)果
通過相關(guān)性分析發(fā)現(xiàn)因素之間存在很強的相關(guān)性.車頭時距與交通流量相關(guān)性最高,達到0.942;車頭時距與大型車比例,標志清晰度與標志可視性相關(guān)性次之,分別為0.784和0.781;持續(xù)時間、交通量、與交通標志相關(guān)性系數(shù)小于0.5,不具有相關(guān)性.
由此可知,Logit模型評估精度確實受自變量相關(guān)性影響,當自變量相關(guān)時,可以利用主成分分析,將自變量降維、獨立化后,再使用Logit模型.
本文利用寧滬高速無錫段采集的數(shù)據(jù)建立模型,蘇州段采集的數(shù)據(jù)驗證模型的準確率,將132條數(shù)據(jù)帶入改進的Logit模型,得到各風險等級的準確率,如表9所示.
Ⅳ級風險的評估錯誤是將風險級別極低的Ⅳ級風險評估為風險水品稍高的III級風險;III級風險的評估錯誤主要是將III級風險評估為Ⅱ級風險;II級風險的評估錯誤主要是將II級風險評估為I級風險;I級風險的評估錯誤主要是將I級風險評估為II級風險.由于高級別的風險應(yīng)對措施對低級別的應(yīng)對措施有效;I級風險發(fā)生概率較小,卻評估精度較高,因此,本文建立的模型實用性滿足要求.

表9 改進累計Logit方法的驗證結(jié)果
1) “KMO檢驗”和“Bartlett球度檢驗”及自變量相關(guān)性分析論證了高速公路交通安全風險影響因素存在較強的相關(guān)性,不能直接使用Logit模型評估其風險等級,可以利用主成分分析將影響因素降維處理以滿足Logit模型要求自變量相互獨立的要求.
2) 主成分分析結(jié)果說明高速公路交通安全影響因素包括三個主成分,分別是天氣、交通流、交通標志.天氣因素對風險等級起主要影響作用,交通流對風險等級的影響比交通標志的影響的大.天氣等級增大和交通流量增加后,交通安全風險等級也隨著增大.
3) 交通量與車型比例正相關(guān),與車頭時距負相關(guān);交通標志的清晰度和可視性正相關(guān);災(zāi)害天氣的變量中,災(zāi)害天氣的等級和持續(xù)時間是最主要的兩個變量,二者負相關(guān).
4) 模型對各等級評估精度不同,風險等級越高,評估精度越高;模型存在將風險等級評估高一個級別的可能,由于風險應(yīng)急主要針對Ⅰ、Ⅱ、Ⅲ級風險,高級別的風險應(yīng)對措施對低級別的應(yīng)對措施有效,所以本文建立的模型滿足使用要求.
參考文獻
[1] 雷海超.高速路“趴窩”有失公平效率[EB/OL].[2017-11-02].http://finance.jrj.com.cn/opinion/2012/05/06213613007515.shtml.
[2] 柳本民.災(zāi)害性天氣下高速公路運行安全控制技術(shù)研究[D].上海:同濟大學,2008.
[3] 吳堅,黃俊,李升連,等.基于專家調(diào)查法的公路隧道洞口失穩(wěn)風險分析[J].地下空間與工程學報,2009,5(1):1407-1411.
[4] 杜潔.基于故障樹技術(shù)的鐵路信號設(shè)備故障診斷專家系統(tǒng)的實現(xiàn)方法研究[D].北京:北京交通大學,2009.
[5] 解家畢,孫東亞.事件樹法原理及其在堤壩風險分析中的應(yīng)用[J].中國水利水電科學研究院學報,2006,4(2):133-137.
[6] 李鳳偉,杜修力,張明聚,等.改進的層次分析法在明挖地鐵車站施工風險辨識中的應(yīng)用[J].北京工業(yè)大學學報,2012,38(2):167-172.
[7] 蔡豐.基于模糊綜合評價的工程項目進度管理研究[D].天津:天津大學,2007.
[8] 楊宇杰.事故樹和貝葉斯網(wǎng)絡(luò)用于潰壩風險分析的研究[D].大連:大連理工大學,2008.
[9] 劉建軍.高速公路項目運營風險預(yù)警與控制研究[D].武漢:武漢理工大學,2010.
[10] YANG J S, SUN H Y, WANG L, et al. Vulnerability evaluation of the highway transportation system against meteorological disasters [J]. Procedia-Social and Behavioral Sciences, 2013,96(6):280-293.
[11] JACEK S. The simulation-fuzzy method of assessing the risk of air traffic accidents using the fuzzy risk matrix[J]. Safety Science, 2016,88:76-87.
[12] 徐鋮鋮,劉攀,王煒,等.惡劣天氣下高速公路實時事故風險評估模型[J].吉林大學學報(工學版),2013,43(1):68-73.
[13] JUNG S, QIN X, NOYCE D A. Rainfall effect on single-vehicle crash severities using polychotomous response models [J]. Journal of Accident Analysis and Prevention, 2010,42(1):213-224.
[14] ZHENG Z D, LEE J, SAIFUZAMAN M, et al. Exploring association between perceived importance of travel/traffic information and travel behavior in natural disasters: a case study of the 2011 Brisbane floods [J]. Transportation Research Part C, 2015,51:243-259.
[15] 江蘇省氣象局.氣象災(zāi)害預(yù)警信號等級以及防御指南[EB/OL].[2017-11-02].https://wenku.baidu.com/view/e3e0e68d6529647d272852f7.html.
[16] 陸鍵,張國強,馬永鋒,等.公路交通安全設(shè)計理論與方法[M].北京:科學出版社,2011.