熊 睿,鄧院昌
(1.中山大學 智能工程學院,廣東 廣州 510006; 2.廣東省智能交通系統重點實驗室,廣東 廣州 510006)
隨著汽車保有量和路網密度的快速增加,交通事故頻發,造成一定人員傷亡和財產損失。相關統計數據顯示,2020年全國交通事故發生約24.5萬次,死亡人數達61 000余人,直接財產損失高達131 361萬元[1]。疲勞駕駛已經成為影響交通事故不可忽視的因素,因其造成的交通事故數量約占總體事故數量的10%~20%[2-3]。在特大事故中,疲勞駕駛導致的交通事故比例高達40%[4]。
國內外學者針對疲勞駕駛交通事故檢測進行研究:蔡素賢等[5]采用隨機森林算法對疲勞駕駛狀態進行識別;You等[6]引入改進的YOLOv3-tiny卷積神經網絡建立駕駛員疲勞評估模型評估駕駛員的疲勞狀態;徐蓮等[7]提出1種基于遷移學習的眼睛狀態識別網絡,采用PERCLOSE準則判斷駕駛員的疲勞情況。
在疲勞駕駛特點統計分析層面:劉秀等[8]研究發現貨車和私人小汽車發生疲勞駕駛交通事故的事故率高,駕齡在3 a以下、20~30歲的駕駛員、男性駕駛員等幾個群體發生疲勞駕駛交通事故的事故率較高;李都厚等[9]研究發現30歲以下的男性駕駛員和駕齡為10 a的駕駛員是疲勞駕駛的高發群體;凌晨2~6時與下午3~4時是疲勞駕駛的高發時段,高速公路上疲勞駕駛交通事故的比例遠高于普通公路。
針對疲勞駕駛交通事故的檢測問題:Naveen等[10]提出基于神經網絡的混合多模式系統用于檢測駕駛員疲勞狀態;Majkowski等[11]提出基于對照相機記錄的圖像進行分析的駕駛員疲勞癥狀檢測系統評估疲勞狀況;Joonchul等[12]利用Smart Fatigue Phone和腦電圖信號獲取疲勞狀態和唾液皮質醇濃度之間的相關性,提出未來可通過定時定量唾液皮質醇識別駕駛員疲勞狀態的設想。
針對疲勞駕駛特點統計分析問題:Sooyoung等[13]研究發現每天工作超過12 h或者駕駛公交車的職業司機發生嚴重疲勞駕駛交通事故的概率較高;Bunn等[14]研究發現與州際公路和濕潤路面相比,商用車輛駕駛員更有可能在林蔭大道與干燥路面上發生疲勞駕駛交通事故;Tefft[15]研究指出涉及駕駛員疲勞駕駛的致命性交通事故發生率比報告高350%以上。
綜上,現有研究主要集中在如何及時發現駕駛員的疲勞狀態方面,將疲勞駕駛與事故嚴重程度直接聯系起來的研究較少,而同時從人、車、路、環境和時間5個方面分析疲勞駕駛事故嚴重性影響因素的文獻則更加少見[16-18]。
基于此,本文擬采用2006—2017年廣東省1 370條疲勞駕駛事故數據,結合Logistic理論從人、車、路、環境和時間5個方面探析和定量化事故嚴重性相關因素的影響程度,研究結果可為減少和預防疲勞駕駛嚴重事故提供基礎數據支持。
為對疲勞駕駛導致的嚴重交通事故影響因素進行探究,本文將嚴重事故定義為有人員死亡或重傷的事故。在此基礎上,從事故發生年份、發生時間段、天氣3個方面對疲勞駕駛事故的事故數量和嚴重事故比例進行統計,結果如圖1所示。
圖1 不同年份、時間段和年齡段下疲勞駕駛交通事故數量和嚴重事故占比
由圖1可知,2006—2017年廣東省疲勞駕駛交通事故數量整體呈下降趨勢,2006年事故數據量相對最多;嚴重交通事故所占比例整體呈上升趨勢,疲勞駕駛交通事故數量和嚴重交通事故所占比例在凌晨時間段的數值相對較高,且2者都在4∶00~6∶00時間段達到1 d中的最大值;10∶00~12∶00,14∶00~20∶00時間段內嚴重交通事故所占比例較低,隨年齡增長,駕駛員疲勞駕駛發生嚴重交通事故的概率越高。
在2006—2017年的1 370條廣東省疲勞駕駛交通事故數據中,嚴重交通事故占比達37.52%。因此,研究如何減少和預防疲勞駕駛導致的嚴重交通事故的發生十分必要。
Logistic回歸模型是1種將概率作為因變量的非線性回歸分析方法,常用于研究分類觀察結果(因變量)與影響因素(自變量)之間的關系,如式(1)所示:
(1)
式中:P為事件發生概率;Y為因變量;X=(x1,x2,…,xn)為與因變量有關的n個自變量的集合;xi表示影響因素,可以是連續變量,也可以是分類變量;β0為常數項;βi為回歸系數。
在Logistic模型中,將事件發生概率P與事件不發生概率1-P的比值稱為發生比或者優勢比。將該發生比取自然對數,可得到線性函數如式(2)所示:
(2)
式中:α表示回歸截距。
首先,初步從人、車、路、環境和時間5個角度選擇17個變量作為自變量,為更清楚地表現各變量間的關系,對本次分析所涉及的交通事故特征變量進行賦值。
影響因素賦值及含義如表1所示。其中,年齡、駕齡、人員類型、車輛類型、道路類型、天氣、能見度以及照明條件為多分類變量,需要進行啞變量轉換,如年齡轉換賦值如表2所示。
表1 影響因素賦值及含義
表2 多分類變量年齡轉換賦值
本文選取事故嚴重程度作為因變量(記為yi),考慮交通救援在交通事故中的作用,將有人員死亡或受重傷的事故記為嚴重事故,記為yi=1,將僅有人員輕傷或財產損失記為非嚴重事故,記為yi=0。
完成自變量以及因變量的賦值及處理后,使用SPSS 22.0軟件,采用正向逐步法(條件)并選取顯著水平α=0.05進行二項Logistic回歸和參數估計。
將上述17個候選自變量進入模型,顯著水平低于α=0.05的變量將被剔除。根據軟件回歸結果,最終滿足條件的自變量見表3。
表3 參數估計結果
Logistic模型建立后,首先需要保證模型的有效性和可信度,其次才能夠進一步對模型結果進行分析和探討。因此,本文將對模型的擬合優度和擬合劣度進行檢驗。
1)模型擬合度檢驗
模型擬合度檢驗包括擬合優度檢驗(Omnbinus檢驗)與擬合劣度檢驗(Hosmer-Lemeshow檢驗),具體擬合指數如表4所示。
由表4可知,Omnbinus檢驗的卡方值為150.029,自由度為15。卡方檢驗臨界值表顯示顯著水平為0.05時,卡方臨界值為24.996,由于150.029大于24.996,Sig.值小于0.001,表明模型擬合優度好,有效性較強。對模型進行Hosmer-Lemeshow檢驗,得到卡方值為8.335,自由度為8,Sig.值為0.401。當顯著水平為0.05時,卡方臨界值為15.507,因此接受零假設,說明模型擬合劣度低,缺陷小。綜上,模型通過檢驗,可以進行結果分析與解讀。
表4 擬合度檢驗
2)結果分析
①由表3可知,在駕駛員疲勞駕駛情況下,18~25歲的駕駛員發生嚴重交通事故的概率是45歲以上年齡段駕駛員的0.580倍,25~45歲年齡段發生嚴重交通事故的概率是45歲以上年齡段駕駛員的0.658倍。這可能是因為年齡較小的駕駛員身體素質和健康狀況比較好,反應速度比較快,在發生交通事故的時候能夠在較短的時間內采取補救措施,最大限度保護自己少受傷害,從而降低嚴重事故發生概率。
②在駕駛員疲勞駕駛情況下,公務員、工人、個體戶和普通職員發生嚴重交通事故的概率分別是其他職業人員的2.727,2.183,1.517,2.016倍;農民發生嚴重交通事故的概率僅為其他職業人員的0.807倍。這是因為公務員、個體戶和普通職員工作壓力大,需要長期奔波,缺乏休息時間,工人工作量大,強度高,體力消耗大,身體容易疲乏,這幾類人員駕駛時更可能處于深度疲勞狀態,發生事故相對嚴重。農民對交通工具的需求較低,較少長途奔波,因此發生嚴重事故的概率相對較低。張旗[19]指出,最常見的疲勞駕駛原因是駕駛員睡眠不足,因此不同職業的駕駛人員發生嚴重交通事故的概率可能與其睡眠時間和質量相關。該研究結果尚需進一步驗證和研究。
③在駕駛員疲勞駕駛情況下,駕駛摩托車、客車和貨車的駕駛員發生嚴重交通事故的概率分別是駕駛其他車型的0.517,0.634,0.890倍。這可能是因為摩托車車型小,操作輕便,在發生交通事故時,采取減速、避撞等行為更容易。公安部對客車和貨車的監管嚴格,對司機疲勞駕駛的情況相當重視,因此發生嚴重事故的概率比較低。
④在駕駛員疲勞駕駛情況下,城市道路發生嚴重事故的概率是其他道路的0.302倍。這可能因為城市道路設計比較規范,行車相對安全,管理嚴格、電子警察等執法措施相對完善,對機動車駕駛員具有一定的約束作用。
⑤在駕駛員疲勞駕駛情況下,直線路段發生嚴重交通事故的概率是非直線路段的0.638倍。這可能是因為當駕駛員在非直線路段駕駛時,需要時刻注意道路線段的變化,更容易疲勞。同時,非直線路段可能存在視野盲區,駕駛員難以注意到危險因素的存在,與林慶豐等[20]的研究成果相同。
⑥在駕駛員疲勞駕駛情況下,能見度在<50 m、≥50~100 m時發生嚴重交通事故的概率分別為能見度>200 m的1.735,1.658倍。這可能是因為能見度較低時,駕駛員無法辨認前方路況,難以發現潛在危險因素,發生車輛碰撞時無法做出及時的應急反應。郭智亮等[21]研究發現,1 d時間內最低能見度通常出現在清晨,午后明顯好轉,之后又逐漸降低。這很好地印證疲勞駕駛嚴重事故占比與時間段的關系特征,間接反映本文結論的合理性。
根據前文研究結果,城市道路和非城市道路發生嚴重事故的概率相差較大,道路類型是影響疲勞駕駛交通事故嚴重程度的重要因素(Sig.<0.001)。為更具體地探究不同道路條件下疲勞駕駛交通事故嚴重程度的影響因素,本文將道路類型進一步細化為城市道路、高速公路、1級道路、2級道路和其他道路,并據此將廣東省的1 370條疲勞駕駛事故數據劃分為5個數據集,分別建立事故嚴重程度預測模型。
選取年齡、人員類型、車輛類型、道路線形和能見度作為自變量,采取正向逐步法,將顯著水平設為α=0.05。結果顯示除高速公路數據集外,其他4個數據集所對應的模型均通過擬合度檢驗。
在城市道路環境下,滿足條件的自變量如表5所示。從表5可知,在城市道路環境下,對疲勞駕駛交通事故嚴重程度具有顯著影響的因素為車輛類型和道路線形。
表5 城市道路數據集的參數估計結果
與前文不同的是,在城市道路直線路段更容易發生嚴重疲勞駕駛事故,其概率為非直線路段的3.483倍。原因可能是相比于非直線路段,司機在直線路段發生超車行為的概率較高,變道和加減速變換行為比較頻繁,容易與其他車輛形成較大的速度差,因此發生嚴重事故的概率相對較高。Zhang等[22]同樣在研究中指出直行車輛更容易造成嚴重交通事故。
根據SPSS結果,在高速公路環境下,年齡、人員類型、車輛類型、道路線形和能見度均對疲勞駕駛交通事故的嚴重程度沒有顯著影響。可能原因是高速公路的道路設計比較完善,交通監管力度嚴格,駕駛員的個人特質表現不明顯,車輛、環境要素對事故嚴重程度的影響不大,結果與陳昭明等[23]的研究相悖,有待進一步研究。
在1級道路環境下,滿足條件的自變量如表6所示。從表6可知,在1級道路環境下,能見度是影響疲勞駕駛交通事故嚴重程度的重要因素,能見度越低發生嚴重事故的概率越高。
表6 1級道路數據集的參數估計結果
在2級道路環境下,滿足條件的自變量如表7所示。從表7可知,在2級道路環境下,人員類型、車輛類型、道路線形和能見度均會影響疲勞駕駛事故的嚴重程度。相比于其他類型的道路,影響2級道路疲勞駕駛事故嚴重程度的因素最多,因此交通管理部門應該尤其重視對2級道路的監管工作。
表7 2級道路數據集的參數估計結果
普通職員發生嚴重事故的概率是其他職員的6.040倍,貨車發生嚴重事故的概率是其他類型車輛的2.056倍,直線段發生嚴重事故的概率是非直線段的2.163倍。說明在設計規范較差的2級道路中,貨車及直線道路應該是交通管理部門的重點監測對象,同時,應該適當提醒普通職員在駕車上下班的途中應保持較強的交通安全意識。
在其他道路環境下,滿足條件的自變量如表8所示。從表8可知,在其他更加低級的道路中,人員類型和能見度是影響疲勞駕駛交通事故嚴重程度的重要因素。公務員發生嚴重交通事故的概率是其他人員的8.493倍,能見度為50~100 m時發生嚴重交通事故的概率相對最高。提高能見度是減少和預防低級道路中發生嚴重疲勞駕駛事故的有效手段,針對公務員的交通安全教育也應該受到重視。
表8 其他道路數據集的參數估計結果
綜上,疲勞狀態下發生交通事故的嚴重程度與年齡、人員類型、車輛類型、道路類型、道路線形和能見度有關,不同道路條件下的事故嚴重程度影響因素有所不同。利用模型預測的結論,本文提出相關建議以減少和預防疲勞駕駛導致的嚴重交通事故的發生。
1)加強對特殊職業群體的交通安全教育。針對公務員、工人和普通職員疲勞駕駛出現嚴重事故的概率較高的問題,相關部門應對該部分群體開展交通安全教育,提高職員安全意識和責任意識,減少駕駛員疲勞駕駛傾向。重點提醒公務員和普通職員在2級及更低級道路駕駛時應保持較高的警惕性。
2)嚴格把控道路設計、完善道路設施。在規劃設計道路方面,盡量采用平直線形。若存在必須采用非平直線形的路段,應嚴格按照道路設計標準對道路的曲率、半徑等進行規范,同時應在非平直線路的路段合理設置明顯的警示標識,提醒駕駛員小心駕駛。在照明條件方面,完善道路照明設施,保證每條路段尤其是道路等級較低的路段均有路燈照明。當能見度較差時,合理設置警示標語。
3)加強交通監管力度。盡可能完善測速裝置和監控裝置布設,加強車速監督管理,嚴格控制車距,保障行車安全。重點提高城市道路和等級較低道路直線路段的速度監測和超車行為監管力度,對違法交通行為采取嚴格處罰措施,減少違法行為發生。
1)在疲勞駕駛前提下,以事故嚴重程度為因變量,以涵蓋人、車、路、環境和時間5個方面的17個因素為自變量建立Logistic模型,最終得到年齡、人員類型、車輛類型、道路類型、道路線形和能見度6個因素與事故嚴重程度顯著相關。
2)針對不同道路類型下的數據集分別建立Logistic模型,得出車輛類型、道路線形與城市道路的疲勞駕駛交通事故嚴重程度顯著相關;能見度與1級道路的事故嚴重程度顯著相關;人員類型、車輛類型、道路線形和能見度與2級道路的事故嚴重程度顯著相關;人員類型和能見度與其他更低級道路的事故嚴重程度顯著相關。
3)對Logistic模型進行檢驗,說明構建的模型具有較高的準確性和可信度。研究結果可作為相關部門從人、車、路、環境等方面預防和減少疲勞駕駛嚴重事故的基礎支持數據,也可為相關管理部門對不同類型道路制定針對性監管措施提供參考。