洪 東
(廣西交通職業技術學院,廣西 南寧 530023)
目前我國經濟正處于高速發展的時期,經濟的發展,帶動了交通的繁榮。然而交通安全問題給人民群眾的生活帶來嚴重的影響。2020年我國公安部下發了道路交通事故預防“減量控大”的工作方案和提出道路交通事故預防工作部署。根據公安部的這一重大工作部署,廣西要求各地市把道路交通事故預防“減量控大”的工作作為交通管理工作的重中之重加以落實。
近年來,南寧市的交通安全形勢也并不容樂觀。2018年南寧市發生涉及貨運、客運車輛事故共826起,死亡人數283人。2019年,共發生道路交通事故3 383起,死亡636人,受傷3 515人,直接財產損失1 675萬余元,總體來看,事故量呈上升態勢。交通事故頻發引起全社會的極大關注,人民群眾對交通安全治理的呼聲越來越大。
因此,本文運用大數據技術及邏輯回歸算法,對道路運輸企業(南寧區域)相關數據進行分析,圍繞交警、運管部門的管理需要,結合道路運輸企業的利益訴求,分析西部地區道路崎嶇、山路多彎、橋隧比高等外在因素,提出道路運輸交通安全預警這一迫切需求,即構建一個覆蓋運輸企業交通安全因素的預警模型,對風險進行預測,保障企業運輸安全;再建立風險預警機制,全力以赴抓好企業隱患源頭治理,扎實推進“減量控大”工作,降低風險、減少事故。
根據當前現狀及存在問題,結合南寧市道路條件及運輸環境特點,根據道路交通風險源分類,調研分析已有事故數據,再收集和驗證對比數據,發現影響交通安全的風險主要有駕駛人員、運輸車輛、道路缺陷、環境因素和組織管理這5個方面。因此,重點對這些方面因素進行研究。
依托廣西壯族自治區交通運輸廳、南寧市交警支隊及其管轄的運輸企業資源優勢,整合公安部公安交通管理大數據分析研判平臺、公安部公安交通管理“六合一”平臺等相關數據信息,并從各地市交警部門、道路運輸發展中心、公路發展中心、交通運輸信息管理中心等單位采集道路運輸企業、駕駛人員、運輸車輛、道路情況和交通安全事故等相關數據信息,同時提取互聯網的接口數據,進行基礎數據采集、處理、篩選和研究。
綜合運用專家評議法、主觀評價法及相關文獻資料,分類建立一階與二階指標體系。通過層次分析法(AHP)及灰色系統理論,確定指標權重值。結合交通運輸行業特點,根據灰色預測模型、邏輯回歸算法、極大似然估計法以及梯度下降法,最終搭建出道路交通安全風險預警模型。
通過專家評議法、主觀因素評價法及相關文獻資料,結合交通風險源分類內容,構建包含人、車、路、環境、管理五個方面的道路運輸企業交通安全風險評估指標,分類建立一級指標5項,二級指標27項。通過層次分析法(AHP)及灰色系統理論,融合大數據對數據進行處理后的分析結果,確定指標權重值,將定性指標變為定量指標。指標內容與權重系數如表1所示。

表1 道路運輸企業交通安全風險評估指標體系表
根據評價指標體系,運用評價灰類和大數據技術,將風險分為高風險(f1)、較高風險(f2)、一般風險(f3)、較低風險(f4)和低風險(f5)5個等級,借鑒白化權函數并構造5個風險分類函數,采用“5、4、3、2、1”定量數字代表“好、較好、一般、較差、差”5 個等級評價。5個風險等級函數如下:
結合交通運輸行業特點,根據灰色預測模型、邏輯回歸算法、極大似然估計法以及梯度下降法,搭建出交通安全風險預警模型。
(1)建立邏輯回歸預測模型。以駕駛人員、運輸載體、道路條件、環境因素和組織管理這5個因素為X值,結合分析為Y,綜合結合線性回歸函數sigmoid函數,運用Python的Numpy 和 Matplotlib 庫完成雙函數的程序編寫、繪制及結果預測,構建出邏輯回歸預測模型如式(1)所示:
(1)
(2)邏輯回歸預測模型學習。根據邏輯回歸預測模型的取樣訓練,采用最大似然估計法(MLE)和似然函數,運用Python完成損失函數圖像繪制,通過取對數構建出損失函數模型如式(2)和圖1所示:
(2)

圖1 模型算法推演過程示意圖
(3)模型優化獲取最佳參數值。根據損失函數的結果,結合樣本數據進行分析,采用梯度下降算法對取樣數據進行迭代來求出其最佳的參數值。如圖2所示。

圖2 模型優化流程圖
基于Hadoop環境,將分別采集的事故數據、違法數據、車輛數據和企業數據等信息,經過大數據處理和指標權重評分后,通過預警模型計算風險向量作為特征值。現提取2018—2019年南寧市5家企業數據進行計算,得出120組數據進行模型訓練。
在Python環境下應用邏輯回歸算法進行訓練,5類因素指標體系樣本數據分布情況如圖3所示。
在Python環境下訓練,單因素影響目標變量分布情況如圖4所示。

圖3 5類因素指標體系樣本數據分布圖

圖4 單因素影響目標變量分布圖
根據訓練結果,將5家企業2018年20組(9~12月)數據和2019年60組(1~12月)數據,使用模型進行預測檢驗,結果顯示,預測正確率達100%。
在Python環境下測試,繪制預測結果圖情況如圖5所示。

圖5 訓練預測結果圖
提取廣西某運輸企業2019年的12組數據,使用Python 將數據導入模型進行預測。預測結果的正確率為91.7%,結果分布如圖6所示。
2019年模型測試運行后,完成南寧市5家道路運輸企業安全風險預警綜合評價,在2020年8月底成功預警兩家高風險企業,企業通過整改,9月份的事故數量同比降低23%;完成南寧市5家企業800人的交通安全行為預警,其中駕駛員行為低風險520人、較低風險200人、一般風險80人、較高風險零人、高風險零人,預警提醒范圍達到93.8%。

圖6 5類因素指標體系和預測結果圖
交警部門通過模型預警發現兩家企業存在環境因素下車輛夜間行駛比例過高的問題,立即進行排查。在排查中發現,其運營時間存在安全隱患,及時通知企業進行了整改。由此形成預警、整改、調研、回訪的風險預警整改機制。
交警部門根據預警模型中出現高風險預警的指標,對相關企業進行詳細排查,總結出排查重點,對排查重點進行安全調研,形成整改方案,讓模型服務“減量控大”總目標 ,提升民生服務質量。
本文通過駕駛人員、運輸載體、道路缺陷、環境因素和組織管理這5個因素對南寧市道路運輸企業安全風險等級開展調研、收集和分析工作,運用大數據技術將道路運輸企業安全風險的定性指標轉變成定量指標,將安全風險的二級指標體系實現模塊管理,預測模型具有可通用性,采用灰色評價法,結合邏輯回歸模型,可實現道路運輸安全風險預測。本次研究涉及的范圍、技術、算法及模型都很有限,采集的數據類型、范圍和特征還不夠全面,預測模型的試點工作開展覆蓋面也不夠廣泛,后期需進一步優化指標、模型和算法,繼續構建一個能普遍應用于西南地區其他城市的交通安全風險預警模型。