(3)頻繁加減速行為。
頻繁加減速行為的出現是由于交通環境的復雜,需要頻繁加速減速進行速度控制規避風險,另一種則發生在交通流擁擠時需要保證與前車有足夠的安全間距而不斷變速。首先根據a>1.2 m/s2或a<-2 m/s2對加速度進行判斷,如式(1)所示,n用來標記是否滿足判定條件,為更簡約地統計符合閾值的個數,將a>1.2 m/s2的數據標記為1,將a<-2 m/s2的數據標記為-1,其余的標記為0,然后對60 s內的1與-1進行計數,計數總數超過3個的時間區間認為公交車出現頻繁加減速的行為。
(1)
(4)急轉彎行為。
在行駛過程中速度偏高時容易發生急轉彎行為,急轉彎時橫向加速度較大,乘客容易出現失去平衡的情況,因此急轉彎行為也是影響公交車運行安全的因素。本文根據已有研究得出,急轉彎行為根據行駛平均速度及方向角變化值進行判定,以窗口長度為5的滑動窗口對數據進行遍歷,當窗口內的v>20 km/h且ω>90°時認為公交車出現急轉彎行為。轉向角計算公式如式(2)所示。
(2)
轉向角值判斷如式(3)所示,其中status表示是否滿足ω>90°這一判定條件,滿足時status為1,反之,status為0。
(3)
1.3 數據空間連接
首先,通過Python將交叉口、路段的起終點構造線要素,利用公交站、風險點位坐標構造點要素。其次,生成交叉口、路段和公交站的緩沖區,交叉口緩沖半徑設為20 m,公交站緩沖半徑設為30 m,路段緩沖半徑設為15 m。最后,完成空間連接,以風險點位數據為基準,運用sjoin函數完成對不良駕駛行為數據及dms報警數據與道路信息數據的空間連接,得到發生風險駕駛行為的空間位置(交叉口、公交站或路段)。
1.4 指標選取
本文共選取了10個常見指標,分別為平均加速度及加速度標準差、平均減速度和減速度標準差、不良駕駛行為次數和持續時間、異常駕駛行為指數、年齡、駕齡和參與工作時間。由于在不同等級道路上,公交車運行速度限制不同,故不將速度作為劃分駕駛員類別的指標。
2 畫像標簽提取
本文采用因子分析中的主成分分析進行指標降維,通過因子可行性驗證,主成分分析后得出KMO值為0.810,表明各指標之間有較強的相關性。
通過SPSS降維中的因子分析功能,選擇主因子分析并描述其系數相關性矩陣及KMO和巴特利特球形度檢驗,利用最大方差法進行因子旋轉得出其旋轉后的解,并輸出旋轉后的成分矩陣如表1所示。

表1 旋轉后的成分矩陣
根據載荷絕對值越大的因子與變量越接近的規則,特征變量共分為3類,成分1與平均加速度、平均減速度、加速度標準差及減速度標準差較為靠近,這類速度皆與速度相關參數相關,故將這一類參數構成的特征變量命名為駕駛風格偏好特征變量;成分2與年齡、駕齡、不良駕駛行為持續時間及不良駕駛行為總數較為密切,不良駕駛行為多與駕駛員的自身特征相關,故將此類命名為駕駛員個體偏好特征變量;成分3與異常駕駛行為指數及參與工作時間相關,2個指標代表了駕駛員的安全態度及駕駛經驗,故將此類命名為違規偏好特征變量。
3 聚類分析
聚類方法采用K-means聚類,對數據進行歸一化處理后,通過確定的3類特征變量及相關指標分別進行聚類,并結合手肘法對最優聚類數進行判斷。
3.1 數據歸一化
為統一不同數據指標的量綱,需要對數據進行歸一化處理,方便對比每個指標之間的關系,研究中的歸一化計算公式如式(4)所示[9]。
(4)
其中,x為指標單一樣本的觀測值,μ為研究樣本中某一指標的總體平均值,σ為研究樣本某一指標的總體標準差。
3.2 K-means聚類原理
K-means聚類是一種典型的無監督學習的算法,SPSS自動設置初始中心點并把所有樣本值分到各中心點所在的類中,針對每一個類別里的所有點,計算所有點的平均值,生成新的中心點,并不斷重復迭代直至收斂。其目標函數如式(5)所示。
(5)
其中,n為數據集中點的總數目,K為聚類數,mi為簇中心位置,對于riK,當xi屬于第K個類時,riK=1否則riK=0。最終的目的是要求解mi和riK。
3.3 手肘法原理
手肘法中運用SSE的趨勢變化拐點來判斷最優的聚類數(即K值),確認最優K值。需要利用Python進行計算,SSE值公式如式(6)所示。
(6)
其中,SSE為誤差總平方和,K為最優K均值聚類數,Ci為第i簇,wp為Ci中的一個觀測值,mi為簇中心即聚類中心位置。
3.4 駕駛員駕駛行為聚類過程
通過SPSS軟件分類功能中的K-均值聚類,選擇樣本收斂準則為0,并選擇輸出聚類中心、與聚類中心的距離,從2次開始調整聚類數進行聚類,與最優K值進行比較,最終選定聚類效果好且解釋性好的K值,并對聚類結果中的類別進行命名,確定每個類別的風險程度排名。
3.4.1 駕駛風格偏好
手肘法及聚類結果如圖1(a)所示,在K=4時斜率明顯減小,故駕駛風格偏好中將駕駛員個體聚成4類,結果如表2所示,4個聚類簇中包含的個案數目較為均衡,聚類效果較好。如圖1(b)所示,平均加速度與加速度標準差成正相關,平均加速度升高則其速度標準差相應升高,同樣平均加速度與減速度成負相關。

圖1 駕駛風格偏好特征結果
對聚類結果進行分析可以看出,如表(3)所示,聚類共得出4個類別,根據其聚類中心偏離0的程度可以判斷其駕駛行為的激進與否,分為激進型、較激進型及平穩型3大類。故將各類別命名如表3所示,其中激進型駕駛員其加速度相關指標的風險程度大,需要對其加速度指標進行持續監控并進行督促、改進,并加強駕駛技能和駕駛平穩性的培訓,而平穩型駕駛員的相對風險程度較小。
3.4.2 駕駛員個體偏好
通過手肘法判斷如圖2(a)所示,斜率突變發生在K=4時,故將K=4作為最優K值,并將其可視化為散點圖,如圖2(b)所示,駕齡與不良駕駛行為數及不良駕駛行為持續時間呈負相關,不良駕駛行為次數越多其持續時間越長,聚類后分類較為明顯,結合表4,聚類后的個案在每個類別中分布均勻,聚類效果較好。

圖2 駕駛員個體特征結果

表4 駕駛員個體偏好聚類各類別數量
如表5所示,對聚類中心進行分析可以看出年齡及駕齡中類別3最高、類別4最低,據此依照年齡將駕駛員分為年長駕駛員、中年駕駛員及年輕駕駛員3類,根據駕齡將駕駛員分為成熟型、進階型及新手型3類,并根據不良駕駛情況將駕駛員分為平穩駕駛型、較平穩駕駛型、較風險駕駛型及風險駕駛型,故將各類別命名如表5所示,其中年輕新手風險型駕駛員在駕駛員中風險程度更大,而年長成熟平穩型駕駛員的不良駕駛行為最低,即風險程度小于其他3類駕駛員。
3.4.3 違規偏好
違規偏好是以駕駛員產生異常駕駛行為等分散駕駛員注意力的危險行為為指標進行聚類,找出其參與工作時間與其違規偏好的規律。手肘法結果如圖3(a)所示,其在K=3和K=6時均出現斜率突變的拐點,為了更清晰簡潔地解釋聚類結果,最終確定以K=3作為最優得到K值。如散點圖3(b)所示,參加工作時間與異常駕駛行不具有正負相關性,如表6所示,聚類后的3個類別的分類明顯,聚類效果較好。

表6 違規偏好聚類各類別數量
對聚類中心進行分析,如表7所示,3類可分為工作時間短且異常駕駛行為少、工作時間長且異常駕駛行為少及工作時間短且異常駕駛行為多的3類駕駛員,第二類駕駛員的異常駕駛行為指數高于平均值,解釋為參與工作時間越久的駕駛員經驗豐富,對自己的能力非常自信,使得其安全意識有所下降。本文對這3類駕駛員的類別進行命名,其中危險型駕駛員需要進行密切關注,風險程度明顯高于其他2類,安全型駕駛員的風險程度在3個類別中最低。

表7 違規偏好最終聚類中心
3.5 駕駛員風險駕駛行為畫像
根據每個特征變量的聚類結果,每個特征劃分了3或4個類別,均存在風險程度高低的變化,能夠從中判斷出需要特別關注的公交駕駛員個體及群體。對結果中每個駕駛員在各個特征中的類別劃分進行排列組合,將包含嚴重風險的駕駛員歸為一類,具體劃分標準為:若駕駛員在某一個特征中出現在風險嚴重程度最高的類別,則將其劃分為高風險人群;若駕駛員在多項特征中皆為風險程度排名中間的類別,則將其劃分為中風險人群;其余駕駛員則劃分為低風險駕駛員。最后將駕駛員劃分為3類風險等級,劃分結果如表8所示。

表8 駕駛員風險類型劃分
將畫像后的3類駕駛員的3個特征變量制作成箱線圖,如圖4所示,通過分布可以看出當駕駛員風險等級升高時,整體加速度分布都不斷升高,中低風險的數據更加集中,高風險駕駛員的數據較為分散,可解釋為部分駕駛員在某一特征中的風險程度較大,極具危險性,因此被劃入高風險駕駛員人群。

圖4 各風險等級駕駛員不同特征下的箱線圖
3.6 高風險駕駛員風險駕駛行為畫像
上文所識別的不良駕駛行為數量較多,經對比,頻繁加減速行為數量明顯高于其他行為,且樣本量大,故對其進行進一步研究。
如圖5所示,速度主要分布區間為14 km/h~28 km/h,分布較為集中,在公交站位置的頻繁加減速行為最多,與公交車進出站的行為相匹配;而路段位置的速度分布曲線相較于公交站和交叉口更偏于高速。對比加速度,加速度分布多大于0,僅有少部分點位于-2.5 m/s2附近,3個不同位置的加速度中值。

圖5 頻繁加速和減速行為不同指標分布
異常駕駛行為中接打電話報警及駕駛員異常報警樣本量過低,故未考慮這2類報警類型。下文將通過分神駕駛及疲勞駕駛報警2個類型,進一步探究高風險駕駛員人群在各報警類型中的特征。
如圖6和圖7所示,疲勞駕駛行為的速度分布更加分散,公交站位置分布在0~40 km/h,交叉口及路段位置分布在0~50 km/h,而分神駕駛行為在公交站及交叉口處的分布相近,為8~15 km/h,路段位置速度集中在0~30 km/h。疲勞駕駛行為的分布區間上限均高于分神駕駛行為,具有更大的風險性。

圖6 疲勞駕駛行為速度相關指標分布
加速度分布中,疲勞駕駛行為出現多個峰值,公交站位置中,加速度值在±3 m/s2附近出現了較明顯的峰值,而路段位置主要集中在0附近。分神駕駛行為的加速度范圍明顯低于疲勞駕駛行為,公交站位置分別在3 m/s2和0附近出現明顯峰值,在路段中,加速度小于0的分布在-1.4 m/s2附近,在負值范圍內相較于公交站和交叉口出現更大減速度值。故高風險駕駛員在疲勞駕駛和分神駕駛中擁有更大的加速度絕對值,且疲勞駕駛的加速度和減速度具有更大的風險性。
如圖8和圖9所示,從提取到異常駕駛行為發生時的實際運營里程(距離包含了加氣和充電環節)可以看出,出現疲勞駕駛頻數最高的實際里程分布在13.3 km、15.5 km、17.6 km附近,在路段位置的發生里程在27 km附近出現了較高頻率,而分神駕駛的發生實際運營里程主要集中在15 km附近,與疲勞駕駛較為相似。5條公交線路的長度為15~25 km,從圖中可以看出疲勞駕駛及分神駕駛多出現在運營路線的后半程中。

圖8 疲勞駕駛行為運營里程指標分布

圖9 分神駕駛行為運營里程指標分布
綜上所述,在以上3個最常發生的風險駕駛行為中,高風險駕駛員在公交站和路段上出現了更多的風險駕駛行為,且在速度和加速度2個指標中的分布范圍更加更廣,存在風險較高的值,在實際運營里程方面,分布相似且主要集中于15~17 km。
4 結語
本文對公交車駕駛員進行風險駕駛行為聚類,并對高風險駕駛員在特定時空場景下的風險駕駛行為進行特征畫像。本文采用了K-means聚類算法對115名公交車駕駛員進行駕駛行為聚類分析,根據聚類結果的風險程度進行統計分析,將駕駛員劃分為低風險型、中風險型及高風險型。高風險駕駛員速度偏好特征中各項指標高于平均值,駕駛更激進;駕駛員個體特征中不良駕駛行為次數高于均值,駕駛習慣較差;違規偏好特征中,異常駕駛行為的次數和嚴重程度綜合指標高于均值。
本文對判別出的高風險駕駛員的風險駕駛行為進行群體畫像,進一步研究了這類駕駛員在不同空間位置、不同時段中的風險駕駛速度、加速度或運營里程分布特征,得出其在部分空間位置場景下的特征規律。研究發現駕駛員在公交站及路段中更具風險性,同時在對公交車運行安全監管的過程中,需要加強對運營路線中后段的監管力度。
通過對高風險駕駛員群體的特定場景下的風險駕駛行為特征畫像,可以為公交企業的駕駛安全意識培訓及操作技能訓練評估提供方向,對特定場景集中監管,提高公交駕駛員的安全駕駛意識,培養駕駛員群體安全運行車輛的操作習慣,最終提升公交運行的安全性和經濟性。