袁 王永東
濟南大學西校區(250022)
道路交通系統是一個耦合系統,由道路和人共同組成,不但具有非線性、開放性,而且處于動平衡狀態。道路交通系統是由多種要素組成,但是并非所有要素都是相互兼容、相互調節的,也有不調節和不兼容的,這就造成了系統存在一定的失效率,導致交通事故頻發。從宏觀角度來治理道交通,就需要借鑒相關系統的基本性質并進行分析,找出容易發生交通事故的地點和位置,對其進行重新設置和建設,以保證道路交通的安全。
所謂聚類分析方法,就是將整個道路交通系統中的時間周期和特定路段進行合理安排和組織,最后進行分析。這樣有特定目標、特定評價及相應鑒別方法的鑒別方式,可以更好的地鑒別頻發事故的地點。
當然,曾經也有許多比較傳統的鑒別方法,如CRM、ZIP模型等。這些模型包含的參數很多,如散步泊松分布參數等。傳統的鑒別方法需要利用一定的事故統計數值作為相對的模擬數據。但是在現實生活當中很多事故都是隨機的,無法進行有效的分類和區域劃定,若純粹的運用傳統的鑒別方式對事故多發地進行鑒別,很難反映出其空間分布的具體位置及效應規律。相比來看,在同一區內用聚類方法進行判斷和鑒別,更容易找出其中的共通性。交通事故發生的地點和時間具有很大的隨機性且非常分散,若想對其進行實際和深入性的挖掘,需要應用一定的分析方法對其進行鑒別分析。
而這種鑒別分析的方法稱為k-means。kmeans應用起來非常簡便,計算的速度也比較快,適用于大數據,有較高的效率。k-means需要與其他算法、模型結合使用,也適合用于大數據的相關細節內容,在特定分析及參數估計方面有絕對的優勢[1]。
k-means的基本思想是在空間范圍內以一個中心K為點進行相應的聚類,最終對靠近K點的相應對象進行各種分類。這樣計算之后,再通過重復迭代的方式對每種聚類中心的值進行相應的歸類,最后得到結果:
1)c作為類別的樣本集合,將所有的規整化一后整體反應在各別象限內,選擇一個適當的初始中心作為c個類。
2)對于任意一個樣本,將第k次代入求c的中心距離。樣本所在的地方與中心c的最短距離就是中心所在的類。
3)以求平均值的方法對整個類種的中心值進行重新評定和計算。
4)運用類聚的中心在利用上述的二和三兩種方法進行更新計算,直到目標滿足相應函數,最后減少不查確定待次數做到迭代結束,并最后得出結論。
其中給定的第i個事故點樣本點xi是多維事故屬性向量,其所屬類為

對于整體數據的分析來說,一起事故的數據眾多,若想對數據進行精準化劃分和處理,應對相關數據進行一個初步的整理和確認,以便保證相應數據的準確度和精準度,最大限度地減少顯著差異數據。對于缺少經緯度信息的相應數據,應采用特殊的事故信息分析方式對事故的地點進行相應的匹配,并在地圖上進行標識。該種方式可以對其進行一定的經緯度坐標確定。考慮市區內的地域和道路交通分布狀況,將整個事故多發地點進行區域性劃分和統計,在GIS地圖點進行排列,得出事故多發地域的總體分布狀況,并以此作為參考系數進行相應的聚類中心分析。在整個相應的程序系統內進行多次聚類中心數值分析和迭代數值分析。在區分事故的檢疫情況上,可以按照事故的頻發次數和交叉路口常年事故指標相似度進行聚類[2]。
交叉路口作為整個道路的路段,是事故頻發區域,被鑒定為主次路干的低級城市道路相互交叉形成的路段。這樣的路段事故黑點的激化交叉和梯形交叉所占比例較少。有個別交叉路口的交通事故高于一般的交通路口,這樣的路口等級較高,承載的交通流量較重。在接警處,其相鄰的交叉路口間距較小,以至于形成易發事故的黑點類型。對于交通事故頻發的解決方案,可以在道路交通系統中尋找出相應的事故高發地,并提前落實事故的解決方案。在容易發生事故的地點進行一定的設施建設,有針對性地治理和改善,實施物理隔離或者是重新設置相應的標志警戒線,增加一定的溝渠設計,保證路段通順。
文章內容根據某城市的一年內交通事故的數據進行相應的聚類和事故分析處理。利用可視化分布圖對整個事故高發點進行了特征分析,得到了有關的分布結果。這樣的方法可以有效地挖掘出城市道路中潛在的事故高發地,幫助相應的管理機構提早作好預防措施,對該地點進行管理和控制,以便提前作好相應措施,保證整個城市的道路安全。