999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類分析的交通事故影響因素研究

2024-12-31 00:00:00王愷亮朱新宇
科技創新與應用 2024年35期
關鍵詞:影響因素

摘" 要:為研究道路交通事故的主要因素,先對數據變量集進行賦值,使用Calinski-Harabasz函數選擇適宜聚類簇數,利用K-means聚類算法聚類交通事故數據,再采用Logistic模型對事故數據建立嚴重程度分類模型。結果表明,基于Calinski-Harabasz函數的K-means聚類的Logistic回歸,既考慮k值選擇的合理性以及數據的異質性,又提高了模型的精度;星期、路面狀況、地形、路口路段類型僅在某一個類別中顯著。事故發生時間、年齡、交通方式、駕齡、季節、人員類型和能見度在兩個及以上類別中顯著。能見度、人員類型在多個類別中顯著,但是影響方式不同。可知,上述變量對交通事故的嚴重程度影響具有差異性。

關鍵詞:道路交通安全;影響因素;K-means聚類;Calinski-Harabasz函數;Logistic回歸

中圖分類號:U491.31" " " 文獻標志碼:A" " " " " "文章編號:2095-2945(2024)35-0107-06

Abstract: In order to study the main factors of road traffic accidents, the data variable set is first assigned, the Calinski-Harabasz function is used to select the appropriate number of clusters, the K-means clustering algorithm is used to cluster the traffic accident data, and then the Logistic model is used to establish a severity classification model for the accident data. The results show that the Logistic regression based on K-means clustering based on the Calinski-Harabasz function not only considers the rationality of k value selection and data heterogeneity, but also improves the accuracy of the model; week, road condition, terrain, and intersection section type are only significant in a certain category. Accident time, age, transportation mode, driving age, season, personnel type, and visibility are significant in two or more categories. Visibility and person types are significant in multiple categories, but the impact is different. It can be seen that the above variables have different impacts on the severity of traffic accidents.

Keywords: road traffic safety; influencing factor; K-means clustering; Calinski-Harabasz function; Logistic regression

據國家統計局2022年的數據統計,汽車保有量已經達到了26 150萬輛,隨著汽車保有量的增加,社會對道路交通完全問題也更加關注。交通事故受天氣[1]、環境[2]、道路[3]、駕駛員[4]和車輛自身[5]等因素影響,盡管交管部門通過完善法律法規來防范交通事故,但交通事故仍然時有發生。發生交通事故不但可能造成不必要的財產損失,還可能危及人身安全甚至更嚴重的后果。因此依據已有交通事故數據,提取發生事故的特征,探究發生事故的主要影響因素,有利于預防事故的發生。

近年來,眾多學者挖掘事故致因進行了一系列深入而廣泛的研究。李英帥等[6]使用隨機森林模型探究電動自行車交通事故的影響因素;王天文等[7]使用多個模型進行對比選擇多項Logit對人、路、環境、事故特征等方面的顯著因素進行探討,最后對交管部門提出意見;戢曉峰等[8]利用TOPSIS法和Logistic模型識別時間、事故形態、車輛自身等與事故嚴重程度的相關性;何雅琴等[9]利用累積Logistic模型探討人、車、路和環境等事故特征與事故嚴重程度的相關性,發現事故發生時間、事故形態、車輛類型、照明條件、行人年齡等因素與事故嚴重程度顯著相關性;孟云偉等[10]利用Logistic模型探究高速公路交通事故與車型、天氣、時間、路段類型、事故類型和月份的關系,發現以上6個因素對事故嚴重程度均有顯著影響;溫惠英等[11]利用多項Logit模型識別對老年人交通事故嚴重程度的影響因素,發現車輛類型、車輛使用年限、路口路段類型、車道數和性別等因素為顯著影響因素;馬景峰等[12]利用多項、有序、廣義有序Logit模型進行橫向對比擬合度,識別出電動自行車與機動車事故嚴重性影響最大的因素為2種車輛類型、騎行者的年齡。

在挖掘事故致因時,使用上述方法的學者們往往會忽略事故數據的異質性,這可能會影響結果的準確性。鑒于此,在研究水上交通事故時,張慶年等[13]考慮了數據的異質性,使用因子分析法對特征變量進行降維后,將交通事故數據通過K-means聚類,再將對各類別中的交通事故數據進行分析。但在選擇K-means聚類時,需要提前確定聚類數目k值[14],在上述文章中作者所選擇的k值只是為了讓分類后的數據能適用Logistic模型,并不合理。因此,為了同時考慮數據的異質性和k值的合理選擇,先使用Calinski-Harabasz函數來選擇適宜的k值,利用K-means聚類算法對事故數據進行分類,最后利用Logistic模型分別對各個類別下事故嚴重程度的重要因素進行識別。

1" 研究方法

1.1" 基于Calinski-Harabasz函數的K-means聚類算法

1.1.1" K-means算法原理

K-means算法是一種常用的聚類方法,用于將數據劃分為k個不重疊的簇。其基本步驟如下。

1)設置簇的數量k,選擇初始的k個聚類中心。

2)迭代更新:計算每個樣本與所有聚類中心的距離,將樣本分配給最近的聚類中心。然后,重新計算每個簇的中心,即簇內樣本的平均值。

3)檢查收斂:當聚類中心穩定或迭代次數達到預設值時,算法收斂。

4)輸出結果:為每個樣本分配簇標簽。

在K-means算法中,初始聚類中心的選擇至關重要,因為它會影響最終的聚類效果。為了避免局部最優解,可以多次運行算法并選擇最佳結果。

將使用Calinski-Harabasz指數評估不同簇數量下的聚類質量,選擇最佳的簇數,以用于后續的嚴重程度分類模型的構建。

1.1.2" Calinski-Harabasz函數的定義和計算

Calinski-Harabasz(CH)函數[15]是一種評估聚類結果的指標,衡量聚類的緊密度和分離度。其公式如下

CH=×,

式中:BSS(類間離差)表示不同簇中心與整體數據中心的差異,WSS(類內離差)表示同一簇內數據點之間的差異,N為總樣本數,k為簇數。公式中的校正因子用于平衡簇數對CH值的影響。CH值越大,聚類效果越好。

1.2" Logistic回歸

設因變量Y為二分類變量,1表示發生傷亡事故,0表示發生財產損失事故。有n個自變量與因變量有關,記X=(x1,x2,……,xn),則

P(Y=1/X)=,

式中:P為事故Y發生的概率;B0為回歸截距;Bi為自變量i的回歸系數。

Logistic回歸模型因其良好的可解釋性和性能,在二分類問題中廣泛應用。

2" 數據

2.1" 數據來源及處理

交通事故數據來自某市歷史交通事故數據,涉及機動車交通事故。由于數據格式不一致,通過查詢天氣等信息,盡量補全缺失數據,以確保完整性。篩選標準包括:駕駛人年齡大于18歲;駕齡大于等于1年;交通事故類型;星期;月份;天氣;能見度;事故發生時間分類;人員分類;交通方式分類;車輛類型;路面狀況;路表情況;地形;道路線性;路口路段類型,得到事故樣本4 797個。

2.2" 數據變量集構建及賦值

依據搜集到的事故數量及模型的要求,交通事故類型量化為2個等級:財產損失事故=“0”,傷人事故和死亡事故=“1”。各個變量的具體賦值及其含義見表1。

3" 交通事故數據聚類結果

K-means聚類在python平臺上進行試驗。首先需要確定k值,將k值的范圍設置為2≤k<11,得到9組不同k值對應的CH值,對應結果如圖1所示。

結合圖像可知:CH值隨著k的增加而減小,即聚類效果隨著k的增大而下降,但是需要進行合理的劃分,當聚類簇數為2時,CH值為763,當k為3時,CH值為747,選擇k=3。

使用K-means算法將樣本劃分為3類,各類別對應的樣本數目見表2。

4" 事故嚴重程度模型分析結果

4.1" Logistic回歸模型檢驗

通過Hosmer-Lemeshow檢驗來驗證模型:檢驗結果顯示,分類后的3種類別樣本數據的卡方值均低于15.507,且顯著性水平高于0.05。這表明分類后的樣本在回歸模型中的整體擬合度較好,自變量能夠有效解釋因變量。

再將顯著性水平高于0.05的自變量剔除后,最終鑒別出各類事故中對傷亡事故有顯著影響的因素。

4.2" 事故嚴重程度模型結果分析

筆者采用聚類分析模型對事故數據進行分析,進而探究不同類別下影響水上交通事故嚴重程度的主要因素。下文將對3個類別的回歸結果進行分析。

由表3可知,在類別1中,事故發生時間、年齡、人員類型、交通方式、季節和地形6個變量顯著。

事故發生時間:傷亡事故概率隨時間增加逐漸下降,其中[0:00,4:00]的事故概率是[20:00,24:00]的5.537倍。這可能是由于深夜和凌晨交通量低,駕駛員容易忽視交通規則,導致超速、闖紅燈等危險駕駛行為增加。

季節:夏季發生傷亡事故的概率為冬季的2.194倍,說明夏季對事故影響最大,春季和秋季次之。高溫可能導致駕駛員疲勞、分心、急躁等行為增多。

年齡:36歲到45歲之間的傷亡事故概率是56歲及以上的1.676倍。位于年齡段的駕駛人可能在工作中壓力較大,影響專注度和決策能力,且對自身駕駛能力過于自信。

人員類型:其他職業的傷亡事故概率是自主營業者的1.769倍,可能是因為工作壓力影響駕駛行為,自主營業者相比其他職業者的駕駛員工作壓力較小。

交通方式:駕駛拖拉機比汽車更容易導致傷亡事故。拖拉機操作需要特定技能和經驗,駕駛拖拉機駕駛員缺乏培訓或經驗比例較高,導致事故風險更高。

地形:平原地區發生傷亡事故的概率為非平原地區的1.516倍,可能是因為平原地區交通流量大,交通沖突和潛在危險情況更多。

由表4可知,在類別2中,事故發生時間、人員類型、交通方式、駕齡、季節、能見度和路口路段類型7個變量顯著。

事故發生時間:傷亡事故概率隨時間增加逐漸下降,[0:00,4:00]的事故概率是[20:00,24:00]的3.854倍,與類別1類似。

季節:同秋季相比夏季發生傷亡事故的概率最高,為冬季的2.04倍。原因可能是夏、秋季的氣溫升高,這可能導致駕駛員的注意力分散或不適應高溫天氣,從而影響駕駛技能和判斷力,增加了事故發生的概率。

人員類型:自主營業者對傷亡事故的影響最大,工人和農民的系數為負。自主營業者可能缺乏必要的專業培訓和安全知識。這可能導致他們在安全管理和控制方面的能力不足,增加了事故發生的概率。

駕齡:駕齡6到10年發生傷亡事故的概率最高,為駕齡21年及以上的1.898倍。原因可能是,有駕駛經驗的駕駛員更加謹慎和遵守交通規則,并且對于可能發生的危險有更好的預知能力。

交通方式:駕駛農用運輸車的傷亡事故概率是駕駛拖拉機的10.512倍,可能因為農用運輸車需要更復雜的操控,駕駛人容易出現操作失誤導致交通事故的發生。

能見度:能見度小于等于50 m對傷亡事故的影響最大,因為低能見度減少了駕駛員的反應時間,導致事故較容易發生。

路口路段類型:普通路段發生傷亡事故的概率是交叉口的1.406倍。普通路段通常為直線或相對較直的路段,駕駛員更容易高速行駛,而交叉口需要減速或停車,較高的車速導致事故的高發生率。

由表5可知,在類別3中,事故發生時間段、年齡、人員類型、駕齡和能見度5個變量顯著。

事故發生時間:凌晨[0:00,4:00]的傷亡事故概率是[20:00,24:00]的2.14倍。可能是凌晨時段較容易出現疲勞駕駛,這無疑增加了事故風險。

年齡:36歲到45歲之間的傷亡事故概率是56歲及以上的1.755倍。原因可能是,年長駕駛人可能更傾向于遵守交通規則、保持謹慎和注意力集中。相比之下,年齡較小的駕駛人可能更容易產生駕駛過度自信或冒險行為,這可能增加了事故的風險。

人員類型:工人發生傷亡事故的概率是自主營業者的1.385倍,農民為1.465倍。原因可能是職業為工人和農民的駕駛人,缺乏系統的駕駛培訓和交通安全教育,導致他們在駕駛過程中更容易忽視交通規則和安全注意事項。

駕齡:駕齡11到15年的傷亡事故概率高于16到20年,為大于等于21年的1.574倍和2.073倍。原因可能是隨著駕駛經驗的增加,駕駛員通常更加謹慎。

能見度:能見度100~200 m的傷亡事故概率是能見度小于等于50 m的1.834倍。低能見度時,駕駛員更警覺,采取更保守的駕駛行為,有利于減少事故發生。

4.3" 交通安全改善對策

根據上述分析的結果,就道路方面而言,平原、普通路段、施工道路容易發生傷亡事故的概率較大。改善道路設計和標志標線,特別是在高風險路段。增加警示標志、限速標志和行人過街設施,提高駕駛員和行人的警覺性,減少事故風險。

駕駛人方面,拖拉機駕駛員、農用運輸車駕駛員、其他職業的從業人員、自主營業者、36歲到45歲傷亡事故的概率較高,隨著駕齡的增長發生傷亡事故的概率也更高。提供針對拖拉機駕駛員和農用運輸車駕駛員的專門培訓計劃,以提高他們的駕駛技能和安全意識,同時確保這些車輛在道路上符合必要的安全標準。向相關從業者提供針對性的交通安全培訓,強調他們在工作壓力下的注意力和決策能力的重要性,同時提供專門的交通安全指導和資源,幫助他們了解并實施適當的安全措施。針對駕齡高和針對36歲到45歲的駕駛員,加強安全宣傳教育,提醒他們不要因為駕齡增長而掉以輕心,保持良好的駕駛習慣和注意力。鼓勵年齡較大的駕駛員進行定期身體檢查,并確保他們的身體狀況適合駕駛。

環境方面,凌晨、春、夏、秋、能見度較低容易導致傷亡事故的發生。在凌晨時段加強巡邏和監控,提高警察和交通管理人員的存在感,以減少事故發生的可能性。在夏季、春季和秋季增加交通警力,加強交通管制,提高駕駛員的遵守交通規則和安全駕駛意識,提醒他們在高溫天氣下保持良好的體力和注意力,同時在雨雪天氣或能見度較差的情況下,加強巡邏和監測,確保駕駛員遵守減速和保持安全距離的規定。

根據上述分析的結果,就道路方面而言,平原、普通路段、施工道路容易發生傷亡事故。建議改善這些路段的設計和標志標線,增加警示標志、限速標志和行人過街設施,提高駕駛員和行人的警覺性,減少事故風險。

5" 結論

1)基于Calinski-Harabasz函數的K-means聚類的Logistic回歸,既考慮k值選擇的合理性以及數據的異質性,又提高了模型的精度,鑒此這個模型可用于分析交通事故嚴重程度。

2)交通事故數據被分成3個類別。星期、路面狀況、地形、路口路段類型僅在某一個類別中顯著。事故發生時間、年齡、交通方式、駕齡、季節、人員類型、能見度在兩個及以上類別中顯著。能見度、人員類型在多個類別中顯著,但是影響方式不同。據結果可知,上述變量對交通事故的嚴重程度影響具有差異性。

參考文獻:

[1] 馮忠祥,雷葉維,張衛華,等.道路環境對繞城高速公路交通事故嚴重程度影響分析[J].中國公路學報,2016,29(5):116-123.

[2] 孫軼軒,邵春福,趙丹,等.交通事故嚴重程度C5.0決策樹預測模型[J].長安大學學報(自然科學版),2014,34(5):109-116.

[3] 林慶豐,鄧院昌.基于Logistic的城市公交事故嚴重程度影響因素分析:以廣東省為例[J].中山大學學報(自然科學版),2020,59(4):120-127.

[4] 宋棟棟,楊小寶,祖興水,等.基于均值異質性隨機參數Logit模型的城市道路事故駕駛員受傷嚴重程度研究[J].交通運輸系統工程與信息,2021,21(3):214-220.

[5] 胡驥,閆章存,盧小釗,等.基于有序Logit與Probit模型的交通事故嚴重性影響因素分析[J].安全與環境學報,2018,18(3):836-843.

[6] 李英帥,張旭,王衛杰,等.基于隨機森林的電動自行車騎行者事故傷害程度影響因素分析[J].交通運輸系統工程與信息,2021,21(1):196-200.

[7] 王天文,莊越.基于多項Logit模型的機動車相關事故影響因素和嚴重程度探究[J].交通工程,2023,23(2):11-18.

[8] 戢曉峰,李德林,楊文臣.山區二級公路交通事故致因的時間演化機制[J].中國安全科學學報,2019,29(4):31-36.

[9] 何雅琴,段雨陽,王晨.基于累積Logistic模型的行人交通事故嚴重程度分析及對策研究[J].安全與環境學報,2021,21(3):1165-1172.

[10] 孟云偉,張熙衍,青光焱,等.基于Logistic回歸的高速公路交通事故后果的影響因素分析[J].武漢理工大學學報(交通科學與工程版),2022,46(1):12-16.

[11] 溫惠英,區俊鋒,宋文通.老年駕駛人交通事故嚴重程度影響因素分析[J].合肥工業大學學報(自然科學版),2021,44(6):812-817,850.

[12] 馬景峰,任剛,李豪杰,等.電動自行車與機動車事故嚴重性影響因素分析[J].交通運輸系統工程與信息,2022,22(2):337-348.

[13] 張慶年,張瑨,楊杰,等.基于聚類分析的水上交通事故影響因素研究[J].重慶交通大學學報(自然科學版),2022,41(6):1-7.

[14] 何選森,何帆,徐麗,等.K-Means算法最優聚類數量的確定[J].電子科技大學學報,2022,51(6):904-912.

[15] 賈秀燕,孫秋霞,李勍.基于K-means聚類與PLS回歸模型的交通速度短時預測[J].青島大學學報(自然科學版),2023,36(1):42-48+53.

猜你喜歡
影響因素
房地產經濟波動的影響因素及對策
零售銀行如何贏得客戶忠誠度
醫保政策對醫療服務價格影響因素的探討
東林煤礦保護層開采瓦斯抽采影響因素分析
影響農村婦女政治參與的因素分析
高新技術企業創新績效影響因素的探索與研究
水驅油效率影響因素研究進展
突發事件下應急物資保障能力影響因素研究
中國市場(2016年36期)2016-10-19 03:54:01
環衛工人生存狀況的調查分析
中國市場(2016年35期)2016-10-19 02:30:10
農業生產性服務業需求影響因素分析
商(2016年27期)2016-10-17 07:09:07
主站蜘蛛池模板: 成人福利在线免费观看| 国产日本欧美在线观看| 国产精品视频猛进猛出| 干中文字幕| 久久亚洲中文字幕精品一区 | 国内精品一区二区在线观看| 国产丰满成熟女性性满足视频| 2021国产精品自拍| 男女猛烈无遮挡午夜视频| 国产精品美女自慰喷水| 亚洲天堂日韩在线| 欧美国产日韩在线| 亚亚洲乱码一二三四区| 国产成人h在线观看网站站| 在线综合亚洲欧美网站| 性视频一区| 久久精品欧美一区二区| 中文字幕无码电影| 中文无码精品A∨在线观看不卡 | 免费观看男人免费桶女人视频| 99久久国产综合精品2023 | 在线va视频| 日本亚洲成高清一区二区三区| 亚洲毛片一级带毛片基地| 日韩精品久久久久久久电影蜜臀| 91久久大香线蕉| 四虎精品国产永久在线观看| 久久大香香蕉国产免费网站| 亚洲视频一区| 亚洲国产无码有码| 国产美女精品一区二区| 亚洲VA中文字幕| 天天摸夜夜操| 久久免费精品琪琪| 青草国产在线视频| 国产精品hd在线播放| 亚洲欧美成人影院| 久久婷婷六月| 久久久久国色AV免费观看性色| 97综合久久| 国产精品丝袜在线| av性天堂网| 久久天天躁夜夜躁狠狠| 亚洲精品在线影院| 99热这里只有精品2| 国产美女免费| 国产精品浪潮Av| 亚洲最黄视频| 国产精品一区二区在线播放| 欧美日本激情| 欧美一级高清视频在线播放| 丝袜亚洲综合| 免费人成网站在线高清| 91人人妻人人做人人爽男同 | 四虎影视8848永久精品| 成人在线第一页| 视频一区视频二区日韩专区| 再看日本中文字幕在线观看| 71pao成人国产永久免费视频| 国产一二视频| 99热国产这里只有精品9九| 国产v精品成人免费视频71pao| 中文字幕波多野不卡一区| 久久性视频| 免费A级毛片无码免费视频| 九色视频在线免费观看| 亚洲精品动漫在线观看| 国产最爽的乱婬视频国语对白| 久久久久青草线综合超碰| 国产欧美日韩在线一区| 亚洲国产欧美目韩成人综合| 91福利片| 手机精品福利在线观看| 国产剧情无码视频在线观看| 2020国产精品视频| 亚洲欧美日韩成人高清在线一区| 青青国产视频| 亚洲精品欧美日韩在线| 老熟妇喷水一区二区三区| 欧美性猛交一区二区三区| 国产精品永久免费嫩草研究院| 国产夜色视频|