999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于H2O自動化機器學習的電動自行車交通違法行為影響因素分析

2024-12-31 00:00:00申遠戴帥趙琳娜楊鈞劍侯志賢
科技創新與應用 2024年36期

摘" 要:隨著電動自行車保有量的逐年增長,電動自行車交通事故死亡人數占交通事故總死亡人數的比例在不斷增加,在此背景下,探究電動自行車違法行為影響因素對降低事故率和事故嚴重程度具有重要意義。該研究使用廈門島內電動自行車違法行為數據,基于H2O自動化機器學習(AtuoML)算法對電動自行車的違法行為進行影響因素分析,并與隨機森林(RF)算法進行對比,結果表明H2O自動化機器學習具有更好的預測精度和效率。此外,研究中還引入建成環境變量。研究結果表明,小型商鋪、居民小區等建成環境對違法行為具有正向影響,且小型商鋪在眾多影響因素中占主導地位。

關鍵詞:交通安全;自動化機器學習;電動自行車違法;建成環境;隨機森林

中圖分類號:U491.31" " " 文獻標志碼:A" " " " " 文章編號:2095-2945(2024)36-0017-06

Abstract: As the number of electric bicycles increases year by year, the proportion of electric bicycle traffic accident deaths in the total number of traffic accident deaths continues to increase. In this context, exploring the factors influencing electric bicycle illegal behaviors is important for reducing accident rates and accident severity. significance. This study used data on illegal behaviors of electric bicycles in Xiamen Island to analyze the influencing factors of illegal behaviors of electric bicycles based on the H2O automated machine learning (AutoML) algorithm, and compared it with the Random Forest (RF) algorithm. The results show that H2O automated machine learning has better prediction accuracy and efficiency. In addition, built environment variables were also introduced into the study. The research results show that built environments such as small shops and residential areas have a positive impact on illegal activities, and small shops dominate among many influencing factors.

Keywords: traffic safety; automated machine learning; illegal electric bicycles; built environment; Random Forest (RF)

隨著城市化進程的加速和交通需求的日益增長,電動自行車因其便捷性、經濟型及環保性,在全球范圍內迅速普及,電動自行車的安全問題也受到了越來越廣泛的關注。盡管電動自行車的安全問題越來越受到重視,但關于電動自行車違法行為的系統性研究相對較少,現有研究大多集中在對交通事故的描述性統計和影響因素分析上。馬景峰等[1]研究了騎行者性別、年齡、電動自行車類別等因素對電動自行車交通事故的影響。Wang等[2]研究了騎手對交通法規熟悉程度和頭盔使用與電動自行車碰撞間的關系。上述研究為電動自行車違法行為影響因素的選擇提供了一定參考,但仍不全面,例如未考慮建成環境因素,其作為影響人們出行行為的重要因素,理應被納入電動自行車違法行為研究的影響因素范疇。

隨著模型與算法的進步和發展,學者們開始將更多樣、更先進的統計模型和機器學習模型應用于交通事故與違法行為的研究。范浩軒等[3]運用卡方檢驗方法分析交通違法行為與潛在影響因素之間的關系。Huang等[4]使用GWPR模型發現,車禍與建筑環境之間關系的強度和方向隨空間變化而變化。隨著機器學習算法的快速迭代,自動化機器學習(AutoML)使用廣泛的搜索算法來探索模型和參數的最優組合,極大簡化了傳統機器學習的工作流程復雜性。然而自動化機器學習(AutoML)在交通安全領域的研究中應用較少,其能否解決復雜的交通問題仍然缺乏足夠的探索。

綜上,本研究以廈門島為研究區域,考慮使用H2O平臺的自動化機器學習(AtuoML)算法構建電動自行車違法行為的影響因素模型,并在特征變量中加入建成環境因素,旨在為降低電動自行車事故嚴重程度和違法率,制定有效交通政策和預防措施提供理論支撐。

1" 數據基礎

1.1" 數據獲取與處理

1.1.1" 道路數據

本研究所用的廈門島路網數據來源于OpenStreetMap(OSM),采集于2023年8月,數據屬性主要包含道路名稱、道路等級、道路空間位置等。具體道路等級分為主干道(圖1)、次干道(圖2)、支路(圖3)3種類型。由于快速路禁止非機動車通行,因此將快速路排除掉。

使用ArcGIS軟件對道路數據進行拓撲修正,將所有道路融合后再以200 m作為間隔進行分割。各類型道路長度、占比及分割數量見表1。

1.1.2" 電動自行車交通違法行為數據

本研究使用2021—2023年廈門市電動自行車交通違法行為數據,提取廈門島內的違法行為記錄,共22 832起,數據屬性包括編號、違法行為發生時間、違法地點和違法行為類型等。同時使用高德API的地理編碼服務批量獲取違法地點的經緯度坐標。

由于違法行為的研究需要考慮其空間效應,本研究沒有直接統計電動自行車違法行為的頻數作為研究變量,而是使用核密度估計法,將違法行為密度均攤到道路上,并將道路分割為200 m的路段,作為研究單元。利用ArcGIS軟件對電動自行車違法行為進行核密度分析,違法行為密度結果如圖4所示。

1.1.3" 建成環境數據

在當代城市規劃和環境研究中,建成環境指人類制造或改造的空間及其配套的基礎設施,是人類活動發生的物理場所。Cervero等[5]于1997年提出建成環境“3D”模型并被廣泛應用于交通領域研究,后于2009年拓展為“5D”模型。本研究選取與交通行為相關的興趣點(POI)、多樣性變量中的土地利用混合度,以及設計類變量中的交叉口密度作為研究變量。研究使用的POI數據來源于高德地圖API提供的2022年廈門島內的POI數據,從中選取了11類與違法行為研究較為密切的類別作為特征變量,分別為餐飲、地鐵、公交、公司企業、居民小區、教育機構、商業大廈、小型商鋪、休閑娛樂、醫療機構和銀行,并統計路段半徑300 m范圍內的各個POI數量,作為特征變量。其具體分布如圖5所示。

本研究基于熵方法計算土地利用混合度,如果一個區域的土地被多種用途平均分配使用,那么它的熵值較高,意味著高度的混合和多樣性;相反,如果土地使用非常集中,即某一種或幾種用途占主導,則熵值較低,反映出混合度較低,其計算公式如下所示

通過ArcGIS軟件計算,廈門島土地利用混合度如圖6所示。

交叉口密度與POI數據的處理方式一致,為路段半徑300 m范圍內的交叉口數量,并整合到路段上,如圖7所示。

1.2" 數據關聯

以200 m路段為研究單元,利用ArcGIS等相關工具將違法行為密度、道路類型、POI數據、土地利用混合度和交叉口密度等數據匯總到路段單元中,形成以違法行為密度為目標變量,其他為特征變量的電動自行車違法行為數據庫,用于后續的H2O自動化模型的分析,數據庫中所有特征變量的描述見表2。

2" 模型構建與結果分析

2.1" 模型介紹

H2O是一個由H2O.ai 公司開發開源的機器學習和數據分析平臺,使自動化機器學習技術得以在該平臺上實現,即為H2O AutoML。H2O AutoML自動處理許多機器學習工作流程中耗時的步驟,這允許用戶快速有效地開發和部署高質量的機器學習模型。H2O AutoML可以自動訓練和交叉驗證多種模型,包括但不限于深度學習、梯度提升機、隨機森林和廣義線性模型等,同時它不僅可以訓練單個模型,還會嘗試模型堆疊和集成技術來提升模型性能,并自動進行超參數調優,以找到最優模型配置。

隨機森林(Random Forest,RF)是機器學習中常見的經典算法,廣泛應用于多種領域,能夠獲得相對穩定、無差的預測結果,同時避免過擬合的發生。

2.2" 模型構建

本研究通過對比傳統的隨機森林(Random Forest,RF)模型與基于H2O AutoML技術構建的預測模型在交通違法行為中的預測準確性來驗證所提出模型的效果。

將收集到的數據進行預處理后分別導入隨機森林模型和H2O平臺的AutoML框架中,通過split工具按照0.8∶0.2的比例對數據集進行隨機分組,分組為訓練集和測試集。在隨機森林模型中設置learning_rate=0.1,n_estimators=500,max_depth=5,在AutoML框架下設置最大模型數量為60。

本研究采用常見的模型評估指標均方根誤差(RMSE)和決定系數(R2)來評估模型的預測效果。均方根誤差用來衡量預測值與真實值之間的誤差,其值越小,則模型的擬合效果越好,預測準確性越高;決定系數用于評估回歸模型的擬合度,其范圍通常在0到1之間,越接近1表示模型的預測效果越好。

2個評估指標的計算公式如下

最終兩模型的訓練結果見表3。在H2O AutoML算法下RMSE為2.55,小于隨機森林算法下的2.79;R2為85.26%,高于隨機森林下的82.42%。

圖8為測試集與預測結果的散點圖,圖中點大多分布在擬合線兩側,說明二者擬合效果較好,但相較于隨機森林,H2O AutoML的點分布顯然更加集中。

綜上,相較于隨機森林模型,H2O AutoML的預測效果更好,準確性更高,因此本文最終采用基于H2O AutoML技術構建的模型作為后續影響因素重要性分析的基準模型。

2.3" 結果分析

本研究采用H2O平臺內部提供的SHAP(SHapley Addictive exPlanations)可解釋框架和部分依賴圖(Partial Dependence Plot,PDP )進行分析。

2.3.1" SHAP和PDP方法簡介

SHAP可解釋框架可以解釋復雜的黑箱機器學習模型的預測結果,廣泛應用于各種機器學習任務中,能夠增強模型的可信度和可靠性。其具體計算原理如下。

首先,各個特征對某一個樣本的預測值的影響可以表示為

式中:xi表示第i個特征值,?茁i表示特征i的權重,m表示總特征數。

假設E[f(z)]表示不考慮特征時預測的基準線,那么當加入一個特征xi時,其影響程度?準i可以表示為

式中:E(?茁ixi)表示特征i的平均貢獻值,將每個特征的貢獻值相加可以得到

所有特征的貢獻之和即為模型的輸出結果。

部分依賴圖可以展示單個特征對預測結果的影響,用于解釋預測模型中特定特征與預測結果之間的關系。其以圖形方式描述了變量對響應的邊際效應。

2.3.2 特征重要性排序

圖9展示了14個特征變量的重要性排序,圖中每個點即為樣本在相應特征上的SHAP值,SHAP值大于0即對目標變量有正向影響,小于0對目標變量有負向作用。從圖中可以看出,重要性程度排名前四的為小型商鋪、居民小區、教育機構和醫療機構,且對違法行為密度呈現正向影響。

圖10顯示的是貢獻度排名前四的特征變量的部分依賴圖,可以看出小型商鋪、居民小區、教育機構和醫療機構與預測結果基本上呈現上升趨勢,且數量達到一定值后預測結果不再變化。

3 討論與結論

通過上述解釋模型的可視化結果可以看出,小型商鋪、居民小區、教育機構、醫療機構、地鐵和公交等特征對電動自行車違法行為密度具有正向影響,該結果與其他學者對電動自行車事故影響因素研究的結論類似[1,6],可見建成環境對違法行為和交通事故的影響在某種程度上具有共通性。

其中小型商鋪的影響在眾多影響因素中占主導地位,該結果與行人交通事故影響因素的研究相似[7],推測小型商鋪對行人和非機動車具有更大的吸引力,小型商鋪附近更容易發生與弱勢群體有關的違法行為和交通事故。

此外,居民小區對違法行為的影響也較為顯著。居民小區內外的交通情況較為復雜,且廈門島內的居民區道路由于土地資源受限,一般設計的較為狹窄,且大部分未設非機動車道(圖11),這導致人行道與非機動車道共板(圖12)、機機動車道與非機動車道共板(圖13)的現象非常普遍,違法行為發生的概率也會更高。

教育和醫療機構對違法行為的影響也是正向的,但影響沒有前兩者顯著,其原因可能在于學校與醫院其本身建設成本高,數量較少,影響范圍有限,尤其對于電動自行車用戶的影響,多集中于學校與醫院方圓3~5 km范圍內,正好是電動自行車出行的舒適范圍。其他特征變量對電動自行車違法行為沒有明顯傾向趨勢,其更深層次的影響結果需進一步探究。

綜上,本研究通過構建電動自行車違法行為數據庫和H2O AutoML模型,初步探究了電動自行車交通違法行為的影響因素,為電動自行車違法行為的治理提供思路和方法,也為后續進一步深入研究更多特征變量以及多因素的交互影響提供參考。

參考文獻:

[1] 馬景峰,任剛,李豪杰,等.電動自行車與機動車事故嚴重性影響因素分析[J].交通運輸系統工程與信息,2022,22(2):337-348.

[2] WANG X,CHEN J,QUDDUS M,et al.Influence of familiarity with traffic regulations on delivery riders'ebike crashes and helmet use:Two mediator ordered Logit models[J].Accident:Analysis and Prevention,2021(159):106277.

[3] 范浩軒,任剛,李豪杰,等.基于電子執法數據的交通違法行為影響因素研究——以上虞區為例(英文)[J].Journal of Southeast University(English Edition),2021,37(2):227-236.

[4] HUANG Y, WANG X, PATTON D. Examining spatial relationships between crashes and the built environment: a geographically weighted regression approach[J]. Journal of Transport Geography, 2018(69):221-233.

[5] CERVERO R, KOCKELMAN K. Travel demand and the 3Ds: Density, diversity, and design[J]. Transportation research part D: Transport environmental Research Letters, 1997,2(3):199-219.

[6] 王菁,董春嬌,李鵬輝,等.考慮建成環境的電動自行車事故嚴重程度致因分析[J].交通運輸系統工程與信息,2024,24(1):179-187.

[7] 郭珮珺.基于社會感知數據的行人交通事故建模與影響因素分析[D].上海:華東師范大學,2014.

主站蜘蛛池模板: 性欧美在线| 白浆视频在线观看| 国产高清在线观看| 国产欧美视频一区二区三区| 一级毛片网| 激情午夜婷婷| 日韩成人在线网站| 真人免费一级毛片一区二区 | 亚洲一级毛片在线观播放| 91精品国产麻豆国产自产在线| 久久久久九九精品影院 | 欧美第一页在线| 毛片基地美国正在播放亚洲| 国产成人亚洲精品色欲AV | 久热中文字幕在线观看| 国产尤物在线播放| 成人韩免费网站| 无码啪啪精品天堂浪潮av| 成人在线天堂| 在线观看视频99| 亚洲成人网在线播放| 欧美精品xx| 动漫精品啪啪一区二区三区| 婷婷六月综合| 国产SUV精品一区二区6| 欧美一道本| 亚洲高清资源| 福利国产在线| 欧美国产综合色视频| 国产女人在线| 久久久波多野结衣av一区二区| 国产精品视频3p| 97久久免费视频| 亚洲人成网站观看在线观看| 熟妇丰满人妻| 农村乱人伦一区二区| 亚洲欧美成aⅴ人在线观看 | 粗大猛烈进出高潮视频无码| 久久特级毛片| 粗大猛烈进出高潮视频无码| 老司国产精品视频91| 狠狠亚洲五月天| 26uuu国产精品视频| 成年网址网站在线观看| 国产成人成人一区二区| 婷婷亚洲最大| 制服丝袜在线视频香蕉| 成人亚洲天堂| 国产超碰一区二区三区| 国产新AV天堂| 日韩一区二区三免费高清| 天天综合网色中文字幕| 99精品在线视频观看| 日韩欧美视频第一区在线观看| 国产久操视频| 欧美三级视频在线播放| 国产一区二区福利| 亚洲精品大秀视频| 在线观看亚洲国产| 91成人在线观看| 婷婷激情亚洲| 在线国产91| 波多野结衣无码AV在线| 亚洲精品自拍区在线观看| 亚洲日韩AV无码一区二区三区人| 婷婷中文在线| 麻豆精品在线播放| 国产不卡在线看| 国内精品久久九九国产精品| 国产福利一区在线| 国产sm重味一区二区三区| 亚洲精品在线91| 综合网久久| 91伊人国产| 亚洲系列无码专区偷窥无码| 在线观看无码a∨| av无码一区二区三区在线| 国产亚卅精品无码| 国产一区二区三区在线观看视频| 97狠狠操| 国产情精品嫩草影院88av| 成人午夜久久|