999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ARIMA的公交行程時間預測研究

2024-05-29 18:48:25閻瑜婷
交通科技與管理 2024年9期

收稿日期:2024-03-11

作者簡介:閻瑜婷(1999—),女,碩士研究生,研究方向:公交優先。

摘要 文章在小汽車產業迅速發展、私家車保有量逐年增加、交通問題突出的背景下,通過研究預測公交車在站點間的運行時間,為出行者決策以及公交的運營管理提供數據基礎,進而提高公共交通的分擔率,緩解存在的交通問題。首先,對數據做預處理和可視化操作,利用單位根檢驗和白噪聲檢驗數據的可用性;其次,確定模型階數并建立模型,用自相關和偏自相關函數,通過殘差檢驗模型證明了模型的可用性;最后,將建好的模型用以預測西海岸東1路公交車從卓亭廣場站到崇明島路小學站的行程時間。

關鍵詞 時間序列;ARIMA模型;公交GPS數據;行程時間

中圖分類號 U491.17文獻標識碼 A文章編號 2096-8949(2024)09-0011-04

0 引言

隨著經濟的發展,私人小汽車的數量快速增長,造成了許多問題。不僅是交通擁擠,隨之而來的還有交通污染、交通事故頻繁、公路秩序混亂等一些嚴重的問題。公共交通能夠很大程度地解決上述存在的問題,大幅節約能耗,是解決擁堵、污染、秩序混亂等問題的有力支撐。但公交車沿確定路線行駛,路上實時的車輛行駛狀態影響公交車到站時間,進而影響出行者乘車體驗。如果能夠進一步提高公交服務質量和水平,此舉對發展公共交通有重要作用。

2002年,周雪梅等[1]對公交車的行駛特點進行了分析,建立了公交車輛行程時間的預測模型,并且獲得了相關模型的預測結果。2007年,陳巳康等[2]通過車載GPS設備獲取了公交車運行的實時數據,并且建立了公交道路網模型,預測了公交車的到站時間。2014年,胡繼華等[3]通過分析大量公交GPS數據,構造了馬爾科夫狀態轉移矩陣。2015年,Kumar B A等[4]采用基于模型的卡爾曼濾波算法對公交出行時間進行了預測。2016年,Amita J等[5]建立了一種基于人工神經網絡(ANN)的GPS數據預測公交出行時間的模型。2017年,黃明芳、鄭娜英[6]對影響公交車行程時間的動靜態影響因素進行了綜合性分析,構建了RBF-BP協作神經網絡的預測公交車行程時間的模型。

1 ARIMA模型

ARIMA模型是自回歸移動平均模型,用于對時間序列進行建模和預測。模型包含三個部分:自回歸(AR)、差分(I)和移動平均(MA)。AR表示自回歸,即當前觀測值與之前若干個觀測值之間的線性關系。I表示差分,用于將非平穩時間序列轉化為平穩時間序列,使得序列的均值和方差在不同時間點上保持不變。MA表示移動平均,即當前觀測值與之前若干個隨機誤差項之間的線性關系。ARIMA模型記作ARIMA(p, d, q),其中p是自回歸項數,q是滑動平均項數,d是差分次數。差分是ARIMA模型中的關鍵步驟,通過對非平穩時間序列進行差分,可以將其轉化為平穩的時間序列,使得可以應用ARIMA模型進行建模和預測。

2 實例分析

選取青島市開發區東1路公交線路,始發站為啤酒城公交站、終點站為黃島輪渡公交站,總里程為22.6 km,途經站點41站。東1路途經青島理工大學、青島職業技術學院、青島濱海學院等大學以及卓亭廣場住宅區和中心醫院、崇明島路小學等流量聚集處,這些區域在出行高峰期給周圍交通帶來極大壓力。該文研究從卓亭廣場住宅區到崇明島路小學在不同時間段公交車的運行時間,并做出預測,為周圍出行者的出行決策以及換乘提供宏觀的信息支撐。

2.1 數據說明

對青島市西海岸新區公交車GPS數據進行初步處理,去掉經緯度以及GPS速度列,數據內容包括線路號、站點、車站號、運營類型、GPS產生時間、瞬時速度、車牌號等,原數據共有452 461條,線路包含65條線路,從中篩選出東1路數據27 495條,再將站點、運營類型、到站和離站進行篩選后,得到東1路經過卓亭廣場站點,且為下行離站的數據共186條,同理得到東1路經過崇明島路小學站點,且為下行到站的數據有190條。

上述得出的數據存在一定問題:由于數據受到車載設備以及傳輸情況的影響,導致行駛線路一致,到達站點的車輛數不一致的現象,對應車牌號出現缺失;并且還存在重復數據,可能由于在短時間內公交車重復進站,GPS重復采集了數據;當不同車牌號公交車同時刻在相同站點發車,但運行時間不一致時,同一時刻就會對應多個運行時間。為避免對預測造成影響,不對缺失的車輛牌信息進行補充,對缺失行進行整行刪除,同樣刪除重復信息,實現一個發車時刻對應一個運行時間,采取求平均值的方法將數據實現一一對應。最后根據車牌號對應原則,將卓亭廣場下行離站時間和崇明島路小學車站下行到站時間進行相減,得出站間運行時間,將提取的到站時間和運行時間兩列數據作為預測研究的對象,具體見表1所示。

2.2 模型建立

模型建立過程中用到的Python庫有:NumPy、Pandas、Matplotlib、Seaborn、Statsmodels等。其中,NumPy提供了大量的數學函數庫可以進行復雜的數組運算;Pandas是基于NumPy工作,對于處理大數據有很好的效果,并且包含很多的數據結構,如DataFrame、Series等;Seaborn是Python的可視化庫,通過可視化庫理解并展示數據,其與Matplotlib主要不同是Seaborn的色彩搭配更鮮明、繪圖風格更優美;Statsmodels可以擬合多種統計模型,可以進行數據探索、統計測試以及可視化,Statsmodels中的模型可用于時間序列分析,以及對模型進行評估。

2.2.1 數據處理

將上述經過篩選的數據導入,用Matplotlib將處理的數據進行成圖展示,如圖1所示,可以直觀地看出不同時段公交車行程時間的變化。由圖1可見,在7:00和17:00左右,公交車的行程時間比平峰時期長2~3 min,這是受到早晚高峰車流的影響。

圖1 站間運行時間圖

2.2.2 ADF檢驗和白噪聲檢驗

進行平穩性檢驗,再根據檢驗結果確定是否需要進行差分。平穩性檢驗采取單位根檢驗(ADF)的方法,看序列是否存在單位根。如果不存在單位根那么序列平穩就不需要進行差分;如果存在單位根序列,那么序列不平穩則需要進一步確定差分階數。經過檢驗得到ADF的結果為0.112 47,由于大于0.05所以序列不平穩需要進行差分。為了使時間序列平穩,需要對序列在一階差分的基礎上進行二階差分(如圖2所示)。由圖2可以看出,時序圖圍繞常數進行波動,一階差分基本滿足平穩性,可使序列平穩。

圖2 差分結果圖

ADF檢驗后需要進行白噪聲檢驗,也叫純隨機性檢驗。白噪聲序列相互之間沒有關聯,是無法預測的歷史數據且無法影響未來的數值,所以要進行預測就需要保證序列具有規律性,通過程序計算出統計量為3.03754254e-7,由于小于0.05所以序列不是白噪聲,可以繼續預測。

2.2.3 時間序列定階

ACF和PACF定階,用Matplotlib中的subplot函數畫出ACF圖和PACF圖。如圖3所示為ACF圖,橫坐標為滯后階數,縱坐標為ACF值,可以看出圖3中的1階后震蕩衰減趨于零。如圖4所示為PACF圖,橫軸為滯后階數,縱軸為PACF值,圖4中的1階后震蕩衰減趨于零。根據表2所示的定階原則,確定出p=1、q=1。

圖3 ACF圖

圖4 PACF圖

表2 定階原則表

模型 ACF PACF

AR(p) 衰減趨于零

(幾何型或震蕩型) p階后截尾

MA(q) q階后截尾 衰減趨于零

(幾何型或震蕩型)

ARMA(p,q) q階后衰減趨于零

(幾何型或震蕩型) p階后衰減趨于零

(幾何型或震蕩型)

3 模型評估

通過殘差檢驗對建立的模型進行評估,殘差是模型擬合值和觀測值之間的差值。好的模型殘差為正態分布,方差固定,均值為0,沒有自相關性。通過將殘差的數據表現成圖,檢驗其相關性,如圖5所示,縱坐標為殘差,橫坐標為樣本數,隨著樣本數的增加,殘差不會顯示任何明顯的季節性,均值接近0。圖6所示為殘差QQ圖,QQ圖的計算原理是將數據由小到大排列,并按1到n進行標號,計算分位數。計算公式為:

(i?0.5)/n (1)

式中,i——第i個數據的標號。

橫軸為正態分布的理論分位數,縱軸為殘差的分位數,做y=x的直線,QQ圖趨近落在y=x直線上,說明兩分布相似。上述檢驗都說明建立的模型近似正態分布,滿足要求。

圖5 標準化殘差圖

圖6 殘差QQ圖

4 模型預測

建立的模型確定了階數,并且對其進行了評估,充分證明了模型的可用性,最后就可以用確定的模型進行預測。對處理后的公交車輛站間運行時間的歷史數據進行劃分,并利用所建立的模型進行預測,如圖7所示為預測結果。橫坐標為樣本數,縱坐標為運行時間,藍色實線為歷史數據、紅色虛線為預測的行程時間。從圖7中可以看出,預測部分的誤差在2 min以內,表明該模型在預測公交運行時間上的可行性,通過增加數據量,可以預測出任意兩站點之間在不同時段的運行時間。

5 結語

該文闡述了公交站間行程時間的研究方法,分析了相關模型原理。并且基于ARIMA模型,對西海岸新區公交車GPS數據進行了處理,選出所用線路、站點的數據,對數進行預處理。以東1路卓亭廣場站至崇明島路小學站的下行路線為例,建立模型并進行預測,其間使用了Python語言進行處理數據、展示數據、可視化、模型建立,以及檢驗過程用到了很多的Python庫,如Numpy、Pandas、Matplotlib、Statsmodels等。構建ARIMA模型時,首先可視化展示數據并對數據初步觀察,對數據進行平穩性和白噪聲檢驗,使用ACF、PACF定階,再通過殘差檢驗模型,用Matplotlib展示殘差的QQ圖,最后通過檢驗后,劃分訓練集和測試集,得出模型的預測值。

參考文獻

[1]周雪梅, 楊曉光, 王磊, 等. 公交車輛行程時間預測方法研究[J]. 交通與計算機, 2002(6): 12-14.

[2]陳巳康, 詹成初, 陳良貴. 基于路段行程時間的公交到站預測方法[J]. 計算機工程, 2007(21): 281-282.

[3]胡繼華, 李國源, 程智鋒. 基于馬爾科夫鏈的公交站間行程時間預測算法[J]. 交通信息與安全, 2014(2): 17-22.

[4]Kumar B A, Mothukuri S, Vanajakshi L, et al. Analytical approach to identify the optimum inputs for a bus travel time prediction method[J]. Transportation Research Record, 2015(1): 25-34.

[5]Amita J, Jain S S, Garg P K. Prediction of bus travel time using ANN: a case study in Delhi[J]. Transportation Research Procedia, 2016(17): 263-272.

[6]黃明芳, 鄭娜英. 基于RBF-BP協作神經網絡的公交行程時間預測[J]. 閩江學院學報, 2017(5): 100-107.

主站蜘蛛池模板: 四虎精品国产AV二区| 四虎影院国产| 日韩资源站| 久草视频一区| 午夜精品区| 日韩中文字幕免费在线观看 | 欧美亚洲香蕉| 91年精品国产福利线观看久久| 欧美日韩国产精品综合| 中文字幕66页| 婷婷亚洲天堂| 亚洲va欧美ⅴa国产va影院| 九九这里只有精品视频| 99成人在线观看| 一级看片免费视频| 欧美曰批视频免费播放免费| 久热re国产手机在线观看| 国产欧美高清| 91青青在线视频| 欧美不卡视频在线| 宅男噜噜噜66国产在线观看| 欧美自慰一级看片免费| 日本91视频| 91精品专区| 国产男人天堂| 国产三级韩国三级理| 九九热视频在线免费观看| 免费国产小视频在线观看| 少妇高潮惨叫久久久久久| 国产精品lululu在线观看| 91成人在线免费视频| 国产小视频a在线观看| 色综合久久久久8天国| 亚洲第一在线播放| 国产办公室秘书无码精品| 91精品国产综合久久不国产大片| 国产99视频精品免费视频7 | 中文字幕色在线| 欧美一区二区丝袜高跟鞋| 欧美亚洲一区二区三区在线| 日韩资源站| 国产免费黄| 亚洲免费黄色网| 国产免费久久精品99re不卡| 亚洲一级毛片| 911亚洲精品| 国产精彩视频在线观看| 久久久久亚洲精品成人网 | 欧美性天天| 亚洲自偷自拍另类小说| 久久国产V一级毛多内射| 中文字幕人成人乱码亚洲电影| 亚洲综合九九| 欧美福利在线| 真实国产乱子伦视频| 中文国产成人精品久久| 国产女人在线| 成年人国产网站| 国产浮力第一页永久地址| a级高清毛片| 农村乱人伦一区二区| 午夜丁香婷婷| 色综合中文综合网| 91亚洲影院| 无码一区二区三区视频在线播放| 青青草一区| 欧美日韩专区| 人妻丰满熟妇αv无码| 国产黄网永久免费| 国产91丝袜| 久久免费看片| 网久久综合| 色成人亚洲| 男人天堂亚洲天堂| 国产成人精品一区二区秒拍1o| 91年精品国产福利线观看久久| 国产第一页亚洲| 精品国产免费观看一区| 欧美三级视频网站| 国产一级裸网站| 色欲综合久久中文字幕网| 天堂成人在线|