999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

公交車到站時間預測模型研究

2020-03-26 15:13:40吳少健江秋楓盧潔楚李子晗朱潤峰
機電工程技術 2020年2期
關鍵詞:模型

吳少健,江秋楓,盧潔楚,李子晗,朱潤峰

(廣東工業大學機電工程學院,廣州 510006)

0 引言

眾所周知,公共交通能提高交通效率,并且具有低碳、運量大、承載率高的優點。實現智能公交是發展智能交通的重要內容。合理調度公交車以有效治理交通擁堵,其中需要能精確預測公交車到站時間的方法。

公交車在行駛過程中受到諸多因素的影響,到達指定站點的時間難以準確預測。一些模型的提出,可以探索出公交車運行的機理,從而準確預測。

從文獻[1]可以看到公交車到站預測主要分為三類:第一類是基于公交車GPS數據的研究;第二類是基于公交IC卡數據的研究[2-3];第三類是將2種數據融合綜合研究。其所用建模大同小異,常用的有時間序列模型、卡爾曼濾波模型、人工神經網絡模型[4-5]和支持向量機模型[6]等。

本研究結合社會車對公交車的影響,運用決策樹和隨機森林等6個模型預測公交到站時間,根據公交到站時間預測的特征和6個預測模型的特征等提出了可拓預測模型。測試結果可以看出,該模型有效并可接受。

1 大數據處理及挖掘分析

1.1 數據來源

數據來源于廣州市2019年3月1日公交進出站數據和出租車GPS數據。

公交車GPS終端系統在依次報站的同時,對公交車進出站信息進行記錄。每一條記錄的內容包括了很多屬性,如表1所示。

表1 公交車數據屬性

出租車GPS數據記錄了出租車在廣州道路上行駛的情況,數據由出租車上的GPS發出,并在終端進行記錄。記錄周期為15 s左右1次。每一條記錄包括很多屬性,具體內容如表2所示。

1.2 數據預處理

公交路線140路經過廣州大道、東風東路、黃埔大道等主干道,途經珠江新城等客流車流大的商業密集區,有較高的研究價值。考慮140路公交路線經過的主要干道以及兩站點之間的距離等情況,最終選擇“石牌村站—冼村站—人民日報廣東分社站”3站之間的路段作為研究對象。

表2 公交車數據屬性

1.2.1 公交車進出站數據的預處理

(1)將數據導入數據庫,進行篩選。在SQL Server中,以ROUNT_NAME為140路為限制條件進行篩選,初步得到140路公交車進出站的所有數據。

(2)將篩選后的數據進行排序以及數據剔除,包括缺失值和重復值。進一步探究數據,發現其中存在重復記錄到站的現象。在數據量較多的條件下,對此小部分數據進行數據剔除處理。

(3)將剔除后的數據進行相關計算,便可得到輸入變量和輸出值。

1.2.2 公交車進出站數據的預處理

(1)將數據導入數據庫,進行篩選。

(2)將站點GPS之間的路段進行點集化處理。

(3)進行路網匹配。由于出租車GPS數據本身存在漂移的現象,為了盡可能地匹配出足夠的數據量,需對不同的匹配距離(即出租車GPS點與點聚化的GPS點之間距離)做一個探究,可得到篩選數據量與匹配距離的關系,選擇匹配距離為0.000 4(*111 000 m)作為約束條件進行篩選。

(4)對數據進行相關計算,得到輸入變量。

1.3 數據挖掘分析

公交車在實際運行中會受到各種隨機因素的影響,例如:時段、節假日、交通擁擠程度、交通意外等。要較準確預測公交到站時間,需要對不同的影響因素進行數據采集和挖掘分析。可以作為特征向量的有以下3個:

(1)在“石牌村站”的停靠時間由公交進出數據選取站臺停留時間作為輸入樣本的變量,記為v1。

(2)在“石牌村站”與“冼村站”之間的行駛時間由公交進出數據選取兩站的行駛時間作為輸入樣本的變量,記為v2。

(3)社會車速度由出租車GPS數據選取在“石牌村站”與“冼村站”之間的行駛時間內,道路上的出租車速度的平均值作為輸入樣本的變量,記為v3。

目標值的選取由公交進出站數據得到,即“冼村站”到下一站“人民日報廣東分社站”之間的行駛時間作為輸出樣本的因變量,記為t。

3個特征向量與目標值進行皮爾遜相關性分析,如圖1所示,發現目標值t與v1呈現弱相關,與v2呈中等強度相關,與v3呈負的強相關。這說明特征向量的選取是合理的。

圖1 各特征向量皮爾遜相關性分析情況

2 可拓預測的建立與應用

2.1 可拓預測的框架

(1)目標的確定

公交車到站時間預測,記為t0,可用物元形式[7]表示為:

(2)目標條件分析

公交車到站時間預測的依據記為L0,可用物元形式表示為:

(3)建立問題的可拓模型

根據所確定的目標和目標條件,可以發現問題的矛盾是復雜的自然環境、道路情況和現有的設施設備難以用已有的預測模型進行準確、穩健、及時地預測。為了解決此矛盾問題,進行目標與條件的拓展與變換。

(4)已有預測模型的共軛分析

公交車到站時間預測的硬部是天氣情況、道路情況、紅綠燈情況等部分,這些部分之間的聯系屬于軟部。硬部可以采取相關技術獲得數據,用數據來表征。軟部通過數據間的關系呈現出來。模型為描述刻畫數據間關系和規律的載體。所運用的6個模型呈現出數據在不同情況下的規律。

(5)對不相容問題進行拓展分析

根據模型的特點,對條件L0進行發散分析,從一物多征、一征多值、一值多征等角度描述公交車到站時間預測的特征,預測模型的特征等。對目標t0進行蘊含分析,借助已有預測模型和相關數據以實現目標。

多元線性回歸模型適用于規律性強的情況;ARIMA模型適用于短期的平穩時段;SVM模型適用于長期樣本少的情況;BP神經網絡模型適用于長期樣本多的情況;Decision Tree和Random Forest模型適用范圍廣泛。預測模型很大程度上解決了目標條件的不穩定性和不確定性,使得預測效果有效可靠。

(6)創意方案的生成

6種預測模型適用于不同的數據情況,在數據增刪、擴縮、分解和組合后,匹配合適的模型后能生成多種創意方案。基于公交路線140路的研究,得到以下選擇模型的依據:

(a)若數據量大,優先使用決策樹;

(b)在平穩條件下,預測到較近的站,優先考慮時間序列模型;

(c)若數據量少,預測到較遠的站,優先考慮SVM模型;

(d)在硬件支持的條件下,優先考慮隨機森林模型;

(e)若道路等情況平穩,采用均值法或多元線性回歸模型。

(7)預測模型的最終選取

預測模型的選取依據主要看區分度和指標度。區分度體現在預測模型運用時的適用情況以及發生概率;在指標度選取了判定系數R-Squared,平均絕對誤差MAE和均方根誤差RMSE這3個指標為依據。

2.2 可拓預測的應用

(1)目標

預測公交車從“石牌村站”到“冼村站”后,從“冼村站”到“人民日報廣東分社站”的時間。要求預測準確,保證誤差可接受,實現概率高。即預測值與實際值不能差別太大,而且預測值發生的概率不能過低。

(2)條件

數據來源于廣州市2019年2月16日至2019年2月22日公交進出站數據。根據這一周的數據量可以挖掘出特征向量在“石牌村站”的停靠時間,在“石牌村站”與“冼村站”之間的行駛時間。此外,已經使用6個模型進行2019年3月1日當天的預測,已初步了解6個模型的適用情況。

(3)建立可拓模型

原本只有一天的數據量,現在有了一周的數據量。6個預測模型分別單獨用于預測,結果顯示誤差較大,沒有發揮出模型自身的優勢。因此,對數據和模型進行雙向的選擇,建立可拓建模。

(4)拓展與變換

由數據支持,可進行置換變換和擴縮變換,一天可以分為高峰期和非高峰期,一周可分為工作日和非工作日,因此增加“是否工作日”和“是否高峰期”這2個特征向量。運用6個預測模型于不同的場合,得到如表3所示的結果。

表3 各模型在不同場合下的適用情況

(5)創意方案生成

根據模型的表現挑選不同具體情況下的模型,從而進行組合。組合方式多種多樣,這里給出一種方案,如表4所示。

表4 不同場合下的模型選取

將數據進行分組,代入相對應的模型進行預測,結果如下:

test r2_score:0.5463

mean_squared_error:0.508

mean_absolute_error:0.512

圖2 各模型的R方情況

2.3 結果分析

可拓預測模型的優點為區分度高和指標度好。可拓預測充分考慮了數據的特征,從而企圖挖掘出數據背后的規律。可拓預測是利用大數據進行可拓變換,研究公交車到站時間機理的過程。指標度選取了R方,RMSE和MAE這3個依據。如圖2(圖中字母為各模型英語單詞的縮寫,如MLR表示多元線性回歸;EP表示可拓預測,下同)所示,可拓預測的R方并不高,但也不是最低,說明可拓預測擬合的效果一般。但圖3和圖4表現出,可拓預測的RMSE和MAE在所運用模型中是最低的,說明可拓預測的誤差是最可接受的,準確度是偏高的。整體來說,可拓預測模型是有效的。

圖3 各模型的RMSE情況

圖4 各模型的MAE情況

可拓預測模型的缺點為操作難度高和可移植性低。處理數據時會遇到記錄不完整、缺失或重復等問題,模型應用中需要尋找最優的參數;選取特征向量和目標值、多次運用模型結果取平均值等工作繁雜且量多。可拓預測模型還不是一個成熟的模型,目前僅僅解決了廣州市公交路線140路公交車到站時間預測問題,如果更移到其他情境,需得重新審視一番,因為暫時還沒有形成一個統一、快速、標準和規范的系統來專門解決相關問題。因此,模型運用時有盲目性,無可避免地要去試錯。

3 結束語

公交車到站時間的機理以停靠時間、行駛時間和社會車速度等變量來審視,在決策樹、隨機森林等6個模型的基礎上提出了可拓預測模型。結果表明,可拓預測模型與單一模型相比是可接受的和有效的。可拓預測模型是基于數據規律和模型特點的復合模型,其準確度比單一模型高。在實際運用方面,可拓預測模型具有操作難度高和可移植性低的缺點,有待未來改進。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 日韩高清一区 | 国产乱人免费视频| 欧美黄网站免费观看| 久久久精品国产SM调教网站| 91精品综合| 国产又粗又爽视频| 国产真实自在自线免费精品| 色综合久久88| 国产青榴视频在线观看网站| 国产最新无码专区在线| 三上悠亚在线精品二区| 日本三级黄在线观看| 国产精品精品视频| 综合亚洲网| 99国产精品国产高清一区二区| 国产导航在线| 国产99视频精品免费观看9e| 欧美日韩一区二区三区在线视频| 亚洲最黄视频| 色色中文字幕| 欧美翘臀一区二区三区| 成人一级黄色毛片| 亚洲欧州色色免费AV| 伊人久久福利中文字幕| 欧美在线一二区| 亚洲第一成年网| 无码AV动漫| 精品国产香蕉伊思人在线| 91精品久久久久久无码人妻| 日韩一级二级三级| 欧美一级在线播放| 99福利视频导航| 中文字幕日韩视频欧美一区| 国产成人精品2021欧美日韩| 国产99精品久久| 亚洲欧美日韩中文字幕在线一区| 久久婷婷国产综合尤物精品| 亚洲精品成人福利在线电影| 九九免费观看全部免费视频| 国产一区二区丝袜高跟鞋| 亚洲精品少妇熟女| 亚洲一区二区在线无码| 久久精品这里只有国产中文精品| 欧美一区二区自偷自拍视频| 男人天堂伊人网| 看av免费毛片手机播放| 日本欧美视频在线观看| 成人在线不卡视频| 欧美日韩久久综合| 欧美日韩理论| 在线视频亚洲色图| 国内精品久久人妻无码大片高| AV老司机AV天堂| 亚洲二区视频| 成人精品亚洲| 一区二区三区四区精品视频| 久久美女精品| 区国产精品搜索视频| 最新国产精品鲁鲁免费视频| 成人在线第一页| 国产永久免费视频m3u8| 日本一区二区不卡视频| 久久精品人人做人人爽电影蜜月 | 亚国产欧美在线人成| 666精品国产精品亚洲| 久久精品最新免费国产成人| 国产成人1024精品下载| 免费国产好深啊好涨好硬视频| 亚洲色精品国产一区二区三区| 国产91成人| 国产精品人莉莉成在线播放| 欧美精品1区| 欧美一区二区三区国产精品| 美女无遮挡免费网站| 孕妇高潮太爽了在线观看免费| 露脸国产精品自产在线播| 日韩大片免费观看视频播放| 国产欧美日韩一区二区视频在线| 成人午夜天| 毛片手机在线看| а∨天堂一区中文字幕| 亚洲伦理一区二区|