999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多源數據的城市群樞紐間多模式交通系統異常狀態影響研究

2023-06-02 09:17:54馬書紅陳西芳
關鍵詞:關聯規則

馬書紅,楊 濤,岳 敏,陳西芳

(1. 長安大學 運輸工程學院,陜西 西安 710064;2. 生態安全屏障區交通網設施管控及循環修復技術交通運輸行業重點實驗室,陜西 西安 710064)

0 引 言

2019年《交通強國建設綱要》明確提出“構建便捷順暢的城市(群)交通網”、“城市群2小時通達”,2021年《國家綜合立體交通網規劃綱要》提出,綜合交通網絡需要增強互聯互通,推動融合發展,提升運輸整體效率,為進一步發展城市群交通指明了方向。隨著城市群一體化多模式交通網絡的建設,出行者的聯程出行需求不斷擴大,但多模式交通網絡在組合效率、換乘銜接、功能協作等方面還存在短板;同時,突發異常狀況(如突發客流、線路故障、自然災害等)也會對多模式交通網絡帶來極大沖擊,需要提出快速應對策略和提高網絡韌性。因此,在異常狀態發生時,如何準確判別城市群多模式客運交通系統的異常狀態、受影響的通道/樞紐和影響范圍,提出應急對策,確保城市群樞紐間多模式交通一體化運行效率成為當前亟待解決的重點問題之一。

在樞紐異常事件的識別及影響研究方面,R.SILVA等[1]基于智能卡數據提出一種用于量化因軌道線路和車站關閉產生影響的方法;SUN Huijun等[2]利用貝葉斯方法對突發事件進行識別并建立城市軌道交通網絡中斷影響評估模型;楊靈[3]分析了突發大客流在城市軌道交通網絡的擴散過程及傳播特性;李臣等[4]利用地鐵AFC數據對大客流下時空影響范圍做出識別。上述研究多基于網絡理論對異常影響范圍進行界定,對乘客的實際出行需求考慮較少。隨著多源大數據分析技術的發展,利用手機信令數據分析城際間乘客出行能夠更加準確地反映實際情況[5]。結合多源出行數據,利用關聯規則挖掘方法能夠更好地發現數據集中有意義的聯系。比如,利用出租車GPS數據和關聯規則,李勇[6]分析了城市道路擁堵的關聯性和傳播特性;YU Wenhao[7]提出了挖掘一定時段內頻繁項集的移動路徑算法;項譯[8]使用手機信令數據并基于出行軌跡的關聯性,研究了景區游客的路線分布規律?;谲壍澜煌ㄋ⒖〝祿?、AFC數據提取相關出行信息,褚凡[9]利用關聯規則挖掘方法分析軌道交通客流特征和出行行為;GUO Xin[10]分析了通勤時段內強關聯性的地鐵站點組合。

基于此,筆者擬在獲取手機信令數據的基礎上,結合意向出行調查及客票信息等多源數據提出城市群樞紐間多模式交通系統異常狀態影響范圍識別流程與方法,并結合京津冀城市群樞紐間多模式交通出行典型場景進行分析和驗證,為利用數據挖掘方法確定突發異常狀態的影響和對策提供借鑒,為進一步完善城市群多模式交通系統應急處置、韌性評估和提升等提供理論基礎。在此基礎上,為提高管理部門在面對災害和突發事件等異常狀態下的快速反應能力和主動保障能力,提高城市群樞紐間多模式交通系統銜接協調和整體運行效率提供支撐。

1 城市群多模式交通系統異常狀態分類

筆者將異常狀態定義為“由于突發事件所導致的樞紐(間)客流的非正常狀態”。突發事件指突然發生、造成或可能造成嚴重社會危害、需要進行緊急處理的事件,包括突發事故、自然災害、恐怖主義行為、重大群體性事件等。筆者從需求端非常態客流變化和供給端運輸能力下降 2 個方面對城市群多模式交通系統異常狀態進行分類總結,如表1。

表1 城市群多模式交通系統異常狀態分類

2 基于多源數據的異常狀態影響范圍識別流程及方法

2.1 異常狀態影響范圍識別流程

筆者基于獲取的手機信令數據、乘客意向出行調查數據、客票數據及地圖信息等提出針對某些異常狀態影響范圍的識別流程,如圖1。

圖1 基于多源數據的異常狀態影響范圍識別流程 Fig. 1 Recognition process of the influence range of abnormal state based on multi-source data

異常狀態影響范圍識別的關鍵是樞紐間通道客流異常聚集檢測和樞紐群強關聯規則挖掘。前者是借助手機數據獲取惡劣天氣、節假日活動期間乘客的出行鏈信息,得到樞紐間通道客流量,利用貝葉斯預測方法就實際客流量給出動態安全閾值,進而識別通道客流的異常聚集狀態;后者是在獲得與實際和假定異常情況相關的乘客出行鏈基礎上,利用Apriori算法挖掘乘客出行經由的樞紐群頻繁項集,并應用關聯規則特性指標對關聯規則有效性進行判別,得到樞紐組合的強關聯規則,識別異常條件下受影響的樞紐群。

2.2 樞紐間通道客流異常聚集檢測

樞紐間通道客流異常聚集檢測主要基于統計學方法,首先根據歷史的通道客流數據構建一般化模型,之后結合研究時段內的通道客流數據,利用貝葉斯預測得到動態模型參數,同時確定客流人數θ的異常檢測閾值。主要建模步驟如下:

1)利用歷史手機信令數據獲取所研究的樞紐間客流量,分析并確定合適的通道客流分布類型。

2)確定先驗分布模型參數,得到分布密度π(θ)。

3)根據貝葉斯公式確定θ的后驗分布密度,如式(1):

(1)

式中:h(θ|x′)為后驗分布密度;π(θ)為先驗分布密度;P(x′|θ)為樣本x′在給定θ條件下的聯合分布密度;Θ為參數空間。

4)以滿足99.7%的概率條件確定客流人數閾值范圍。

2.3 樞紐群強關聯規則挖掘

關聯規則表示不同數據項目在同一事件中出現的相關性,能夠利用有效算法對大量數據集進行數據挖掘。Apriori算法是一種關聯規則發現方法,可從大量數據集中尋找項集之間的隱含關系。筆者選擇利用這種算法做初步的樞紐關聯性挖掘,獲得頻繁項集,并基于大量的頻繁項集通過設定條件獲取關聯規則,從而得到關聯性高的樞紐群。

置信度和支持度是廣泛用于獲取簡單關聯規則的有效指標。筆者將置信度表示為C(X→Y),反映樞紐X出現條件下樞紐Y出現的可能性;同時將支持度表示為S(X→Y),反映項集(X,Y)在乘客出行事務集中出現的概率。

在獲得滿足一定支持度和置信度的頻繁項集的基礎上,利用興趣度指標(規則提升度、余弦相似度等)來分析樞紐關聯規則的有效性。規則提升度為規則置信度與樞紐Y的支持度之比,反映乘客在出行過程中,樞紐X的出現對樞紐Y出現的影響程度,其計算公式如式(2):

(2)

式中:S(X)為樞紐X的支持度;S(Y)為樞紐Y的支持度。

當兩個規則具有相同提升度時,可利用提升度的標準化值來區別其重要性順序。標準化的提升度作為興趣度比原值更加有效[11],其計算公式如式(3):

(3)

式中:υ和λ為標定參數,分別為最小支持度閾值σ和最小置信度閾值κ的函數。標定原則如式(4)、式(5):

(4)

(5)

余弦相似度作為興趣度也可以對樞紐關聯規則的有效性進行判別,余弦相似度值越大表示樞紐之間的關聯性越強,其計算公式如式(6):

(6)

同樣地,可以利用標準化的余弦相似度來區別樞紐關聯規則的重要性順序,其計算公式如式(7):

(7)

與標準提升度一樣,υ′和λ′為標定參數。標定原則如式(8)、式(9):

(8)

(9)

3 乘客出行鏈信息獲取

利用多源數據獲取乘客的出行鏈信息(手機數據、意向調查數據)和出行相關地理信息(高德地圖),確定樞紐間通道客流量和乘客出行經由的樞紐情況,為分析客流安全閾值和樞紐頻繁項集挖掘提供基礎[12]。針對“城市群地域范圍廣、樞紐數量多、城際和城內交通方式多、管理主體多、異常狀態類型多”這一現狀,選取典型場景開展研究。以京津冀城市群為例,重點針對城市群內部城際間的旅客出行需求。

3.1 基于手機信令數據的乘客出行信息獲取

3.1.1 手機信令數據內容

極智數據庫平臺開放了基于聯通全量手機用戶信令數據的用戶駐留和出行位置數據,輔以用戶入網基礎屬性、通信相關偏好屬性和消費等多源數據。以此為基礎,利用Hive SQL語句從數據庫平臺提取的乘客出行數據示例結果如表2。

表2 乘客出行數據示例

3.1.2 數據范圍選取

根據在線平臺數據情況和對異常狀態的分類結果,結合示范場景信息來確定研究的樞紐范圍。筆者對2019年5月京津冀城市群內發生的 2 種異常狀況進行研究:節日期間大規模乘客出行(2019年5月2日)和突發雷雨大風天氣(北京,2019年5月19日),提取的數據量分別為480 983條和414 162條。同時提取2019年5月5日至5月18日的出行數據作為正常日出行參考,數據總量為614萬余條。

最終確定基于手機數據研究的交通樞紐(表3),其包括航空樞紐3個(因數據時間范圍限制, 不含北京大興國際機場)、鐵路樞紐10個、公路樞紐24個,共37個。

表3 京津冀城市群內研究的樞紐范圍

3.2 基于意向調查數據的乘客出行信息獲取

由于手機數據獲取的異常出行數據比較有限,為擴展異常狀態研究范圍,筆者以京津冀城市群為研究對象,對出行者在一定異常狀態下對單程和聯程出行方案的意向選擇/調整情況進行問卷調查。問卷假定的異常場景包括北京西站突發大客流(Q1)、強降雨天氣導致保定東至石家莊鐵路段關閉(Q2)、保定東至石家莊段高鐵線路事故(Q3),結合出行時間、出行目的、出行起訖點,最終設定異常狀態下的出行場景共12種,如圖2。

圖2 假定異常狀態下的出行場景Fig. 2 Travel scenarios in assumed abnormal state

調查共獲得問卷1 667份,有效問卷1 336份。其中,男性和女性受訪者分別占47.53%和52.47%;年齡在21~40歲區間內的受訪對象為研究的核心人群(比例為62.20%);從職業和月收入情況看,政府工作人員、企業上班族和學生共占88%,57%的受訪者月收入位于3 000~15 000元之間。

4 異常狀態影響范圍確定

4.1 通道客流分析及檢測結果

考慮到數據采集的精度,筆者針對一定樞紐范圍獲取樞紐間的通道客流量。共獲取2019年5月2日10的613位乘客信息,2019年5月19日的8 275位乘客信息。

通過處理部分手機數據得到強鏈接樞紐間的客流量,在此基礎上應用2周的客流數據并采用正態性檢驗方法進行驗證。表4中各通道的顯著性均大于0.05(95%置信度),表明各強鏈接樞紐間客流量服從正態分布假設。

表4 強鏈接樞紐間客流量的正態性檢驗結果

應用極大似然估計初步估算各樞紐通道客流先驗分布參數,利用貝葉斯方法求得后驗信息,并不斷對先驗信息進行修正。在獲得分布參數之后,利用拉依達準則(準則)作為人數異常檢測的依據。最終得到2019年5月2日和2019年5月19日的樞紐間通道客流量及其安全閾值,如圖3。由圖3(a)可以看出,2019年5月2日,通道2、通道3的客流均超過了閾值上限,說明這兩個通道客流已經達到異常聚集狀態,應設計疏散方案及時進行客流疏散;通道1、通道5、通道6、通道8的客流接近安全閾值上限,應急管理部門應針對此通道提前設計預案,以防客流溢出。由圖3(b)可以看出,2019年5月19日,通道4、通道7的客流超出了安全閾值,達到異常聚集狀態;通道6的客流超出閾值下限,說明在大風影響下,可能部分采用航空出行的客流轉而采用高鐵出行,并導致通道7客流達到異常聚集的狀態。

圖3 各樞紐間通道客流量及安全閾值Fig. 3 Passenger flow and safety threshold of channels between hubs

4.2 基于關聯規則的異常狀態影響范圍研究

為進一步確定受影響的樞紐(群),基本思路是利用Apriori算法挖掘樞紐群的頻繁項集,應用關聯規則挖掘正常和異常情況下關聯性高的樞紐群,結合發生異常情況的位置確定該異常狀態的影響范圍。

4.2.1 基于手機數據的樞紐關聯規則挖掘及影響范圍確定

設定最小條件支持度閾值為0.5%,最小置信度閾值為10%,得到基于手機數據的關聯規則挖掘結果如表5。

表5 基于手機數據的乘客出行經由樞紐的關聯規則

分別計算每條規則在工作日、非工作日、節假日和突發大風天氣時的提升度及其標準化值(圖4)、余弦相似度及其標準化值(圖5)。

圖4 各時段下基于手機數據挖掘的規則提升度標準化值Fig. 4 Standardized value of rule enhancement based on mobile data mining at different time periods

圖5 各時段下基于手機數據挖掘的規則余弦相似度標準化值Fig. 5 Standardized values of rule cosine similarity based on mobile data mining at different time periods

結合正常日和兩種異常狀態下的樞紐群關聯結果,同時分析相關的關聯規則興趣度指標,確定受不同影響情況的樞紐站點。得到兩種異常狀態下受影響的樞紐范圍如表6。

表6 異常狀態下的樞紐影響范圍

4.2.2 基于調查數據的樞紐關聯規則挖掘及影響范圍確定

3種假定異常情況下意向出行的2-頻繁項集分析結果如圖6,不同粗細的線條反映了樞紐之間關系的緊密程度。

圖6 強鏈接樞紐的2-頻繁項集Fig. 6 Frequent itemset of strongly linked hubs

由圖6可以看出,在Q1這一突發事件下,北京西站和石家莊站、保定東站和石家莊站、保定站和徐水站容易被出行者選擇;在Q2這一突發事件下,保定東站和石家莊站、北京西站和石家莊站、保定東站和北京西站、保定站和徐水站容易同時被出行者選擇;在Q3這一突發事件下,保定東站和石家莊站、北京西站和石家莊站、保定東站和北京西站容易被出行者選擇。在進行相應狀態下的通道客流異常識別時,可重點考慮這些強鏈接的鐵路樞紐間通道。

針對假定的3種異常情況,分別設定最小條件支持度閾值為13%、21%、15%,設定最小置信度閾值為80%,得到基于意向調查數據的關聯規則挖掘結果,如表7。分別計算每條規則在不同異常情景下的提升度和余弦相似度,同時結合假定異常事故發生位置和樞紐關聯性挖掘結果,最終確定假定異常狀態下的樞紐影響范圍,如表8。

表7 基于意向調查數據的乘客出行經由樞紐的關聯規則

表8 假定異常狀態下的樞紐影響范圍

4.2.3 結果分析

實際異常狀態下受影響的樞紐類型比較齊全,包括航空、鐵路和公路樞紐,說明基于手機數據獲取的實際出行數據能夠很好地反映多種類型樞紐間通道的客流分布情況。假定異常場景下受影響的樞紐均為鐵路站點,其一方面與意向調查假定的場景有關,假定的異常狀態均發生在鐵路站點或站間線路上;另一方面,在意向調查中,不同出行方案之間相互交叉的樞紐較少,僅能反映同一類型樞紐站點的關聯程度。因而在實際應用過程中,利用相對客觀、較大樣本的手機數據能夠更好地反映樞紐組合的關聯性,進而確定受影響的樞紐群。

5 結 語

筆者基于手機信令數據、意向出行調查及客票信息等多源數據,提出了城市群樞紐間多模式交通系統客流異常狀態的確定及影響范圍識別方法,針對節假日和突發大風天氣情況,分析和檢測了京津冀城市群內部樞紐間客流的異常聚集通道;就異常檢測結果與假定情況,結合樞紐群關聯分析得到所研究異常狀態的樞紐影響范圍。在實際發生相同異常情況時,影響范圍分析結果能夠有助于進行客流疏散方案決策和交通方式運營調度。筆者在對異常情況下乘客相關出行信息進行獲取時,由于手機數據時間范圍的限制,異常狀態類別較少,而利用多種異常時段下的手機數據能夠更真實地反映乘客選擇樞紐的關聯情況。

猜你喜歡
關聯規則
撐竿跳規則的制定
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
“一帶一路”遞進,關聯民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
規則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 婷婷丁香在线观看| 91午夜福利在线观看精品| 亚洲国产欧洲精品路线久久| 粉嫩国产白浆在线观看| 操国产美女| 国产一区二区三区夜色| 亚洲日韩Av中文字幕无码 | 国产精品网址你懂的| 露脸一二三区国语对白| 中文字幕在线永久在线视频2020| 亚洲中文字幕在线一区播放| 免费在线不卡视频| 欧美日韩第二页| 欧美一级高清免费a| 中文成人在线| 国产成人AV综合久久| 毛片免费视频| 国产一线在线| 亚洲国产第一区二区香蕉| 欧美色99| 欧美日韩国产在线观看一区二区三区| 欧美午夜视频| 亚洲欧美日韩色图| 毛片大全免费观看| 欧洲精品视频在线观看| 午夜毛片免费观看视频 | 久久一日本道色综合久久| 国产精选小视频在线观看| 国产亚洲欧美日本一二三本道| 永久在线播放| 91成人免费观看在线观看| 国产日韩欧美成人| 午夜毛片福利| 国产第八页| 欧美日韩中文国产va另类| 亚洲日韩国产精品无码专区| 九九香蕉视频| 久久青青草原亚洲av无码| 欧美成在线视频| 日韩二区三区| 亚洲a级在线观看| 2022国产91精品久久久久久| 无码综合天天久久综合网| 日韩在线网址| 久久精品亚洲热综合一区二区| 伊人久久婷婷五月综合97色| 另类欧美日韩| 亚洲精品无码AV电影在线播放| 香蕉在线视频网站| 日韩国产一区二区三区无码| 蜜桃臀无码内射一区二区三区| 欧美综合中文字幕久久| 深爱婷婷激情网| 亚洲一区色| 91毛片网| 亚洲成人福利网站| 日本伊人色综合网| 天天综合网色中文字幕| 无码乱人伦一区二区亚洲一| 香蕉国产精品视频| 手机看片1024久久精品你懂的| 欧美日韩中文国产va另类| 日本一区二区三区精品视频| 精品视频一区在线观看| 九色综合视频网| 国产精品第一区在线观看| 国产靠逼视频| 国产精品久久久免费视频| 日韩二区三区无| 亚洲福利一区二区三区| 国内精品九九久久久精品| 亚洲国产天堂久久综合226114 | 99在线观看国产| 波多野结衣无码视频在线观看| 波多野结衣在线se| 亚洲国产成人无码AV在线影院L| 欧美午夜网| 91久久偷偷做嫩草影院精品| 欧美综合成人| 日韩欧美中文字幕在线精品| 亚洲欧美日韩成人在线| 亚洲侵犯无码网址在线观看|