999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于刷卡數據和高斯混合聚類的地鐵車站分類

2017-06-21 15:05:43岳真宏陳峰王子甲黃建玲汪波
都市快軌交通 2017年2期
關鍵詞:分類

岳真宏,陳峰,2,王子甲,2,黃建玲,汪波

(1.北京交通大學土木建筑工程學院,北京100044;2.北京市軌道交通線路安全與防災工程技術研究中心,北京100044;3.北京市交通信息中心,北京100161)

基于刷卡數據和高斯混合聚類的地鐵車站分類

岳真宏1,陳峰1,2,王子甲1,2,黃建玲3,汪波3

(1.北京交通大學土木建筑工程學院,北京100044;2.北京市軌道交通線路安全與防災工程技術研究中心,北京100044;3.北京市交通信息中心,北京100161)

合理的城市軌道交通車站分類對車站的規劃設計及客流預測有重要作用。基于刷卡數據提取出行時間、頻次、車票類型等反映車站客流特性的若干變量,運用主成分分析法(PCA)和高斯混合模型(GMM)進行車站聚類。該聚類方法不僅可以識別車站類別,同時可以根據后驗概率確定混合類型的車站。以北京地鐵為例,將全網233個車站分為4類,利用地理信息系統(GIS)工具可視化分類結果,并疊加地理信息描述各類車站的特征,直觀地展示了部分混合性質的車站。與K-均值聚類結果比較顯示,GMM方法可以更好地解釋多種特性混合的車站類型。

地鐵;車站分類;刷卡數據;高斯混合模型;地理信息系統

城市軌道交通車站的分類對車站個性化設計有重要意義。目前,國內對于站點分類的研究主要集中在以節點導向的分類和以場所導向的分類[1]。大多數分類僅僅基于定性分析[24],而定量分析也有很大的局限性[56]。首先采用的數據量有限,不能全面反映車站的特性;其次分類結果往往是單純的幾類車站,不能反映車站可能同時屬于多種類型的實際。這種問題在基于用地性質或客流特性的分類上表現更為突出。如果車站緊鄰同等開放強度的居住用地或商業用地,非此即彼的分類可能掩蓋一些重要信息,不能很好地指導站點的個性化規劃設計。

既有研究表明,可以從交通智能卡數據中挖掘乘客出行時空分布、頻次等關鍵信息。這些信息可以為車站分類提供豐富的數據支撐。本文針對目前車站分類存在的問題,基于刷卡數據,引入主成分分析法和GMM聚類方法,建立了基于車站客流特性的具有一定柔性的車站分類方法。該方法不僅能從大量刷卡數據中提取最有效的信息,同時能給出車站從屬于某種特定類別的概率,以判斷車站是否為混合類型及其回合程度。本文采用該方法對北京地鐵網的所有車站進行了分類并利用GIS工具可視化了分類結果,取得了較好的效果。這種分類可以為軌道交通規劃、設計者基于客流特性和車站承擔的功能對站內及站外導向、便民服務等設施的配置提供數據支持。

1 基于卡數據的客流特征指標選取

城市軌道交通車站是乘客乘降的場所,是城市交通網絡的重要節點和集散點。對車站進行聚類分析,首先要從刷卡數據中提取出反映車站客流特性的具有代表性的相關因素作為初始變量。

1.1 刷卡數據描述

智能卡數據一般包含了卡號、上車站點、上車時間、下車站點、下車時間等信息,這些信息中包含了乘客出行的時空特性和卡屬性。在車站層次對客流的時空特性進行分析,獲得了早晚高峰客流分布、通勤客流分布、工作日和周末客流差異等特性,對卡屬性進行分析得到一票通的比例,為初始變量的選取提供支撐。

1.2 初始變量的提取與描述

綜合考慮通勤客流、早晚高峰客流特性、工作日與周末客流差異、一票通的比例等因素的影響,選取以下13個因素作為聚類分析的初始變量。各個變量的編號及主要反映的車站客流信息如下:

1)工作日早高峰進站客流量/工作日全天進站客流量(F1)、工作日晚高峰進站客流量/工作日全天進站客流量(F2)、工作日早高峰出站客流量/工作日全天出站客流量(F3)、工作日晚高峰出站客流量/工作日全天出站客流量(F4):這4個變量主要反映車站早晚高峰的客流特性,通常早高峰取6:30—9:30,晚高峰取17:00—20:00;

2)工作日全天客流量/周末全天客流量(F5):反映車站工作日和周末的客流差異;

3)工作日ABBA_A客流量/工作日全天客流量(F6)、工作日ABBA_B客流量/工作日全天客流量(F7):反映車站通勤客流的特性,其中,ABBA_A客流量表示滿足一天中從A站進站B站出站再從B站進站A站出站的乘客在A站的客流量,ABBA_B客流量表示滿足一天中從A站進站B站出站再從B站進站A站出站的乘客在B站的客流量;

4)一票通比例(F8):表示使用臨時卡進出站客流量與全天客流量的關系;

5)工作日單次進出站客流量/工作日全天客流量(F9):表示一天內在某車站內僅僅進站一次或出站一次的客流量與全天客流量的關系;

6)周末上午8:00—12:00出站客流量/周末全天出站客流量(F10)、周末下午3:00—7:00進站客流量/周末全天進站客流量(F11)、周末晚8:00—10:00進站客流量/周末全天進站客流量(F12)、周末晚8:00—10:00出站客流量/周末全天出站客流量(F13):反映了周末各個時段的進站(或出站)客流量與周末全天進站(或出站)客流量的關系。

2 GMM方法

將城市軌道交通車站分為K類,每一類車站均由一個單高斯分布生成,然而具體車站屬于哪個單高斯分布未知,因此假設每一個車站分別由K個單高斯分布的混合模型表示,即軌道交通車站由高斯混合模型生成的概率密度函數為:

式中,x是維度為d的向量;k為單高斯模型的數量;πk為第k個單高斯分布被選中的概率;μk,∑k為第k個單高斯分布的均值和方差;η(x|μk,∑k)為第k個單高斯分布的概率密度函數,可表示為:

利用高斯混合模型進行聚類的一般步驟如下:

1)估計數據由每個單高斯分布生成的概率,對于每個數據xi來說,它由第k個單高斯分布生成的概率為:

2)估計每個單高斯分布的參數,通過極大似然估計求出對應的參數值:

3)重復迭代以上兩步,直到似然函數的值收斂為止。

3 應用案例

本文以北京市軌道交通2014年10月13日至19日一周的刷卡數據為依據進行客流分析,刷卡數據經過篩選清理后,可用于車站客流特性分析。

3.1 公共因子的提取

選取了與車站客流特征相關的13個初始變量進行車站聚類分析,由于選取的初始變量較多,變量之間可能存在較大的相關性,因此需要對變量進行降維處理以從多個變量中提取隱藏的公共因子。本次公共因子的提取選擇主成分分析法從眾多的初始變量中提取出主成分變量。

在運用主成分分析法降維之前,需要進行KMO檢驗和Bartlett檢驗以考察結構效度,結果如表1所示,KMO檢驗系數0.867,概率值為0.000,結構效度較高,可以進行主成分分析。

表1 KMO和Bartlett的檢驗Tab.1 Tests of KMO and Bartlett

基于主成分分析法提取隱藏的公共因子,從13個反映車站客流信息的初始變量中提取出初始特征值大于1的2個成分。這2個成分可以解釋原信息中81.443%的信息量,可以較好地提取出客流信息。因此,可以選用這2個成分作為主成分分析法的公共因子。

3.2 GMM聚類結果及分析

以提取出的2個公共因子為聚類變量,利用GMM模型進行聚類,分別選取K值為3,4,5,6,將不同的聚類結果進行分析比較,得知當K=4時聚類結果更符合實際情況,因此將全網233個車站分為4類進行聚類分析。刷卡數據中提取出來的信息不含車站的社會屬性等定性的描述,而刷卡數據反映的交通樞紐和旅游商業區性質的車站具有相似的分類指標,因此文中將交通樞紐和旅游商業區歸為一類,后續研究可以進一步做定性區分。

根據GMM模型將北京地鐵全網233個車站分為4類,則各類質心附近的典型車站初始變量指標如表2所示。

表2 質心附近典型車站初始變量指標Tab.2 Initial variable indicators of typical stations near the center ofmass

基于GMM模型進行站點分類的依據為模型產生的后驗概率,站點聚類結果由GIS工具展示如圖1。

對聚類結果進行分析,所得結論描述如下:

1)第1類站點為工作區車站,如金臺夕照站、國貿站、中關村站、永安里站、西二旗站、生物醫藥基地站。該類車站多分布于市二環至四環之間,從地理位置上看,北城工作區站點數量明顯高于南城工作區站點數量,工作日出行客流多為“先出后進”的通勤客流,周末全天客流分布較平緩,屬于特征顯著的工作區站點;

圖1 站點GMM聚類GIS展示Fig.1 The stations visualization with GIS based on GMM clustering

2)第2類站點為居住區車站,如天通苑站、生命科學園站、蘋果園站等。該類站點多為各條線路遠離市中心的端頭站,乘客早上乘坐地鐵上班,晚上乘坐地鐵回家,居住區域車站周邊區域多體現“睡城”特性,八通線、昌平線所屬車站均為該類型車站;

3)第3類站點為交通樞紐類車站和旅游區車站,如北京西站、北京站、前門站、天安門東站、天安門西站。該類車站有大量臨時客流,屬于外地乘客聚集地,北京站和北京西站是大型火車站,前門站、天安門東站、天安門西站屬于旅游景點類車站;

4)第4類站點為機場T2、T3航站樓站。這兩個站點為一票通比例超高的對外交通樞紐站,工作日臨時客流量占工作日全天客流量的85%左右,較其他對外交通樞紐表現出更明顯的特性。

3.3與K-均值聚類的比較

K-均值聚類算法是通過迭代算法,逐次更新各類的中心值,直至得到最好的聚類結果。以提取出的兩個公共因子為聚類變量,利用K-均值聚類算法進行聚類,得到的聚類結果由GIS展示,如圖2所示。

基于GMM模型產生的后驗概率來識別混合型車站,部分混合型車站的后驗概率及對應的K-均值聚類結果如表3所示。

比較GMM聚類結果和K-均值聚類結果,兩者的車站分類基本相同,但基于GMM的聚類是依后驗概率進行車站聚類,對于混合程度較高的車站,單純的類別劃分并不能準確地表示該車站的特征,因此對于車站分類,GMM算法優于K-均值算法。

圖2 站點K-均值聚類GIS展示Fig.2 The stations visualization with GISbased on K-means clustering

表3 部分混合車站GMM聚類與K-均值聚類比較Tab.3 Partialm ixed stations’com parative analysis between GMM clustering and K- means clustering

4 結論

本文提出了一種基于刷卡數據和GMM模型的地鐵車站聚類方法。其中,刷卡數據為地鐵站點分類研究提供了一種全新高效的數據來源,考慮一票通比例、單次出行比例、早晚高峰特性與通勤客流特性、工作日與周末客流差異等因素后利用GMM模型進行車站聚類,并依據模型產生的后驗概率識別了混合類型的車站。

該聚類與K-均值聚類結果比較表明,GMM聚類方法對混合類型車站的識別有良好的效果,較傳統單一的車站分類模式更具有現實意義,可為站點周邊土地的開發利用與城市空間結構的識別提供技術支持。

[1]邵瀅宇,丁柏群.基于聚類分析的地鐵站點分類:以哈爾濱地鐵1號線為例[J].森林工程,2015,31(3):106- 111.

SHAO Yingyu,DING Baiqun.Metro stations classification based on clustering analysis:A case study of harbin metro line 1[J].Forest engineering,2015,31(3):106- 111.

[2]王俊.地鐵車站綜合開發及影響的初步探討[D].成都:西南交通大學,2000.

WANG Jun.Primarily study ofmetro stations’comprehensive development and influence[D].Chengdu:Southwest Jiaotong University,2000.

[3]惠英.城市軌道交通站點地區規劃與建設研究[J].城市規劃匯刊,2002(2):30 33.

HUIYing.Planning and construction of the areas round the rail transportation station[J].Urban planning forum,2002 (2):30- 33.

[4]金磊,彭建,柳昆,等.城市地鐵車站分類理論及方法研究[J].地下空間與工程學報,2010,6(Z1):1339 1342.

JIN Lei,PENG Jian,LIU Kun,et al.Sorting theory and investigation of urban metro station[J].Chinese journal of underground space and engineering,2010,6(Z1):1339 1342.

[5]李向楠.城市軌道交通站點分類的聚類方法研究[J].鐵道標準設計,2015,35(4):19- 23.

LIXiangnan.Classifying urban rail transit stations using cluster analysis[J].Railway standard design,2015,35 (4):19- 23.

[6]羅芳,柴蕾,邱星.基于交通換乘的城市軌道交通車站分類研究[J].洛陽理工學院學報(自然科學版),2015,25(3):45 48.

LUO Fang,CHAI Lei,QIU Xing.Classification of urban rail transit station based on traffic transfer[J].Journal of Luoyang Institute of Science and Technology(natural science edition),2015,25(3):45- 48.

(編輯:曹雪明)

Classifications of Metro Stations by Clustering Smart Card Data Using the Gaussian Mixture Model

YUE Zhenhong1,CHEN Feng1,2,WANG Zijia1,2,HUANG Jianling3,WANG Bo3
(1.School of Civil Engineering,Beijing Jiaotong University,Beijing 100044; 2.Beijing Engineering and Technology Research Center of Rail Transit Line Safety and Disaster Prevention,Beijing 100044;3.Beijing Transportation Information Center,Beijing 100161)

Reasonable classification of urban rail transit stations is of great significance to station planning,designing and ridership forecasting.This research focused on the characteristics of station ridership and proposed travel time,frequency,ticket type and other variables extracted from smart card data.Accordingly,Principal Component Analysis(PCA)and the Gaussian M ixture Model(GMM)were used in clustering and classifying stations.Themetro stations are classified into arbitrary types and m ixed types using the posterior probability generated by GMM,which revealed to what extent and by which arbitrary types a mixed station wasmixed.Beijing was selected as a case and 4 clusters were determined for the 233 stations on Beijingmetro network.The classification resultswere visualized by GISand all types of stationswere characterized by superposing geographic information,meanwhile,parts of m ixed stations were presented intuitively.At last,comparative analysis was conducted between GMM and K-means algorithm and the results showed thatGMM can explainmixed stationsw ith various characteristics preferably.

metro;station classification;smart card data;Gaussian M ixture Model;geographic information system

U231.4

A

1672- 6073(2017)02- 0048- 04

10.3969/j.issn.1672 6073.2017.02.010

2016- 05 03

2017 01 09

岳真宏,男,碩士研究生,主要從事城市軌道交通規劃與設計,14121208@b jtu.edu.cn

王子甲,男,博士,講師,主要從事城市軌道交通規劃與設計,zjwang@b jtu.edu.cn

中央高校基本科研業務費專項資金資助(2016YJS102)

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數據分析中的分類討論
按需分類
教你一招:數的分類
主站蜘蛛池模板: 久青草国产高清在线视频| 国产高清无码麻豆精品| 色偷偷一区二区三区| 亚洲日本韩在线观看| 思思99热精品在线| 国产人成午夜免费看| 亚洲国产天堂久久九九九| 国产综合精品一区二区| 亚洲国产理论片在线播放| 午夜激情福利视频| 国产xx在线观看| 中文毛片无遮挡播放免费| jizz在线观看| 欧美一区二区三区不卡免费| 亚洲精品国产自在现线最新| 99精品视频播放| 大陆精大陆国产国语精品1024| 国产精品福利社| 天堂成人av| 激情网址在线观看| 一级香蕉视频在线观看| 国产性猛交XXXX免费看| 欧美精品亚洲日韩a| 久久青草免费91线频观看不卡| 亚洲日韩精品伊甸| 成人免费一区二区三区| 五月激情综合网| 一本一道波多野结衣av黑人在线| 免费一极毛片| 色老头综合网| 青青青伊人色综合久久| 国产无码制服丝袜| 日本少妇又色又爽又高潮| 国产欧美亚洲精品第3页在线| 久久久受www免费人成| 亚洲成A人V欧美综合| 日日拍夜夜嗷嗷叫国产| 美女一级免费毛片| 亚洲无码91视频| 国产96在线 | 一级毛片在线播放免费| 四虎综合网| 无码丝袜人妻| 亚洲欧美日本国产综合在线| 国产对白刺激真实精品91| 欧美h在线观看| 日韩无码黄色| 国产91视频观看| 亚洲欧美国产高清va在线播放| 青草视频久久| 视频一区亚洲| 污网站在线观看视频| 无码在线激情片| 久久综合色视频| 精品无码专区亚洲| 全部无卡免费的毛片在线看| 久久精品亚洲专区| 91在线免费公开视频| 日韩无码视频播放| 国产一国产一有一级毛片视频| 色网站在线视频| 中文无码日韩精品| 亚洲人成色77777在线观看| 熟妇丰满人妻av无码区| 在线欧美a| 777国产精品永久免费观看| 中文字幕日韩欧美| 国产欧美日韩18| 欧美国产日韩一区二区三区精品影视| 欧美激情第一欧美在线| 久久久久免费看成人影片| 日韩小视频在线观看| 亚洲综合色在线| 日韩在线播放欧美字幕| 成人91在线| 综合人妻久久一区二区精品| 高清无码一本到东京热| 一级片一区| 国产又黄又硬又粗| 青草视频久久| 国产又黄又硬又粗| 欧美日韩国产在线观看一区二区三区|