999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據驅動的區域交通TOD時段識別方法研究*

2014-01-18 02:52:56王海起王勁峰
關鍵詞:方法

王海起 張 騰 王勁峰 孟 斌

(中國石油大學(華東)地球科學與技術學院1) 青島 266580)(中國科學院地理科學與資源研究所資源與環境信息系統國家重點實驗室2) 北京 100101)(北京聯合大學應用文理學院3) 北京 100191)

0 引 言

TOD(time of day)多時段配時屬于交通信號離線配時方式,它根據交通流的變化情況將1d分為多個時段,每個時段內的交通量基本不變,各時段分別采用不同的配時方案,信號燈根據實時時鐘自動進行配時方案的切換.

隨著智能交通系統的發展,城市道路、交叉口等安裝了不同類型的交通流檢測設備,這些采集系統積累了大量的交通流歷史數據,借助于聚類手段,可以將1d不同時刻的交通流數據聚為不同的幾類,不同的類代表高峰、低峰等不同的交通狀態,屬于同一類的各時刻具有相近的交通狀態[1],因此,同一類中的連續時刻可以歸為同一個TOD時段,從而可以確定1d的TOD時段分布.

然而,對于區域交通TOD配時,由于參與聚類的交通檢測器數目較多,且數據質量參差不齊,可能導致出現無效的TOD時段(無效時段一般指長度少于30min,沒有實際價值的TOD時段)或TOD時段數過多,各時段間的切換需要耗費時間,頻繁的TOD時段切換將導致信號配時性能下降,因此應減少參與TOD時段識別的檢測器,重點考慮關鍵路口的檢測數據[2].所謂關鍵路口是指對區域路網性能具有關鍵影響的信號交叉口.

本文提出了一種基于數據驅動的區域TOD時段識別方法,包括交通數據整理、關鍵交通流選取、聚類分析、TOD時段識別等步驟,數據整理的目的是對檢測設備獲取的交通數據進行質量監測,定位缺失值和無效值,并采用合適的方法進行插補;交通流選取的目的是在空間上識別出整個區域路網的關鍵交通流,包括確定關鍵交通流個數和定位關鍵交通流位置2個步驟;聚類分析的目的是對關鍵交通流不同時刻的觀測值進行聚類,從而獲取不同類型的交通狀態,包括聚類分析、聚類效果判別及類數確定等;TOD時段識別的目的是根據各時刻所處的交通狀態,識別出一天的TOD時段數及各時段間隔.

1 基于數據驅動的區域TOD時段識別方法

1.1 交通數據整理

1.1.1 數據質量監測

造成原始檢測數據缺失或無效的可能原因有多種,包括檢測器故障、通信故障、人員或系統數據處理錯誤等[3].

原始數據中的缺失值一般以零值或空白作為記錄,容易判斷,缺失現象的出現較隨機,可能缺失某一個或多個時段的數據,可能缺失1d或多天的數據,也可能出現在單個或多個檢測器上.

相對于數據缺失,交通數據的無效性判斷要復雜些,無效數據是指不符合交通流特征與參數關系的檢測數據或異常高、低的離群數據.

Turochy和May提出了無效數據探測的交通數據篩選規則[4],包括:非零值檢驗、預篩選檢驗和可行流量值檢驗.

離群數據探測可采用可視化與統計相結合的手段[5].例如,對于道路某方向可繪制連續時刻流量的變化曲線,一般來說,流量的連續變化總是相對平滑的,因此,如果相鄰時段流量突然劇增或劇減,那么該數據存在高度離群的可能,進一步的判斷可采用正態分布χ2檢驗、偏度峰度檢驗、四分位檢驗等統計方法.

由于涉及的研究區域線圈檢測器僅采集流量數據,并沒有占有率和速度數據,因此本文對無效值的判斷集中于離群數據的探測.需要指出的是,對采用可視化、統計等手段探測出的離群數據應作進一步辨識,以判斷是由于設備、通信故障等造成的偽數據,還是特定交通狀況的真實反映,可從時空兩方面進行識別:在時間上將離群數據所處時段和前后時段、前后若干天同一時段進行對比,在空間上將離群數據所在交通流向和同一路口其他流向對應時段、相鄰路口同一流向對應時段等進行對比,以確認離群數據的真偽性.

1.1.2 缺失及無效數據處理

處理缺失、無效數據的簡單方式是將其對應的記錄從交通數據倉庫中刪除.但是,對于TOD時段識別,簡單刪除將導致對應時段的觀測值出現空白,而對一天不同時刻觀測值進行聚類要求參與聚類的時段能夠反映不間斷的交通變化狀況,即各時刻須具有相應的觀測值,因此可對缺失或無效數據進行插補以獲得合理的估計值.韓衛國比較了幾種用于流量缺失數據插補的方法,包括歷史平均值法、相鄰時段平均值法、相鄰檢測器平均值法、EM(expectation maximization)方法,MCMC(markov chain mento carlo)方法,以及改進的空間EM方法,實際效果表明后三種方法明顯好于其他方法[6].本文采用EM方法進行插補.

1.2 關鍵交通流選取

對于單個信號交叉口而言,可能僅有4個入口,卻可能有12種交通流向(每個入口有左轉、直行和右轉3個方向),如果每個方向均安裝檢測器,那么單個路口就存在12種交通流的觀測數據.對于包含多個交叉口的區域路網來說,檢測器數目增加得更快.從數據挖掘角度來說,大量的數據總能提供更多有價值的信息.然而,對交通工程來說,一方面,交通網絡中不同路口、不同方向、交通流的重要性是不一樣的,那些對整個路網性能起到關鍵影響的交通流向總是被優先考慮;另一方面,對于隨后的聚類分析,如果參與的檢測器過多(即交通流過多),可能導致獲取的交通狀態及相應的TOD時段數過多,各TOD配時方案的頻繁切換不僅耗費時間而且會干擾交通流的正常流動,從而降低整個交通控制系統的性能.

因此,關鍵交通流選取就是識別路網的主要交通流,在維持交通控制系統性能不降的前提下僅保留那些包含主要特征的變量(每個交通流視為一個變量)以降低問題空間維數,采用多元相關分析和主成分分析法.

1.2.1 多元相關分析

基于多元相關分析的主要變量選取思路就是選取一個指定數目的變量子集,使子集中的變量(看作解釋變量)與子集外的其余變量(看作因變量)具有最大的復相關系數.

設全體變量的個數為k,需從中選取p個主要變量,有以下2種方法.

方法A1,每次從全體變量中選取p個變量作為一組,計算該組p個變量與其余k-p個變量中每個變量的復相關系數,并保留其中最小的復相關系數,最后比較各組的最小復相關系數,數值最大的那組即為最終選取的p個主要變量.該方法可以找到一組最佳的主要變量,但需獲取p個變量的所有組合,效率較低.

方法A2,每次在全體變量中尋找與其他變量復相關系數最大的那個變量將其舍棄,并在剩余變量中重復該過程,直至剩下p個變量.該方法比方法A1速度快,但不能保證找到最佳的p個主要變量.

1.2.2 主成分分析

將貢獻率小的主成分最能解釋(即變差比例大,主成分與原始變量之間的相關系數稱為變差比例)的原始變量舍棄掉,剩余的原始變量即為需保留的主要變量.

從k個原始變量中選取p個主要變量有以下2種方法.

方法B1,從最小特征值開始的k-p個主成分,對每個主成分選取其最能解釋的一個原始變量,每次選取時不考慮之前已被選取的變量,直至最后得到k-p個需舍棄的原始變量.

方法B2,從最大特征值開始的p個主成分,對每個主成分選取其最能解釋的一個原始變量,每次選取時不考慮之前已被選取的變量,直至最后得到p個需保留的主要變量.

1.2.3 主要變量個數

選取多少個變量足以包含原始數據集的主要特征,即多元相關分析和主成分分析中p的確定.

Jolliffe認為當舍棄的變量個數等于相關矩陣小于0.7的特征值個數時,其效果較好,稱為Jolliffe’s eigenvalues less than 0.7方法.

在SAS,SPSS等統計軟件中,常用的是主成分個數與協方差矩陣或相關矩陣大于1.0的特征值個數相同,稱為eigenvalues-great-than-one.

Velicer提出了基于偏相關矩陣的MAP(minimum average partial)方法,該方法依次構建各階偏相關系數矩陣(階數從零到變量個數減1),計算各階矩陣中相關系數平方的均值(即矩陣上三角或下三角元素平方的均值),則具有最小均值的階數即為主要變量個數.

另外,Horn提出了平行分析法PA(parallel analysis),是eigenvalues-great-than-one方法基于樣本的改進版本.首先構建與樣本數據集具有相同變量、樣本個數的隨機數據集,然后比較樣本數據集和隨機數據集相關矩陣的特征值,若前者的特征值大于后者對應的特征值,則相應的主成分被保留,最后保留的主成分個數即為主要變量個數.

基于多檢測器數據識別路網的關鍵交通流時,首先采用上述4種方法確定關鍵交通流的個數,然后采用A1,A2,B1和B2方法識別出關鍵交通流所處的空間位置.

1.3 聚類分析

采用層次聚類對區域關鍵交通流各時刻的觀測值進行樣本聚類,從而獲取不同類型的交通狀態.

1.3.1 層次聚類

使用聚合聚類中的Ward法,聚合聚類初始將每個對象單獨作為一組,每次僅聚合兩個組,直至所有對象聚合為同一組,Ward法要求同類對象間的離差平方和較小,類間對象間的離差平方和較大.

1.3.2 聚類效果及類數判別

包括R2、半偏R2、偽F、偽t2等統計量.R2統計量即RSQ(Root SQuare Variance),其值越大,類內離差平方和在總離差平方和中所占比例越小,說明各類之間區分越明顯,即聚類效果好。偽F統計量即PSF(PSeudo FStatistic),其值越大,表明聚類的分類效果越好。偽t2統計量即PST2(PSeudo t2Statistic),其值為正數且顯著時表明2個類合并后的類內離差平方和比合并前的類內離差平方和要大,說明合并的2個類應分開,即合并前的聚類效果好。半偏R2統計量即SPRSQ(Semi-Partial RSQ),該統計量與t2統計量有類似的含義,當兩個類合并后其值為正數時,說明合并前的聚類效果好。

這四4統計量將用于區域關鍵交通流不同時刻觀測值聚類效果的判別,在綜合各統計量結果的基礎上確定聚類的最終類數.

1.4 TOD多時段識別

1d的各時刻依據其觀測值的聚類結果可歸為不同的類,各類可通過均值、中值、最大最小值等統計特征描述其反映的交通狀態,進而,處于同一交通狀態的連續時刻可歸為同一個TOD時段.

然而,由于樣本數據包含檢測器幾天、幾個月、甚至幾年的觀測值,聚類結果中不同天的同一時刻可能歸為不同的類,即可能具有兩個或更多的交通狀態,從而無法確切地認定同一時刻所屬的TOD時段.解決方法是對一個時刻統計其所屬各交通狀態的天數,天數最多的狀態即為其最終的交通狀態,可利用統計直方圖完成;在此基礎上,可識別出一天的TOD時段數及各時段起止時刻,對于間隔小于30min的TOD時段則視具體情況合并到前一或后一時段中.

2 應用研究

2.1 研究區域

選擇北京西城區西二環和西三環之間一面控子系統為研究區域(見圖1),9個平面交叉口,每個交叉口的4個入口均埋設有環形線圈檢測器用于采集不同流向的流量數據,共37個檢測器.

采集時間為2002年8月~11月4個月,重點考察工作日的檢測數據,共87d,檢測器每天24h每15min采集一次流量數據,每天有96個觀測值,故原始數據集Dataset0共有37個檢測器變量,8 352個樣本觀測值(87d×96).

圖1 研究區域交叉口檢測器分布及監測交通流方向示意圖

2.2 流量數據整理

對數據集Dataset0的整理發現檢測器21111f,21121b,25241e,25271i并沒有采集數據,對其余33個檢測器進行缺值統計,發現數據缺失現象存在2個較長的連續時段:9月9日~9月17日、11月18日~11月29日,其他缺失時段較為分散.

對于較長時段的數據缺失,過多的插補數據會包含太多的人為信息,因此,基于如下兩個原則剔除相關的檢測器和觀測天數據:(1)如果一個檢測器有一半以上的觀測天(即大于43d)沒有數據,那么該檢測器將被剔除.據此,檢測器21111g,21121p被剔除;(2)如果某天缺失數據超過40個的檢測器數目>=3,那么該觀測天的數據將被剔除;另外,也不考慮節假日數據,即10月1日~7日.

再對其余零散的缺失采用EM方法進行插補,最后得到的數據集Dataset1有31個檢測器變量,4 896個觀測值(51天×96).

2.3 關鍵交通流選取

采用 Eigenvalues-great-than-one、Jolliffe’s eigenvalues less than 0.7,MAP和PA 4種方法得到的關鍵交通流個數(即檢測器個數)分別為4,6,6,6,其中3種方法的個數相同,因此將從31個檢測變量中挑選6個主要變量.

采用多元相關分析的A1,A2方法和主成分分析的B1,B2方法識別出的6個主要檢測變量見表1,并分別計算主要檢測變量(看作解釋變量)與其余每個變量(看作因變量)的復相關系數,表中給出了每種方法的最小復相關系數,其中方法A1值最大,說明該主要變量子集對其他變量的解釋能力最強,因此,以方法A1的選取結果為準,在這6個檢測器中,3個監測自北向南的交通流,2個監測自南向北的交通流,1個監測自西向東的交通流,反映了該區域南北向為主要交通流方向.相應的數據集Dataset2包括6個主要檢測變量,4 896個觀測值.

表1 4種方法識別的主要檢測變量及最小復相關系數結果

2.4 聚類分析

采用層次聚類對Dataset2中6個變量的所有觀測值進行聚類,具體實現利用SAS軟件的Cluster過程完成,圖2~5為統計量RSQ,SPRSQ,PSF和PST2隨類數的變化情況.

聚類中的每個類可以定義為一種交通狀態,如前所述,過多的類會增加配時方案切換的頻率,當然,過少的類也不能充分反映交通狀況的變化,Wang認為對于交通信號配時,聚類類數介于4~7之間較為合適,結合聚類統計量結果,最終類數選擇為5類,則相應的數據集Dataset3中4 896個觀測值均可歸屬為某個確定的類.

圖2 Ward聚類R2統計量的變化

圖3 Ward聚類半偏R2統計量的變化

圖4 Ward聚類偽F統計量的變化

圖5 Ward聚類偽t2統計量的變化

2.5 TOD多時段識別

圖6 是各類平均流量變化情況,每個類代表的交通狀態可描述如下.

圖6 5個類各主要檢測器平均流量變化情況

1)類1 代表了低流量需求的交通狀態,如午夜或凌晨期間的交通狀況.

2)類2 代表了整個區域南北向、東西向高流量需求的交通狀態,反映區域各方向交通高峰期.

3)類3 代表了中等流量需求的交通狀態,如高峰來臨前或高峰結束后的交通狀況.

4)類4 代表了由展覽館路、三里河東路組成的干線南北向高流量需求的交通狀態,反映干線南北向交通高峰期.

5)類5 代表了由展覽館路、三里河東路組成的干線南北向、東西向高流量需求的交通狀態,反映干線各方向交通高峰期.

根據數據集Dataset3中各觀測值的采集時間和所屬的類,可以對1d內不同時刻的交通狀態分布進行描述,圖7是1d各時刻5種交通狀態頻數統計直方圖.

圖7 1d各時刻5種交通狀態頻數統計直方圖

可以看出,存在著不同天的同一時刻具有多種交通狀態的現象,這是由交通系統的隨機性、不確定性決定的,實際上,期望每天同一時間的交通狀況保持不變是不現實、也不可能的,因此基于多天觀測數據獲取的一天不同時刻交通狀態的分布情況應該是一種總體的或平均的分布描述,對于某個時刻,以出現次數最多的狀態為其最終的交通狀態,并據此將處于相同狀態的連續時刻歸為同一個TOD時段,同時對間隔較小的TOD時段進行合并,最終確定的該區域工作日一天內TOD時段數為8個,各時段的起止時間見圖8.

圖8 研究區域工作日1d各時刻交通狀態最終分布情況

其中,晚上10:45~早晨06:30時段車輛較少,屬于低交通量時期;早晨06:30~07:30時段隨著上班外出車輛的增多,預示著高峰期的即將到來,屬于中交通量時期;早晨07:30~上午09:15時段是展覽館路、三里河東路各方向交通量高峰期,上午09:15~中午12:00和下午02:00~04:15兩個時段屬于整個區域各方向交通量高峰期,中午12:00~下午02:00和下午04:15~晚上08:00兩個時段屬于展覽館路、三里河東路南北方向交通量高峰期,各高峰時段不同交通狀態的形成與不同時期車輛的出行目的有關,與該區域居民區、商業區、行政事業單位等交通影響因素的空間分布差異和聚集程度有關,也與該區域的區位和在交通組織中承擔的主要功能有關,原因的探究需采取進一步的相關調查(如OD調查等);晚上08:00~10:45時段隨著出行車輛的減少,預示著交通低峰期的即將到來,屬于中等交通量時段.

3 結束語

海量交通流數據中隱含著大量有價值的交通關系、模式或特征信息,本文基于數據驅動方式首先關注不同交通流的空間分布,識別出反映區域路網主要特征的關鍵交通流,接著關注這些關鍵交通流的流量變化,從而識別出一天各時刻所處的交通狀態及相應的TOD時段分布.

需要指出的是,不同交叉口的交通流之間具有緊密的關聯關系,因此在識別區域關鍵交通流時,進一步分析不同路口、不同方向交通流之間的空間、時空關聯關系能更好地描述區域交通狀態的時空分布及變化格局,區域交通的“熱點”路口也應是判斷關鍵交通流優先考慮的位置.

[1]HAUSER T A,SCHERER W T.Data mining tools for real-time traffic signal decision support & maintenance[A].2001IEEE International Conference on Systems,Man,and Cybernetics[C]∥IEEE,2001:1471-1477.

[2]WANG T.A methodology for data-driven signal timing optimization[D].Virginia:University of Virginia,2003.

[3]施莉娟,朱 健,陳小鴻,等.基礎交通數據質量評價研究[J].交通信息與安全,2011,29(5):57-61.

[4]TUROCHY R E.Traffic condition monitoring using multivariate statistical quality control[D].Virginia:University of Virginia,2001.

[5]韓衛國,王勁峰,王海起,等.基于數據可視化的交通流量分析[J].武漢理工大學學報:交通科學與工程版,2004,28(5):668-670.

[6]韓衛國,王勁峰,胡建軍.交通流量數據缺失值的插補方法[J].交通與計算機,2005,23(1):39-42.

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 欧美自拍另类欧美综合图区| 天天干天天色综合网| 日本精品αv中文字幕| 大陆精大陆国产国语精品1024| 久草国产在线观看| a网站在线观看| 国产精品99r8在线观看| 国产对白刺激真实精品91| 亚洲三级成人| 国产在线观看人成激情视频| 亚洲精品成人福利在线电影| 亚洲天堂日韩av电影| 中文无码精品a∨在线观看| 91亚洲视频下载| 国产丝袜丝视频在线观看| 国产无码精品在线| 国产农村1级毛片| 中文字幕在线一区二区在线| 精品国产网站| 日韩在线永久免费播放| 成人午夜视频网站| 中文字幕久久波多野结衣 | 亚洲欧美综合在线观看| 毛片免费高清免费| 99re精彩视频| 国产精品视频系列专区| 激情亚洲天堂| 白丝美女办公室高潮喷水视频| 5555国产在线观看| 好紧太爽了视频免费无码| 91精品人妻一区二区| 波多野结衣第一页| 最新精品久久精品| 亚洲精品欧美日本中文字幕 | 美女毛片在线| 国产亚洲视频播放9000| 亚洲国产成人在线| 日本91视频| 性视频一区| 高清久久精品亚洲日韩Av| 天天综合网色| 曰韩人妻一区二区三区| 毛片网站在线看| 国产精品分类视频分类一区| 老司机久久精品视频| 综合色婷婷| 久久国产精品嫖妓| 亚洲手机在线| 一本大道AV人久久综合| 婷婷成人综合| 国产成熟女人性满足视频| 成人福利视频网| 国产精品漂亮美女在线观看| 国产在线91在线电影| а∨天堂一区中文字幕| 亚洲精品黄| 色男人的天堂久久综合| 日本在线免费网站| 在线无码av一区二区三区| 91欧美在线| 国产在线视频导航| 国产成人精品免费视频大全五级| 国产爽妇精品| 91福利免费| 久草性视频| 啪啪永久免费av| 青草91视频免费观看| 久久久久亚洲精品无码网站| 国产成人久久777777| 日韩无码一二三区| 日韩毛片免费视频| 成人日韩视频| 国产成人一二三| 國產尤物AV尤物在線觀看| 成人综合久久综合| 国产97视频在线| 欧美精品v| 亚洲色图欧美视频| 中文字幕在线观看日本| 亚洲综合中文字幕国产精品欧美| 国产精品va| 日本91视频|