摘 要:對城市道路交通擁堵狀態判別的問題,提出了一種硬C均值(HCM)聚類與模糊C均值(FCM)聚類相結合的快速模糊C均值聚類(FFCM)算法。用硬聚類的結果對模糊聚類初始值的選取進行指導,以加速算法的收斂過程。將該算法用于城市交通流數據的聚類分析結果表明,該算法能夠快速而有效地對城市交通流狀況進行判別,為動態交通擁堵預警和交通疏導策略的制定提供依據。
關鍵詞:城市交通; 快速模糊聚類; 擁堵判別
中圖分類號:TP391 文獻標志碼:A
文章編號:10013695(2008)09276803
Study of urban traffic congestion judgment based on FFCM clustering
YANG Zuyuan, HUANG Xiyue, DU Changhai, TANG Mingxia
(College of Automation, Chongqing University, Chongqing 400044, China)
Abstract:In order to solve the problem of urban traffic congestion judgment, a fast fuzzy Cmeans (FFCM) clustering method integrating hard Cmeans clustering method and fuzzy Cmeans clustering method was put forward. In this algorithm, the result of HCM clustering is the basis of the initial value of FFCM, which can speedup its convergence. Then it’s applied to a set of real traffic flow data. The clustering result shows that this method enjoy good performance in fast and effective distinguishing urban traffic congestion and will contribute to dynamic traffic congestion warning and traffic guidance.
Key words:urban traffic; fast fuzzy clustering; traffic congestion judgment
0 引言
交通擁堵已成為現代城市交通的嚴重問題。旅行時間、旅行安全、環境質量和生活質量均受到了交通狀況的制約,各級交通管理部門都在積極尋求解決辦法。
智能交通系統被認為是解決交通擁堵難題的有效途徑。在智能交通管理系統中,通常應用各種交通狀態判別算法進行道路環境中實時交通擁堵狀態的判別。這個判別的結果將提供給交通系統的管理者和決策者,他們針對不同的情況作出相應的交通控制、管理和誘導措施。因此,及時而正確地判別道路的交通擁堵狀態,是采取合理交通擁堵預警措施、主動避免交通擁堵的前提[1]。
在交通流理論中, 用于描述交通狀態的參數主要有三個,即交通量、車速和密度。單獨根據某個交通流變量來判斷交通流狀況是不夠全面的:當速度為0時,可能是車輛堵死的情況, 也可能是道路上沒有車輛的暢通情況;交通流量很低可以對應擁堵和暢通兩種交通流狀況;密度小可能是道路暢通的表現,也可能是大車居多的情況。所以,應該對交通流的三個變量進行綜合分析來確定交通流狀況,才能較全面反映交通流的真實情況。
交通擁堵的判別也就是對交通流數據的分類,對數據進行分類的方法稱為聚類分析。聚類的目的在于將大量的數據辨識為幾個較少的數據組從而能對系統行為進行簡潔描述。傳統的聚類分析是一種硬分類,將每個待識別的對象嚴格地劃分到某個類中,非此即彼,界限分明。然而,客觀事物之間并沒有一個截然區別的界限,分類時所依據的數據指標的變化也大多是一個連續的過程[2,3]。因此,用模糊聚類方法對交通流狀態進行判別更符合實際。模糊聚類方法得到的結果指明事物在多大程度上屬于哪一類。同理,交通流狀態的變化也具有連續性,人們對交通狀況的判斷往往擁堵、暢通等模糊概念。所以利用模糊聚類的方法進行研究比較合理。
在眾多的模糊聚類方法中,應用最廣泛的是模糊C均值(fuzzy Cmeans,FCM)算法。與硬C均值(HCM)相比,FCM能夠獲得更豐富的聚類信息,能更準確地反映樣本的實際分布,其收斂性也已得到了證明。因此,FCM算法得到了廣泛應用。FCM算法的主要問題是計算復雜度遠遠高于HCM算法,聚類時間冗長。特別是在數據量很大的情況下,FCM算法要消耗大量的運算時間[3,4]。針對交通流數據量大的特點,本文考慮使用硬聚類的結果對模糊聚類初始值的選取進行指導,以加速算法的收斂過程,使之滿足交通管理和控制的實際需要。
1 快速模糊C均值聚類算法
1.1 標準FCM算法
模糊聚類的概念最早是由Ruspini提出來的。FCM聚類是一種比較典型的模糊聚類算法,由Bezdek在1981年提出,用于將多維數據空間分布的數據點分成特定數目的類第i個聚類中心間的歐氏距離;m為模糊指數,控制分類矩陣U 的模糊程度,m越大,分類的模糊程度越高。當m取值為1時,FCM便退化為HCM[5]。目標函數Jm(U,V)為每個數據點到各聚類中心的加權距離平方和。FCM 算法就是一個使目標函數Jm(U,V)最小化的迭代求解過程。
應用Lagrange乘數法求解式(2)在式(1)約束下的優化問題,可得到U、V的取值公式為
FCM算法中,隨機給定一初始聚類中心,每次迭代都依據式(3)(4)對分類和聚類中心同時進行調整,直到相鄰兩次迭代所得的聚類中心變化小于預先設定的ε,則認為算法已收斂。1.2 快速FCM算法
研究表明,標準FCM算法中,當m取值范圍為m=1~5時,模糊聚類中心與硬聚類中心非常接近,兩者的偏差隨m值的增加略有增大,在最大偏差時兩者的接近度為0.98。而在典型的m值(m=2)附近,兩者非常接近于1[6]。Pal和Bezdek認為m的合理取值范圍為1.5~2.5[7],本文中取2,故硬聚類中心和模糊聚類中心是非常接近的。因此,可以將硬聚類中心作為模糊聚類中心的迭代初值,以獲得加快算法收斂速度的效果。據此,本文提出一種改進的FCM聚類算法。首先用快速的HCM聚類算法確定輸入數據的硬聚類中心,然后將所得的硬聚類中心作為FCM算法的初始聚類中心,加快了算法的收斂速度。算法的迭代步驟如下:
第一階段算法
2 數據準備
要正確對主干道交通狀態進行分類,所采集的數據應該覆蓋交通流數據變化的整個范圍,不僅包括暢通狀態,也包括擁堵狀態,還有兩者之間的過渡狀態[8]。
本文所用的數據來源于重慶市交通控制管理中心的交通信息數據庫,采集自重慶市渝中區菜園壩至上清寺的CC斷面。本文處理的數據對象為單車道內流量、速度和密度。由于時間間隔太短無法準確地把握交通狀態的特征,而且狀態特征還易于走向極端現象。這里所處理數據時間間隔為5 min。連續統計一周,以保證數據的完整性。
最終得到的數據樣本為:每個車道共2 016組數據,每組數據包含流量、速度和交通流密度三個特征參數。其中流量按照標準車輛進行轉換,單位為pcu/5min。速度為單車道5 min內車流的平均速度,密度為單車道5 min內車流的平均密度。獲得的交通流數據如圖1所示。其中流量數據是5 min內通過檢測點的車輛數,沒有轉換為小時流量,是為了使交通流三個參數在數值上相差不大,以利于聚類分析。
3 交通擁堵狀態的模糊判別及分析
依據我國公安部2002年公布的《城市交通管理評價指標體系》,本文將道路交通狀態劃分為四個等級,即通暢、輕度擁堵、擁堵和嚴重擁堵。其中通暢表示最佳的道路運行狀態,而嚴重擁堵則表示最差的運行狀態。
利用前述FFCM算法進行模糊聚類,ε值取0.001,聚類結果如圖2所示。目標函數迭代過程如圖3所示。
表示通暢、輕度擁堵、擁堵和嚴重擁堵四個分類的聚類中心分別為[65.5 13.2 60.5]、[96.0 25.7 50.9]、[48.8 54.7 28.5]和[18.0 70.3 16.4]。聚類中心的三個參數分別表示流量(pcu/5 min)、速度(km/h ) 和密度(pcu/km)。從圖2可以看出基于模糊聚類的算法綜合考慮到交通流三個變量的綜合作用。為了檢驗算法的效果,隨機抽取幾個樣本點進行分析,如表1所示。
表1 隨機選取的樣本
樣本流量速度密度μcμqμyμyz結果
4828.661.223.20.590.350.030.02CT
7483.047.533.80.080.320.420.18YD
34030.957.624.60.390.550.030.03QD
77074.514.658.70.020.040.060.88YZ
1 27889.221.057.30.010.020.820.14YD
1 78634.454.928.20.220.700.030.04QD
表中:μc表示暢通隸屬度;μq表示輕度擁堵隸屬度;μy表示擁堵隸屬度;μyz表示嚴重擁堵隸屬度;CT表示暢通;QD表示輕度擁堵;YD表示擁堵;YZ表示嚴重擁堵。
從表1和圖2可以看出:
a)交通流的分類與速度的關系最為緊密,單憑速度幾乎可以將交通流分為四類:速度大于61 km/h,可以認為是暢通,速度在[45,61]可認為是輕度擁堵,速度在[20,45]可以認為是擁堵,而速度在20 km/h以下則認為是嚴重擁堵。這與大多數只根據速度經驗性地對交通流的分類方法基本一致。
b)交通流密度超過55 pcu/km,可以判斷交通狀態為嚴重擁堵,其他情況需要根據三個變量來綜合判斷。
c)單獨用流量很難對交通流進行劃分,因為有很多各類交通流狀況相互重合的區域,即同一個流量對應多種交通流狀況。
d)僅僅依靠速度也很難精確劃分交通流狀態,因速度在[40,50],需要根據流量和密度進一步判斷交通流狀態。
4 結束語
及時而有效的交通擁堵狀態判別是進行動態交通擁堵預警和交通疏導、主動避免交通擁堵、保持道路暢通的前提和依據。通常情況下,人們對交通流狀態的判別是憑經驗進行的。本文給出一種較科學的判斷方法,根據實測的道路交通流數據,采用FFCM聚類分析方法對交通擁堵狀態分類進行了研究。在得出交通流狀態各聚類中心之后, 根據算法很容易判斷新測的交通流數據屬于何種交通流狀態。
聚類結果表明:a)用模糊聚類的方法進行交通流狀態聚類分析是一種行之有效的方法;b)速度對交通流分類的影響最大, 其次是交通流密度, 流量的作用最低;c)交通流狀態是各個交通流變量綜合作用的結果,單獨根據某一個交通流變量進行經驗性的交通擁堵判別是不夠全面的。
參考文獻:
[1]SHANGA P, LUB Y, KAMA S. The application of Hlder exponent to traffic congestion warning[J].Physica,2006,370:769776.
[2]姜桂艷, 江龍暉, 王江鋒. 城市快速路交通擁擠識別方法[J].交通運輸工程學報, 2006,6(3):8791.
[3]成衛, 李江. 模糊聚類法在基于交通沖突技術的交叉口安全評價中的應用[J].交通運輸系統工程與信息, 2004,4(2):4855.
[4]普運偉, 金煒東, 朱明,等. 核模糊C均值算法的聚類有效性研究[J].計算機科學, 2007,34(2):207210.
[5]HATHAWAY R J,BEZDEK J C. Extending fuzzy and probabilistic clustering to very large data sets[J].Computational Statistics Data Analysis, 2006,51:215234.
[6]GAO Xinbo, XIE Weixin. Advances in theory and applications of fuzzy clustering[J].Chinese Science Bulletin,2000,45(11):961970.
[7]錢同惠,沈其聰,葛曉濱,等. 模糊邏輯及其工程應用[M].北京:電子工業出版社,2001:165210.
[8]皮曉亮, 王正, 韓皓,等. 基于環形線圈檢測器采集信息的交通狀態分類方法應用研究[J]. 公路交通科技, 2006,23(4):115119.