孫廣林, 劉君
(公安部道路交通安全研究中心, 北京 100062)
道路交通狀態是表征交通運行狀況的關鍵指標。準確識別當前交通狀態是引導出行者合理選擇出行方式及路徑,提高道路交通資源利用效率和防止交通狀態持續惡化的重要依據。根據已有研究成果,交通狀態可劃分為暢通和擁擠兩類,以此為基礎可進一步細分為自由流、密集流、擁堵流和阻塞流等。交通狀態識別主要依據交通量、速度、占有率、密度、排隊長度、飽和度等基本交通參數,采用聚類分析方法劃分狀態類型。實際應用中,不同交通參數對交通狀態聚類的貢獻程度不一樣,且樣本屬性特征間具有不平衡性。傳統的聚類分析方法假定所有數據樣本及其特征具有一致性,未體現樣本及特征屬性對聚類結果的影響。針對傳統聚類算法理想化的假設條件,提出多屬性加權的改進聚類算法,該方法主要采用樣本概率分布和最大熵原理確定權重值。多采用信息熵原理確定各交通狀態識別指標的權重或根據交通參數間的相似性構建評價函數,通過最優化方法獲得權值。樣本與特征雙加權聚類算法的提出及在圖像識別等領域的應用,補充了樣本及特征對聚類結果的影響,也為解決傳統模糊C均值(Fuzzy C-means,FCM)聚類算法在交通狀態識別應用中的弊端提供了路徑。該文在確定交通狀態類別和FCM算法的基礎上,利用樣本和特征加權FCM聚類方法進行交通狀態識別,采用拉格朗日乘數法更新隸屬度和簇中心及樣本與特征權值,進一步設計雙加權聚類算法,通過實例對比分析雙加權策略FCM與傳統FCM聚類的效果和性能,驗證雙加權策略FCM識別交通狀態的有效性。
傳統交通流理論應用交通量、車速和密度描述交通流狀態特征,并將交通流劃分為自由流和擁擠流兩種狀態。這里根據道路交通管理需要及出行者對交通運行的直觀感受,將交通狀態劃分為自由流、擁堵流和阻塞流3種類型。道路交通量、速度、密度是描述交通流基本特征的主要參數,其中交通密度在實際應用中往往采用容易測量的車道占用率來間接表征,包括空間擁有率和時間占用率。綜合現有研究成果選用交通狀態參數的頻率及參數樣本獲取的便利性,選取交通量、平均速度、空間占用率3個交通參數進行聚類分析,識別交通狀態類別。
(1) 自由流。自由流狀態下交通流量小、車速高、路段車輛空間占有率低,駕駛人具有較大的行車自由度,車輛行駛幾乎不受其他車輛影響,道路交通處于暢通狀態。
(2) 擁堵流。擁堵流狀態下交通流量接近道路通行能力,車速顯著下降,路段車輛空間占有率較高,駕駛人駕車自由度明顯受限,行駛車輛之間相互影響,道路交通處于不穩定狀態,交通流波動較大。
(3) 阻塞流。阻塞流狀態下交通流量呈斷崖式下降,車輛間歇性停駛,車頭時距趨于穩定,路段車輛空間占有率非常高,整個路段車輛處于同步跟馳狀態,相鄰車道車速基本一致。
FCM聚類是基于目標優化的聚類方法。設給定的數據集X={X1,X2,…,Xn}包含n個樣本,將樣本分為c類,1 (1) 式中:J(U,V)為樣本到簇中心的距離加權值;U={uij},為c×n階模糊分類矩陣;V=[v1,v2,…,vc],為p×c階簇中心矩陣;vi為簇中心;uij為第j個樣本隸屬于第i個簇的程度,1≤i≤n,1≤j≤c;m為加權指數;(dij)2=‖xj-vi‖2,為樣本到簇中心的歐式距離。 由樣本距離模糊簇中心最小準則,可獲得聚類目標表達式: (4) 拉格朗日乘數法是求解變量在多個條件限制下多元函數極值的方法,具有較高的通用性和普適性。因此,通過構建拉格朗日函數,采用拉格朗日乘數法求解隸屬度uij及簇中心vi。 (5) 2.1.1 隸屬度的確定 由式(5)~(8),采用Lagrange方法確定隸屬度。定義f、g、h為Lagrange乘子,其中f是由Lagrange乘子構成的向量,f=(f1,f2,…,n)。Lagrange函數L表示為: 1.對于縣級金融機構的撤并,縮減農村金融服務。從1999年起,中國工商銀行、中國農業銀行、中國銀行、中國建設銀行從農村逐步撤出,四大國有銀行基本取消了縣級分支機構。現有網點主要是集中于縣城,鄉鎮農村金融基本上被邊緣化。這導致在一些金融服務城鄉經濟中出現了空白現象,農村嚴重缺失金融資金供給,農村金融服務的狀況令人擔憂。 (9) 將Lagrange函數L分別對uij和fj求偏導,令?L/?uij=0、?L/?fj=0,則: (10) (11) 由式(10)計算隸屬度uij,得: (12) 將Lagrange函數L對簇中心vik求導,由?L/vik=0得到簇中心值: (13) 聯合式(11)、式(12)求解隸屬度uij,得: (14) 2.1.2 權值的確定 將Lagrange函數L分別對樣本權值αj、特征權值βk求導,由?L/αj=0、?L/βk=0,得樣本與特征權值分別為: (15) (16) 根據式(5)~(16),設計雙加權FCM聚類算法(DFCM)如下: (2) 若j 3.1.1 數據準備 選取北京市西五環晉元橋—石景山路出口段南向交通視頻數據作為聚類分析的數據源,該路段長1 km,單向三車道,最高限速80 km/h。視頻數據記錄時間為2019年3月13日7:00—19:00,未發生交通事故或其他突發事件。以5 min為單位(共145個樣本)統計該路段交通量、平均速度、空間占有率時間分布情況,結果見圖1~3。 從圖1~3可以看出:測試路段7:25—8:25、17:25—18:25出現顯著的流量高峰,流量波動幅度較大,交通運行處于擁堵流狀態;中午時段流量相對較低,對應的平均車速較高、道路空間占有率較低,交通運行處于自由流狀態;17:20平均速度降至最低20 km/h,道路空間占有率達到最高0.64,同時流量顯著下降,交通運行處于阻塞流狀態。測試路段7:00—19:00時段內具有不同的交通運行狀態特征分布,源數據完整可用并具有良好的適用性。 圖1 測試路段交通量時間分布 圖2 測試路段平均速度時間分布 圖3 測試路段空間占有率時間分布 3.1.2 參數初始化 輸入測試路段源數據及初始化參數值,采用MATLAB模糊聚類工具箱輸出傳統FCM聚類結果,對比分析3類交通狀態隸屬度函數值、聚類目標函數值,比較兩類算法的聚類效果與計算效率。 3.2.1 簇中心矩陣 FCM和DFCM聚類算法簇中心矩陣V1、V2為: V1與V2中,行表示交通狀態,列表示狀態識別指標,各類交通狀態識別指標值均在交通量閾值[189,2 047]、平均速度閾值[20,76]、占有率閾值[0.1,0.64]內,簇中心可用于聚類計算。 3.2.2 隸屬度值 聚類算法樣本隸屬度值接近0/1的數量可用來衡量聚類算法效果的優劣,隸屬度值越接近0/1,類內樣本的相似度越高,不同類間的差異越顯著,聚類效果愈顯著。FCM和DFCM聚類算法3類交通狀態隸屬度函數值見圖4~6。 圖4 FCM與DFCM阻塞流樣本隸屬度 圖5 FCM與DFCM擁堵流樣本隸屬度 圖6 FCM與DFCM自由流樣本隸屬度 3.2.3 目標函數 傳統FCM和DFCM聚類算法目標函數值的變化見圖7。 圖7 FCM與DFCM的目標函數值 由圖7可知:DFCM聚類算法的目標函數值遠小于FCM聚類算法,DFCM聚類算法經過43次迭代即滿足迭代終止條件,而FCM聚類算法經過70次迭代才滿足迭代終止條件,DFCM聚類算法的計算效率比FCM聚類算法提高1.6倍。 引入樣本權值和特征權值,提出雙加權FCM的交通狀態識別方法。針對實測路段交通視頻數據,分別采用傳統FCM與雙加權FCM進行計算,并對聚類結果進行對比分析。結果表明:雙加權FCM聚類算法獲得的交通狀態識別效果、相同狀態內樣本相似度、不同狀態間的差異性及計算性能均優于傳統FCM聚類算法,能有效體現數據樣本和特征屬性對交通狀態聚類結果的影響。2 加權FCM聚類算法

2.1 隸屬度與權值

2.2 算法實現
3 實例分析
3.1 數據準備與初始化




3.2 聚類效果分析




4 結論