李樹仁 盧朝陽 任廣建
(南京航空航天大學民航學院 南京 210016)
隨著我國空中交通流量的急速增長和空管信息化建設的快速推進,空中交通流量管理逐步從實時戰術的流量調配模型研究拓展至預戰術階段流量管理決策和觸發機制研究中[1].機場終端區運行環境復雜,是進離場飛行程序運行和空域規劃管理的基礎,對終端區海量高復雜度的運行數據進行技術研究,有助于深度認知交通流組織模式,精細描述終端區交通態勢,把握交通特性變化規律和時空分布特征.飛行軌跡分析是反應終端區空域宏觀特性和智能決策分析的關鍵部分,新航行技術和雷達引導在空中交通管理中的應用使得飛行軌跡和標準進離場程序差異度較大,因此找出能夠有效整合航空器行為的聚類學習方法成為空中數據挖掘的重點.
目前關于航跡聚類方法核心在于離散軌跡點降維處理、相似度模型的建立(如基于部分特征點提取、最長公共子序列、點對歐式距離等)和高效的聚類算法(如k-means、DBSCAN和層次聚類等),Rehm[2]提出基于航跡點比對的相似性度量算法,Gariel等[3]以提取轉彎點為聚類分析對象表示軌跡間差異度,趙元棣等[4]通過主成分分析對飛行數據的降維,采用MeanShift方法實現軌跡聚類.針對航跡聚類中不同軌跡數據集規模參數選取困難和計算效率低的問題,提出一種基于自然鄰自適應的軌跡譜聚類分析方法.
航空器飛行數據通常是由二次雷達或ADS-B等監視設備實時獲取,由相同時間間隔的離散數據點構成,包含了記錄時間、空間位置(x,y,z)、航向,地速、上升下降率等飛行特征信息.相較于航路飛行,終端區內航空器起降頻繁,進離場航班匯聚,飛行流量異常(軍方活動或惡劣天氣等)時航空器需脫離標準進離場飛行程序,按照管制員指令實施機動飛行,由此產生的軌跡數據具有數據量大、時序性強、異常率高等特點.為保證數據處理速度和計算精度,在飛行軌跡聚類之前,需要對飛行數據進行清洗和預處理.
結合終端區空域結構對雷達數據點集合進行空間裁剪,保留歸屬終端區內的雷達數據集A.水平投影以終端區邊界點構成的多邊形區域為參考,對于無終端區設置的繁忙機場,以機場基準點為中心,按照半徑50 n mile進行界定.垂直投影以高度6 000 m為上限.若為取得更明顯聚類效果,可以先向外延伸終端區范圍,以區域管制數據為基礎用于軌跡分類,然后在以終端邊界進行軌跡選取.提取雷達數據集A所有單個航空器飛行軌跡序列,構造航跡初始樣本集合P=(p1,p2,…,pn),每條航跡pi={pi1,pi2,…,pim},n為數據集內航空器軌跡數量,m為單條航空器軌跡pi含有的雷達點數量,每個雷達點pim為pim=(t,x,y,z,v,φ,η),由記錄時間t、空間坐標(x,y,z)、速度v、航向φ、垂直上升下降率η等特征信息,按時間先后順序排列.由于監視設備在采集數據過程中采取固定時間間隔,采集過程可能受地形、天氣等影響導致雷達信息丟失,需對數據進行有效清洗.
1) 單條航跡pi中連續兩點時間間隔不超過10次以上雷達間隔,數據在可接受的容錯修復范圍內.
2) 單條航跡pi軌跡點數量m需要大于平均航跡雷達點數的1/2,避免掛牌錯誤,清除連續兩點間位置不合理跳變數據.
提取航跡后需保證航空器飛行特征信息前提下縮減數據規模,將軌跡集集時間歸一化,轉化到[0,1]時間片序列中,滿足聚類相似度計算要求.
基于文獻[4]的方法使用均勻參數化對飛行軌跡進行重采樣,將每條軌跡pi={pi1,pi2,…,pim}中各軌跡點空間坐標pil=(xl,yl,zl),l=1,2,…,m坐標進行累加弦長,得到位于[0,1]區間的參數λl.
λ1=0
λl=λl-1+
(1)


圖1 航跡重采樣示意
譜聚類核心是親和度矩陣變換得到拉普拉斯矩陣,進行特征分解后得到的特征向量進行聚類[5].
飛行軌跡相似度模型是影響聚類結果的關鍵因素,通常軌跡間的相似度可通過歐式距離、最小外包矩形距離和最長公共子序列距離等.文獻[6]提出基于3D網格的軌跡間相似性模型,將終端區空域劃分為多個大小相等的3D空間網格,依據占據度判斷不同軌跡間的相似性.文獻[7]提出基于轉彎點最長公共子序列的軌跡聚類模型,依據公共子序列個數計算差異度.終端區內交通密度大,飛行軌跡具有差異化和強機動性特征,不同扇區之間走廊口位置不同且移交高度有所區別,相比之下,兩條航跡間的歐式距離更為較好適應軌跡數據結構,計算不便捷.
(2)
式中:D(X)為歐式距離集合方差;H為航跡點對間速度相差50節出現的點對數量;Δ為航跡點對間距離小于5 n mile,航向夾角小于20°點對數量.rij越大,表明兩條軌跡間差異度越明顯,rij越低,說明兩條軌跡在空間距離上更加吻合.由于相似度rij基于歐式距離計算,由此構建的相似度矩陣R為對稱陣.
考慮到飛行數據中噪聲影響,不同走廊口間軌跡緊密程度不同,為保證聚類結果準確性,相似度矩陣需要進行降噪處理.傳統譜聚類算法通常使用高斯核函數獲得親和度矩陣W[8],即
(3)
式中:rij為上述飛行軌跡相似度;σ為軌跡尺度參數,需根據經驗手動設置,聚類效果易受到主管因素影響.軌跡點的分布圖見圖2.

圖2 軌跡點分布圖
由圖2可知,傳統譜聚類算法僅僅依靠點對間距離構建親和度矩陣,即Wab=Wac,若引入密度條件則實際Wab 表1 自然鄰算法 根據密度分布情況,同處高密度區域的數據點相似度更大,由此構造新的親和度矩陣: (4) (5) (6) (7) 將親和度矩陣W規范化求出其特征值及特征向量,在實際處理中遇到大量含有雷達引導的飛行數據往往無法確定聚類數k,可以采用特征間隙思想[10],將特征值λt從大到小順序排列,計算每兩個相鄰值之差構成本征間隙序列,即ηi=λi-λi+1,本征間隙序列的第一個極大值點就是特征間隙,其對應下標為聚類數目k,若先驗知識充足,可結合飛行程序中走廊口的設定確定最終聚類數目k.將特征向量V歸一化后,取前k個特征向量,采用k-means對進行聚類,得到最終聚類結果.具體算法過程為 步驟1有效軌跡提取,設置采樣數c對航跡進行重采樣與歸一化處理,得到新軌跡集P′. 步驟2結合軌跡集空間特征信息,依據式(2)計算航跡相似度r,構建相似度度矩陣R. 步驟3結合2.2算法得出軌跡集nb,supk,rate,改進高斯核函數得出親和度矩陣W. 步驟5依據特征間隙或先驗知識設置聚類數k,獲取前k個最大特征值對應特征向量并歸一化處理,得到Y=[y1,y2,…,yk]. 步驟6將Y中的每一行對應一條飛行軌跡,采用k-means聚成k類,若Y中第i行屬于第k類,則軌跡i分為第k類. 圖3 航跡重采樣示意 對重采樣的新軌跡P′求取相似度矩陣,結合3.2節自然鄰思想求出親和度矩陣,并對親和度矩陣W規范化得出拉普拉斯矩陣L,計算其特征值λt,并將特征值從大到小順序排列,求本征間隙,結果見表2. 表2 特征值和本征間隙值 表2中特征間隙為0.203 5,對應下標標號5,通過實驗測試發現部分軌跡之間存在較多的重合部分,出現二義性,參照昆明長水機場NAIP進離場走廊口的設定,最終設聚類數目為k=6,依據重采樣軌跡P′構建親和度矩陣W并規范正交化,采用k-means聚類算法對前六個特征向量子空間進行聚類,得到北側進場交通流MEBNA,XISLI,西側進場交通流有GUILOT、P297,東側進場交通流LXI,南側進場交通流ELASU,基于聚類結果,提取南北向進場交通流,見圖4,由圖4可知,該方法對所有進場軌跡實行有效劃分,各分類簇可準確刻畫不同方向進場軌跡特征.部分交通流和盛行交通流見圖5~6. 圖4 飛行軌跡聚類結果 圖5 部分交通流提取 圖6 盛行交通流 針對聚類結果,采用核密度估計對盛行交通流進行識別.由于軍航活動或危險天氣原因,在航班流量過大情況下管制員對進場航空器實施較大程度的雷達引導.由聚類結果可知雷達引導時軌跡偏置與跑道運行模式相關,北向03進場和南向21進場方式對應盛行交通流有所差異.北側走廊口MEBNA,XISLI方向異常軌跡往往中心線兩側大量偏置,可能是北側進場交通流占比較大,走廊口繁忙時段管制員命令部分航空器繞飛拉開間隔,實現航班排序. 通過飛行軌跡聚類分析,昆明長水機場南側ELASU、東側LXI進場軌跡較為集中,北側MEBNA、XISLI進場航跡出現大量偏置,呈現發散趨勢,為進場飛行程序管制適用性提供另一個視角,同時可進一步分析飛行軌跡偏置出現原因和飛行軌跡偏置時空分布特性,研究管制員特殊情況下指揮偏好及交通流動態特征. 文中結合終端區航空器飛行特點,采用重采樣方法保留航跡飛行特征,提出了基于自適應改進譜聚類的航跡聚類方法,以昆明長水機場為例,該方法能夠減少規模參數選取,得到滿意的聚類結果,從龐雜的進場軌跡中提取盛行交通流和識別異常軌跡,為航空器運行特性分析提供數據支持,后續研究可結合交通流相態變化,進一步分析終端區交通特性變化規律和時空分布特征.

3 飛行軌跡聚類實例分析






4 結 束 語