翟文鵬, 陳梵驛, 金嗣博
(中國民航大學 空中交通管理研究基地, 天津 300300)
?
基于分位數回歸的機場容量評估
翟文鵬, 陳梵驛, 金嗣博
(中國民航大學 空中交通管理研究基地, 天津 300300)
對北京首都國際機場航班運行的歷史數據進行了統計分析,建立了進離場小時架次及時間的三維數據結構,并利用DBSCAN算法進行聚類分析;在消除“噪點”的基礎上,利用改進后的分位數回歸算法生成分時段的具有95%概率的機場小時運行能力包線。仿真結果表明,各個時段的機場進離場架次具有一定的時間特性和差異:8點到10點處于離港早高峰,離港小時架次遠大于進港小時架次;10點到22點進離港航班較為均衡,機場全負荷工作;其他時間段航班小時架次未達到最大容量值。
機場容量; 延誤; 分位數回歸; 聚類分析
當前,國內外空中交通流量需求旺盛,不少大型機場的容量已飽和,航班延誤問題較為突出,提升航班正點率是迫切需要解決的問題。而機場改擴建工程耗時長、投資大,因此對機場現有容量進行科學合理的評估,提高機場容量利用率,有助于航班時刻資源優化和機場延誤水平降低[1]。
常見的機場容量評估方法主要有仿真模型法、數學模型法和實證研究法。其中,仿真模型法能夠逼真地模擬機場的運行情況,主要用于跑道容量評估;但目前多集中在對跑道容量的評估問題中,同時需要豐富的空管專業知識,特別是場面運行專業知識。李雄等[2]應用Simmod仿真軟件針對不同典型構型平行跑道及常用跑道運行模式,分別對跑道極限容量和實際運行容量進行了仿真研究。高偉等[3]通過建立雙跑道容量計算模型,并應用Simmod軟件仿真兩種方式評估機場跑道容量極限。該方法與數據計算模型所得的容量差異率不超過2%。數學模型法得到的評估結果僅是理論計算值,是宏觀的容量評估,缺乏對細節的考慮,例如沒有考慮空域環境對機場容量的影響,通用性較差。張洪海等[4]建立了機場進離場容量和時隙協同配置的多目標優化模型,考慮了機場容量的動態性和航班間的相互影響,可以動態充分利用進離場容量。盧朝陽等[5]假設機場到達流特性符合正態分布或韋布爾分布,采用T系統推導跑道容量,論證得到的跑道容量符合現實情況。實證研究方法通過對機場日常運行情況的觀測,利用統計方法獲得機場跑道容量的統計規律,通過對機場進離場航班運行態勢的統計分析得到機場容量的評估結果。王飛等[6]應用k-means算法和SOM神經網絡的混合聚類算法確定機場典型容量樣本,評估機場容量。國內外關于分位數回歸的應用主要集中在經濟方面,鮮有用于交通領域。文獻[7]率先提出了將分位數回歸算法應用到容量包線中,對機場群進離場容量進行了評估。
目前,國內外基于歷史統計數據的機場容量評估方法,均未考慮大型樞紐機場由于不同時段的運行情況差異而導致的機場運行能力的變化,且未能對高峰小時進離港架次進行評估。本文構建了具有時間維度的進離場小時架次,采用聚類算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)[8-9]對進離場態勢進行了統計與分析。另外,本文將分位數回歸模型[10]改進后應用于機場容量評估問題中,發掘了分位數回歸在解決容量包線問題方面的優越性,得出了具有一定概率分布的容量包線,使得最終得到的容量評估結果更加符合實際的運行情況。
傳統的聚類方法需要預先對簇的個數進行預設,不能保證精確度。本文選擇DBSCAN算法來處理所研究的數據集,能夠根據密度對數據進行聚類,且對簇的個數和形狀沒有要求,而且能夠發現“噪點”(進離場小時架次出現次數少的點)并將其分離,從而可以從大量的原始數據中獲得若干個時間段的容量簇,減少這些“噪點”對于容量評估的影響,提高容量評估的精確度和合理性[11-12]。此外,傳統的聚類方法只需沿著聚類分析點的外邊線進行描繪就可獲得機場的極限容量評估值,以此作為機場容量標準并不準確、科學。多個時段的實際容量低于極限容量評估值,同時沒有考慮不同時段進離場航班需求。因此,需要將時間信息加入到待處理數據中,從而完成包含時間信息的三維數據聚類分析。采用DBSCAN聚類方法將進離場航班進行分析后,可獲得不同時間段進離場航班各自的容量區間,但并不能獲得準確時間區間的容量情況。因此,需要進一步應用分位數回歸對聚類分析獲得的幾個主要區間分別進行分析,并以95%概率的容量而非極限容量進行評估,可獲得滿足機場實際運行的容量,避免由于實際容量小于極限容量從而造成不正常航班。由于進港航班架次是非負整數且為有限值,故容量包線的潛在分段點也是有限的,意味著容量包線線段覆蓋了所有進港航班架次的極小值。因此,分位數容量包線可描述為:
(1)

對于給定的τ分位數分段系數(αk,βk)的評估過程,涉及到以下線性規劃問題,目標函數為:
(2)
約束條件為:
(3)
(4)
式(3)定義了來自觀測值y的分位數函數的絕對偏差,式(4)保證了分段斜率的凹性。
利用傳統的基于歷史統計數據的容量評估方法得到的機場容量包線,僅為對機場運行能力上限值的評估。然而運行能力在滿足一切內外條件下才能達到機場容量上限,出現的次數極少,不能作為容量評估值,否則在大部分時間段運行能力低于極限能力的情況下,將出現大量航班延誤。本文擬用基于DBSCAN聚類方法對首都機場實際運行中大量、長期的運行數據進行分析,樣本來自首都機場2013年3月至10月的進離港航班數據。采用本文所提出的DBSCAN聚類分析方法對其進行聚類后,得到的結果如圖1所示。圖中未劃入各區域的點為噪點,即進離場架次統計值出現次數較少的點,需要去除,為下一步基于分位數回歸提供有效數據。另外,高峰小時容量是制約機場運行能力的重要指標,對于航班時刻的分配和實際運行中航班調配都具有重要作用,關系到機場資源和航班時刻的利用效率。聚類分析得到的5個核心區域分別用數字區分,即進離場航班運行在5個主要的區間內,從而獲得了不同時間段進離場航班各自的容量區間,為下一步通過分位數回歸評估容量包線奠定了基礎。

圖1 進離港小時架次聚類結果Fig.1 Clustering results of arrival and departure per hour
對上述5個時間段的起降架次范圍進行分位數回歸,結果如圖2所示。
圖2(a)為0點到6點進離港小時架次,對應圖1中的區域1,該時段進離港架次較少,共30架次;圖2(b)為6點到8點進離港小時架次聚類的結果,對應圖1中的區域2,該時段離場航班逐漸增多,共48架次;圖2(c)為8點到10點進離港小時架次聚類的結果,對應圖1中的區域3,該時段處于早高峰,大量航班離場,少量航班進場,共82架次;圖2(d)為10點到22點進離港小時架次聚類的結果,對應圖1中區域4,該時段進離場架次較為均衡,機場全負荷工作,共106架次;圖2(e)為22點到24點進離港小時架次聚類的結果,對應圖1中區域5,該時段大量航班進港過夜,共66架次。
本文針對首都機場進離港小時架次進行統計數據分析,將歷史統計進離港小時架次與時間結合構成三維數據并進行DBSCAN聚類分析。本文方法避免了數據噪聲點的干擾,充分發揮機場運行能力和降低航班延誤,使得容量評估更加合理。該算法為繁忙機場分時段小時容量評估提供了數據分析及容量評估手段,為航班時刻資源合理分配提供了依據。下一步將以航班延誤作為指標之一對進離港小時容量進行評估。
[1]Barnhart C,Belobaba P,Odoni A R.Applications of operations research in the air transport industry[J].Transportation Science,2003,37(4):368-391.
[2]李雄,李冬賓,衛東選.機場典型平行跑道容量仿真分析[J].計算機應用,2012,32(9):2648-2651.
[3]高偉,傅煒.基于相關進近模式的雙跑道容量計算及仿真[J].科學技術與工程,2014,14 (4):108-112.
[4]張洪海,胡明華.CDM ADGDP機場容量與時隙協同配置[J].系統工程理論與實踐,2010,30(10):1901-1908.
[5]盧朝陽,趙新燦.基于到達流特性的跑道容量分析[J].南京航空航天大學學報,2011,43(1):30-34.
[6]王飛,徐肖豪.隨機GHP模型中機場容量混合聚類算法[J].交通運輸工程學報,2011,11(1):64-68.
[7]Ramanujam V,Balakrishnan H.Estimation of arrival-departure capacity tradeoffs in multi-airport systems[C]//Proceedings of the 48th IEEE Conference on Decision and Control.Shanghai:IEEE,2009:2534-2540.
[8]劉大有,陳慧靈,齊紅,等.時空數據挖掘研究進展[J].計算機研究與發展,2013,50(2):225-239.
[9]王駿,王士同,鄧趙紅.聚類分析研究中的若干問題[J].控制與決策,2012,27(3):321-328.
[10]Kim M O.Quantile regression with varying coefficients [J].The Annals of Statistics,2007,35(1):92-108.
[11]鄧敏,劉啟亮,王佳繆,等.時空聚類分析的普適性方法[J].中國科學:信息科學,2012,42(1):111-124.
[12]Wang M,Wang A P,Li A B.Mining spatial-temporal clusters from geo-database[C]//Li X,Za?ane O R,Li Z H.Advanced Data Mining and Applications:Vol 4093.Xi’an:Springer Berlin Heidelberg,2006:263-270.
(編輯:李怡)
Evaluation of the airport capacity based on quantile regression
ZHAI Wen-peng, CHEN Fan-yi, JIN Si-bo
(Research Base for Air Traffic Management, CAUC, Tianjin 300300, China)
3D data structure of the arrival-departure hour sorties and time were established based on the statistical analysis of the historical data of capital airport flight operation, and proceeded the cluster analysis with DBSCAN algorithm. The airport hour operation capacity envelope with 95% probability was generated by using quantile regression algorithm on the basis of eliminating "noise". Simulation results show that the arrival and departure sorties of the airport has certain amount of time characteristics and differences: at 8:00-10:00 am in the morning rush, departure hour sorties are far greater than arrival hour sorties; at 10:00 am-22: 00 pm, arrival and departure flights is relatively balanced and full load working at the airport; other times flight hour sorties reduced and have not reached maximum capacity.
airport capacity; flight delay; quantile regression; clustering analysis
2015-09-29;
2016-01-25; 網絡出版時間:2016-04-22 09:52
國家自然科學基金資助(41501430,71571182,U1333116);國家空管科研課題基金資助(GKG201405002);中央高校基本科研經費資助 (ZXH2012M003);中國民航大學科研啟動基金資助(2012QD02X);大學生創新創業訓練計劃基金資助 (201410059082);教育部人文社科青年基金資助(14YJC630185)
翟文鵬(1985-),男,天津人,講師,博士,研究方向為空中交通規劃與管理。
V355.1
A
1002-0853(2016)04-0086-04