王春政, 胡明華, 楊 磊,*, 趙 征
(1. 南京航空航天大學民航學院, 江蘇 南京 211106; 2. 國家空管飛行流量管理技術重點實驗室, 江蘇 南京 211106)
近年來,隨著空中交通需求量的增加,國內外空中交通系統均面臨巨大壓力,由此造成了嚴重的空中交通延誤。據民航局統計,2015-2019年間,全國客運航班平均正常率為75.71%,平均延誤時間為18 min,其中2015年客運航班的正常率僅為68.33%,平均延誤時間超過20 min。根據美國交通運輸統計局統計顯示,同時期的美國主要航司的航班準點率也僅為79.99%。雖然受新冠疫情影響,全球空中運輸出現下滑趨勢,延誤率出現短暫下降。但隨著疫情的恢復,國內外航空業逐漸回暖,空中交通需求仍具有強勁增長勢頭。因此,航班延誤問題仍是未來一段時間內所面臨的重要挑戰。
航班延誤影響旅客行程的同時,還對國民經濟造成巨大損失。據統計,2013年航班延誤給我國間接造成約3 500億元的經濟損失;2007年美國由于航班延誤造成的經濟損失約33億美元。此外,空中延誤的發生還造成了額外的燃油消耗,增加的碳排放量亦加重了環境負擔。緩解延誤,降低延誤損失成為空中交通管理中亟待解決的問題。
雖然空中交通服務能力下降引發的容需不平衡造成了不可避免的延誤的發生。但空中交通管理者在準確獲知未來延誤信息的情況下,提前部署空中交通流量管理策略,則可有效降低延誤損失。此外,通過探明容量波動引發系統延誤的變化,可為戰略階段部署基礎設施提供有效支撐。因此延誤預測對于指導戰略規劃和戰術運行均具有重要意義。
空中交通系統由機場、航空公司、空中交通管制單位等實體組成,屬典型復雜系統,其內部各元素的交互作用構成了系統的非線性聚合的動力學特征。空中交通系統的復雜屬性給延誤預測問題帶來挑戰。為此大量學者應用多種方法展開延誤預測問題的研究。Sternberg等回顧航班延誤預測研究現狀,但僅對延誤預測方法做出劃分,缺乏關鍵方法必要的方法闡釋與對比。劉博等結合國內研究現狀,亦對航班延誤問題進行了綜述,但在方法上,僅考慮了統計推斷、仿真與建模和機器學習方法3種方法,缺乏部分關鍵研究方法的系統性分析,未對各種方法包含的模型進行縱向對比。羅鳳娥等僅對基于數據挖掘的延誤預測方法進行了綜述。鑒于研究快速發展的趨勢,因此有必要結合國內外最新研究成果,系統性深入回顧空中交通延誤預測研究現狀,縱橫向分析其方法特點,從而洞見研究趨勢,辨明未來研究方向。
為此,本文應用分類學方法,從預測延誤的類型以及延誤預測方法等方面展開綜述。第1節闡述了延誤的生成與傳播機理,第2節對目前研究中的預測的延誤類型進行劃分,第3節對比分析了國內外延誤研究預測方法,第4節總結了空中交通延誤預測研究趨勢,并結合各類算法的特點探討了未來發展趨勢,最后對本文進行總結。
一般而言,航班延誤的研究對象側重于重個體航班的延誤水平,而空中交通延誤除了涵蓋個體航班的延誤外、還包括了以機場(對)、航路、或航空公司等為單位的延誤狀況。但空中交通延誤仍然由其運行的航班所引發。為明確規范兩個術語的使用,本文根據使用場景,適應性選擇了不同的表達方法。
航班延誤通常定義為計劃起飛到達時間與實際起飛到達時間的差值。作為衡量空中交通系統運行性能的關鍵指標,一般將15 min作為劃分航班延誤的延誤依據,即航班晚于計劃15 min起飛或到達時,視為航班起飛到達延誤。
空中交通系統屬于多方參與、資源共享的典型復雜系統,多種原因造成了空中交通延誤的發生。如圖1所示,根據延誤統計結果,可將延誤歸因為天氣、航空公司、空管(含流量原因)等幾類主要原因。一方面機場容量易受天氣影響,惡劣氣象條件造成機場容量下降,導致容需不平衡,引發航班延誤。另一方面,航路上的惡劣氣象條件會導致總飛行時間門到門時間延長,增加了到達延誤發生的概率。此外,研究表明慢發天氣對延誤也存在不同程度的影響。當飛行量超過區域或終端區扇區保障能力時,為保障空中交通的整體流動性,實時空中交通管制措施的實施造成了部分航班的延誤。

圖1 航班延誤因果圖Fig.1 Cause and effect diagram for flight delays
除空中延誤因素影響外,地面等待策略的實施以及地面保障資源的限制,可能增加額外航班地面服務時間,造成地面延誤。地面等待策略是指當航班到達機場容量下降后,不能在指定時段為航班提供到達服務時,通常在出發機場實施地面等待,從而將空中延誤轉化為地面延誤,以減小延誤損失。此外,廊橋機位(近機位)等地面資源的缺乏以及場面交通流的擁堵將使航班產生附加的滑行時間或服務保障時間,進而產生航班延誤。除上述因素外,維修或機組等航空公司自身資源管理問題導致航班難以按時起飛時,亦造成了航班延誤。
天氣、航空公司、空管(流量)、機場保障等原因引發航班產生初始延誤后,由于航班之間的連接性以及航空器、機組、機場等資源的共享性,致使延誤再次傳向下游航班,造成了延誤傳播現象。延誤傳播成為空中交通延誤的另一主要因素。在航班計劃制定階段,航空公司一般會通過增加其計劃飛行時間與周轉時間,利用緩沖區吸收航班的延誤。但當延誤過大,超出緩沖區負載時,后續航班將發生難以避免的延誤。另外,就系統層面而言,航司與機場在提升自身資源利用率的同時,降低了系統的魯棒性,致使出現小范圍的延誤不斷擴大,形成“雪球效應”,加劇了延誤在空中交通網絡內的傳播。
依據不同指標,對空中交通延誤預測涉及的類型進行劃分有助于系統性理解延誤類型的差異,采用針對性方法展開基于目標導向的延誤預測研究。本文根據延誤結果的數值類型,將延誤分為連續型延誤與分類型延誤;根據預測對象的差異,將延誤預測類型分為個體延誤與聚合延誤;根據延誤預測對象的時間尺度,將延誤分為戰術型延誤和戰略型延誤。
在航班延誤相關定義中,航班延誤一般以15 min為界限進行劃分,即實際起飛/到達時間超過計劃起飛/到達時間15 min時,視為航班起飛/到達延誤。延誤預測研究中,數值延誤以連續型數值作為延誤輸出變量,分類延誤是按照延誤相關等級作為輸出變量。
連續型延誤輸出結果精細程度較高,能夠為機場、航空公司與空管部門協同決策,實施精細化策略提供必要信息支撐,從而降低延誤損失。由于航班延誤受多種復雜因素的影響,難以實現數值延誤的絕對性精確預測。在數值延誤預測研究中,一般采用均方根誤差(root-mean-square error,RMSE)和平均絕對誤差(mean absolute error,MAE)衡量延誤預測精度。

(1)

(2)
式中:和分別表示延誤的預測值與實際值。由式(1)和式(2)可見,MAE對所有誤差給出相同的權重,而RMSE對絕對值較大的誤差給出的權重大于絕對值較小的誤差對應的權重。MAE與RMSE在衡量模型性能時具備不同的優勢,采用多種指標綜合對比分析的方法更能客觀度量模型性能,但當預測誤差預計服從高斯分布時,RMSE更能體現模型整體精度。
相對于連續型延誤變量而言,分類型變量對于理解延誤程度更具直觀表現形式。正確率常作為衡量分類型延誤模型的性能指標。在建模過程中,合理分類設置延誤等級閾值對理解延誤程度以及衡量模型精度至關重要。一方面延誤分類結果要根據實際運行的需要,保證分類結果的易理解性。另一方面,分類結果對預測精度具有重要影響。尤其在不平衡數據集中,合理分類是保證客觀衡量預測結果的重要前提。例如在二分類延誤預測問題中,假設延誤數據集占10%,即使預測精度達到90%,依然難以直接認定預測模型具有較高的預測精度。目前分類型延誤預測研究中,多采用15 min,30 min,60 min 作為二分類問題的延誤閾值。
此外,為使預測結果與空中交通系統的隨機性因素相融合,部分學者重點考慮系統的不確定性特征,展開了概率型延誤估計的相關研究。其預測結果為對應延誤量級下的概率值。
根據延誤的主體攜帶者,可將延誤分為個體延誤與聚合延誤。具體而言,個體延誤以單個航班為對象,聚合延誤以單/多個航司、機場、機場對乃至整個空中交通系統為統計對象。
在空中交通運行中,旅客與航司通常更加關注個體航班的延誤程度。乘客會視航班延誤程度,對未來行程做出規劃。單個航班的延誤程度,對整個公司后續的運行具有重要意義。航空公司會權衡航班延誤與取消的經濟損失、社會影響等,以便對未來運行做出決策。在協同決策運行條件下,這些決策結果將直接或間接影響與其共享資源的航班運行。但考慮到空中交通中各要素的交互作用,資源共享,即使以單個航班為預測對象,仍然需要考慮整個系統內個體的運行狀態以及環境狀態,以保證預測精度。
雖然聚合延誤是系統主體內的航班個體綜合作用的結果,鑒于空中交通系統的復雜性,涉及眾多要素,很難精確預測單體航班延誤狀況,由此產生了以聚合延誤作為響應變量的相關研究。雖然聚合延誤忽視了主體內個體航班的微觀差異,但其模糊式的處理方式使得建模過程更容易聚焦影響延誤的主要因素,簡化建模過程與問題復雜度。預測結果有利于空中交通管理者和參與者整體理解系統性延誤演化趨勢。
戰略流量管理是指在運行前一周至數月所采取的措施,戰術階段是在運行當日采取的方案和措施。本文沿用“戰略”“戰術”在空中交通流量管理中所表示的時間范圍含義,指代延誤預測的時間尺度,將延誤類型分為戰術型延誤和戰略型延誤。
戰術型,又可稱實時型延誤,預測時間一般為2~8 h,其研究更加注重氣象條件等外界環境波動對系統運行的影響。預測結果對指導流量控制決策,制定減少延誤、取消和其他成本的策略具有重要意義。由于戰術延誤預測及時性需求,對模型的運行時間具有較高要求。因此,當模型運行長達數小時,則難以滿足戰術階段的流量管理需求。
當考查系統基礎設施和內部要素變動引起網絡運行的變動時,常以可能導致的延誤時間作為系統性能的重要度量指標,此時的延誤可稱為戰略型延誤。盡管戰略階段規劃的運行方案還未執行,但在一定程度上可預見部分延誤的發生。航班時刻分配是戰略流量管理階段最常用的規劃手段。在航班時刻制定過程中,常以航班延誤作為關鍵的優化目標。此外,戰略型延誤估計對探明新增機場/跑道、改善空域結構引發的系統整體性能影響方面具有重要參考意義。
空中交通網絡系統的復雜特點保持了延誤預測問題的開放性。研究目的、面向對象與問題特點促進多種方法應用于空中交通延誤預測問題。綜合國內外研究文獻,如圖2所示,可將主要研究方法分為基于歷史數據的延誤預測方法、運籌學方法以及復雜網絡方法3類。

圖2 空中交通延誤預測方法分類Fig.2 Classification of air traffic delay prediction methods
空中交通系統每日運行產生大量數據,包括航班運行時間節點、氣象信息等。海量運行數據的支持為應用傳統機器學習、深度學習、概率模型等方法研究空中交通的復雜延誤現象提供了可能,豐富了空中交通延誤預測手段。
3.1.1 傳統機器學習方法
機器學習是人工智能和模式識別領域的共同研究熱點,其理論和方法已被廣泛應用于解決工程應用和科學領域的復雜問題。傳統機器學習的研究方向主要包括決策樹、隨機森林、貝葉斯學習等方法,其中貝葉斯網絡和隨機森林被大量應用于空中交通延誤預測。
貝葉斯網絡是表示一組隨機變量之間的概率關系圖形,主要由有向無環圖和概率表組成。貝葉斯網絡為表達子系統的內部行為和子系統之間的相互聯系提供了一種簡潔方式,成為研究復雜系統中多種因素相互依賴性的重要工具。通過貝葉斯網絡與傳統統計方法相結合時,可以利用條件獨立性假設,為預測或分類問題提供更準確的估計,為分析系統微觀和宏觀層面的現象提供了可能。2005年,為分析網絡節點的延誤傳播作用,Xu等構建了最早的貝葉斯機場網絡模型。該模型基于芝加哥奧黑爾國際機場(簡稱為ORD)、紐約拉瓜迪機場(簡稱為LGA)和亞特蘭大杰克遜國際機場(簡稱為ATL) 3個機場構建,數據來源于美國聯邦航空管理局,包含了2003年11月-2004年1月的航班運行數據。模型基本結構如圖3所示。

圖3 基于貝葉斯網絡的機場延誤傳播圖Fig.3 Airport delay propagation graph based on Bayesian network
模型納入天氣、時間、航班數量對ORD的影響,由此產生的起飛延誤輸入至一定時間后的ATL延誤節點。網絡圖的右下方基于類似原理構建。分析結果表明,ORD和LGA的延誤分別經過1.75 h和2.5 h后傳播至ATL,并且ORD對ATL的影響遠遠高于LGA。雖然模型僅考慮了美國國家空域系統(national airspace system,NAS)中的3個機場與簡化的影響因素(天氣、取消航班的數量),但其結果所呈現的直觀、清晰的延誤傳播效應為后續基于貝葉斯網絡的延誤分析提供了引導。
此后,Xu等利用貝葉斯網絡分析了延誤因素與各航段延誤的影響以及各航段延誤之間的內部作用關系,并研究了機場對航空運輸系統中傳播的延誤的“彈性”,確定了機場延誤吸收的能力取決于計劃的周轉時間(特別是地面緩沖時間),并比較了不同機場的延誤吸收水平在機場延誤傳播的程度差異。李俊生等利用貝葉斯網絡,以北京首都機場為中心節點,研究了其與國內其他網絡節點的延誤傳播效應。曹衛東建立了優化算法與貝葉斯相結合的延誤預測模型,通過與傳統結構算法對比表明改進貝葉斯網絡模型的有效性。劉玉潔利用貝葉斯網絡探索了航班延誤預測中的運行時間與精度問題,并提出了改進的貝葉斯網絡模型,預測結果表明網絡的預測準確率和運行速度均可得到有效提升。近年來,吳薇薇等利用貝葉斯網絡模型分析了航班運行條件與航班延誤的關系,并基于此開展航班計劃優化研究。Wu等闡述了延誤傳播模型的重要作用,并指出現有基于延誤傳播樹的研究主要聚焦于單個航空器或兩個機場間的延誤傳播,未考慮乘客連接;并且延誤傳播樹與延誤乘子模型中獨立同分布的假設不符合實際情況。基于此,Wu等人重點考慮了資源連接,包括航空器、機組等以及乘客連接,結合延誤傳播樹與貝葉斯網絡建立了延誤傳播模型。模型主要用于探討航空公司網絡的延誤傳播效應,重點分析配置資源對延誤的影響。聚焦于空中交通網絡中單個節點的運行細節,Rodríguez等考慮氣象、航班信息、機場構型等因素,建立了基于機場節點的貝葉斯網絡到達延誤和擁堵預測模型,旨在提升進港排序輔助決策系統運行效能。實驗結果表明到達過程的飽和水平、當日時間以及氣象狀況將影響機場延誤水平。雖然貝葉斯網絡能夠有效分析網絡傳播效應,但在構建過程中需要大量先驗性知識。基于小規模探索分析時,尚且包括眾多復雜變量與預處理過程,因此擴展至全網進行系統性研究時,其繁雜變量的處理過程給實際執行帶來挑戰。
如圖4所示,隨機森林組合多棵決策樹做出預測,其中每棵樹均基于隨機向量的一個獨立集合的值產生,是一類專門為決策樹分類器設計的組合方法。將分類樹替換為回歸樹,將類別替換為每個回歸樹預測值的加權平均,能夠將隨機森林分類算法轉化應用于回歸問題。研究表明,隨機森林算法的預測誤差能夠收斂到泛化誤差,從而有效避免過擬合的產生。在應用中,隨機森林能夠自動生成變量的重要度,對訓練數據中的異常值具有低敏感性特征,當變量數量多于樣本數時仍能夠發揮良好的性能。

圖4 隨機森林示意圖Fig.4 Schematic diagram of random forest
2014年,Rebollo等通過事先定義的系統延誤狀態,綜合考慮了時空解釋變量,通過隨機森林分類和回歸算法實現了NAS中關鍵機場對的延誤預測。算法中的解釋變量由分類變量和連續變量構成。在建模過程中,分別利用Kruskal-Wallis參數方差分析檢驗和多重比較檢驗以及隨機森林算法自身評估類變量和連續變量與延誤的相關性。檢驗分析后,形成如圖5所示的時空解釋變量。

圖5 隨機森林算法解釋變量Fig.5 Explanatory variables applied to random forest algorithm
其中,時間變量中的當日時間為一天中整數時刻,屬于分類變量;星期為含有7個類的分類變量;月份則劃分為1~5月,6~8月,9~11月和12月三類。空間變量中,NAS延誤狀態為事前通過k均值聚類算法獲得的6類延誤狀態;不同的延誤狀態對該日的影響程度不同,該日與前日延誤狀態用于解釋延誤的原因,該日延誤狀態假設為已知量,前日延誤狀態還包含了延誤的時延性。針對100個機場對的延誤預測測試中,分類算法被解釋變量以60 min為延誤閾值進行劃分。預測結果顯示:在分類型延誤預測中,兩小時預測區間的精度為81%;在連續型延誤預測,即回歸建模中,誤差為21 min。
Belcastro等定義延誤閾值后,考慮了機場對,計劃到達時間,以及兩個機場前后數小時的天氣特性,包括天氣特征,能見度,濕度,風向,風速等因素,測試了C4.5、支持向量機(support vector machine, SVM)、隨機森林、隨機梯度下降、樸素貝葉斯、邏輯回歸等分類算法預測單個航班延誤時的性能,結果表明隨機森林在精度與召回率方面呈現出優越性能。另外,為充分發揮數據預處理對于提升算法性能關鍵作用,Belcastro等人采用隨機欠采樣方法處理了不平衡數據集問題。Choi等應用決策樹、隨機森林、自適應提升、k近鄰算法,考慮航班計劃與氣象信息,預測了航班二值延誤(準點或延誤)情況,并重點分析了航班計劃、氣象、采樣技術的應用對算法性能的影響。通過十折交叉驗證結果表明,隨機森林在上述算法中具有最高的預測精度。Gui等考慮了廣播式自動相關監視系統數據、氣象條件、航班計劃、機場信息等,應用隨機森林算法構建了單個航班延誤的分類和回歸模型,并驗證了隨機森林回歸在解決過擬合問題時優于長短期記憶網絡算法的特性。綜上,雖然隨機森林算法在預測性能方面具有顯著優勢,尤其隨機森林算法的重要度輸出,給理解延誤誘發因素提供了直觀度量與分析方法。但由于其基于數據的固有特性,即對歷史數據的高度依賴性,致使空中交通發生大尺度變化時,如大型機場開航,歷史數據量的缺乏致使其難以應用。
此外,郭野晨風等考慮了氣象因素,引入簡化的天氣影響交通指標,分別采用多元線性回歸和反向傳播(back propagation,BP)神經網絡對國內兩個機場進行了延誤預測。為表征延誤與其影響因素的高度非線性關系,Xu等利用多元自適應樣條回歸方法構建了全美34個業務發展伙伴關系機場的聚合延誤預測模型。相關變量以15 min內的統計量為基礎,實驗結果表明模型能夠有效預測機場的延誤生成和延誤吸收值。徐濤等將延誤航班量作為延誤等級,基于增量式排列SVM算法對機場航班延誤預警進行預測,驗證結果表明算法能夠滿足在線預警要求。羅赟騫等在利用相空間重構理論分析航班延誤時間的基礎上,結合預測航班的下游機場的歷史運行數據與預測日的上游機場的航班運行數據,采用SVM回歸(SVM regression, SVR)方法構建航班延誤預測模型,實驗表明融合差分進化算法的模型能夠有效預測航班延誤。除航班起降機場因素外,羅謙等針對機場群延誤問題,重點考慮了航空信息網絡內其他機場因素的影響,采用SVR方法建立了延誤預測模型。陳海燕等將上游延誤作為當前延誤狀態,將其他不確定因素引起的延誤作為隨機延誤,建立了航班延誤狀態空間模型,為構建動態數據驅動的航班延誤預測系統提供了模型基礎。何洋等在挖掘出機場單位小時流量對航班延誤影響的基礎上,利用洛杉磯機場與上海浦東機場的航班運行數據訓練了SVR模型和多元線性回歸模型。實驗結果表明,SVR模型能夠更為準確地預測航班延誤趨勢。與單一預測方法不同,王語桐等將SVR和線性回歸相結合,開發了航班延誤組合預測模型,并驗證了模型的有效性。
3.1.2 深度學習方法
深度學習的概念源于人工神經網絡的研究,含多個隱藏層的多層感知器就是一種深度學習結構。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征。目前,深度學習在圖像識別、語音識別、機器翻譯等各種機器學習任務中都取得了顯著的進步。受這一模式巨大成功的啟發,已有部分研究者嘗試將深度學習算法應用于空中交通領域的數據分析問題中。近年來,深度學習算法作為機器學習的延伸,也被應用至空中交通延誤預測研究。2016年,Kim等研究了深度學習模型在空中交通延誤預測任務中的有效性。通過基于深度學習范式的多模型結合,建立了長短時記憶循環神經網絡(long short-term memory recurrent neural network,LSTM-RNN)架構用于預測分類的航班延誤。模型納入了航班數據、天氣數據等,并在美國多個機場進行了測試,結果證實在深度學習的延誤預測中,預測精度隨著結構的加深而提高。傳統神經網絡通常借助1-N編碼方法處理名義變量,此方法有可能引發多重共線性的產生,從而降低算法性能。為解決此問題,Khanmohammadi等提出了一種多級輸入層人工神經網絡(multi-level input layer neural network,MLILNN)用于預測航班延誤。網絡訓練時將時間、航班信息、延誤原因作為解釋變量。在紐約肯尼迪機場的實驗結果表明,MLILNN在預測誤差和訓練神經網絡模型所需的時間方面都優于傳統的反向傳播方法。航班延誤是由多種復雜因素導致,為提供預測精度考慮大量因素時,將產生高維數據,處理不當時易引發維災難,降低模型性能。聚焦于此問題,Yu等提出了一種深度信念網絡(deep belief network,DBN)和SVR結合的方法(DBN-SVR)用于預測航班延誤。在DBN-SVR模型中,DBN主要用于提取對航班延誤有實際影響的主要因素,降低輸入維數,消除冗余信息,其輸出作為SVR模型的輸入,從而生成航班延誤的預測值。模型以北京首都機場為實例進行驗證,結果表明航路狀況和機場擁擠程度等新因素的納入對航班延誤預測的準確性具有重要意義。為實現最新航班數據的有效利用,王慧等通過動態設置訓練集,建立了三層神經網絡模型,能夠實現單個航班的有效預測。吳仁彪等結合卷積塊注意力模塊(convolutional block attention module, CBAM)與壓縮網絡(CondenseNet)建立了CBAM-CondenseNet航班延誤預測模型,實現了航班延誤等級預測。
3.1.3 概率模型
概率模型是對隨機現象的數學表示,由其樣本空間、樣本空間中的事件以及與每個事件相關的概率定義。在延誤預測研究中,概率模型一般輸出延誤等級的概率值。2008年,Tu等提出了一種結合非參方法與混合分布模型的航班起飛延誤估計算法。模型未直接考慮天氣狀況、需求變動、航空公司等因素,而將諸多因素簡化為季節趨勢、日變化模式和隨機殘差3個變量。在非參方法中,利用平滑樣條方法估計航班延誤的季節和日變化趨勢;混合分布模型用于估計殘差。模型如下所示:
(,)=()+()+
(3)
式中:(,)表示航班在季節、時間的延誤值;()表示延誤的季節趨勢;()表示日變化模式;表示隨機誤差。利用混合分布函數對參數擬合后,可計算航班的延誤概率。在丹佛機場的測試中,該模型具有良好的擬合優度和模型參數選擇的魯棒性。Boswell等通過概率密度函數表達延誤類別,使用狀態轉移矩陣驗證了前后序航班之間延誤傳播效應。模型能夠通過條件概率模型,在給定前序航班延誤值的情況下計算航班的取消概率。為對美國航班延誤進行全面表征以及延誤分布對比分析,Mueller等匯總全美機場的歷史延誤數據,討論了航空器、航空公司營運、程序變化及流量對應航班延誤影響。通過最小二乘法調整數據的均值和標準差,實現了離場延誤和到達延誤的有效擬合。實驗結果表明航班離場延誤服從泊松分布,而到達延誤則服從正態分布。在Wong等提出的生存模型中,分析氣象、航班計劃等因素對航班延誤的影響,結果輸出包含了各因素對延誤的貢獻程度以及延誤航班的恢復可能性,但未給出航班延誤預測值。
如表1所示,上述基于歷史數據的延誤預測算法呈現出不同優勢。總體而言,目前仍缺乏一種行之有效的統一框架為復雜的空中交通延誤預測提供方法參考。但在面對海量歷史數據時,根據研究需求,采用多種方法對比試驗是產生高精度預測結果的有效方式。

表1 基于歷史數據的延誤預測方法總結
基于深度學習/神經網絡的算法能夠實現延誤預測,并且在一定程度上能夠達到可觀的精度,但由于各變量間隱含的表示關系,使得相互作用效應難以理解,黑箱屬性的使預測結果缺乏可解釋性。因此,在實際應用研究中,提出了大量基于仿真與排列理論的運籌學方法。
國家空域系統性能分析工具(national airspace system performance analysis capability,NASPAC)是MITRE CAASD開發的最早的NAS仿真模型之一,NASPAC的核心部分基于離散時間仿真模型開發,主要功能為通過計算延誤,探明容量限制區域,分析新建機場、跑道關閉、新增航班等要素調整后的系統性能,模型結構如圖6所示。

圖6 NASPAC 框架圖Fig.6 Architecture of NASPAC
模型主要考慮了機場,進離場點,航路扇區,流控區等空間容量,其中機場容量由包絡方法進行設置,過點時間根據航空器性能與常用航路進行計算。數據輸入后,由預處理模塊生成NAS描述文件和系統需求文件。NAS描述文件用于表達NAS系統的空間屬性,需求文件表明系統目標。兩者相結合后輸入至離散事件仿真模型,通過捕捉空中交通控制網絡內單個航空器的行程,分析系統層面問題。此外,MITRE CAASD還開發了詳細政策評估工具(detailed policy assessment tool,DPAT),其功能與NASPAC類似。DPAT將NAS概念化為一個容量受限的資源網絡,由機場、航路扇區和航路點組成。與NASPAC不同的是,DPAT在航路部分主要基于排隊理論構建,通過服務時間表示航空器的空間位置移動。在機場容量設置中,DPAT采取了與NASPAC一致的方法。LMI與NASA基于排隊網絡合作研發了LMINET,其中包含了美國64個機場,終端雷達進近管制扇區以及航路中心管制扇區。在模型中,各站點服務時間均是通過排隊獲得。與NASPAC和DPAT不同,LMINET詳細考慮了航班在地面滑行、最小周轉時間。模型中所有過程均是通過排隊模型實現,機場容量在模型中由帕累托邊界獲得,并通過服務率發揮作用。由于LMINET沒有納入航空器行程信息,使其難以精確輸出單個航班的延誤狀況、捕捉其延誤傳播效應。為彌補LMINET在延誤傳播和航班延誤預測方便的不足,Long等開發了LMINET2。LMINET2詳細考慮了航空公司控制中心和空中交通管理者可能的運行策略調整、地面等待程序等。在解決航班周轉時間和航行時間時,分別采用了分位數設置方法和“計劃時間減去緩沖時間”方法。模型通過排隊理論輸出機場聚合延誤,然后根據航班計劃,計算單個航班延誤。同樣基于排隊論,Pyrgiotis等在Odoni等多年研究的基礎上,構建了近似網絡延誤(approximate network delays,AND)模型。AND由排隊引擎和延誤傳播算法兩個子模型構成。其中,排隊引擎是一個隨機動態排隊模型,主要用于計算單個機場的延誤;延誤傳播算法主要用于更新航班時刻表及實時容量,從而發揮網絡中延誤傳播的功用。
此外,Fleurquin等基于Agent構建基于數據驅動的全美機場網絡延誤模型。由于模型的系統參量設置中采用了事前標定方法,其功能主要局限于延誤傳播效應分析,而無法應用于面向戰術的實時延誤預測。為此,王春政等結合數據挖掘與復雜系統建模方法,構建基于Agent的機場網絡延誤預測模型。與上述Agent架構不同的是,該模型中的關鍵參數通過數據挖掘方法獲得,并詳盡考慮了天氣、航空公司等主要延誤因素。
總結上述延誤預測工具、方法特點如表2所示。在構建過程中,以機場容量為代表的關鍵參量設置是各種模型所需考慮的關鍵問題。在預戰術/戰術流量管理階段,更具時效性的參數是保證模型預測性能的關鍵。但在現有研究中,僅部分模型簡單考慮了氣象條件等環境變量。具體而言,機場容量僅就目視與儀表氣象條件做出區分。同樣為儀表氣象條件下的機場容量,在實際運行中的不同天氣特征下仍然存在較大差異,因此在容量參量標定時仍存進一步細化的空間。此外,基于航空器性能的過程時間設置方法雖然能夠在一定程度上確保飛行時間精度,但由此帶來的巨大計算時間消耗顯然不適用于戰術流量管理階段的及時性需求。另外,基于排隊過程的方法難以區分各航空器性能造成的差異。雖然部分方法探索了計劃時間中的緩沖量級,能夠將各航班視為差異化對象,但此方法顯然缺乏天氣等動態因素的考慮。因此,除建模方法外,有必要探索參數設置對模型預測性能的影響,從而進一步提升在戰術階段預測的準確性。另外,AIRTOP、SIMMOD、TAAM等工具亦常用于空中交通流量管理中,與上述模型不同,這些工具中考慮了更細致的網絡構建與航空器性能,其功能主要側重于容量評估以及考查由新技術引發系統性能改變。因此,當納入個體交互作用,面向空中交通網絡進行延誤預測時,長達數小時或數天的執行時間使得輸出結果在戰術層面的空中交通流量管理中缺乏時效性。

表2 基于運籌學方法的延誤預測方法總結
除上述方法外,近年來以傳播模型為代表的復雜網絡理論被逐漸用于空中交通延誤相關研究中。2016年,Baspinar等基于傳染病模型建立了機場延誤傳播模型和航班延誤傳播模型,分別用于計算機場之間和航班之間的延誤感染率和恢復率。雖然模型能夠在一定程度上探索延誤傳播規律,但單純的傳染率參數,難以定量、直觀分析航班受傳播的延誤影響后的延誤程度。武喜萍等結合負荷容量級聯失效模型和傳染病模型建立了空中交通延誤傳播模型,并通過北京首都機場、廣州白云機場以及深圳寶安機場驗證了模型的有效性。張兆寧等從網絡層面出發,面向大面積航班延誤問題,利用傳染病模型建立了航班延誤傳播模型,通過2018年冬春航季發生的大面積延誤的實例驗證表明,模型能夠預測大面積航班延誤的發生。
目前空中交通延誤研究多采用機器學習、概率模型、建模與仿真以及排隊理論方法。經典機器學習、深度學習和概率模型方法能夠有效涵蓋氣象狀況、航空公司特性、流量變化趨勢等復雜特性,在計算時間和精度方面展現了一定的優勢。但深度學習等算法的黑箱屬性,使得預測效果缺乏可解釋性,應用于高風險決策的空中交通系統中時存在挑戰。此外,其高度基于歷史數據的固有特征,使得無法探索運行環境發生重大變化時的影響。雖然航班延誤演化雖然具有一定的隨機特征,但在服務能力等基本參數確定的情況下,具有高度可確定性,這也是應用建模與仿真以及排列理論廣泛探索空中交通延誤的關鍵前提。但目前基于建模與仿真以及排隊理論航班延誤研究難以直接精細化考慮氣象條件等環境因素影響。雖然建模仿真在實際應用能夠涵蓋系統的交互特征,但在時變環境下,難以發揮有效性能。此外,高度抽象的微觀建模方法,造成長達數小時的計算時間消耗,難以滿足戰術級空中交通流量管理實時性需求。而實際戰術流量管理階段,考慮實際運行環境,精準把控透明化的航班延誤信息是管理者做出智慧決策的關鍵。
本文針對空中交通延誤預測方法論中的上述問題和近年來的研究趨勢,面向高精度、實時性以及可解釋性等應用需求的研究目標,對空中交通延誤預測的未來研究及發展方向做出如下展望。
(1) 基于網絡的中觀建模。復雜系統在缺乏中央控制的組件情況下,依靠簡單的操作規則產生復雜的集體行為、精細的信息處理及自適應過程,并由此產生系統的涌現效應。空中交通網絡系統屬于典型復雜網絡系統。空管部門、航空公司、機場等異構實體的交互產生了復雜動力學現象。全網絡觀的建模思想是保證實體交互作用得以充分實現,延誤預測輸出有效的關鍵環節。在全網運行條件下,尤其以中美為代表的大型航空網絡,基于航跡等層面的微觀建模造成的運行時間消耗難以滿足戰術管理需求。而基于宏觀的預測難以適應精細化管理的需求。因此,有必要根據實際需求,權衡模型復雜度與結果有效性,探索中度抽象層級的中觀建模在空中交通延誤預測中的應用。
(2) 可解釋性機器學習的應用。針對空中交通延誤眾多誘發因素,機器學習算法能夠綜合融合氣象條件、航空公司策略、流量變化趨勢等變量,使研究者將主要工作部署在模型參數的調節方面,簡化了建模復雜度,并驗證展現了高精度、高速度等優越性能。但在基于歷史數據的航班延誤預測算法中,深度學習等部分算法缺乏有效解釋性,限制了其在空中交通系統中的應用。因此,有必要深入研究以樹模型為代表的可解釋性機器學習模型在空中交通延誤中的研究,增強算法在面向動態環境變化,信息缺乏條件下的預測能力,從而為基于延誤的運行決策提供可靠的信息支撐,實現人機交互的和諧運行場景。
(3) 機器學習與運籌學方法的結合。空中交通系統的復雜性產生了非線性動力學特征。在缺乏有效解析模型的參與下,建模仿真方法為探索系統性航班延誤提供了適用性手段。有效的參數輸入是利用仿真、排隊理論等運籌學方法,復現空中交通動力學的關鍵。但空中交通運行除受內部運行因素影響外,還受外部氣象條件制約。天氣的變動性特征,使得機場容量等空中交通系統關鍵參量具有時變特性,且受外部擾動的量級差異呈現出跨度廣泛的分布特征。這種參數時變特性增加了運籌學方法精確預測實時環境下的航班延誤的挑戰性。與直接利用機器學習算法航班預測延誤不同,數據挖掘與中觀仿真建模相融合,利用機器學習中的算法優勢對系統參量進行估計,為運籌學方法提供有效的參數輸入,不僅可增加使用單一機器學習方法的可解釋性,而且對揭示空中交通延誤內在機理,感知動態運行環境變化,推演復雜條件下延誤演化規律具有重要意義。
本文在對空中交通延誤預測類型分類的基礎上,總結了基于歷史數據的方法、運籌學方法以及傳染病模型為代表的復雜網絡理論在空中交通延誤預測領域的研究成果,詳解介紹了代表性算法的實現過程,分析了各種算法的實現效果及特點。總體而言,空中交通的復雜性仍使延誤預測問題保持開放性。為此,本文總結了研究趨勢,并提出了未來空中交通延誤預測的發展方向。