999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹的航空器離港滑出時間預測方法和模型

2021-07-07 10:29:30唐小衛林有超任思豫
關鍵詞:特征模型

陳 禎 唐小衛* 林有超 任思豫

(南京航空航天大學民航學院1) 南京 211106) (中航空管系統裝備有限公司2) 上海 200241)

0 引 言

當前我國大型繁忙機場采用的協同決策(collaborative decision making,CDM)系統通過集成空管、航空公司、機場三個獨立的子系統搭建出一個信息交互、數據共享的航空運輸一體化平臺,實踐表明:CDM系統在減少航班總體延誤、擴大機場容量等方面起到了積極作用.對于每一個離港航班,目前CDM系統是用每個航班在跑道上的計算起飛時刻減去平均滑行時間得到其在機位上的推出時刻,但航班離港滑行的過程具有較大的不確定性,僅憑經驗預測滑行時間的傳統管理模式已不能滿足CDM系統的要求.因此,研究影響離港滑行時間的關鍵因素并設計合適的算法來提高離港滑行時間預測的準確性對優化離場順序、提高CDM機制下起飛時刻的執行率具有重要意義[1].

國內外對航空器離港滑行時間預測的研究主要涵蓋特征選取和模型方法兩個方面.在特征選取方面,Kistler等[2-3]考慮了滑行距離、進離港交通量、跑滑結構等影響滑行時間的因素,一定程度上豐富了特征變量集;Jordan等[4]進一步引入航空公司、滑行方向等虛擬變量并構建交互特征,有效提升了模型的預測精度;Ravizza等[5-6]利用歐洲機場滑行道的專有特點構建滑行轉彎角度與距離特征,在歐洲機場的樣本集上取得了良好的預測結果;馮霞等[7]將滑出時間預測分為兩個階段,先利用已知特征預測滑出期間使用同跑道起降的航班數量,再將其作為輸入變量構建滑行時間預測模型,發現該方法的預測效果優于直接預測;劉繼新等[8]對航空器滑出時間的影響因素進行分析,驗證了場面流量的影響最為顯著.在模型方法方面,Balakrishna等[9]在隨機動態規劃的概率框架中采用強化學習的方法進行滑行時間預測;Zhang等[10]建立計量經濟學回歸模型預測無阻滑行時間,在計算排隊長度時考慮了飛機超越等因素,同時將跑道構型、地面延誤程序和天氣作為解釋變量,使得模型可以廣泛應用于歐美機場滑行延誤對比;Herrema等[11]研究了機器學習在滑行時間預測上的運用,將神經網絡、回歸樹分析、強化學習和多層感知方法四種機器學習方法運用于戴高樂機場實際運行數據,得出回歸樹模型預測效果最好.

以上研究主要聚焦于每個特征單獨對滑行時間的影響以及特征構建后的模型選擇,少有研究考慮特征間相互作用會對滑行時間預測產生的效果.因此,文中基于滑出時間的影響因素構建一次特征變量,運用特征工程構建交互特征,與一次特征共同構成初始變量集.考慮到初始變量集可能存在冗余特征對預測產生一定的影響,因此基于決策樹算法從所構建的大量特征中篩選出一部分最重要的特征作為最優特征變量集構建離港滑行時間模型,并將該模型與僅使用一次特征構建的模型對比驗證.

1 滑出模型的特征構建

數據來源于首都機場2019年10月—2020年1月的航班運行數據,考慮到36R跑道為首都機場主離港跑道,因此選取36R跑道的航班運行數據進行研究分析.

1.1 一次特征構建

1) 滑行距離 一般而言離港滑行時間隨著滑行距離的增加而增加,因此首先考慮建立離港滑行時間和滑行距離的一元線性回歸模型.現有數據無法獲得每個航班的具體離港滑行路徑,通過機場地面管制部門提供的場面運行規則,依據機場CAD底圖量取各機位至跑道口的滑行距離,將數據進行歸一化處理后得到

Tout=0.081D+0.184

(1)

式中:Tout為離港滑行時間,min;D為離港滑行距離,km;表1中的各項評價指標分別為該預測模型的±3 min準確度、±5 min準確度、擬合優度和相關系數,可見滑行距離與離港滑行時間的相關性很低,滑行時間不會受到滑行距離的顯著影響.

表1 評價指標

2) 擁堵變量 航空器的離港滑行會占用跑道、滑行道等場面資源,航空器間由于資源占用而發生沖突,當沖突發生時航空器需在原地等待直至沖突解除.場面擁堵加劇導致沖突發生的頻率變高、解除沖突的時間變長,進而滑行時間增加.因此構建了兩個擁堵變量,即某個航班滑出期間內使用同跑道離港的航班數量(Ntxot)和進離港瞬時流量(Nins).Ntxot指在航班撤輪擋推出時刻至計算起飛時刻的這段時間內使用同跑道離港的航班數量;Nins指在航班撤輪擋推出時刻的場面進離港瞬時流量.

圖1分別給出了Ntxot,Nins與Tout的相關性分析,相關系數分別為0.88和0.47,可見Ntxot,Nins與Tout具有較強的相關性,但在流量相同的情況下,出港滑行時間相差可達30~40 min,說明除了上述2個擁堵變量,還存在其他影響離港滑行時間的因素.

圖1 Ntxot,Nins與Tout的相關性分析

3) 推出前15 min離港航班平均滑行時間tdep通過挖掘相鄰時間段內使用同跑道離港的航空器的滑行時間之間的關系,以15 min為一個單位將滑行時間離散化處理,發現推出前15 min使用同跑道起飛的其他航班的平均滑行時間tdep與該航班的滑行時間具有一定的相關性.圖2為tdep與Tout的相關性分析,結果顯示相關系數為0.47.

圖2 tdep與Tout的相關性分析

4) 機型類別 不同機型的操縱性能不同,其本身滑行時的速度也有差異.航班樣本涉及C、D、E、F四種機型,在相同范圍的滑行距離下,各類機型的樣本數量、平均滑行時間、標準差見表2.

表2 各類機型樣本數量、滑行時間均值及標準差

由表2可知,C類和E類機型為樣本占比最大的兩種機型,E類機型的平均滑行時間比C類機型長約1 min,且標準差相差很小,說明數據的離散程度相似.總體而言大機型的滑行時間普遍高于小機型,可見機型對滑行時間具有一定的影響.

為了讓訓練集涵蓋更多的數據特征,使用one-hot編碼將非數值型數據轉化為數值型數據,機型變量就可以編碼為一個長度為4的特征向量.每個航班有且僅有一種機型執飛,因此機型變量的約束條件為:

(2)

式中:FtypeC、FtypeD、FtypeE、FtypeF分別對應C、D、E、F四種機型;i為執飛的航班號.

5) 航空公司類別 一般而言,基地航司比非基地航司更熟悉場面環境,滑行速度相對更快;國內飛行員與管制對話時沒有語言障礙,可以比外籍飛行員更快地執行指令,因此可以認為航空公司類型與滑出時間有一定的聯系.從樣本數、平均滑行時間和滑行時間標準差三個角度對國內航司、國外航司分別進行統計,結果見表3.可以看出國外航司執飛的航班占比近11%,在相同范圍的滑行距離內,國外航司平均滑行時間比國內航司高出近2 min,可見航空公司類別不同對離港滑行時間具有一定影響,因此可將航空公司類別A分為國內和國外兩種類型并設置為二值型變量,即當A=1時表示航班由國內航司執飛,A=0時表示航班由國外航司執飛.

表3 不同類別航空公司樣本數、滑行時間均值及標準差

6) 機位影響指數 航空器的推出和滑行會占用推出引入線、機位資源和滑行道資源,導致周圍其他機位上的航空器運行受限.受機坪構型等因素的影響,不同機位的飛機在推出滑行過程中影響的機位數量不同.受限機位數量越多,表明這個機位受其他機位的影響程度越大,因此對這個機位上航班的滑行時間影響也越大,因此將機位影響指數I也考慮進來.

基于上述分析,初步構建出了10個一次特征作為航空器離港滑行時間預測的初始特征集合,即X={D,Ntxot,Nins,tdep,FtypeC,FtypeD,FtypeE,FtypeF,A,I},其中特征Ntxot,Nins,A,I以及機型變量為本文首次提出.

1.2 二次特征構建

在特征工程中,運用兩個特征的乘積就可以組成一對簡單的交互特征,即二次特征.這種相乘關系可以用邏輯操作符AND來類比,表示由一對條件形成的結果,這種特征常見于決策樹模型和廣義線性模型中.除了采用離港飛機數量、機型等單獨的特征來預測滑行時間,還可以將離港飛機數量和機型相乘,即根據某種機型的離港飛機數量來進行預測,通過構建此類二次變量捕獲特征之間的交互作用.與僅使用單一特征相比,引入交互特征在一定程度上可能會為模型準確率的提升帶來顯著效果.

基于3.1的10個一次特征,可將它們分別兩兩相乘構建出一組二次特征.需要注意的是,在一次特征中機型類別為正交型特征,意味著它們之間兩兩相乘為0,因此需將這部分二次特征從候選集中剔除.此外,FtypeC,FtypeD,FtypeE,FtypeF,A這五個特征為二值變量,它的平方等于自身,因此也需將其從候選集中刪除,所以一共可構建出44個二次特征.

本文構建二次特征基于以下兩點原因:①在上述構建的10個一次特征中FtypeC,FtypeD,FtypeE,FtypeF,A分別為表征機型和航空公司類型的二值變量,這些二值特征和其他特征之間構成的交互特征可能會對模型產生重要的影響.②構建三次或更高次的特征會增加模型復雜度,容易導致模型過擬合,因此我們僅考慮構建二次特征.綜上,候選特征集由一次特征、二次特征共同組成,共包含54個候選特征.

2 滑出模型設計

2.1 模型選擇

為了選出合適的預測模型,使用K-最近鄰(k-nearest neighbor,KNN)、支持向量回歸(support vactor regression,SVR,包括Linear SVR、Poly SVR、RBF SVR)、決策樹(decision tree)這幾種常見的回歸算法對54個候選特征進行初步試驗,選取±3 min準確度、±5 min準確度、可決系數(R2)、均方誤差(mean square error,MSE)、平均絕對誤差(mean absolute error,MAE)、算法運行時間這6個指標對模型進行評估,結果見表4,決策樹模型的預測效果在各項指標上的表現都更佳,此外決策樹模型具備特征選擇的功能可以去除冗余優化模型,因此選擇決策樹模型作為航空器離港滑行時間的預測模型.

表4 模型預測結果對比

2.2 決策樹模型構建

CART樹是決策樹算法中用于解決回歸問題的常見算法,CART樹的生成是遞歸構建二叉決策樹的過程,即每次劃分都把當前樣本集劃分為兩個子集,用誤差平方和最小化準則進行特征選擇.CART樹回歸算法具體如下:

假設X與Y分別為輸入與輸出變量,給定訓練數據集

D={(x1,y1),(x1,y1),…,(xn,yn)}

(3)

選擇第j個特征xj及其取值s作為切分變量和切分點,并定義兩個區域R1和R2

(4)

步驟1遍歷每一個特征及其每個取值,計算每個特征和切分點的損失函數,選擇最小損失函數所對應的最優切分變量xj與切分點s,損失函數為

(5)

式中:cm為區間Rm上的輸出平均值.

(6)

步驟2使用上步得到的切分點將當前的輸入空間劃分為R1和R2兩個部分.

步驟3分別對兩個子區域R1和R2遞歸調用步驟1~2,直到不能繼續劃分.

步驟4最終將輸入空間劃分為k個部分R1,R2,…,Rk,并且在每個部分Rk上有一個固定的輸出值ck,那么回歸樹模型為

(7)

式中:I(x∈RK)為指示函數.

3 基于決策樹的特征篩選

在機器學習的實際應用中,特征數量多、維度高容易引發“維度災難”.本文構建的候選特征變量集中含有大量二維交互特征,增加了模型的訓練時間和計算成本,因此特征選擇具有十分重要的意義.具體而言,特征選擇的目的是在不降低預測準確性或者在對預測準確性影響很小的情況下,從候選特征集中去除冗余和不相關特征,選擇出能夠構建一個簡約模型的關鍵特征子集.通過精簡無用的特征,可以降低模型的復雜程度、增強模型的泛化能力、提高計算效率.本文采用的決策樹算法能夠將特征選擇作為模型訓練的一部分,即在模型訓練的同時自動進行特征選擇.

3.1 最優特征集構建

以首都國際機場2019年10月10日—2020年1月2日36R跑道離港航班的實際運行數據作為樣本數據集,采取隨機抽樣法進行劃分,其中70%的數據作為訓練集,其余30%作為測試集,訓練集樣本數為28 896,測試集樣本數為12 384.

決策樹的構建會針對每個特征計算出一個劃分標準值,特征重要度為劃分標準減少量的歸一化值.CART回歸樹的特征重要度是誤差平方和減少量的歸一化值,公式為

(8)

式中:N為樣本的總數;Nt為當前節點的樣本數目;NtL為結點左子樹的樣本數目;NtR為結點右子樹的樣本數目;impurity為不純度,這里指的是誤差平方和;right_impurity為結點右子樹的不純度;left_impurity為結點左子樹的不純度.特征越重要,不純度就越??;不純度減小得越多,意味著該結點分裂的收益越大,該節點對應特征的重要度越高.

特征重要度反映了各個特征在模型構建中對目標變量預測的貢獻能力,特征重要度越大說明對目標變量預測的貢獻能力越強.將重要度由大到小排序,表5為重要度排名前10位的特征,采用序列前向選擇算法進行特征篩選,即從空集開始依據重要度排名由高到低依次將特征加入特征子集,接著重新訓練模型,然后依據預測準確率最高的原則選擇最優的特征子集.圖3為不同特征子集訓練出的模型所對應的平均絕對誤差(mean absolute error,MAE),橫軸為每次用于模型訓練的特征個數.

表5 特征重要度(前10位)

圖3 特征篩選迭代過程

由圖3迭代的結果可以看出,當添加5個特征變量時,平均絕對誤差最小,當繼續添加特征變量時,預測誤差在不斷變大.由此可以認為這5個特征變量構成的特征子集是決策樹模型的關鍵特征子集,不僅可以提升模型的準確度,同時大大降低了模型的復雜程度,提高了計算效率.因此,本文構建的最優特征變量集為

最優特征變量集由4個二次特征和1個一次特征組成,可以看出通過決策樹算法對特征變量進行篩選后,從10個候選一次特征中選出了4個一次特征,即Ntxot、Nins、A和FtypeC,這4個二次特征均與Ntxot有關,說明擁堵變量對滑行時間特征選擇具有十分重要的影響.

圖4 最優二次特征和滑出時間的相關性分析

3.2 結果分析

對篩選出的五個交互特征的各項指標進行交叉驗證,對比使用篩選出的五個交互特征構建的模型和單獨使用一次特征構建的模型的性能指標見表6,與單獨采用一次特征相比,引入交互特征預測離港滑行時間可使準確率有較大的提升.圖5為滑行時間預測值與實際值的對比圖,橫軸為測試集樣本,縱軸為離港滑行時間的預測值和真實值,可見預測值能較好得擬合真實值的變化情況,再次驗證本文采用的方法具有較好的預測效果.

表6 預測結果對比

圖5 預測結果對比圖

4 結 論

1) 提出進離港瞬時流量、機型、航空公司等因素對離港滑行時間的影響,并將這些影響因素構建成一次特征作為預測模型的輸入,取得了良好的效果.

2) 運用特征工程構建交互特征,驗證了二值特征和其他特征之間的交互作用對預測模型產生的重要影響.

3) 采用決策樹模型進行特征篩選構建最優特征子集,在降低模型復雜度的同時提升了預測的準確度.

4) 與直接采用單獨的一次特征構建預測模型的傳統做法相比,本文引入交互特征的方法使模型具有更好的預測準確率、R2和MAE.

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 中国一级特黄大片在线观看| 国产激情无码一区二区免费| 日韩成人在线视频| 国产门事件在线| 国产一线在线| 中国国产一级毛片| 国产在线一区二区视频| 国产女人喷水视频| www亚洲天堂| 免费国产不卡午夜福在线观看| 亚洲第一综合天堂另类专| 成人综合在线观看| 黄色网址免费在线| 88av在线| 亚洲制服丝袜第一页| 久久精品丝袜高跟鞋| 999精品免费视频| 黄色网页在线播放| 亚洲第一极品精品无码| 人妻21p大胆| 91丨九色丨首页在线播放| 亚洲中文字幕无码爆乳| 一级成人a毛片免费播放| 91精品小视频| 这里只有精品免费视频| 久久久久人妻一区精品| 香蕉在线视频网站| 高潮爽到爆的喷水女主播视频 | 天天色天天综合| 尤物亚洲最大AV无码网站| 蜜桃视频一区二区三区| 国产精品一老牛影视频| 思思热在线视频精品| 国产一区二区网站| 亚洲国产成人久久精品软件| 九九热视频精品在线| swag国产精品| 日本午夜精品一本在线观看 | 午夜国产精品视频| 国产美女视频黄a视频全免费网站| 免费又爽又刺激高潮网址| 亚洲日本中文综合在线| 亚洲欧美人成人让影院| 精品国产亚洲人成在线| 亚洲人成网18禁| 91蜜芽尤物福利在线观看| 亚洲日韩AV无码精品| 亚洲日韩AV无码一区二区三区人| 91激情视频| 国产精品私拍99pans大尺度| 国产激情第一页| 国产精品粉嫩| www欧美在线观看| 精品久久国产综合精麻豆| 四虎亚洲精品| 免费无码AV片在线观看中文| 在线五月婷婷| 日韩福利视频导航| 特级精品毛片免费观看| 69av在线| 美女被躁出白浆视频播放| 久综合日韩| 国产综合欧美| 大乳丰满人妻中文字幕日本| 免费全部高H视频无码无遮掩| 99久久人妻精品免费二区| 片在线无码观看| 国产原创第一页在线观看| 欧美一道本| 又爽又大又光又色的午夜视频| 欧美激情视频一区二区三区免费| 国产欧美专区在线观看| 91po国产在线精品免费观看| 国产成人狂喷潮在线观看2345| 波多野结衣亚洲一区| 国产欧美日韩va另类在线播放| 婷婷成人综合| 国产白浆一区二区三区视频在线| 日韩人妻精品一区| 日韩国产亚洲一区二区在线观看 | 久久久精品无码一区二区三区| 国产精品无码一二三视频|