999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于貝葉斯網(wǎng)絡(luò)的航班離港延誤預(yù)警分析

2008-12-31 00:00:00曹衛(wèi)東丁建立劉玉潔
計算機應(yīng)用研究 2008年11期

(1.天津大學(xué) 系統(tǒng)工程研究所, 天津 300072;2.中國民航大學(xué) 計算機學(xué)院, 天津 300300)

摘要:貝葉斯網(wǎng)絡(luò)是一種有效的概率預(yù)測方法,嘗試將其應(yīng)用于航班數(shù)據(jù)分析預(yù)警,應(yīng)用Netica 軟件工具構(gòu)建實際航班及其關(guān)聯(lián)的貝葉斯網(wǎng)絡(luò),特別是針對航班延誤的最主要環(huán)節(jié)——離港延誤,分時間段對國內(nèi)某航空公司在某機場的離港數(shù)據(jù)進行了延誤原因分析和延誤預(yù)警分析。

關(guān)鍵詞:貝葉斯網(wǎng)絡(luò);航班離港延誤;延誤原因;延誤預(yù)警

中圖分類號:TP274; TP391文獻標志碼:A

文章編號:1001-3695(2008)11-3388-03

Analysis of flight departure delay and warning based on Bayesian networks

CAO Wei-dong1,2,DING Jian-li2,LIU Yu-jie2

(1.Institute of Systems Engineering, Tianjin University, Tianjin 300072, China;2. College of Computer Science, Civil Aviation University of China, Tianjin 300300,China)

Abstract:Bayesian networks is a valid probability forecast method, it is tried to use in flight data analysis and warning. Netica software packages were used in constructing Bayesian networks of actual flight data and their relationships. Especially aimed at flight departure delay. It analyzed delay reasons and delay warning by using partition time data of an airline company departure from an airfield in China. 

Key words:Bayesian networks; flight departure delay; delay reasons; delay warning

中國民用航空系統(tǒng)是一個龐大的隨機系統(tǒng),包括錯綜復(fù)雜的互相關(guān)聯(lián)成分:行政管理部門、控制中心、機場、航空公司、飛行器、乘客等。這種復(fù)雜性必然導(dǎo)致了管理和控制上的大量困難。其中最難處理的問題之一就是飛機延誤,它給航空公司造成了巨大損失。隨著中國民航事業(yè)的不斷發(fā)展,系統(tǒng)需求與日俱增,航班延誤問題愈顯突出。導(dǎo)致延誤的影響因素較多,雖然有研究致力于分析引起航班延誤的原因,但重點多在于定性分析,對造成航班延誤的因素只當(dāng)做一個既定的概念來用,并沒有對這些因素進行界定,因而使航班延誤的結(jié)果存在一個模糊的范圍。同時,缺乏一個統(tǒng)一的指標體系來表示航班延誤整體的狀態(tài)[1],所以很難進行延誤預(yù)警。貝葉斯方法是概率統(tǒng)計學(xué)中的一種重要方法,用來研究復(fù)雜隨機系統(tǒng)中多因素間的相互依賴關(guān)系。貝葉斯網(wǎng)絡(luò)具有在推論和可視化兩方面獨一無二的強壯性,它根據(jù)各個變量之間概率關(guān)系用圖論方法建立模型, 可以解決專家系統(tǒng)中的不確定知識。 一方面,將人類所擁有的因果知識直接用有向圖自然直觀地表示出來;另一方面,將統(tǒng)計數(shù)據(jù)以條件概率的形式融入模型。這樣,貝葉斯網(wǎng)絡(luò)將人類的先驗知識和后驗數(shù)據(jù)進行了有機的結(jié)合。

民航系統(tǒng)正是一個復(fù)雜的隨機控制系統(tǒng),必須用概率函數(shù)來描述,應(yīng)用統(tǒng)計分析的方法。本文將概率統(tǒng)計的貝葉斯規(guī)則用于分析民航航班數(shù)據(jù),應(yīng)用Netica 軟件包建模實際航班數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)。考慮對離港延誤和到達延誤這兩個主要延誤問題來說,由于到達延誤很大程度上也是由起飛機場的離港延誤而產(chǎn)生。本文重點研究離港延誤問題, 針對給定時間段內(nèi)國內(nèi)某航空公司在某機場的離港數(shù)據(jù)及延誤原因進行分析,其目的在于對未來的延誤進行預(yù)測。在此基礎(chǔ)上嘗試探討離港延誤預(yù)警。

1貝葉斯網(wǎng)絡(luò)

11基本概念

貝葉斯網(wǎng)絡(luò)亦稱信念網(wǎng)絡(luò)(belief network),是一種模擬人類推過程中因果關(guān)系的不確定性處理模型,網(wǎng)絡(luò)拓撲結(jié)構(gòu)是一個有向無環(huán)圖(DAG)[2]。它的節(jié)點用隨機變量或命題來標志,認為有直接關(guān)系的命題或變量則用弧來連接。假設(shè)節(jié)點E直接影響到節(jié)點H,則建立節(jié)點E到節(jié)點H的有向弧(E,H),權(quán)值(即連接強度)用條件概率p(H/E)來表示,即Ep(H/E)H。圖1為5個節(jié)點的貝葉斯網(wǎng)絡(luò)。 

條件概率表示為p(xi/pai),其中pai是隨機變量xi的父節(jié)點。一旦命題之間的相關(guān)性由有向弧表示,條件概率由弧的權(quán)值來表示,則命題之間靜態(tài)結(jié)構(gòu)關(guān)系的有關(guān)知識就表示出來了。貝葉斯網(wǎng)絡(luò)推理需要給出許多先驗概率,它們是根節(jié)點的概率值和所有子節(jié)點在其父節(jié)點給定下的條件概率值。這些先驗概率可以由大量歷史的樣本數(shù)據(jù)統(tǒng)計分析得到,也可由領(lǐng)域?qū)<议L期的知識或經(jīng)驗總結(jié)主觀給出,或者根據(jù)具體情況事先假設(shè)給定。

12貝葉斯網(wǎng)絡(luò)的特點

貝葉斯網(wǎng)絡(luò)可以處理不完整的和帶有噪聲的數(shù)據(jù)集,它用概率測度的權(quán)重來描述數(shù)據(jù)間的相關(guān)性。用圖形的方法描述數(shù)據(jù)間的相互關(guān)系,語義清晰,可理解性強,有助于利用數(shù)據(jù)間的因果關(guān)系進行預(yù)測分析。獨特的不確定性知識表達形式、豐富的概率表達能力、綜合先驗知識的增量學(xué)習(xí)特性使貝葉斯方法成為當(dāng)前數(shù)據(jù)挖掘中最為引人注目的焦點之一。

根據(jù)其基本原理,貝葉斯網(wǎng)絡(luò)具有如下特點:

a)貝葉斯網(wǎng)絡(luò)具有了堅實的概率理論基礎(chǔ),同時具有直觀的知識表示形式。

b)貝葉斯網(wǎng)絡(luò)與一般知識表示方法不同的是:它是對于問題域的建模。因此當(dāng)條件或行為等發(fā)生變化時,不用對模型進行修正。

c)貝葉斯網(wǎng)絡(luò)能夠處理不完備數(shù)據(jù)集。貝葉斯網(wǎng)絡(luò)反映的是整個數(shù)據(jù)域中數(shù)據(jù)間的概率關(guān)系, 即使缺少某一數(shù)據(jù)變量仍然可以建立精確的模型。

d)貝葉斯網(wǎng)絡(luò)是根據(jù)因果關(guān)系進行學(xué)習(xí)的。 在數(shù)據(jù)分析處理中獲得變量域的理解,便于處理各種不確定性信息。

e)貝葉斯網(wǎng)絡(luò)與貝葉斯統(tǒng)計相結(jié)合能夠充分利用領(lǐng)域知識和樣本數(shù)據(jù)的信息。

綜上所述,應(yīng)用貝葉斯網(wǎng)絡(luò)建模進行數(shù)據(jù)分析,能夠很好地解決民航數(shù)據(jù)普遍存在的信息量大、有缺失、直觀因果關(guān)系不明確、知識隱藏等問題。

2模型的構(gòu)建

21數(shù)據(jù)定義

研究所用歷史數(shù)據(jù)來源于國內(nèi)某大型航空公司的實際航班數(shù)據(jù),分析重點在于此航空公司航班離港某大型樞紐機場的情況。

為了有針對性地進行問題分析,首先在SQL Server 2000環(huán)境中對數(shù)據(jù)庫的數(shù)據(jù)進行了必要的預(yù)處理。提取源數(shù)據(jù)庫中出發(fā)機場為已知機場的數(shù)據(jù);增加離港延誤時間屬性,即

出發(fā)機場= 已知機場

離港延誤時間=實際起飛時間-計劃起飛時間

另外,在數(shù)據(jù)庫中存儲用來表示航班延誤原因的延誤代碼,其具體含義如表1所示。

表1航班延誤原因與延誤代碼對照表

延誤原因代碼延誤原因代碼延誤原因代碼

天氣原因TQ流量控制 LL 工程機務(wù)JW

運輸服務(wù)YS機場設(shè)計 JC 空勤人員KQ

公司計劃JH場區(qū)秩序 CQ 食品供應(yīng)SP

安檢AJ聯(lián)檢 LJ 旅客LK

禁飛JF需說明的原因SM

22航班數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)建模

本文中貝葉斯網(wǎng)絡(luò)用Netica軟件包[3]建立。模型創(chuàng)建步驟如下:

a)建立航班離港信息視圖。

b)根據(jù)離港信息視圖建立模型相關(guān)的變量。

c)建立一個離港數(shù)據(jù)的有向無環(huán)圖(DAG),即在Netica軟件包中初建立貝葉斯網(wǎng)絡(luò).neta,它的節(jié)點xi用與離港數(shù)據(jù)相關(guān)的隨機變量來標志,有直接關(guān)系的變量則用弧來連接。

d)通過初始數(shù)據(jù),指派局部概率分布p(xi/pai)。其中pai是隨機變量xi的父節(jié)點。

e)根據(jù)視圖數(shù)據(jù)生成Netica的.cas文件,并進行必要的數(shù)據(jù)處理,缺失數(shù)據(jù)以*表示。

f)進一步向.neta加入.cas文件,并進行編譯。

圖2是用Netica生成的離港延誤的貝葉斯網(wǎng)絡(luò)模型,其中用到的是3月27日~4月7日的航班數(shù)據(jù)。圖中節(jié)點cur_date、time、delay、code分別表示當(dāng)前日期、一天中的時間段、離港延誤時間、延誤代碼。其中時間分為一天中的多個時間段,分別為早8:00以前(less8),8:00~10:00(t8 to 10)……依此類推,最后時間段為20:00以后(more20)。延誤時間分為:小于20 min(less20)的延誤——按照目前中國民航大型樞紐機場執(zhí)行的標準,延誤時間在20 min之內(nèi)為正常航班,不作延誤處理[4]; 20~40 min的延誤(d20 to 40),1~2 h延誤(d1 to 2)……直到超過4 h的延誤(more4)。延誤代碼對應(yīng)的延誤原因見表1。

3數(shù)據(jù)分析

通過構(gòu)造貝葉斯網(wǎng)絡(luò),一方面反映航空公司的航班關(guān)于機場已知時間段的離港延誤情況,通過對已發(fā)生的航班數(shù)據(jù)的反復(fù)學(xué)習(xí),可以產(chǎn)生典型時間段離港延誤相對穩(wěn)定的概率分布;另一方面可以預(yù)測相應(yīng)環(huán)境參數(shù)下的航班延誤情況。由于數(shù)據(jù)的局限性,本文重點對前者進行分析,并嘗試進行延誤預(yù)警。

圖2中每個節(jié)點變量與一系列局部概率分布(參數(shù)在條件概率表(CPT)中)相關(guān)。貝葉斯網(wǎng)中的概率信息是通過這些局部概率分布確定的[5]。在模型中根節(jié)點cur_date代表日期變量和與之相關(guān)的概率分布,在一般情況下,由于該航空公司每日進出機場的航班數(shù)近似,日期變量概率分布均勻;一個非根節(jié)點有一個相關(guān)的隨機變量和一個由父節(jié)點隨機變量決定的條件分布值。以圖2離港延誤模型中的delay為例,其條件概率表(CPT)的部分內(nèi)容如表2所示。

31離港延誤分析

圖2顯示離港延誤在已知時間段內(nèi)的整體狀況,描述了貝葉斯網(wǎng)絡(luò)模型中的4個節(jié)點隨機變量cur_date、time、code、delay。其中有直接關(guān)系的變量用有向弧來連接。例如,時間對于延誤有直接影響,則建立節(jié)點time到節(jié)點delay的有向弧time→delay,其他類推。

圖中顯示的是對模型學(xué)習(xí)實際航班離港數(shù)據(jù)而產(chǎn)生的貝葉斯后驗概率,從中可以清楚地看到,航空公司從機場出發(fā)的航班中,有相當(dāng)一部分存在20~40 min的延誤,后驗概率437%,40~60 min延誤的后驗概率為23.4%,同時以小概率存在有1~2 h延誤,2~4 h延誤以及超過4 h的延誤。其產(chǎn)生延誤的原因主要是LL——流量控制因素,貝葉斯后驗概率363%,明顯高于其他原因;同時看到,以小概率存在由于其他原因產(chǎn)生的離港延誤,如以12.3%的概率存在場區(qū)秩序(CQ)原因產(chǎn)生延誤,8.05%在于禁飛原因(JF),還有10.7%的計劃原因(JH)。另外值得提到的是以11.5%概率的天氣原因(TQ)導(dǎo)致延誤,說明這段時間有異常天氣狀況出現(xiàn)。

貝葉斯方法給出了一種根據(jù)新的數(shù)據(jù)不斷更新后驗分布的貫序方法,每當(dāng)新的數(shù)據(jù)加入,上次結(jié)果的后驗概率變?yōu)橄闰灨怕剩M一步產(chǎn)生新的后驗分布,大量數(shù)據(jù)加入后,數(shù)據(jù)趨于穩(wěn)定的概率分布。圖2中的當(dāng)前時間變量給出示意,表明隨環(huán)境參數(shù)相似的航班數(shù)據(jù)不斷加入,離港延誤隨一天中時間的變化而變化的情況,當(dāng)概率分布趨于穩(wěn)定時,去除日期變量。圖3給出在8:00~10:00時間段內(nèi)航班離開機場時的延誤情況。依概率分布可以看到,相當(dāng)一部分航班發(fā)生20~40 min的延誤,另外也存在40~60 min時間段的航班延誤,導(dǎo)致延誤發(fā)生的主要原因依次是流量控制(LL)、機場設(shè)計(JC)和場區(qū)秩序(CQ)。進一步分析上午8:00~10:00時間段,產(chǎn)生的20~40 min的航班延誤(圖4)。其中反映的整體延誤原因結(jié)論與圖3一致,主要延誤原因是LL、JC和CQ,細節(jié)上有所不同。圖4表明20~40 min延誤以51.7%的概率由流量控制產(chǎn)生的。

32異常情況分析

從圖2的貝葉斯網(wǎng)絡(luò)模型分析可以得到,這段時間該航空公司從該機場離港,產(chǎn)生延誤的主要原因在于流量控制,同時模型反映出禁飛(JF)和天氣(TQ)也是兩個值得關(guān)注的因素。通過貝葉斯模型跟蹤本時間段單獨日歷天的航班數(shù)據(jù)(圖5)發(fā)現(xiàn),4月5日影響航班離港延誤的主要原因是空中禁飛,其后驗概率33.2%。圖6表明4月6日產(chǎn)生的1~2 h的離港延誤主要是由異常天氣導(dǎo)致的,code中TQ延誤代碼的后驗概率高達41.7%,而實際情況是該機場地區(qū)在此期間出現(xiàn)空氣浮塵,造成大氣透明度不好。貝葉斯網(wǎng)絡(luò)模型數(shù)據(jù)分析的結(jié)果與實際情況吻合。

33離港延誤預(yù)警

通過貝葉斯網(wǎng)絡(luò)建模很好地表示了航班離港延誤的主要變量之間的因果關(guān)系,利用給定樣本數(shù)據(jù)去學(xué)習(xí),清晰地反映出無論是單獨日歷天還是分時間段的航班延誤的概率分布情況。反映歷史情況不是本文研究的意圖所在,數(shù)據(jù)分析的根本目的在于預(yù)測、預(yù)警進而輔助決策。基于貝葉斯的離港延誤模型可以根據(jù)相對早的歷史數(shù)據(jù)作為先驗概率,不斷更新后驗概率,使模型更加準確地刻畫相應(yīng)時間的離港延誤情況。這樣在相似情況發(fā)生之前,準確預(yù)測未來離港延誤情況,根據(jù)模型反映的情況,當(dāng)存在延誤的后驗概率達到一定程度時,可以根據(jù)民航行業(yè)相關(guān)規(guī)定進行延誤預(yù)警。所以,基于模型的數(shù)據(jù)分析的更進一步工作是延誤預(yù)警,給出機場延誤預(yù)警等級,提示航空公司和乘機旅客提前做好相應(yīng)準備。

參照民航上海虹橋機場關(guān)于大面積不正常航班應(yīng)急處置預(yù)案,設(shè)預(yù)警等級從高到低依次分為紅色(red)、橙色(orange)、黃色(yellow)、藍色(blue)。借助機場離港延誤貝葉斯網(wǎng)絡(luò)模型的分析結(jié)果,規(guī)定延誤與預(yù)警等級之間的關(guān)系:當(dāng)delay節(jié)點中超過2 h的航班延誤概率分布大于50%時進行紅色預(yù)警。1~2 h航班延誤概率分布大于50%時進行橙色預(yù)警; 40 min到1 h航班延誤概率分布大于50%時進行黃色預(yù)警;20~40 min的航班延誤概率分布大于50%時進行藍色預(yù)警。在VC++中借助Netica提供的API獲取貝葉斯模型的后驗概率分布,可以很方便地設(shè)計程序,給出預(yù)警等級。例如,當(dāng)圖7的情況發(fā)生時,由VC++程序給出藍色預(yù)警。 

4結(jié)束語

研究表明,基于貝葉斯概率統(tǒng)計的基本理論,借助Netica軟件工具構(gòu)建的航班離港數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)模型,能夠清晰地反映航空公司航班在起飛機場的整體延誤情況,直觀顯示發(fā)生離港延誤的時間段,延誤原因以及延誤時間之間的概率分布情況;為預(yù)測未來相應(yīng)的航班離港延誤提供強有力的依據(jù);模型數(shù)據(jù)分析的結(jié)論,結(jié)合民航行業(yè)要求,能夠方便地給出航班延誤預(yù)警。

參考文獻:

[1]

石麗娜,朱金福.航空公司航班延誤預(yù)警管理理論應(yīng)用分析[J].集團經(jīng)濟研究,2006(26):138-139.

[2]史忠植.知識發(fā)現(xiàn)[M].北京:清華大學(xué)出版社,2002:169-174.

[3]XU Ning,DONOHUE G,LASKEY K B.Estimation of delay propagation in the national aviation system using Bayesian networks[C]//Proc of the 6th USA/Europe Air Traffic Management Research and Development Seminar.2005.

[4]中國民用航空總局民航空發(fā)(2003)96號,民航航班正常統(tǒng)計辦法[S].2003.

[5]XU Ning,LASKEY K B,CHEN Chun-hung,et al.Bayesian network analysis of flight delays[EB/OL].(2007).http://catsr.ite.gmu.edu.pubs/XuTRB2007.pdf.

主站蜘蛛池模板: 97在线碰| 欧美精品v| 亚洲成a人片77777在线播放| 国产成人啪视频一区二区三区 | 亚洲欧美另类久久久精品播放的| 日韩精品无码不卡无码| 91色在线观看| 久久99国产精品成人欧美| 亚洲国产精品日韩专区AV| 91小视频在线| 亚洲国产天堂在线观看| 成人综合网址| 免费国产福利| 日本欧美视频在线观看| 91偷拍一区| 精品天海翼一区二区| 日韩在线成年视频人网站观看| 亚洲色婷婷一区二区| 91视频99| 日本一区高清| 婷婷激情五月网| 国产人在线成免费视频| 亚洲综合久久成人AV| 黄片在线永久| 黄色网在线| 久久天天躁狠狠躁夜夜2020一| 国产在线观看成人91| 久久毛片网| 久久黄色一级视频| 国产美女丝袜高潮| 91欧美亚洲国产五月天| 欧美福利在线| 99热国产这里只有精品9九| 人妻无码中文字幕一区二区三区| 无码AV动漫| 免费看美女自慰的网站| 亚洲美女久久| 国产精品免费电影| 国产精品蜜芽在线观看| 亚洲国产日韩在线成人蜜芽| 亚洲国产成人综合精品2020 | 免费毛片视频| 国产最新无码专区在线| 国内视频精品| 91人妻在线视频| aa级毛片毛片免费观看久| 亚洲三级片在线看| 在线观看亚洲人成网站| 精品亚洲麻豆1区2区3区| 日韩精品亚洲一区中文字幕| 国产无码精品在线| 亚洲成年人片| 成人免费午夜视频| 国产欧美在线观看视频| 在线观看亚洲成人| 欧美在线综合视频| 国产乱码精品一区二区三区中文 | 久久无码av一区二区三区| 亚洲成人精品久久| 久久久久人妻一区精品色奶水| 精品伊人久久久大香线蕉欧美| 五月婷婷综合色| 2020极品精品国产 | 亚洲AV色香蕉一区二区| 亚洲色图欧美激情| 欧美日韩精品在线播放| 国产永久免费视频m3u8| 中文字幕一区二区视频| 伊人久热这里只有精品视频99| 色欲色欲久久综合网| 在线免费观看a视频| 日韩欧美视频第一区在线观看| 国产精品99r8在线观看| 三级视频中文字幕| 国产成人精品日本亚洲| 国产精品jizz在线观看软件| 欧美天天干| 人妻丰满熟妇AV无码区| 1024国产在线| 国产区在线看| 亚洲91精品视频| 亚洲人成网站观看在线观看|