999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機集貝葉斯網的航班延誤分析*

2017-11-02 03:03:29貢英杰劉君強

貢英杰 劉君強 黃 亮

(南京航空航天大學民航學院 南京 210016)

基于隨機集貝葉斯網的航班延誤分析*

貢英杰 劉君強 黃 亮

(南京航空航天大學民航學院 南京 210016)

針對鮮有研究的航空聯盟對航班延誤的影響以及航空聯盟與延誤成因的組合關系,基于貝葉斯網絡原理和隨機集理論,分別在完整樣本和僅有統計信息的情況下對航空公司的航班運行情況進行貝葉斯建模.通過對加入航空聯盟前后的延誤情況進行對比分析、敏感性分析及與其他影響航班延誤的關鍵因素進行組合分析,指出基于隨機集貝葉斯建模的方法能為延誤分析提供支持;加入航空聯盟后,航班延誤的整體情況得到改善;相對其他不可控的影響因素,航空聯盟、航空公司自身因素的組合改善能有效地減少延誤.

航空聯盟;航班延誤;貝葉斯網絡;隨機集理論

0 引 言

航班延誤的客觀原因可以分為航空公司自身原因、空管原因、流量控制、天氣原因等,從近5年的民航統計公報來看,航空公司原因的占比一直處于前三的位置.

許多針對航班延誤的研究是對延誤成因進行分析及預測,并量化考量這些因素對其帶來的影響.徐濤等[1-3]通過貝葉斯方法建立了不同的航班延誤預測與波及的模型,對航班延誤情況進行概率性預測,體現了其有效性;楊秀云等[4]基于動態排隊模型依據航班運行流程對航班延誤進行了仿真,得出各關鍵影響因素對航班延誤影響大小;Rutner等[5]以繁忙機場為研究對象,認為有限的跑道容量是制約航班延誤的主要因素,改良跑道運作策略能增加容量并減少航班延誤;Schaefer等[6]對機場航班延誤波及進行了建模,模擬了天氣原因帶來的影響;Wong等[7]建立了出發和到達延誤模型來研究航班延誤的傳播方式、恢復措施以及個人因素的影響;Malone等[8]通過建立網絡模型對樞紐機場航班延誤的復雜現象進行分解學習,并計算了各個機場帶來的延誤情況;這些研究都關注了航班延誤的影響因素及傳播方式,并對不同延誤因素進行了分析學習.

目前的文獻鮮有航空公司加入航空聯盟后對其航班延誤的影響分析,同時多數研究都在航班延誤的因素相互獨立且不同時發生的基礎上進行[9].這兩方面的主要難點在于航班延誤和航空聯盟之間影響關系不夠清晰,分析兩者之間的相關性以及組合原因的影響所需的實際數據也很難直接獲取.貝葉斯網絡在概率推理上是一種行之有效的方法,而隨機集理論能夠處理一些不確定或者不精確的信息,可以充分利用統計信息,解決缺少樣本數據的問題.將運用貝葉斯網絡方法,并結合隨機集理論,以航班延誤情況為分析點對航空聯盟與航班延誤之間的關系做出分析,并與航班延誤的客觀原因的影響進行組合分析.

1 基礎理論方法

1.1 貝葉斯網絡

貝葉斯網絡的圖形是一個有向無圈圖.圖中一個節點表示一類隨機變量,節點間的關系用有向弧表示,通過各節點之間的條件概率計算,將各個條件概率作為節點之間的強度鏈接關系構建網絡.在d-分隔和條件獨立性假設的前提下,一個變量集U={X1,X2,…,Xn}的概率分布可以表示為

(1)

獲取觀測證據E后,可以根據貝葉斯定理來更新事件的后驗概率,即由下式求得

(2)

貝葉斯網的建立主要為兩個方面的內容,模型結構學習和參數學習.網絡結構可以簡單的以專家經驗進行構建;而參數估計把模型參數θ視作隨機變量,用先驗概率分布來表示關于θ的先驗知識,觀測到完整數據后,再對其后驗概率分布進行計算.

1.2 隨機集方法下的貝葉斯網

隨機集是指取值為集合的隨機元,是概率論中隨機變量(或隨機向量)概念的推廣.設(Ω,F,P)是一個概率空間,F是Ω上的σ代數,P為概率測度,(Θ,βΘ)是一個可測空間,βΘ是Θ上的σ代數,則稱映射X:Ω→2Θ為隨機集,表示為[10]

X={Ai,Mi},?i,1≤i≤2n

(3)

樣本數據較少或缺失時,經典貝葉斯網絡無法直接通過樣本學習獲取網絡參數.這種情況下,EM算法、隨機抽樣算法等都可以進行近似的參數學習,其中EM算法可能陷入局部最優的情況,而隨機抽樣算法在精度方面需要大量的抽樣次數.基于隨機集理論對貝葉斯網的條件概率表進行近似計算,需要明確節點之間的對應關系,以及各個節點的統計參數,而對有標記樣本數量沒有要求.并且在節點不多的情況下,相比其他兩個方法,計算量更小[11].

將航班延誤時間和延誤因素節點之間看作是匯連關系,則延誤因素節點和延誤時間節點之間的關系可以用一個函數ζ=f(ξ),ξ=(ξ1,ξ2,…,ξn)來表示,ξi是第i個因素節點的參數,ξi為隨機變量,則ζ也是隨機變量.則由ζ=f(ξ)的相互關系以及隨機集的單調性原理可以得到隨機集的像,由式(3)的表達方式表示為{Rn,p}.基于隨機集的擴張原理,則可以求得變量的上下概率分布[12],該分布包含了變量的分布函數,則最終需要的條件概率見式(4).

基于隨機集方法的貝葉斯網絡的基本思想在于通過隨機集的方法來獲取網絡參數中的條件概率表,只需要一定的統計樣本參數,而不需要大量的有標記樣本,其建立步驟如下.

步驟1數據預處理,獲取樣本的統計信息,確定貝葉斯網的拓撲結構和節點狀態,根節點先驗概率計算可以直接由統計或者先驗經驗獲得.

步驟4基于區間數學的基本公式,由ζ=f(ξ)計算得到ζ對應An的像的值區間Rn=f(An),以及對應的概率賦值p=∑{Mn|Rn=f(An)}.

步驟5基于步驟3得到的像及其相應概率賦值可以構造隨機變量ζ的數據包絡.則貝葉斯網絡中對應節點的離散區間[a,b)所需的概率可以由式(5)計算.計算得到的概率區間隨著劃分的細化可以越來越精確,當達到所需的精度時,則可以用數值來替代.

步驟6判斷是否獲取了所有需要的條件概率,若沒有則重復步驟2~5,否則就根據貝葉斯公式計算得到完整的條件概率表,即完整的貝葉斯網絡參數.

進行組合分析時,只需要給出相應影響因素的狀態證據,即可由式(2)得到相應的后驗概率進行相應的分析;當組合較少時,也可以直接計算相應條件概率的近似區間進行分析.

2 模型構建

2.1 基于樣本的模型構建

以國內某樞紐機場2011年的航班運行數據作為樣本,選取其中部分國內主要航空公司(東航、南航、國航、海航、廈航、天航、首航、川航、上航、深航、山航)的正班離港航班數據,共計22.5萬條.對樣本進行預處理,航班日期劃分為冬春航季和夏秋航季;計劃時間進行離散化處理,分為00:00-08:00,08:00-11:00,11:00-15:00,15:00-21:00,21:00-24:00五個時間段;計算每個航班的延誤時間,延誤時間=實際時間-計劃時間,延誤時間小于零則代表航班提前起飛(或到達),延誤標識由延誤時間決定,離港航班延誤30 min以上記為延誤航班;根據航班運行的日期和所屬航空公司來界定是否加入航空聯盟,例如東航在6月21日前的航班視為未加入,之后的視為加入,所有航班數據有11.6萬條被標記為加入航空聯盟的航班.

航班數據之間的依賴關系比較明顯,可以直接根據相應邏輯關系建立網絡模型,并通過直接的樣本計算獲取了各節點的條件概率表.得到圖1的簡化模型,可以更直觀地看出航空聯盟對同一個航空公司航班運行的影響.

2.2 基于隨機集的模型構建

此節構建的貝葉斯網絡加入了航班延誤因素節點,選取航空公司、流量控制、天氣、軍事活動、旅客以及航空聯盟作為航班延誤的關鍵因素數據.由于樣本數據中缺少航班延誤的具體原因,所以根據隨機集理論近似求得節點間的條件概率.

圖1 基于樣本數據的貝葉斯網

表1 隨機變量軍事活動以及航空聯盟基本概率賦值表

表2為根據步驟3~4計算每個焦元的區間以及概率賦值,并計算相應的Rn,p,得到延誤時間分布區間及其概率賦值.

表2 航班延誤時間區間及概率賦值

圖2是由表2的得到的概率賦值所構造的延誤時間的上下概率分布.根據航班延誤時間將對應的延誤狀態等級分為{正常,輕微延誤,一般延誤,嚴重延誤}={[0,30),[30,60),[60,120),[120,+∞)},則由式(5)得到相應概率區間為

p(正常)=[0.099,0.213)

p(輕微延誤)=[0.106,0.314)

p(一般延誤)=[0.212,0.347)

p(嚴重延誤)=[0.334,0.374)

圖2 航班延誤時間的上下概率折線圖

當隨機變量的區間劃分得越多時,得到上下概率分布的區間就越小,也更貼近真實的概率分布曲線,但同時也會帶來計算量的增大.將隨機變量劃分成30個區間時,同樣基于該方法可以計算得到如下近似結果.

p(正常)=[0.166,0.173)≈0.17

p(輕微延誤)=[0.185,0.196)≈0.19

p(一般延誤)=[0.267,0.286)≈0.28

p(嚴重延誤)=[0.355,0.365)≈0.36

此時得到的結果為發生軍事活動影響的條件下,未加入航空聯盟的航班發生不同延誤狀況的條件概率.同理可以計算得到其他條件下的延誤分布概率,根節點基本事件的發生概率可以由專家經驗或統計數據得到,根據航班延誤的定義可以構造延誤時間與延誤的條件概率表,最終得到圖3的貝葉斯網絡.

圖3 基于隨機集方法的貝葉斯網

將圖1和圖3的模型進行對比,以延誤時間節點計算其均方根誤差(RMSE)

式中:xm1,i,xm2,i分別為兩個模型中航班延誤時間分布節點的對應概率,計算得到的結果說明分別由兩種方法得到的貝葉斯網絡在總體分布上很接近,基于隨機集方法得到的貝葉斯網絡與由實際運行的樣本數據得到的網絡參數基本一致.

3 數據分析

3.1 加入聯盟前后對比分析

圖4為2011年東航、南航及該機場總體延誤情況,通過統計數據分析航空聯盟的影響.南航在2007年加入天合聯盟,其每個月的總體延誤概率上始終處于機場整體延誤概率的下方,優于機場整體情況;東航在6月21日加入航空聯盟,對比前半年和后半年東航和機場整體的后驗延誤概率情況,前6個月延誤概率在整體延誤概率的折線附近上下移動,兩者基本持平,后6個月的延誤概率處于整體折線的下方較多,略優于機場整體延誤概率.通過與機場整體延誤情況的對比,可以看出:在東方航空加入航空聯盟,天合聯盟與該機場建立合作伙伴關系后,東航在2011年下半年的航班產生延誤的概率上相比前半年有了一定的改善.

圖4 2011年南航、東航、機場整體延誤概率圖

由圖1可得加入航空聯盟之前和之后的航班延誤的條件概率,將航空聯盟也視為航班延誤的一個影響節點.基于樣本數據可以與航季以及計劃起飛時間之間的影響進行對比,二值變量如航季、航空聯盟和延誤率節點,可以直接比較對最終延誤概率的影響.聯盟的影響由P(delay|alliance=Y)-P(delay|alliance=N), 航季的影響由P(delay|season=ws)-P(delay|season=sa)計算可得,結果可知,加入航空聯盟之后的航班與未加入的航班延誤僅相差13%,而不同航季之間的航班延誤率相差了23.8%,這說明航空聯盟這一屬性的影響比航季的影響小.對于有多個取值的節點,可以計算三個節點對航班延誤時間節點的互信息[13]來進行比較,見表3.

表3 節點間互信息計算表

表3中變量與延誤時間的互信息所占比重越大,表明影響越顯著.模型中三個父節點對航班延誤時間產生的影響由大到小依次為航班時段、航季和航空聯盟.航空聯盟相對于航季和航班的計劃時間的影響略顯薄弱,但是考慮到航季和航班時段這些航班計劃中基本屬于固定信息,是否加入航空聯盟是航空公司的策略之一,可以作為航空公司改善航班延誤的一種手段.

3.2 航空聯盟與主要航班延誤成因的組合分析

對于影響航班延誤的外在原因,需要將航空聯盟與航班延誤成因因素進行組合分析.

圖5將旅客,天氣,流量控制,航空公司,軍事活動和航空聯盟分別記為因素A,B,C,D,E,F.依次組合,根據貝葉斯條件概率的計算可以得到加入航空聯盟前后不同原因下發生航班延誤的條件概率.加入航空聯盟之后,同時發生了A,B,C三個因素的情況下,航班產生延誤的概率比未加入航空公司時僅發生A,B兩個因素的概率低10%.相同的組合因素發生時,加入航空聯盟后發生航班延誤的條件概率總是小于未加入航空聯盟.當所有因素都發生時,得到的結果很接近,但是考慮到每個影響因素自身發生的概率并不高,多個因素組合發生的概率相當低,也就失去了其實際意義.由此可以得出,當多個航班延誤原因同時發生時,加入航空聯盟可以有效地減少航班延誤發生的概率.

圖5 各因素組合時的延誤概率變化

表4為在加入航空聯盟并改善某一因素之后,由模型計算得到的航班延誤概率.航空公司加入航空聯盟,并在航空公司自身因素上進行改善時(表中D+F),航班延誤概率為圖中最低的0.383.考慮到實際進行改善所需的經濟成本,只考慮兩兩組合改善的情況,得出的結果是航空公司和航空聯盟的組合能得到航班延誤的條件概率最低.另外,在實際運行中,模型所分析的五個因素中軍事活動和天氣屬于不可控因素,流量控制因素也存在著一定程度的不可控,旅客和航空公司自身屬于較為可控的因素,因此加入航空聯盟也可以成為航空公司改善航班運行的一種手段.要想以最小的調整換取最大的航班延誤改善,建議航空公司在加入航空聯盟的基礎上,對航空公司自身因素進行改進.

表4 各因素與航空聯盟組合改善的延誤概率

4 結 束 語

研究表明,基于貝葉斯概率統計和隨機集的基本理論,可以基于樣本的統計數據和隨機變量之間的函數關系建立相應的貝葉斯網絡模型,得到的模型與基于完整樣本數據的模型之間誤差較小,能夠地反映加入航空聯盟前后航空公司航班的整體延誤情況.結合不同的模型數據分析,對比加入聯盟前后的延誤概率數據,并對航班運行時的內在屬性行了敏感性分析,可以發現加入航空聯盟能對航空公司的航班延誤產生較為明顯的改善.同時,研究結果也可以為航空公司的航班延誤改進提供決策依據,考慮實際進行改善措施需要的經濟成本以及實際可操作性而言,只對其中兩個因素進行組合改善時,加入航空聯盟并對航空公司自身改善是最有效的手段.

[1] 徐濤,丁建立,王建東,等.基于貝葉斯網絡的航班延誤與波及分析模型[J].系統仿真學報,2009,21(15):4818-4822.

[2] 曹衛東,丁建立,劉玉潔.基于貝葉斯網絡的航班離港延誤預警分析[J].計算機應用研究,2008,25(11):3388-3390.14

[3] 丁建立,趙鍵濤,曹衛東,等.基于動態貝葉斯網的航班延誤傳遞分析[J].計算機工程與設計,2015(12):3312-3316.

[4] 楊秀云,王軍,何建寶.航班延誤關鍵影響因素及影響程度識別-基于動態排隊模型的分析[J].統計與信息論壇,2014,29(4):88-95.

[5] RUTNER S M, WHITAKER J. Alternatives for reducing delays at the United States' busiest airports[J]. Transportation Journal, 1997,36(3):18-25.

[6] SCHAEFER L, MILLNER D. Flight delay propagation analysis with the detailed policy assessment tool[C]. Proceedings of the 2001 IEEE Systems, Man, and Cybernetics Conference,USA, 2001.

[7] WONG J T, TSAI S C. A survival model for flight delay propagation[J]. Journal of Air Transport Management, 2012,23(7):5-11.

[8] PYRGIOTIS N, MALONE K M, ODONI A. Modelling delay propagation within an airport network[J]. Transportation Research Part C Emerging Technologies, 2013,27(2):60-75.

[9] 張連文.貝葉斯網引論[M].北京:科學出版社,2006.

[10] 蘭旭輝,熊家軍,陳勁松,等.基于隨機集的多源信息表示方法[J].數據采集與處理,2012(S1):24-27.

[11] 徐曉濱.不確定性信息處理的隨機集方法及在系統可靠性評估與故障診斷中的應用[D].上海:上海海事大學,2009.

[12] 趙亮.基于隨機集理論的QMU關鍵技術研究[D].北京:中國工程物理研究院,2016.

[13] 梁吉業,馮晨嬌,宋鵬.大數據相關分析綜述[J].計算機學報,2016(1):1-18.

Flight Delay Analysis Based on Random Set Bayesian Network

GONGYingjieLIUJunqiangHUANGLiang

(CollegeofCivilAviation,NanjingUniversityofAeronauticsandAstronautics,Nanjing210016,China)

In order to evaluate the impacts of airline alliances on flight delays and the combined effects of alliances with different factors which were barely investigated, according to Bayesian network and random set theory, the Bayesian models of flight delay analysis were separately built based on abundant samples and only statistics. Throughout the research, the extent of flight delays before and after joining the alliance was compared and their sensitivity was analyzed, as well as the combination of other key factors. The results indicate that the proposed method can strongly support the delay analyse and decision. The flight delay status tends to improve after joining the alliance. The combined improvements of the alliance and airlines can effectively ameliorate the impacts of flight delays relative to other uncontrollable factors.

airline alliance; flight delay; bayesian network; random set theory

TP391

10.3963/j.issn.2095-3844.2017.05.026

2017-08-04

貢英杰(1993—):男,碩士生,主要研究領域為民航交通信息工程及控制

*國家自然科學基金與民航聯合基金項目資助(U1533128)

主站蜘蛛池模板: 国产一区成人| 亚洲第一黄片大全| 中文字幕精品一区二区三区视频| 日本不卡在线视频| 亚洲一级色| 中文字幕1区2区| 欧美国产精品不卡在线观看| 日韩精品视频久久| 玖玖精品视频在线观看| 精品午夜国产福利观看| av在线手机播放| 亚洲国产av无码综合原创国产| 欧美精品在线视频观看| 97国产精品视频自在拍| 国产精品视频第一专区| 欧美激情第一欧美在线| 人妻精品久久无码区| 精品福利视频导航| 四虎影视库国产精品一区| 久草国产在线观看| 亚洲国产天堂久久综合226114| 精品国产成人高清在线| 极品国产一区二区三区| 久久综合色视频| 狠狠色噜噜狠狠狠狠色综合久 | 在线精品亚洲一区二区古装| www欧美在线观看| 欧美A级V片在线观看| 国产色网站| 视频二区中文无码| 91麻豆国产视频| 国产女同自拍视频| 黄色网在线| 久久国产精品波多野结衣| 97青草最新免费精品视频| 亚洲欧美日韩中文字幕一区二区三区| 爱做久久久久久| 午夜性爽视频男人的天堂| 国内黄色精品| 香蕉视频在线观看www| 在线看免费无码av天堂的| 亚洲成人77777| 国产成人凹凸视频在线| 在线免费不卡视频| 日韩天堂在线观看| 最新国产你懂的在线网址| 国产精品私拍在线爆乳| 国产女人18水真多毛片18精品 | 久草视频一区| 国产午夜无码片在线观看网站 | 日韩毛片免费视频| 无码 在线 在线| 日韩在线欧美在线| 日韩精品视频久久| 亚洲无码一区在线观看| 伊人久久综在合线亚洲91| 国产精品极品美女自在线看免费一区二区 | 美女视频黄又黄又免费高清| 色婷婷丁香| 久久精品66| 97久久免费视频| 日本不卡在线| 全部免费毛片免费播放| 中国国产高清免费AV片| 午夜啪啪福利| 亚洲欧美日韩综合二区三区| 成人午夜亚洲影视在线观看| 超碰色了色| 国产美女无遮挡免费视频| 精品亚洲麻豆1区2区3区| 国产精品私拍在线爆乳| 国产精品视频猛进猛出| 国模极品一区二区三区| 全部免费特黄特色大片视频| 狂欢视频在线观看不卡| 天堂成人在线视频| 99这里只有精品6| 国产精品无码AⅤ在线观看播放| 免费一级大毛片a一观看不卡| 久久黄色视频影| 免费播放毛片| 國產尤物AV尤物在線觀看|