999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于時間序列模型的國際航段量預測方法

2022-02-10 06:03:54孟雷楊毅李珂鄭蕓
中國科技縱橫 2022年23期
關鍵詞:模型

孟雷 楊毅 李珂 鄭蕓

(中國民航信息網絡股份有限公司,北京 101318)

1.引言

根據中國民用航空局2021年的統計數據,全行業完成運輸總周轉量856.75億噸公里,比上年增長7.3%。國內航線完成運輸總周轉量641.14億噸公里,比上年增長9.1%,;國際航線完成運輸總周轉量215.61億噸公里,比上年增長2.3%[1]。國際航線完成的運輸總周轉量占全行業的25%;同時國際航線完成旅客周轉量90.56億人公里,完成貨郵周轉量207.57億噸公里,完成旅客運輸量147.72萬人次,完成貨郵運輸量266.70萬噸。從以上數據可以看出,國際航線對民航具有重要作用。一張機票有多個航段,每天的航段量是統計當天所有機票包含的航段數量,航段量體現了民航公司的實際運力和旅客的需求。實現航段量的準確預測,對航空公司而言,無論是對航班安排、業務拓展、未來規劃等作出重要決策,還是制定航線規劃和機隊編排都是必不可少的。同時,民航航段量的研究有利于幫助國家合理優化資源配置,制定交通運輸規劃。航段是航空網絡空間結構的重要組成部分,杜德林等人采用圖論和復雜網絡理論的方法,研究了從2005年到2015年這10年間的航空網絡空間結構及進化特征,發現企業行為對航空網絡空間結構的影響,從而為民航的運行管理和發展提供一定的參考價值[2]。

如果能對航段量進行預測,提前預知國際航段量,便能提前知道國際航班的發展趨勢。進而能預知國際旅客量的拐點,就可以對資源進行科學調配,可以使航空公司在激烈的行業競爭中保持競爭力,在發展中不斷壯大。因此,準確地預測國際航段量具有重要的現實意義,有利于打開發展新局面。

另外,通過對機場歷史數據的統計和分析,結合航班的DOW特性,分析值機客流量的相關影響因素,以每小時的值機客流量為研究對象,構建基于時間序列的動態回歸ARIMAX模型[3]。陳聰聰等人基于影響民航客運量主要因素:一年的國內生產總值,外國人入境游客,定期航班航線里程,鐵路客運量,第三產業增加值,利用超極限學習機(Extreme Learning Machine,ELM)的算法模型,對民航客運量進行預測[4]。結合時間序列的知識,挖掘客運變化的特征,建立了ARIMA模型來描述民航客運運輸的發展趨勢以便將來做出合理的預測[5]。最近的基于深度學習方法的民航客運量預測[6],趙芳卉等人在2005年1月至2019年6月我國民航客運量的歷史數據上進行時間序列分析,為了消除回歸殘差的異方差,針對數據呈現的趨勢及季節波動特征建立SARIMA和GARCH組合模型[7]。甘國育等人提出一種融合的一維卷積神經網絡和長短期記憶網絡的客運量預測模型,利用一維卷積神經網絡計算代價小和可以識別序列局部模式的特性以及長短期記憶網絡可以捕獲客運量序列的時間依賴特性,對客運量進行預測[8]。循環神經網絡能較好地預測民航的客運量,但在準確率,尤其是時間效率方面仍需提高。

本文以時間序列和ARIMA理論為基礎,提出了一種基于時間序列的國際航段量預測方法。該方法針對國際航段量時間序列數據具有長期遞增趨勢、季節性變動和不規則變動特征,構建ARIMA模型,較好地捕獲時間序列數據的時間依賴,使用差分化將非平穩數據轉化為穩定時序數據,克服了傳統時間序列預測方法的弊端。在國際航段量預測中,該模型比線性回歸和指示函數模型對穩定的時序數據的線性關系具有更好的擬合能力,因此得到了更好的預測效果。本文方法不僅能對國際航段量進行宏觀預測,還可以適用于具體航空公司以及特定航線的航段量預測,具有較高的理論價值和現實指導意義。

2.時間序列理論

2.1 時間序列的組成部分

在現實生活中,人們經常會關心以后的事,也就是要對未來做預測。比如某只股票明天是否會上漲,明年企業的利潤能達到多少?隨著時間的推移,很多事件及自然現象都會積累一些數據,比如銷售額、收入或北京一年的溫度。

故時間序列是按時間順序記錄的一組數據。其中的觀測時間可以是年份,月份,或者是天等其他任何時間形式。為了便于表述,本論文用T表示所觀察的時間。

一個時間序列通常由4種要素組成:趨勢、季節變動、循環波動和不規則波動。

趨勢(trend)是時間序列在一段較長時期內呈現出來的持續向上或持續向下的變動。

季節變動(seasonal fluctuation)是時間序列呈現出的以年為周期長度的固定變動模式,這種模式年復一年重復出現。例如,交通運輸、旅游都有明顯的季節變動特征。鐵路和航空運輸在節假日會迎來客流高峰。

循環波動(cyclical fluctuation)是時間序列呈現出的非固定長度的周期性變動。比如人們經常聽到的景氣周期,加息周期這類術語。他不同于季節變動,季節變動有比較固定的規律,且變動周期大多為一年。而循環波動無固定規律,變化周期也多在一年以上。

不規則波動(irregular variations)是時間序列中除去趨勢、季節變動和循環波動之后的隨機波動。不規則波動通常是夾雜在時間序列中,致使時間序列產生一種波浪形或震蕩式變動[9]。

2.2 常見時間序列模型

有了不同的時間序列數據,如果要對未來數據進行預測,就要用時間序列模型去建模分析。

(1)常用模型。下面介紹一下常見的時間序列模型。

公式說明:

xt表示t時刻的觀測值,為自相關系數,被假設假設為平均數0,標標準等于隨機誤差值。u為MA模型的常數。

1)AR模型。

這個模型是用前p期的序列值xt-1、xt-2…xt-p為自變量,去預測xt。

2)MA模型。

這個模型說明xt與以前各期的序列值無關,是前q期的隨機擾動項的線性回歸模型。

3)ARMA模型。

這個模型說明xt不僅與前p期序列值有關,還與隨機擾動項有關。

4)ARIMA模型:許多非平穩序列差分后會顯示平穩序列的性質,稱這個非平穩為差分平穩序列。對差分平穩的數據用ARIMA模型進行擬合。

(2)時間序列平穩性。平穩性是時間序列里面的重要概念。其定義是:如果時間序列xt在某一常數附近波動且范圍有限,即有常數均值方差,且延遲k期的序列變量的子自協方差和自相關系數是相等的,則xt是平穩序列。

無論是嚴平穩還是弱平穩,實際上刻畫的都是時間序列的統計性質關于時間平移的不變性。嚴平穩要求比較嚴格,需要所有的統計性質都是關于時間平移不變的,而弱平穩只需要一階矩與二階矩(以及協方差)是時間平移不變的。

平衡的時間序列才能進行建模和預測。因為我們研究時間序列很重要的一個應用或者出發點,是希望通過時間序列的歷史數據來得到其未來的一些預測結果。換句話說,我們希望時間序列在歷史數據上的一些性質在將來保持不變,這也是時間平移的不變性。假設時間序列不是平穩的,那么由歷史數據得到的統計性質對未來毫無意義,歷史數據和未來沒有什么相關性,那么研究時間序列也就沒有意義了。

(3)平穩性的檢驗。既然平穩性對建立時間序列模型至關重要,那么如何檢驗所收集的數據是否滿足平穩性。以下有幾種統計檢驗方法:

1)圖形分析法:將數據繪制成圖形,進行觀察得出結論。通常有兩種做法,一種是直接觀察原始數據,另一種是可視化原始數據的統計特征。①可視化數據,根據平穩時間序列的均值和方差都為常數的性質,平穩時間序列的時序圖顯示該序列始終在一個常數值附近隨機波動,而且波動有界。②可視化統計特征,繪制時間序列的自相關圖和偏自相關圖。平穩時間序列具有短期相關性,這表明平穩時間序列通常只有近期的序列值對現在的值影響較明顯。隨著延遲期數k的增加,平穩序列的自相關系數會衰減趨向于零,并在零附近隨機波動,而非平穩序列的自相關系數衰減速度較慢。

2)假設檢驗方法:檢驗序列中是否存在單位根,若存在,則為非平穩序列,不存在則為平穩序列。常見的有DF檢驗、ADF檢驗、PP檢驗、DF-GLS檢驗和KPSS檢驗。①DF檢驗:迪基(Dickey)和弗勒(Fuller)1979年基于非平穩序列的基本特征將其大致歸為3類并提出DF檢驗:當序列基本走勢呈現無規則上升或下降并反復時,將其歸為無漂移項自回歸過程;當序列基本走勢呈現明顯的隨時間遞增或遞減且趨勢并不太陡峭時,將其歸為帶漂移項自回歸過程;當序列基本走勢隨時間快速遞增時,則將其歸為帶趨勢項回歸過程。②ADF檢驗:為了能適用于高階自回歸過程的平穩性檢驗,迪基等1984年對一階自回歸過程的DF檢驗進行了一定的修正,引入了更高階的滯后項。③PP檢驗:它是一種非參數檢驗方法,主要是為了解決殘差項中潛在的序列相關和異方差問題,其檢驗統計量的漸進分布和臨界值與ADF檢驗相同。④DFGLS檢驗(Dickey-Fuller Test with GLS Detredding):它是一種單位根檢驗方法,即“使用廣義最小二乘法去除趨勢的檢驗”。它利用廣義最小二乘法,首先對要檢驗的數據進行一次“準差分”,然后利用準差分的數據對原序列進行去除趨勢處理,再利用ADF檢驗的模型形式對去除趨勢后的數據進行單位根檢驗。⑤KPSS檢驗:最大的不同點就是它的原假設是平穩序列或趨勢平穩序列,而備擇假設是存在單位根。

3)簡單統計方法:計算均差和方差的統計量的方法。寬平穩中有兩個條件是均值和方差都不變,實際工作中,可以通過觀測數據得出判斷,具體方法是直接將序列前后拆分成兩個序列,分別計算這兩個序列的均值、方差,對比看是否差異明顯。常見的時序異常檢驗也是這樣的做法,前后分布一致則無異常,否則存在異常或突變。

3.基于時間序列的國際航段量預測模型

本文模型的構建流程:首先,收集國際航段量的歷史數據,對數據進行處理,觀測數據的特點。其次,對數據進行平穩化處理,對于不平穩的數據進行一階差分得到平穩的數據,使其滿足ARIMA模型的特性,最后建立基于時間序列的國際航段量預測模型。

3.1 數據集與數據可視化

(1)數據集。本文收集了2020年4月到10月的主機航國際航段量數據,經過數據處理得到國際航段量預測的數據集。數據有兩個特征:日期和日期對應的航段量。

所謂航段是飛機從起飛到下一個著陸之間的飛行。凡航段的兩端都在國內的稱為國內航段,比如北京—上海;北京—廣州等航段;兩端或有一端在國外的稱為國際航段,比如北京—洛杉磯航段;廣州—暹粒航段;悉尼—廣州航段。航段量的計算方式是統計所有機票的航段量。例如,一張票如果有兩個航段,另一張有一個航段,則一共有3個航段。本文數據集收集的是每天的國際航段量,就是將一天所有的國際票進行航段量計算。

主機航是指主機在航信的航司,一般是國內航司。之所以研究國際航段是因為全球國際航班的情況是民航界各個航空公司密切關注的問題。如果能對未來國際航段量做出較準確預測,將能幫助航司及時調整經營策略,意義重大。

(2)數據可視化。接下來對數據進行處理以及可視化分析。首先對航段量數據畫圖分析數據走勢,觀察數據的特點,符合什么模型。然后根據數據走勢和特點選擇最符合的模型去建模。因為除了時間序列模型,還有線性回歸模型,非線性回歸,指數模型。不是所有時間序列數據只能用時間序列模型去建模。這里我們利用Python的畫圖工具包Matplotlib繪圖,使用該模塊把帶日期數據自動處理成時序圖,觀察數據呈現什么規律。

如圖1所示,數據隨著時間有明顯上升趨勢,航段量數據也在來回震蕩,符合時間序列模型曲線。此外,數據大約以一周為一個周期,體現了循環波動,同時也會有隨機波動在時間序列當中。指數模型是平滑上升的曲線,顯然不符合,而線性回歸模型的曲線是線性的,不能來回震蕩,也不符合。通過以上分析,我們認為國際航段量數據滿足時間序列模型的建模型要求。

圖1 時序圖

3.2 數據的平穩化處理

時間序列模型建模之前,需要對時間序列數據進行平穩化處理,將不穩定的數據進行一階差分,得到平穩的數據,然后再進行建模[10]。下面先介紹下平穩性的概念。其基本思想是,決定過程特性的統計規律不隨著時間的變化而變化。其數學定義為:如果對一切時滯k和時點t1,t2,...,tnf,都有Yt1,Yt2,...,Ytn與Yt1-k,Yt2?k,...,Ytn?k的聯合分布相同,則稱過程{Yt}是嚴平穩的。

本文用adf()函數進行檢驗。檢驗結果為:(0.013266272732580436, 0.9596155432394303, 13,201)。其中p值為0.96顯著大于0.05,故是非平穩時間序列,要進行進一步處理。故對此時間序列數據進行一階差分:D_data = data.di ff().dropna()。所謂差分就是對一組數據依次相減,用下一個數值減去上一個數值。對差分后的數據畫時間序列圖進行分析。觀察圖2可以發現現在的數據圍繞x軸上下震蕩,平穩了很多。然后用adf()函數檢驗,得到的p值為4.57*e-10小于0.05,所以1階差分后的序列是平穩序列。

圖2 時間序列圖

3.3 建立時間序列模型

當時間序列數據進行了一階差分后變得平穩,所以采用ARIMA模型進行建模。首先,通過執行差分測試(即Kwiatkowski–Phillips–Schmidt–Shin、Augmented Dickey-Fuller 或 Phillips–Perron)來確定差分的順序d,本文選用Augmented Dickey-Fuller進行差分測試,然后在定義的start_p、max_p、start_q、max_q范圍內擬合模型。啟用季節性選項,ARIMA會確定季節性差分的最佳順序d之后尋求識別最佳p和q超參數。p為自回歸(AR)模型的階數(即滯后觀察的數量)。當時間序列中的先前值非常能預測后來的值時,時間序列被認為是AR。AR過程將顯示ACF圖的逐漸減少。d為差異程度。q為移動平均(MA)模型的階數。這本質上是時間序列數據的“窗口”函數的大小。MA過程是過去誤差的線性組合。通常,ARIMA模型以ARIMA(p,d,q)的形式編寫。為了找到最佳模型,針對給定的信息標準進行優化,并返回使值最小化的ARIMA。信息標準有AIC(Akaike Information Criterion)、AICC(Corrected Akaike Information Criterion)、BIC(貝葉斯信息準則)、HQIC(Hannan-Quinn信息準則)和OOB(Out of Bag),通過這些信息標準分別驗證模型評分。由于平穩性問題,可能找不到合適的收斂模型,因此在重新擬合之前采取誘導平穩性的措施。BIC是評價時間序列好壞的重要標準,所以實驗中編寫了一個程序去循環遍歷ARIMA模型階數,觀察BIC值,BIC值越小說明模型擬合的越好。最終模型的參數為p=6;d=1;q=0時BIC值最小,得到的是ARIMA(6, 1, 0)。然后,通過 fit函數去建立這個模型,得到這個模型的系數。圖3是模型的詳細參數。

圖3 模型參數

4.實驗與結果分析

基于上節建立的基于時間序列的國際航段量預測模型,可以對未來航段量做預測分析。本文預測接下來一個月的航段量數據,調用model.forecast(30)預測這個月30d的航段量。返回的是Python的array數組格式,部分預測結果如圖4所示。

圖4 部分預測結果

另外,在ARIMA模型中,我們通常假定當前觀測值與前p個時間點的觀測值之間存在相關性,該模型的預測準確性同p的取值息息相關。事實上,p的取值較大則更有助于處理長期預測的問題,但其會在一定程度上增加模型的復雜程度,給參數估計帶來一定的困難。反之,如果p的取值較小,盡管模型的結構會更為簡單,但是會損失很多重要信息,進而影響統計分析的結果。因此選擇一個合適的p的取值來實現模型復雜程度與估計準確性之間的平衡是很重要的問題。在本研究中,我們利用BIC準則來選擇p的取值,最終取定的取值為6,因此相應的模型分析結果不太適宜處理時間間隔過長的預測問題。如果在實際問題中,我們感興趣的預測問題與觀測到的數據時間間隔較長,可以通過該時長適當調整模型中參數p的取值,進而得到更為精準的預測結果。

5.結論

對于航空公司來說,能準確預測未來一個月的國際航段量,在競爭激烈的國際市場上是有極大優勢的。本文對于平穩的時間序列數據,能建立良好的時間序列模型。該模型能快速較準確的預測國際航段量,而且還能低成本地快速迭代更新。實驗結果表明,該模型簡單高效,預測效果好。并且對中長期市場非正常事件有一定的預測能力,可以用來預測國際航班的未來走勢。

我國航司的飛機總量及運力總量數據仍然保持正常的增長狀態,同時航司成本也維持著較高水平。通過對未來國際航段量預測發現民航市場的供需關系,調整市場的供給、對資源的動態分配和優化提供了不可或缺的決策支持,提高運行管理效率、加強市場化。

此外,本文方法還可以適應于民航航線客運量和航班機票價格預測研究,旅客出行需求和托運行李需求預測研究,從而具有較高的理論價值和現實指導意義。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国内精品自在自线视频香蕉| 国产资源免费观看| 中文成人在线视频| 91国内视频在线观看| 福利在线一区| 精品综合久久久久久97超人该| 亚洲国产一区在线观看| 欧美精品在线免费| 四虎亚洲精品| 久久久久人妻一区精品| 亚洲一级毛片在线观| 国产伦精品一区二区三区视频优播 | 亚洲狼网站狼狼鲁亚洲下载| 国产日韩欧美成人| 尤物成AV人片在线观看| 四虎精品黑人视频| 国产又色又爽又黄| 久久亚洲精少妇毛片午夜无码 | 亚洲美女久久| 日本国产精品| 乱人伦视频中文字幕在线| av一区二区三区高清久久| 99国产在线视频| 亚洲无码高清视频在线观看| 天天视频在线91频| 三上悠亚一区二区| 国产一级精品毛片基地| 国产精品不卡永久免费| 中文字幕在线一区二区在线| 成人福利视频网| 丰满的熟女一区二区三区l| 午夜人性色福利无码视频在线观看| 亚洲精品午夜无码电影网| 国产欧美精品一区二区| 国产亚洲视频免费播放| 亚洲三级电影在线播放| 伊人久久综在合线亚洲2019| 欧美三级视频网站| 亚洲成人免费在线| 中文字幕精品一区二区三区视频| 青青草欧美| 欲色天天综合网| 毛片在线看网站| 国产素人在线| 精品久久777| 国产玖玖视频| 色婷婷在线影院| 综合五月天网| 欧美亚洲一区二区三区导航| 欧美日韩精品在线播放| 午夜毛片福利| 国产制服丝袜无码视频| 亚洲人成网站色7777| 潮喷在线无码白浆| 毛片视频网址| 国产精品网址你懂的| a在线观看免费| 黄色网站不卡无码| 久久96热在精品国产高清| 欧美成人一级| 亚洲中文字幕在线一区播放| 91色在线观看| 九九热视频在线免费观看| 色综合中文综合网| 久久久久国色AV免费观看性色| 亚洲美女一区| 天天躁日日躁狠狠躁中文字幕| 日韩大片免费观看视频播放| 精品一区二区无码av| 久久情精品国产品免费| 高潮爽到爆的喷水女主播视频 | 久久精品国产亚洲AV忘忧草18| 亚洲天堂免费观看| 久久久噜噜噜久久中文字幕色伊伊 | 美女被躁出白浆视频播放| 国内嫩模私拍精品视频| 在线观看免费黄色网址| 美女毛片在线| 91网站国产| 亚洲欧美成人网| 色悠久久久久久久综合网伊人| 久久久精品国产SM调教网站|