999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于二次分解重構策略的航空客流需求預測

2022-12-18 08:11:38栗慧琳李洪濤
計算機應用 2022年12期
關鍵詞:模型

栗慧琳,李洪濤,李 智

(蘭州交通大學 交通運輸學院,蘭州 730070)

0 引言

隨著中國經濟的快速發展和人民生活水平的逐步提升,大眾出行方式的選擇發生了重要變化,航空運輸業以其快速、舒適、便捷等特點日益受到人們的青睞。近年來,我國的航空客運需求不斷增長,給航空運輸保障工作、機場建設規劃管理以及航空公司市場發展帶來了一系列的機遇和挑戰。各國政府和市場參與者必須準確預判航空客流需求的變化情況,對未來發展做出戰略性規劃,在合理利用資源、滿足運輸需求的同時,為航空所在地區創造更大的經濟和社會價值[1];而航空客流需求受諸多復合因素共同影響,在數據上呈現一定的波動性、不規則性和不穩定性,這使得準確預測航空客流需求成為一項艱巨的任務。

在此背景下,國內外眾多學者對航空客運需求預測進行了研究,取得了若干成果。當前對航空客運需求的研究主要集中在定量預測方面,常用的方法有計量經濟模型(如Holt-Winters[2]、自回歸單整移動平均(AutoRegressive Integrated Moving Average,ARIMA)模型[3]、自回歸單整移動平均季節(Seasonal ARIMA,SARIMA)模型[4]、廣義自回歸條件異方差(Generalized AutoRegressive Conditional Heteroscedasticity,GARCH)模 型[5]和全局 向量自回歸(Global Vector AutoRegression,GVAR)模型[6]等)和人工智能模型(如反向傳播神經網絡(Back Propagation Neural Network,BPNN)[7]、支持向量機(Support Vector Machine,SVM)[8]、回聲狀態網絡(Echo State Network,ESN)[9]、長短期記憶(Long Short-Term Memory,LSTM)網絡[10]等)。上述研究成果都為航空運輸業的發展提供了一定參考價值,然而經濟發展、地理人口、市場結構以及政策調整等諸多因素都會影響航空客流需求數據。為了提高預測方法的準確性和有效性,克服單一模型的缺陷,研究者提出了綜合集成模型理論,即利用不同方式將具有各類優勢的單一模型進行綜合集成。常見的綜合集成模型有兩種方式:第一種是不同模型間組合以獲得更優的預測效果,如ARIMA 模型和灰色預測模型通過賦權法進行組合[11],BPNN、LSTM、ESN 和門回 歸單元(Gated Recurrent Unit,GRU)模型的線性組合[12]等;第二種是數據分解后將不同分解模態預測結果集成,主要利用不同分解方法來識別和提取時間序列的內部特征。如Jin 等[13]利用變分模態分解(Variational Mode Decomposition,VMD)對原始數據進行分解,根據平穩性測試結果采用自回歸移動平均(AutoRegressive Moving Average,ARMA)模型和核極限學習機(Kernel based Extreme Learning Machine,KELM)模型對不同特征分量進行預測,最后采用KELM 模型非線性集成得到預測結果。梁小珍等[14]使用奇異譜分析(Singular Spectrum Analysis,SSA)對原始數據進行分解重構,依據重構序列的復雜度分別使用粒子群算法和布谷鳥算法雙優化的支持向量回歸(Particle Swarm Optimization Cuckoo Search algorithm Support Vector Regression,PSOCSSVR)模型和ARIMA 模型進行預測,并線性集成預測結果。此外,常用的數據分解方法還有經 驗模態分解(Empirical Mode Decomposition,EMD)[15]、集成經驗模態分解(Ensemble EMD,EEMD)[8]等。實驗結果表明,采用數據分解方法在降低數據復雜度的同時,也較為明顯地改善了模型的預測性能。

近年來,有學者在分解集成思想的基礎上提出了二次分解模型,通過組合不同分解方法,將復雜度相對較高的分量進行二次分解,以達到充分提取有用信息、降低預測難度的目的。如梁小珍等[16]采用X12-ARIMA 方法提取了原始數據的季節成分,進而利用改進的自適應噪聲互補集成經驗模態分 解(Improved Complete EEMD with Adaptive Noise,ICEEMDAN)技術二次分解剩余分量,通過FCM-FTS(Fuzzy C-Means Fuzzy Time Series)模型對各分量序列進行預測,將預測結果線性相加得到最終預測值。然而,已有的二次分解模型大多并未在二次分解后考察分量特征,直接將各個分量進行了相同處理,這可能導致預測模型的選取不合理,從而降低模型預測精度。

綜上所述,本文提出了一種新的基于二次分解重構策略的綜合集成模型(STL-CEEMDAN-SAAKAB)用于航空客流需求預測。首先,采用STL(Seasonal and Trend decomposition using Loess)分解方法對航空客流量數據進行分解,得到相應的季節分量、趨勢分量以及殘余分量,再利用自適應噪聲互補集成經驗模態分解(Complete EEMD with Adaptive Noise,CEEMDAN)對殘余分量進一步分解;然后,根據相關特征檢驗結果,將二次分解后的部分分量與趨勢分量相結合,重構得到新的趨勢分量,同時將其余分量基于復雜度結果分為低復雜度分量和高復雜度分量;再者,分析不同分量的不同特性,基于模型匹配策略分別采用SARIMA、ARIMA、KELM、雙向長短期記憶(Bidirectional LSTM,BiLSTM)網絡模型進行預測,其中KELM 和BiLSTM 模型的超參數通過自適應樹Parzen 估計(Adaptive Tree of Parzen Estimators,ATPE)算法確定;最后,線性集成得到最終預測結果。

本文的創新和特色之處在于:1)STL 和CEEMDAN 相結合的二次分解策略在充分考慮航空客運量數據季節性特征的同時,還充分挖掘了復雜分量中的有用信息;2)分析二次分解后不同分量的不同特征,合理進行分量重構,同時基于模型匹配策略有針對性地選擇預測模型,提升了綜合集成模型的預測性能;3)將具有高波動性的殘余分量分為低復雜度分量和高復雜度分量,分別采用神經網絡模型KELM 和深度學習模型BiLSTM 進行預測,得到更加精確和穩定的預測效果;4)采用ATPE算法對KELM和BiLSTM模型的超參數進行確定。

1 方法與原理

1.1 分解模型

1.1.1 STL模型

STL 是典型的時間序列加性分解方法,該方法相較于傳統的季節分解方法(如X12-ARIMA、比率移動平均法等)在處理異常值時具有更強的魯棒性[17]。對于航空客流數據Yt(t=1,2,…,n),STL 基于Loess 將原始數據Yt分解為季節成分St、趨勢成分Tt和殘余成分Rt,其分解表達式如下:

STL 是一種由內循環和外循環兩個遞歸過程組成的迭代方法。每一次內循環分別包含一個更新季節成分的季節性平滑和一個更新趨勢成分的趨勢平滑。內循環完成后,計算外循環中的魯棒權值并將其應用于減少外循環對下一個內循環中季節成分和趨勢成分更新的影響。在第k+1 次迭代的外循環中,用內循環中得到的趨勢成分和季節成分計算殘余分量。對于Rt中的任何過大值都被視為異常值,并基于異常值計算一個權值,在下一次內循環的迭代中,權重被用來降低上一次外循環迭代中識別出的異常值的影響。

1.1.2 CEEMDAN模型

EMD 技術作為一種自適應數據分析方法,主要應用于分析非線性和非平穩數據,它可將復雜數據分解為有限個本征模態函數(Intrinsic Mode Function,IMF)。但該方法容易出現模態混淆現象,即在某個IMF 中存在不同模式的信號成分,或者相似模式信號出現在不同IMF 中。為解決此問題,EEMD 方法被提出,該方法在原始數據中加入高斯白噪聲,從而緩解模態混淆的問題;但因多次反復加入白噪聲會造成最終數據分解成分中包含殘留噪聲且無法徹底消除,同時新數據序列因加入不同的白噪聲在分解過程中可能產生不同數量的分量,導致新的問題生成。為此,CEEMDAN 方法被提出,該方法解決了EEMD 方法中存在的問題,獲得了更好的自適應性和收斂性[18]。相較于EMD 和EEMD 方法,CEEMDAN 方法在每次分解時引入懲罰系數ω來控制噪聲水平。在逐步分解過程中,CEEMDAN 方法通過M次對剩余分量r(t)和噪聲ε(t)重新組合分解的方式,以此來消除噪聲的干擾。對于一個原始數據Y(t),該方法將Y(t)分解為N個IMF 分量和一個殘余分量R,表達式如下:

1.2 特征分析

1.2.1 樣本熵

樣本熵(Sample Entropy,SE)作為近似熵的改進版,是一種用來衡量時間序列復雜度的方法,具有較強的魯棒性。SE 的核心思想是通過衡量重建后時間序列的子向量之間的距離來測量復雜度,子向量之間的距離越近則時間序列的復雜度越低[19]。對于一個長度為n的時間序列x(t),首先計算重建子序列對應元素間的絕對值距離,根據距離值來衡量其概率Cm(r),最終確定x(t)的樣本熵值:

其中:m為重建時間序列移動窗口的嵌入維數,本文設定為2;r為寬容度,基于x(t)的標準差SD來確定的,具體為r=0.2 ×SD(x(t))。

1.2.2 最大信息系數

最大信息系數(Maximal Information Coefficient,MIC)用來描述大數據下任意兩組隨機變量之間的相關程度,它不易受異常值影響,具有普適性和公平性的數據測量特點[20]。如果兩 個變量X={xi,i=1,2,…,n} 和Y={yi,i=1,2,…,n}之間存在某種關系,則可作為一個有序集合D=(x,y),然后將x和y在數據X和Y方向上采取某種方式以網格方式劃分,這就可以使得大多數點集中落在單元格里,由此可計算兩組變量的MIC 值:

其中:B(n)=nα為樣本數n的函數,代表搜索網格的上界,α為一個自定義參數,本文設定為0.6;I(D,X,Y)是在X和Y網格上由D產生的分布的所有最大互信息。如果兩組變量X和Y之間相關程度越強,則MIC(D)越趨近于1;反之,越接近0,則說明兩變量越有可能為獨立變量。

1.3 預測模型

1.3.1 ARIMA模型

ARIMA 是Box 和Jenkins 提出的用于非季節性平穩時間序列數據分析和預測的模型[21]。該模型由自回歸項(AR)的階數p、移動平均項(MA)的階數q和使時間序列平穩化的差分階數d組成,可簡寫為ARIMA(p,d,q)。具體表達式為:

其中:{xi}(i=1,2,…,N)為一個平穩序列,αi為自相關系數,βi為誤差項系數,δ為常量,εt為白噪聲序列。其中前半部分為AR 項,用來描述當前時間序列數據值與歷史時間序列數據值之間的關系,用變量自身的歷史數據預測未來值;后半部分為MA 項,主要是通過移動平均法消除預測中的隨機波動造成的誤差累加。

1.3.2 SARIMA模型

SARIMA 具體包括非季節項ARIMA(p,d,q)和季節項(P,D,Q)s,可簡寫為SARIMA(p,d,q)(P,D,Q)s。其中季節項的P、D和Q分別代表季節AR 項、季節差分項和季節MA 項,通過對一個s周期的時間序列數據進行季節項分析其季節波動規律[22]。該模型的一般表達式為:

其中:ΦP(Ls)為季節P階自回歸算子、ΘQ(Ls)為季節Q階移動平均算子,μt為白噪聲過程。對于時間序列x(t),L為后移算子,即Ls=y(t-s)/y(t)。

1.3.3 KELM模型

極限學習機(Extreme Learning Machine,ELM)是快速單隱層前饋神經算法的一種特殊變體,由于輸入權值和偏差是隨機產生的,因此計算速度很快(如圖1 所示)。根據ELM 原則,采用線性方程組的最小二乘法求解Hβ=T可推導為β=H?T,其中H?=HT(HHT)-1是矩陣H的Moore-Penrose 廣義逆矩陣。然而,在廣義逆矩陣H?中,由于HHT的多重共線性會導致其不是一個非奇異矩陣,這可能造成預測結果不準確的問題。為了克服ELM 的隨機輸出,提高其泛化性能,提出了一種引入正則化和核函數的方案來改進ELM,即KELM 模型[23]。因此,在優化階段,可采用正則化系數C獲得權重向量β,即:

圖1 KELM神經網絡結構Fig.1 KELM neural network structure

其中:I代表一個N維的單位矩陣;HHT(i,j)=K(xi,xj)代表ELM 的核矩陣(記為ΩELM),K(·)代表核函數。對于一個給定的訓練樣本(xi,yi),其隱含層激活函數為h(x),則KELM 的輸出函數推導為:

其中:核函數K(·)根據不同的訓練數據進行調整,常用的有四種核函數,即徑向基核函數、線性核函數、多項式核函數和小波核函數。

1.3.4 BiLSTM模型

LSTM 是傳統前饋神經網絡的一種擴展(如圖2 所示)。LSTM 相較于其他循環神經模型最明顯的優點是它能夠處理消失和爆炸梯度問題[24]。

圖2 LSTM單元結構Fig.2 LSTM unit structure

LSTM 通過迭代地從一系列構建塊中更新內存狀態,從順序的結構化數據中捕獲長期依賴關系。每個構件塊都以一個存儲單元狀態為中心,該狀態由通過使用S 型激活函數σ的3 個功能門過濾的循環輸入信息進行更新。遺忘門通過遺忘或記憶循環輸入控制當前記憶狀態的更新,輸入門和輸出門通過擦除或保持當前單元狀態控制循環輸入流。BiLSTM 是基于兩個LSTM 層開發的(如圖3 所示)。

圖3 BiLSTM結構Fig.3 BiLSTM structure

BiLSTM 擁有兩個可在兩個方向上處理數據的LSTM 層,因此能夠對來自先前和后續信息進行數據依賴性建模[25]。對于BiLSTM 計算t時刻的輸出yt,需要包含前向序列的隱藏狀態和向序列的隱藏狀態,具體表達式為:

其中:W分別為前向和后向隱藏狀態的權重矩陣,b為偏差向量。

1.4 基于二次分解重構策略的航空客流需求預測模型

基于航空客流需求的數據特征以及上述各模型的基本原理,本文提出了一個基于二次分解重構策略的綜合集成模型(STL-CEEMDAN-SAAKAB)用于月度航空客流需求的預測。該模型主要包括二次分解及重構階段和模型匹配預測及集成階段,基本流程如圖4 所示。主要步驟歸納如下。

圖4 航空客流需求預測模型Fig.4 Air passenger demand forecasting model

1)二次分解。根據航空客流量數據的季節性特征,采用STL 方法對原始數據進行分解,得到季節分量、趨勢分量和殘余分量。然后利用CEEMDAN 對殘余分量進行二次分解以獲得未提取出的有效信息,得到n個具有不同時間尺度特征的IMF 分量(記作IMF1,IMF2,…,IMFn)。

2)基于特征分析的重構。分析二次分解獲得的各分量的基本數據特征,根據數據復雜度(SE 值)以及各分量與趨勢分量的相關度(MIC 值),選擇部分二次分解分量與趨勢分量重構為新趨勢分量;然后,將剩余分量依據所設定的復雜度閾值重構為低復雜度分量和高復雜度分量。至此,所有二次分解分量重構為季節分量、新趨勢分量、低復雜度分量和高復雜度分量四類。

3)模型匹配預測。分析重構后各分量的數據特征,有針對性地選擇不同的模型進行預測。具體地,對有明顯周期性、數據波動比較規律的季節分量選用SARIMA 模型進行預測;對復雜度低、變化曲線較光滑的新趨勢分量采用ARIMA模型來預測;對具有相對較低波動性的低復雜度分量選用神經網絡模型KELM 進行預測;而對具有明顯非線性非平穩特征的高復雜度分量采用深度學習模型BiLSTM 進行建模與預測。同時,為進一步提高預測精度,本文采用ATPE 算法優化了KELM 和BiLSTM 模型中的超參數,分別記為AK(ATPE-KELM)、AB(ATPE-BiLSTM)。將這一預測步驟簡寫為SAAKAB(即季節分量SARIMA、新趨勢分量ARIMA、低復雜度分量AK、高復雜度分量AB)。

4)集成。最后將季節分量、新趨勢分量、低復雜度分量和高復雜度分量的預測結果線性相加,得到航空客流量的最終預測值。

此外,為了衡量模型在多步預測下的表現,本文采用了多輸入多輸出策略對每個模型(·)進行建模預測,該策略相較于常見的直接策略具有建模任務簡單且耗時短的優勢[26]。假設一個模型的嵌入維度和零均值的噪聲項分別為d和ε,需做h步預測,則預測向量集合(φt+1,φt+2,…,φt+h),可具體表示為:

2 實驗與結果分析

2.1 數據描述

為充分驗證本文所提模型的預測性能,本文選取了北京首都國際機場、深圳寶安國際機場和海口美蘭國際機場的航空客流量數據作為研究對象進行實證分析。這3 個機場所在城市的地理位置、人口規模、產業結構以及經濟狀況等均有不同,而且航空客流量數據大小也有一定差異。其中,北京首都國際機場作為我國三大門戶復合樞紐之一,航空客流量大,屬于特大型機場;深圳寶安國際機場是干線樞紐型機場,航空客流量較大,屬于大型機場;海口美蘭國際機場為旅游城市機場,受旅游業發展影響較大,航空客流量相對較小。因此,本文選擇上述3 個機場的樣本數據進行預測可以更客觀、系統地評價STL-CEEMDAN-SAAKAB 模型的有效性和穩定性。

本文收集了上述3 個機場2006 年1 月 至2019 年12 月的航空客流需求月度數據(如圖5 所示),共計168 個數據,其基本統計描述見表1。此外,按照8∶2 的比例將原始數據劃分為訓練集和測試集,即2006 年1 月至2017 年2 月設為訓練集(共134 個數據),2017 年3 月至2019 年12 月設為測試集(共34 個數據),數據來源于Wind 數據庫(www.wind.com.cn)。

圖5 3個機場的航空客流需求月度數據Fig.5 Monthly air passenger demand data of three airports

表1 3個機場航空客流需求月度數據的基本統計描述 單位:萬人次Tab.1 Basic description statistics of monthly air passenger demand data of three airports unit:104

2.2 評價準則

本文采用均方根誤差(Root Mean Square Error,RMSE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)、決定系 數(R2)以及方 向預測精度(Direction Accuracy,DA)作為評價指標從不同角度評估模型的預測性能,具體公式如表2 所示。其中,RMSE、MAPE 越小,表明預測值越接近真實值,模型的預測精度越高;R2越接近1,表明模型的擬合程度越高;DA 越大,表明模型的趨勢判斷越準確,方向預測精度越高。

表2 評價指標Tab.2 Evaluation indicators

此外,為了進一步比較模型間的差異性,本文從統計視角引入了DM(Diebold Mariano )檢驗評價所提模型與基準模型預測精度的差異顯著程度。本文以均方誤差(Mean Square Error,MSE)作為損失函數,原假設為所提模型的MSE 值不小于基準模型,即提出模型的預測性能低于基準模型。具體的DM 統計量定義如下:

2.3 北京首都國際機場實例

2.3.1 二次分解重構

本文采用STL 分解技術對航空客流量數據進行分解,提取原始時間序列的季節成分和趨勢成分,并進一步得到殘余成分(如圖6(a)所示)。從圖6(a)中可以看出,北京首都國際機場客流量數據分解所得的季節分量波動極為規律,反映了航空客流需求在一年內的周期性變化(如每年8 月暑假期間,旅游人數增加,季節分量呈現上升狀態);趨勢分量波動平緩,逐年增長趨勢明顯,反映了在經濟增長、行業發展影響下航空客流需求的長期變化情況;殘差分量受各類不確定性因素影響較大(如2008 年8 月受北京奧運會影響,殘差分量有明顯突變),波動情況較為復雜,無明顯規律性。

圖6 二次分解及重構Fig.6 Dual decomposition and reconstruction

在此基礎上,利用CEEMDAN 對殘余分量進行二次分解,得到不同振幅和頻率的8 個IMF 分量,分別計算各分量的SE 值,分析其復雜度,見圖6(b)及表3。可以發現,各分解分量的波動頻率依次降低。波動頻率越高,該分量的非線性非平穩性越明顯,復雜度越高;反之,波動頻率越低,該分量的變化趨勢越平穩,復雜度越低。進一步,本文分析并計算了各分量與趨勢分量的相關度MIC,從表3 的計算結果可知,復雜度越低的分量,對應的MIC 值越大,表明該分量與趨勢項的波動狀態基本保持一致,說明殘余分量中包含了部分未充分提取的趨勢變化信息。

表3 二次分解分量的基本特征統計值Tab.3 Basic characteristic statistical values of dual decomposition components

根據各分量基本特征統計值及上述分析,同時考慮分量過多可能造成預測誤差的累加及計算成本的增加,本文依據各分量與趨勢項的相關度MIC,以及各分量的復雜度SE,將特征相似的分量進行了重構。具體地,將MIC 值大于0.5 且SE 值小于0.1 的分量(即對于CEEMDAN 為IMF8,對于EMD 為IMF7-IMF8)與趨勢分量進行重構,作為新的趨勢分量。其余分量按照復雜度閾值為0.5 重構為兩類,即低復雜度分量(即對于CEEMDAN 為IMF2和IMF5-IMF7,對于EMD 為IMF5-IMF6)和高復雜度分量(即對于CEEMDAN為IMF1和IMF3-IMF4,對于EMD為IMF1-IMF4)。重構后的結果如圖6(c)所示。

2.3.2 各模型參數及超參數的確定

在實證分析中,ARIMA、SARIMA 模型參數基于赤池信息準則(Akaike Information Criterion,AIC)最小化準則確定;KELM 模型的核函數及其對應的核參數,以及BiLSTM 模型的學習率(learning rate)、批處理大小(batch size)、隱藏層數(hidden layer size)和隱藏層單元數(hidden size)超參數,均通過ATPE 算法確定。本文對訓練集進行5 折交叉驗證,根據平均損失值最小原則確定最優超參數。對于KELM 模型,本文最終確定采用線性核函數,圖7(a)展示了KELM 模型懲罰參數的確定結果,從圖7(a)中可看出隨著懲罰參數增大,KELM 模型平均損失值不斷減小。BiLSTM 模型超參數確定的結果如圖7(b)和圖7(c)所示,可以看出當BiLSTM 模型的隱藏層數增加、隱藏層單元數較少以及學習率較低的時候,該模型的平均損失值較低,而批處理大小對模型效果的影響較小。最終,各模型參數及超參數的具體結果見表4。

表4 各模型參數及超參數Tab.4 Parameters and hyperparameters of different models

圖7 KELM和BiLSTM模型的超參數尋優Fig.7 Hyperparameter optimization of KELM and BiLSTM models

2.3.3 預測結果與對比分析

本文通過替換進行預測前使用的分解策略,設計了單一預測模型、一次分解模型和二次分解重構模型這3 類對比模型,具體如下:1)為驗證綜合集成模型的優越性,本文選擇了綜合集成模型中涉及到的4 種單一預測模型進行對比,即ARIMA、SARIMA、AK、AB 模型,均為航空客流需求預測領域中具有代表性的各類預測模型;2)為驗證二次分解重構策略和模型匹配策略的有效性,本文在STL 分解結果的基礎上,分別選擇單一預測模型AK、AB 和模型匹配預測策略(即季節分量SARIMA、趨勢分量ARIMA、殘余分量AB)設計對比實驗,分別記為STL-AK、STL-AB、STL-SAAB;3)基于提出的預測模型,采用EMD 作為二次分解方法,比較不同分解方法的優勢,即STL-EMD-SAAKAB 模型。

本文主要采用了RMSE、MAPE、R2和DA 這4 個評價指標,以及DM 檢驗統計指標對上述各類對比模型的預測結果進行評價。所有模型對北京首都國際機場航空客流量的預測結果具體見表5,提出模型對比其他模型的DM 檢驗結果見表6。從表5、6 可以發現如下結論。

表5 各模型的1步、2步、3步預測結果(北京首都國際機場)Tab.5 One step,2 step and 3 step ahead prediction results of different models(Beijing Capital International Airport)

表6 各模型1步、2步和3步預測的DM檢驗結果(北京首都國際機場)Tab.6 DM test results of 1 step,2 step and 3 step ahead prediction of different models(Beijing Capital International Airport)

1)航空客流時序數據具有明顯的季節性特征且復雜度較高。對比計量經濟模型(ARIMA 和SARIMA 模型)可發現SARIMA 模型預測效果優于ARIMA 模型,這是航空客流數據的季節性特征導致的。對比各單一預測模型的RMSE 值,結合超參數優化算法的深度神經網絡AB 模型具有明顯的預測精度優勢,在多步預測中優于其他所有單一預測模型;且AB模型的擬合精度R2均是最高的,這是因為深度神經網絡可較好地捕捉復雜數據內在規律特征。

2)基于STL 的分解集成模型優于單一預測模型。考慮到航空客流需求數據內在受多種特征影響,利用恰當的分解技術處理數據再進行預測可獲得預測效果的提升,如STLAK 和STL-AB 的MAPE 值低于所有的單一預測模型。根據STL 分解下各分量的特征采用模型匹配策略可獲得更具優勢的預測精度和方向精度,如在1 步預測中,STL-SAAB 的MAPE 值 為1.153 6%,DA 值 為0.903 2,均優于STL-AK(MAPE 為2.410 0%,DA 為0.774 2)和STL-AB(MAPE 為1.724 2%,DA 為0.871 0)。

3)二次分解重構集成模型進一步挖掘了航空客流數據中的有效信息且獲得了更優的預測性能。在STL 分解的基礎上,本文發現殘余分量中仍包含有未充分提取的有效信息,因此考慮采用分解技術進一步處理殘余分量并重構各分解分量。在多步預測中,STL-EMD-SAAKAB 和STLCEEMDAN-SAAKAB 模型的預測精度和擬合效果均優于其他所有對比模型,且方向精度也均超過0.900 0。從RMSE、MAPE 和R2這3 個誤差分析指標來看,STL-CEEMDANSAAKAB 模型在1 步和2 步預測中的效果優于STL-EMDSAAKAB 模型,但在3 步預測中的效果略差。

4)從DM 統計檢驗角度來看,除STL-EMD-SAAKAB 模型外,本文提出的STL-CEEMDAN-SAAKAB 模型相較于其他對比模型在多步預測中的p 值遠遠小于0.100 0,也就是說該模型的預測性能在90%的置信水平下明顯優于其他對比模型。而基于本文提出預測模型下的STL-EMD-SAAKAB 模型,從統計角度來說有著與STL-CEEMDAN-SAAKAB 模型相近的預測性能。

總的來看,本文提出的STL-CEEMDAN-SAAKAB 模型,綜合了二次分解重構策略和模型匹配策略的優勢,在對北京首都國際機場航空客流量的預測中,相較于其他模型,無論從預測精度、方向精度和擬合效果還是從統計分析角度來看,都有著較優的預測性能。

2.4 其他機場實例

為了更加全面、充分地評估所提模型的預測準確性和有效性,進一步選擇客流量數據量級不同、特點不同的兩個機場(深圳寶安國際機場和海口美蘭國際機場)進行建模預測,在實證分析中,模型參數的確定方法、重構依據以及對比模型的設置均與上文保持一致。兩個機場訓練集誤差評價結果和DM統計檢驗值分別見表7、8和表9、10。

表7 各模型的1步、2步、3步預測結果(深圳寶安國際機場)Tab.7 One step,2 step and 3 step ahead prediction results of different models(Shenzhen Bao’an International Airport)

表8 各模型1步、2步和3步預測的DM檢驗結果(深圳寶安國際機場)Tab.8 DM test results of 1 step,2 step and 3 step ahead prediction of different models(Shenzhen Bao’an International Airport)

表9 各模型的1步、2步、3步預測結果(海口美蘭國際機場)Tab.9 One step,2 step and 3 step ahead prediction results of different models(Haikou Meilan International Airport)

從預測評價結果來看,本文所提的STL-CEEMDANSAAKAB 模型的總體效果優于其他對比模型。在深圳寶安國際機場航空客流量的多步預測中,本文模型的擬合效果R2值均在0.98 以上,方向精度均為93.55%;而在海口美蘭國際機場的多步預測中,本文模型的RMSE、MAPE值均為最低,且R2值為最高,甚至在1、2步預測中方向精度DA值達到了100%。

表10 各模型1步、2步和3步預測的DM檢驗結果(海口美蘭國際機場)Tab.10 DM test results of 1 step,2 step and 3 step ahead prediction of different models(Haikou Meilan International Airport)

從DM 統計檢驗角度來看,除了STL-EMD-SAAKAB 模型外,本文模型在深圳寶安國際機場航空客流量預測中,預測性能在95%的置信水平下明顯優于其他對比模型;而在海口美蘭國際機場航空客流量預測中,本文模型相較于其他對比模型在多步預測中DM 統計值的p 值遠遠小于0.100 0。值得注意的是,上述兩個機場在單一預測模型對比中,可發現SARIMA 模型的預測效果是最優的,這說明深圳寶安國際機場和海口美蘭國際機場的航空客流量受季節影響較為明顯,季節性特征為主導因素,而其他不確定因素影響相比北京首都國際機場較低。其余結論均與北京首都國際機場實例中得到的一致,體現出本文提出的預測模型的有效性與優越性。

3 結語

在當前國民經濟穩步增長、航空運輸業快速發展的背景下,航空客流需求不斷增長,給相關管理工作帶來了新的挑戰。如何準確預測航空客流需求,對實現航空運輸資源的優化配置,提升航空運輸能力和質量,都顯得尤為重要。為此,本文從數據特征驅動角度出發,以“分而治之”思想為指導,構建了一個航空客流需求預測的綜合集成模型。該模型考慮了航空客流量數據的內在發展規律,挖掘了需求序列的季節性特征和趨勢變化情況,采用二次分解重構策略處理非線性非平穩的殘余分量數據,進而利用模型匹配策略依據數據復雜度有針對性地選擇合適的預測模型,集成得到最終預測結果。北京首都國際機場、深圳寶安國際機場以及海口美蘭國際機場的實驗結果表明,STL-CEEMDAN-SAAKAB 模型預測效果突出且穩定,所提出的二次分解重構策略和模型匹配策略是有效的航空客流需求分析和預測方法,對航空客運業的發展甚至其他研究領域都有借鑒意義。雖然,通過結合神經網絡模型預測得到了較高的預測精度,但預測結果缺乏一定的可解釋性,后續工作將嘗試融合多源數據,進行特征提取以此來獲得具有可解釋性的預測模型。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲无码高清一区| 久久久精品久久久久三级| 免费观看国产小粉嫩喷水| 欧美国产日韩在线| 亚洲精品卡2卡3卡4卡5卡区| 又猛又黄又爽无遮挡的视频网站| 91小视频在线观看| 好吊妞欧美视频免费| 亚洲女同一区二区| 人妻21p大胆| 99人妻碰碰碰久久久久禁片| 国产成人8x视频一区二区| 在线播放91| 亚洲精品国产精品乱码不卞| 国产在线观看99| 婷婷丁香色| 亚洲无码精品在线播放 | 国产美女精品人人做人人爽| 日韩成人午夜| 91久久国产热精品免费| 亚洲国产成人久久77| 亚洲AV无码精品无码久久蜜桃| 免费看一级毛片波多结衣| 在线观看热码亚洲av每日更新| 精品少妇人妻av无码久久| 国产精品密蕾丝视频| 日韩毛片在线视频| 老司国产精品视频| 福利姬国产精品一区在线| 色AV色 综合网站| 东京热高清无码精品| 国产乱子伦手机在线| 婷婷伊人久久| 久久特级毛片| 色男人的天堂久久综合| 久久久久久久久亚洲精品| 嫩草国产在线| 久久精品国产免费观看频道| 亚洲第一成年人网站| 97se亚洲综合不卡| 71pao成人国产永久免费视频| 亚洲成av人无码综合在线观看| 青青草原偷拍视频| 国产精品黄色片| 夜夜高潮夜夜爽国产伦精品| 精品無碼一區在線觀看 | 亚洲男人的天堂久久精品| 综合天天色| 中文字幕一区二区视频| 亚洲精品成人片在线观看| 在线观看精品国产入口| 欧美精品高清| 国产成熟女人性满足视频| 国产男人的天堂| 国语少妇高潮| 国产综合网站| 中文字幕欧美日韩| 中文字幕日韩丝袜一区| 福利国产微拍广场一区视频在线| 在线无码av一区二区三区| 亚洲中文字幕手机在线第一页| 亚洲精品无码久久毛片波多野吉| 国产在线视频导航| 国产成人高清精品免费| 亚洲精品无码AV电影在线播放| 中文字幕亚洲无线码一区女同| 热久久这里是精品6免费观看| 伊人激情综合网| 亚洲第一香蕉视频| 91精品国产综合久久香蕉922| 成人午夜免费观看| 成年看免费观看视频拍拍| 香蕉eeww99国产在线观看| 午夜福利网址| 精品午夜国产福利观看| 亚洲一区毛片| 国模视频一区二区| 666精品国产精品亚洲| 色妺妺在线视频喷水| 9啪在线视频| 亚洲成人77777| V一区无码内射国产|