隨著社會的發展,科技的進步,飛機成為了人們越來越喜歡的交通工具,航空運輸量規模和增長速度成為衡量我國民航發展的重要指標。據中國民航運輸局統計數據顯示,2018 年,全年完成了旅客運輸量61 173.77 萬人次,比2017 年增長了10.9%;全年運輸飛行小時約1 153.52 萬小時,比2017 年,增長8.9%;運輸起飛架次425.95 萬次,比2017 年增長了7.6%。這些數據表明我國的民航事業在快速的發展,國家實力也在不斷增強。因此,對民航客運量進行精準預測,對中國民航事業的發展有重要的意義。
目前關于ELM 的預測模型已經有了很多的應用,如能源、農業、網絡等方面。袁開銀等[1]通過相空間重構把網絡流量變為有規律的數據,然后用極限學習機算法對這些數據進行仿真模擬,從而實現網絡流量的準確預測。由于風能資源成為了可再生能源發電資源之一,朱抗等[2]用超極限學習機來對短期風速進行仿真預測,進而對風力發電進行預測,更好地利用風能,該方法與傳統的方法相比,預測速度快,精度高。匡亮等[3]人提出了一種優化極限學習機的果園濕度預測方法,有效地提高了果園濕度預測的精度,克服了傳統水蜜桃種植過程中環境監測實時性差、人力物力浪費嚴重的現狀的問題。Hua Xu 等[4]發現碳排放價格波動趨勢與碳排放交易市場有效性的發揮有關系,因此利用時間序列復雜網絡分析技術和超極限學習機的方法,對碳排放進行預測,該方法預測結果和真實值較近。Aranildo R. Lima 等[5]提出了一種在線順序極限學習機,該方法結構簡單,可以不斷地更新數據,節約成本,對加拿大大不列顛和哥倫比亞省的小流域進行預測,結果表明該方法更新的頻率高、誤差小,預測結果和實際值更接近。以上文獻大多將極限學習機算法用到能源,農業等其他領域,達到了理想的預測效果,但是鮮有將其運用到民航客流量預測上。
本文基于超極限學習機的預測模型,以國內生產總值、外國人入境游客人數、定期航班航線里程、鐵路客運量、第三產業增加值五個影響因素[6]作為輸入值,民航客運量作為輸出值,通過ELM 模型,對中國民航客流量進行預測,并分析預測值和實測值的關系,計算誤差,試圖為我國航空運輸發展和企業進行經營決策提供一些有價值的預測結果和相關信息。
極限學習機算法(Extreme Learning Machine,ELM)[7-8]是一種針對單隱含層前饋神經網絡(SLFN) 的新算法,其網絡結構如圖1 所示,它的特點是隨機產生輸入層與隱含層間的連接權值以及隱含層神經元的閾值,而且在實驗的過程中只需要設置隱含層神經元的個數,無需調整其他數值,便可以獲得唯一最優解。

圖1 ELM 網絡結構圖
該算法有三層數據,輸入層、隱含層、輸出層,且輸入層和隱含層,隱含層與輸出層神經元之間全連接。ELM 模型的算法步驟:輸入層有n個神經元,對應有n個神經元,對應的輸入矩陣為X=[xi1,xi2,…,xin]T,隱含層有L個神經元,輸出層有m個神經元,對應有m個輸出,對應的輸出矩陣為Y=[yi1,yi2,…,yim]T。激勵函數為g(x)的ELM 模型為:

其中:βi為隱含層第i個節點與輸出層節點的權重;ωi為輸入層節點與隱含層第i 個節點的權重;bi為第i 個隱含層節點的閾值;oj為網絡的實際輸出值。
網絡輸出可以表達為:Hβ=T',T'為矩陣的轉置;H稱為神經網絡的隱含層輸出矩陣。其中H可以表示為:

若L=N具有L個隱含層神經元網絡的輸出值可以逼近N個訓練樣本,SLFN 可以零誤差逼近訓練樣本。即:

當N足夠大時,ELM 的輸出誤差逼近一個任意值ε<0,β 可通過最小二乘法求解,得

采集1999~2018 年每一年的國內生產總值、外國人入境游客、定期航班航線里程、鐵路客運量、第三產業增加值,數據如表1 所示。
由于影響民航客流量的因素不同,在數據處理時,要求不改變原來的物理意義且把數據映射到(0,1) 的區間內,將有剛量化轉變為無剛量化,因此可對采集的數據進行歸一化處理,目的是輸入變量的不平等使用,以及對數據歸一化處理后,可以防止輸入的數據的絕對值過大,保證輸出數據中小的數據不被覆蓋,加快訓練網絡的收斂性。
將所收集處理過的120 個數據分成20 組6 維數據,每組的前5 維數據,為樣本輸入,每組的第6 維數據為預測數據。前15 組6 維數據為模型訓練數據,后5 組6 維數據為測試數據,利用Matlab 搭建ELM 預測模型,進行試驗仿真。通過ELM 仿真預測民航客運量與實際客運量的對比(如圖2),ELM 模型的擬合度為0.93315,均方誤差誤差為0.041544,和實際結果很相近。
本文針對中國民航客流量及其影響因素,建立ELM 預測模型,通過仿真實驗可以看出ELM 模型所獲得的預測值更加接近真實值。文中預測模型可以在其他領域推廣。

表1 1999~2018 年民航客運量及其相關影響因素數據

圖2 ELM 預測值和真實值對比