向小軍,楊志晗,趙趕超
(1.中國民用航空飛行學院科研處,廣漢 618300;2.中國民用航空飛行學院飛行技術學院,廣漢 618300)
近年來,我國民航業得到巨大發展,雖受到“新冠”疫情的影響,2021 年民航運輸總周轉量仍相較于十年前增長48%,機隊規模擴大近1.3 倍,在《“十四五”民用航空發展規劃》的指導下,民航業還將繼續朝著民航強國的目標飛速發展。與此同時,隨著民航業發展,航空燃油消耗量每年也呈增長態勢,由燃油消耗帶來的碳排放與日俱增。據統計,我國民航業碳排放約占全國碳排放的1.6%,可以預見,未來民航業將成為主要的能源消費和碳排放來源之一。中國已正式宣布將力爭在2030 年前實現碳達峰、2060 年前實現碳中和[1],由于航空業研發投入大、周期長、難度高等特點,很難像其他產業一樣在短時間內完成低碳轉型,因此,民航業減排將成為我國完成“雙碳”目標的重要挑戰。在這樣的背景下,預測我國民航業碳排放量并分析減排措施對于早日完成行業內“雙碳”目標有一定參考意義。
目前,對于碳排放預測的研究主要分為三個方面。一是結合歷史數據,建立回歸預測模型,通過若干易統計數據來推測碳排放量。Wei等[2]通過相關性分析,分析了二氧化碳排放與影響因素之間的關系,然后使用優化后的最小二乘支持向量機預測了碳排放量,該方法有效提高了碳排放的預測精度。Faruque 等[3]建立了二氧化碳排放受電能消耗和國內生產總值(GDP)影響的預測模型,對比分析了卷積神經網絡(CNN)、卷積神經網絡-長短期記憶(CNN?LSTM)、LSTM 和密集神經網絡(DNN)四種深度學習方法的預測精度。陳文婕等[4]基于私家車軌跡數據,通過逆地理編碼與人工神經網絡對各區域私家車碳排放量進行預測,并從效率、效果和公平三個角度評估各區域減排潛力,對我國道路交通領域制定減排策略提供了參考。高金賀等[5]在STIRPAT 模型的基礎上,建立了由遺傳算法優化的支持向量機(GA?SVR)預測模型,選取人口總量、人均GDP、機動車保有量、旅客周轉量、貨物周轉量、城鎮化率和碳排放強度作為影響指標,對北京市1995—2019 年期間數據進行分析,結果表明該模型具有良好的擬合回歸效果。
二是進行情景分析或建立碳達峰預測模型,對各行業碳達峰情況進行預測。李寶成等[6]先是利用排放系數法對河南省交通運輸領域碳排放進行測算,分析能耗與碳排放量、碳排放強度等方面的關系;之后結合情景分析法預測碳達峰時間和碳排放峰值,最后提出一系列節能減排措施。韓博等[7]構建了一套符合民航特征的碳排放綜合預測模型,對2019—2050 年民航碳排放量開展預測分析,結果表明,民航業很難實現2030 年碳達峰愿景,預測民航業將于2045 年實現碳達峰,在此基礎上,可持續性航空燃料等新技術的發展將會使民航碳達峰時間提前4—7 年。胡榮等[8]運用情景分析和蒙特卡洛模擬方法預測了廈門機場航空器碳排放達峰的可能性、峰值與影響因素,結果表明,在基準情景下未來15年內碳排放年均增長率為3.1%,期間沒有達峰可能性。許繼輝等[9]基于LEAP 構建自上而下的中國民航業能源系統模型,探討民航業中長期低碳發展的技術路徑,預計2060年左右中國人均乘機次數翻兩番,現有政策情景下,民航業碳排放有望在2046年左右達峰,峰值水平約為3.5億噸。李心怡等[10]首先采用Kaya恒等式和對數平均迪氏指數分解法(LMDI)分解中國民航運輸碳排放的影響因素,其次建立Tapio 解耦模型分析民航運輸碳排放量與各影響因素的關聯強度,最后運用改進可拓展的STIRPAT模型實現中國民航運輸碳排放預測,預計基準情景下2050年之前未有碳排放峰值出現。
三是借助計算機深度學習等方法建立時間序列預測模型,對碳排放進行短期或中長期預測。張金良等[11]首先根據Kaya 恒等式的擴展,分析出影響碳排放的主要因素為人口、經濟、產業結構、能源消費強度以及消費結構;然后分別建立線性回歸、徑向基函數神經網絡、ARIMA 以及BP神經網絡模型,對比得到最優模型;最后基于最優模型在基準發展、產業優化、技術突破、低碳發展這4 個情景下對未來30 年碳排放進行預測。徐麗等[12]對1997—2015 年中國居民能源消費碳排放現狀進行分析,基于ARIMA 模型對2016—2025 年居民能源消費碳排放進行預測研究,該模型預計,到2025 年居民能源消費碳排放將達7.87 億噸。張昱等[13]設計并實現了一種基于Attention 機制的CNN-LSTM時序預測方法,將此方法應用于某大型園區八個組團的建筑熱負荷多步預測中,結果表明此方法有較高的精確度。魏光普等[14]對內蒙古包頭市2002—2020 年城區三種建筑類型能源消耗量進行分析,以循環神經網絡模型為基礎構建LSTM預測模型,并對2021—2030年的包頭市建筑碳排放量進行預測,結果表明包頭市建筑行業碳排放將于2022 年達峰。胡劍波等[15]基于LSTM 神經網絡模型預測出我國碳排放強度變化趨勢,同時,建立ARIMA?BP 神經網絡模型作為驗證模型對碳排放強度進行直接預測,兩模型對比后預測結果相差2.03 個百分點。Yang等[16]先是使用自上而下的方法對往返上海的所有客運航班進行碳排放估算,后建立ARIMA 模型對途中碳排放進行5年預測,最終得到最佳的ARIMA 模型階數。柴建等[17]基于單變量(ETS、ARIMA 模型)和多變量(Bayes 多元回歸)兩個維度對航空燃油效率及航空運輸總周轉量進行分析和預測,最終綜合以上兩種模型結果得出航空燃油效率、航空總周轉量與人均GDP、城鎮化率之間的關系。
綜上可以看出,國內外學者對碳排放的回歸、達峰等預測已相當成熟,該類研究主要集中在綜合碳排放、高耗能產業碳排放等方面。對于交通運輸業的碳排放預測主要集中在公路運輸上,而民航業碳排放研究相對較少。本文基于時間序列預測的方法建立ARIMA 模型以及WOA?LSTM 組合模型,對我國民航業航空器碳排放量、碳排放強度等數據預測至2035 年并對比結果,最終根據預測數據提出合理減排措施。
差分整合移動平均自回歸模型通常被稱為ARIMA(autoregressive integrated moxving average)模型,是由Box 和Jenkins 于20 世紀70 年代初提出的一種時間序列預測分析方法[18]。在描述ARIMA 模型時,首先要了解AR 模型、MA 模型和ARMA模型。
AR(autoregressive)模型是自回歸模型的簡稱,數學模型表達式如公式(1):
其中:Xt是當前值;c是常數項;p是階數;φi是自相關系數;εt被假設為平均數等于0,標準差等于δ的隨機誤差值;δ被假設為對于任何的t時刻都不變。該模型反映了在t時刻的目標值與前t-1至t-q時刻的目標值之間存在線性關系。
MA(moving average)模型是移動平均模型的簡稱,數學模型表達式如公式(2):
該模型反映了在t時刻的目標值與前t-1至t-q時刻的誤差值之間存在線性關系。
ARMA(autoregressive moving average)模型是自回歸移動平均模型的簡稱,描述的是AR 模型與MA 模型的結合,具體數學模型表達式如公式(3):
ARIMA 模型則是在ARMA 模型的基礎上,將數據通過差分轉化為平穩數據,再將因變量僅對它的滯后值以及隨機誤差項的現值和滯后值進行回歸所建立的模型。
模型參數包括p—趨勢自回歸階數;d—趨勢差分階數;q—趨勢移動平均階數。其中p和q由表1確定。

表1 ARIMA(p,d,q)階數確定
長短期記憶網絡(long short term memory,LSTM)是在循環神經網絡(recurrent neural net?work,RNN)的基礎上進行改進的一種算法,由Seep Hochreiter 等學者于1997 年提出,該算法可以在一定程度上解決RNN 算法的梯度消失和梯度爆炸問題[19]。
作為一種神經網絡模型,LSTM 擁有三種類型的門結構:遺忘門、輸入門和輸出門,這些特殊的“門”結構可以在細胞狀態中增加或丟棄信息。LSTM處理信息的流程如下:
首先通過“遺忘門”決定從細胞狀態中丟棄的信息。該遺忘門讀取前序輸出與當前輸入,再通過sigmoid 函數做非線性映射,之后輸出一個維度在[0,1]之間的向量ft,最后與細胞狀態相乘,表達式如公式(4):
其中:Wf為權值;ht-1為前序輸出;xt為當前輸入;Ct-1為細胞狀態;bf為偏置向量。
其次通過“輸入門”確定何種新信息被存放在細胞狀態中。輸入門包含了決定和值被更新的sigmoid 層和創建新候選向量的tanh 層,數學表達式如公式(5)和(6):
再次,經過上兩步驟后,對細胞狀態進行更新。過去的狀態與遺忘門輸出的向量ft相乘以及輸入門中的相加后得到新的候選值,數學表達式如公式(7):
最后通過輸出門確定需要的輸出值。數學表達式如公式(8)和(9):
整個流程如圖1所示。

圖1 LSTM神經網絡原理圖
鯨魚優化算法(WOA)是2016 年由澳大利亞格菲斯大學的Mirjalili 等學者提出的一種模擬座頭鯨狩獵行為的元啟發式優化算法,該算法采用隨機或最佳搜索代理來模擬捕獵行為,并使用螺旋模擬座頭鯨的氣泡網攻擊機制,具有機制簡單、參數少、尋優能力強等特點[20]。
標準WOA 模擬了座頭鯨特有的搜索方法和圍捕機制,主要包括:圍捕獵物、氣泡網捕食和搜索獵物三個重要階段。WOA 中每個座頭鯨的位置代表一個潛在解,通過在解空間中不斷更新鯨魚位置,最終獲得全局最優解。
1.3.1 圍捕獵物
座頭鯨的搜索范圍是全局解空間,需要先確定獵物的位置以便包圍。由于最優設計在搜索速度中的位置不是先驗已知的,因此WOA 算法假定當前的最佳候選解是目標獵物或接近最優解。在定義了最佳搜索代理之后,其他搜索代理將嘗試向最佳搜索代理更新它們的位置。這一行為由公式(10)和(11)表示:
其中:t表示當前迭代次數;A和C是系數向量;X*(t)是目前得到的最佳解的位置向量;X(t)向量是位置向量。
如果存在更好的解決方案,那么應該在每次迭代中更新X*(t),其中向量A和C的計算方式如公式(12)和(13):
在整個迭代過程中a由2線性降到0,r1和r2是[0,1]中的隨機向量。
1.3.2 氣泡網捕食
座頭鯨捕食主要有收縮包圍和氣泡網捕食兩種機制。采用氣泡網捕食時,座頭鯨與獵物的位置更新用對數螺旋方程表達式如公式(14)和(15)表示:
其中:D′是當前搜索個體與當前最優解的距離;b是螺旋形狀參數;l是值域為[-1,1]均勻分布的隨機數。
由于靠近獵物過程中有兩種捕食行為,因此WOA 根據概率來選擇氣泡網捕食或者收縮包圍,位置更新如公式(16)所示:
其中,p為捕食機制選擇概率,值域為[0,1]的隨機數。
隨著迭代次數t的增加,參數A和收斂因子a逐漸減小,若 |A| <1,則各座頭鯨逐漸包圍當前最優解,在WOA中屬于局部尋優階段。
1.3.3 搜索獵物
為保證所有座頭鯨能在解空間中充分搜索,WOA 根據座頭鯨彼此之間的距離來更新位置,達到隨機搜索的目的。因此,當 |A|≥1時,搜索個體會游向隨機座頭鯨,如公式(17)和(18)表示:
其中:D′′為當前搜索個體與隨機個體的距離;Xrand(t)為當前隨機個體的位置。
LSTM 的訓練效果以及訓練過程中的擬合速度與初始參數的設置密切相關,其中學習率和隱藏節點數直接影響了神經網絡的訓練精度和收斂速度。對于學習率來說,若初始學習率設置過大,會導致偏離值較大且后期無法擬合,反之收斂速度會很慢。對于隱藏節點數來說,設置過少會欠擬合,過多會導致過擬合[21]。通過鯨魚優化算法,全局向局部搜索尋優,確定最佳學習率和隱藏節點個數,從而優化神經網絡。
統計產品與服務解決方案(SPSS)是世界領先的統計分析軟件之一,廣泛應用于自然科學、技術科學、社會科學等各個領域,具有操作簡單、編程簡單、功能強大等特點,世界上許多有影響的報刊雜志紛紛就SPSS 的自動統計繪圖、數據的深入分析、使用方便、功能齊全等方面給予了高度的評價。矩陣實驗室(Matlab)是一款商用數學軟件,常用于數據分析、無線通信、深度學習、圖像處理、信號處理等領域,具有高效的數值計算功能以及豐富的應用工具箱,為用戶提供了大量方便實用的處理工具。
本文將基于SPSS建立ARIMA 時間序列預測模型,同時基于MATLAB 建立WOA?LSTM 時間序列預測模型,采用均方根誤差(RMSE)、平均絕對誤差(MAE)以及平均絕對誤差百分比(MAPE)作為評估指標來對比分析兩種模型的預測結果。
本文涉及的中國民航運輸業交通與經濟數據主要來源于中國民用航空局發展計劃司編著的1992—2020《從統計看民航》,其收錄了1991—2019年中國民航業發展的統計數據。
由于不同指標量綱不同,不存在可比性,故需要將原始數據標準化,以消除量綱的影響。標準化表達式如公式(19):
其中:Xi為原始數據,Zi為標準化后的數據。
根據中國民用航空局發布的年度《民航行業發展統計公報》,可以得出航空燃油消耗量與航空器碳排放之間的關系為1∶3.15,即平均每消耗1噸燃油產生3.15噸二氧化碳排放。本文結合1991—2019 年中國民航統計數據,選取航空器產生的總碳排放、碳排放強度(單位GDP所排放二氧化碳)、噸公里碳排放作為分析預測目標,并將1991—2014 年24 組數據作為訓練集,2015—2019 年5 組數據作為測試集,其中訓練集相關數據如表2 所示,測試集相關數據如表3所示。

表2 1991—2014年中國民航碳排放相關數據

表3 2015—2019年中國民航碳排放相關數據
將中國民航1991—2019 年航空器產生的碳排放量、碳排放強度、噸公里碳排放變化趨勢用折線圖表示,依次如圖2~圖4所示。

圖2 1991—2019年航空器產生的碳排放量趨勢圖

圖3 1991—2019年碳排放強度趨勢圖

圖4 1991—2019年噸公里碳排放趨勢圖
可以看出,1991—2019 年航空器產生的碳排放呈逐年增加的趨勢,且過去十年為快速增長期;而碳排放強度和噸公里碳排放整體處于下降趨勢,碳排放強度相較于噸公里碳排放過去三十年變化幅度較大,且近十年稍有起伏,噸公里碳排放近年處于穩中帶降的趨勢。以上三項數據與我國大力發展民航業和民航業技術變革等因素密切相關,民航業的飛速發展帶來航班量與飛行小時數的增加,從而航空燃油消耗量增加,進一步導致碳排放量增加;民航業新技術的應用使燃油效率提高,因此噸公里碳排放量整體處于下降態勢。
首先對1991—2019 年航空器碳排放量進行自相關(ACF)、偏自相關(PACF)分析,如圖5所示,ACF 出現拖尾,即相關數據不具備平穩性,對其進行二階差分后,ACF 與PACF 均出現截尾,如圖6所示,此時數據具有平穩性,可進行預測分析,此時模型為ARIMA(1,2,1)。同理,對碳排放強度、噸公里碳排放分析后模型分別為ARIMA(0,1,0)與ARIMA(1,1,1)。

圖5 差分前航空器碳排放ACF與PACF分析

圖6 二階差分后航空器碳排放ACF與PACF分析
其次對三項數據預測至2035 年,依次如圖7—圖9所示。經過ARIMA 模型預測,航空器碳排放在未來十六年一直保持增長態勢,2035 年碳排放將達到3.88 億噸,未見“達峰”出現;碳排放強度于2020 年后持續上升,2035 年將上升至與1991 年持平水平;噸公里碳排放則出現穩定下降趨勢,至2035 年噸公里碳排放僅為0.804千克。

圖7 ARIMA模型航空器碳排放演化趨勢圖(1991—2035年)

圖8 ARIMA模型碳排放強度演化趨勢圖(1991—2035年)

圖9 ARIMA模型噸公里碳排放演化趨勢圖(1991—2035年)
最后模型對應RMSE、MAE以及MAPE如表4所示。

表4 ARIMA模型RMSE、MAE、MAPE統計
設置WOA 算法中種群個數為20,迭代10步后得到最優的LSTM 學習率與隱藏節點數,不僅提高了參數選擇與調整的效率,同時提高了預測模型的準確度。通過計算機深度學習的方法,基于WOA?LSTM 建立的三項數據的模型測試集擬合效果如圖10所示。

圖10 測試集擬合效果圖
由圖10 可知,所建時間序列預測模型擬合度良好,使用該模型對2020—2035 年數據進行預測,演化趨勢如圖11~圖13 所示。基于WOA?LSTM 模型預測的航空器碳排放量雖同樣為上升趨勢,但增加較為平緩,甚至出現“達峰”趨勢;碳排放強度與噸公里碳排放變化都較為平緩,噸公里碳排放在未來出現細小波動。
同樣,計算基于WOA?LSTM 所建立三種模型的RMSE、MAE以及MAPE值,如表5所示。

表5 WOA?LSTM 模型預測結果
將ARIMA 模型與WOA?LSTM 模型進行對比,可以看出ARIMA 模型對航空器碳排放的預測比WOA-LSTM 模型更加精準,而對于碳排放強度及噸公里碳排放的預測略遜于WOA?LSTM模型,尤其是碳排放強度預測的MAPE 值為9.173,明顯不如WOA?LSTM 模型準確。綜合來看,經過WOA 優化的LSTM 時間序列預測模型的預測效果好于傳統ARIMA模型。
本文使用SPSS與MATLAB建立了ARIMA及WOA?LSTM 時間序列預測模型,用于對中國民航業航空器碳排放、碳排放強度等數據的未來預測,其中WOA?LSTM 使用鯨魚優化算法對LSTM 模型中的學習率和隱藏節點數進行優化,避免了人為確定參數的主觀性和盲目性。通過對ARIMA 與WOA?LSTM 模型 的 對 比,ARIMA模型在航空器碳排放以及噸公里碳排放預測中具有良好的效果,WOA?LSTM 模型則在碳排放強度和噸公里碳排放的預測中有更為優越的擬合度和準確性。
根據預測結果可知,在當前政策沒有較大變動的情況下,未來民航業碳排放將會持續上升,這將對我國在環境保護方面的總體規劃造成較大沖擊,為我國完成2030“碳達峰”目標造成一定的困難。同時,由于行業特殊性,民航業技術迭代周期長、新技術應用慢等特點,也給民航業的節能減排工作帶來很大困難。基于本文預測結果與民航業特點,總結出以下幾點民航業節能減排方面的建議:
(1)調整優化機隊規模結構。從1991—2019年噸公里碳排放數據的演化可以看出,老舊機型相較于新機型在燃油效率方面有一定劣勢,應加快撤下高排放老舊飛機。
(2)提升空管運行效率,優化航班航線。積極推進空管新技術研發應用以及飛行程序新標準的制定,全面提升航班整體運行效率。
中國是一個發展中的人口大國,根據《“十四五”民用航空發展規劃》的部署,我國民航業未來還將繼續高速發展,隨之而來的二氧化碳排放問題值得特別關注。本文所建立的碳排放時間序列模型可以對相關研究提供一定的參考,同時我們將繼續關注民航業綠色發展等問題,為后續研究做好準備。