梁小林,秦 歡,陳敏茹,許 奇,梁 曌
(長沙理工大學 數學與統計學院,湖南 長沙 410114)
大量研究表明氣候變暖的主要原因是全球溫室氣體的排放,尤其是二氧化碳氣體的排放,積極采取應對措施全面控制和減少二氧化碳氣體排放迫在眉睫.改革開放以來,中國經濟快速發展,中國成為世界第一大碳排放國,其碳排放的未來發展趨勢也成為世界關注的焦點.在第21屆聯合國氣候變化會議協議中,中國提交的國家自主貢獻目標為:到2030 年單位 GDP 的二氧化碳排放量比 2005 年下降 60%~65%.為了實現這一目標,需要對未來碳排放走勢進行分析與預測,并在此基礎上,制定合理減排措施.
目前,有關碳排放研究的相關文獻大致可分為兩部分,一部分是基于碳排量的研究,另一部分是基于碳排放強度的研究.在碳排放量方面,朱勤等[1]基于改進的Kaya恒等式建立因素分解模型,應用LMDI分解方法分析中國1980-2007年的能源消費碳排放,其研究結果為國家產業結構調整提供了理論依據;Wei[2]采用投入產出分析法,計算了北京工業能源相關的 CO2排放量,并且從技術、部門關聯、經濟結構和經濟規模等方面對驅動因素進行了結構分解分析(SDA);宋杰鯤[3]使用偏最小二乘回歸方法選取多項因素建立中國碳排放預測的STIRPAT模型,分析各個因素對碳排放的解釋作用,明確了碳減排應為重點關注的因素.Sun 和 Xu[4]提出了基于改進粒子群算法優化的BP神經網絡模型,對1978-2012年中國河北省的二氧化碳排放及其影響因素進行了實證分析, 通過與其他兩種方法的結果比較證明該模型的擬合和預測精度較高.梁一鳴等[5]利用STIRPAT模型分析中部六省 2000-2012 年碳排放量及其影響因素之間的關系,并且運用灰色 GM(1,1)模型,預測中部六省 2015 年、2020 年碳排放量.從上述文獻可以看出對于碳排放的研究大多是基于碳排放影響因素分析,并且側重于應用因素分解法.在碳排放強度研究方面,“碳強度”這一概念并不如碳排放一樣普及,自我國使用碳排放強度指標制定減排目標以來,有關碳強度的研究日趨增多.林伯強等[6]研究了如何在保障經濟增長條件下實現碳排放強度目標.寇靜等[7]建立Arima模型,研究我國碳排放強度時間序列數據,對其長期變動趨勢預測,發現仍呈下降趨勢,但下降幅度與政府的期望存在一定差距.趙成柏等[8]將碳排放強度的時間序列的數據結構分解為線性和非線性殘差部分之后,利用BP神經網絡與Arima組合模型預測碳排放強度變化趨勢.王鋒等[9]運用協整分析和馬爾可夫鏈方法對碳排放強度進行預測,并分析了能源結構優化對降低碳排放強度的作用.王彩飛[10]在分析確定碳強度的影響因素后提出了基于改進粒子群優化的極限學習機算法,對全國及9個典型省市的碳強度進行實證預測,預測結果顯示該模型具有良好的擬合性能.目前,由于碳排放強度和碳排放的關聯性,關于碳強度的研究基本上還是沿襲碳排放的研究方式.
上述文獻分別使用不同方法從不同角度研究了我國碳排放量以及碳排放強度,但較少文獻使用機器學習方法,本文提出Adaboost-SVR模型預測碳排放強度,支持向量機是基于統計學習理論和結構風險最小化原理的算法,在解決回歸問題上效果很好[11,12],通常用于處理非線性問題,也擅長處理小樣本數據集,對小樣本有較好的擬合作用[13,14],適用于目前年碳排放量數據較少的現狀.但是支持向量回歸不足之處在于預測效果依賴于所選擇的核函數和核參數,且目前沒有很好的關于參數選擇的理論支持.Adaboost算法可以提升任意弱學習器的性能,通過多次迭代降低預測結果的偏差,在訓練過程中也不易發生過擬合[15],將Adaboost算法與支持向量回歸結合,既可以對支持向量回歸訓練的學習器進一步提升,也可以降低參數選擇帶來的誤差,在保證模型精度的前提下進一步提升模型的泛化能力.
支持向量機(Support Vector Machine,以下簡稱SVM),作為傳統機器學習的一個非常重要的算法,由Cortes和Vapink于1995年提出.支持向量機(SVM)本身是針對分類問題提出的,而支持向量回歸(Support Vector Regression Machine, 以下簡稱SVR)是支持向量機原理在回歸預測領域的運用[16-18],其相關原理如下.
設樣本(xi,yi),i=1,2,…,n,xi∈Rn為輸入量,yi∈R為輸出量,SVR要求構建非線性映射φ(x),將原始數據映射至高維甚至是無窮維的特征空間中,然后在高維空間中建立樣本的線性回歸函數為
f(x)=wTφ(x)+b.
(1)
為避免過擬合,由式(1)可以得到式(2)的代價函數:
(2)
式中,C被稱為懲罰函數,決定函數對于數據的擬合程度,|yi-f(xi)|為實際數據與預測數據的偏差.引入不敏感損失函數ε,只有當|yi-f(xi)|>ε時才計算損失,則式(2)的代價函數轉化為式(3)和式(4)形式的目標函數.


(3)


(4)
其中,K(xi,xj)=φ(xi)φ(xj)為核函數,其作用為將高維空間的內積運算轉換為低維空間的核函數運算.最終得到的支持向量回歸函數為:
(5)
Adaboost算法[19]是Boosting提升算法中最具代表性的一種算法,由Yoav Freund和Robert Schapire在1995年提出.該算法的核心思想是:對于指定的樣本集數據,通過多次迭代反復修改樣本權重分布訓練一系列的基學習器,最終將各個基學習器組合建立一個強學習器.在每次迭代過程中,根據訓練集中各個樣本是否被正確學習以及上一次訓練過程中樣本權重來更新權重.對于正確被學習的樣本,降低其權重,而錯誤學習的樣本則要增大權重,之后根據新的樣本權值分布再次迭代,這使得在下次迭代過程中,更加凸顯錯誤學習的樣本,如此重復進行,直到基學習器數達到事先指定的數目,最終將這T個基學習器通過各自權重進行整合,最終得到理想學習器.
支持向量回歸的預測精度很好,但是其性能在很大程度上依賴于核函數以及其他參數的選擇.一般懲罰系數C,不應過大也不應過小,過小會造成欠擬合,過大則過擬合.而在樣本數量較少的條件下,懲罰系數C的取值不應過大,保證模型在樣本外的泛化能力.針對任意的弱學習器,Adaboost算法可以提升其性能,使用SVR作為Adaboost的基學習器,既可以在一定程度上提高模型的預測精度,又可以降低參數選擇帶來的影響.
Adaboost-SVR算法的步驟為:
輸入:m個樣本數據訓練集{Xi,yi}(i=1,2,…,m),迭代次數T

Step2訓練SVR基學習器:對于迭代次數t=1,2,…,T;根據樣本權重分布Dt(x)訓練第t(x)個SVR基學習器Ht(x);計算訓練集上的最大誤差Et、每個樣本的相對誤差eti、以及學習器的回歸誤差率et.
Et=max|yi-Ht(xi)|,i=1,2,…,m.

計算基學習器的權重需要的αt,

更新訓練數據集的權值分布:
D(t+1)=(wt+1,m,wt+2,m,…,wt+1,m);
輸出:最終學習器H(x)=Ht*(x).

由于不同研究機構的統計口徑不同以及某些年份的碳排放量數據未公布,考慮可獲得的碳排放量數據完整性,本文中碳排放量數據采用美國橡樹嶺國家實驗室CO2信息分析中心[20]公布的數據,GDP數據來源于世界銀行,能源消耗總量和人口數據來源于國家統計年鑒.
碳排放強度是指每單位國民生產總值的增長所帶來的二氧化碳排放量,該指標主要是用來衡量一個國家經濟發展同碳排放量之間的關系,反映了經濟增長過程中的能源消耗情況.若國家在經濟增長的同時,單位國民生產總值所排放的二氧化碳在下降,則說明該國實現了低碳發展模式.根據1960-2017年期間我國每年的二氧化碳排放總量以及1960-2017年國內生產總值,二者相除,可以計算1960-2017年碳排放強度,其結果如圖1所示.由圖1可知我國碳排放強度的趨勢是階段性變化的,第一階段為1960-1967年,碳排放強度急劇下降,從1960年的130.44 t/萬美元下降至1967年的59.30 t/萬美元.第二階段為1968-1978年,此階段為緩慢上升階段,碳排放強度從66.0 t/萬美元,上升至97.31 t/萬美元,雖然在1971年開始出現急劇下降,但僅在三年后又極速攀升,在這10年間碳排放強度上升31.31 t/萬美元.第三階段為1979-2002年,碳排放強度呈現穩步下降趨勢,從1979年83.42 t/萬美元的下降至2002年的25.71 t/萬美元,其中1979-1993年的下降速度低于1993-2002年.第四階段為2003年至今,該階段前期碳排放強度出現了輕微的反彈,上升到26.82 t/萬美元,隨后便繼續逐漸下降.雖然在不同時期存在波動,但長期來看,我國碳排放強度呈現逐步下降趨勢.

年份/年
3.2.1 平穩性檢驗
在對時間序列數據建模時,模型要求時間序列數據具有平穩性.從圖1可以看出該序列具有明顯的長期趨勢,是非平穩時間序列,因此在建立模型之前需要對原數據差分使其平穩.
若將原始時間序列記為{xt,t=1,2,…,n},其中xt為每個時刻的序列觀察值,則相距一期的兩個序列值之間的減法運算稱為1階差分運算.記xt為xt的1階差分:xt=xt-xt-1,通常1階差分可以使時間序列平穩.
本文采用單位根檢驗,結果見表1,根據ADF值以及P值均可以看出原變量經過一次差分后,ADF檢驗值為-6.485,低于各顯著水平下的臨界值,且P值近似為0,可以拒絕原假設,差分后時間序列已經平穩.

表1 單位根檢驗
3.2.2 數據形式轉換
在使用Adaboost-SVR對時間序列數據進行預測時,需要將數據轉化為監督學習所需要的數據形式,通常采用滑動窗口法將數據{xt,t=1,2,…,n}轉換為矩陣形式,構造樣本{Xt,Yt},其中Xt={xt-m,xt-m-1,…,xt-1},Yt={xt},m為滑動窗口的大小,代表著用前m個數據預測第m+1個數據[21].在本文中通過對模型反復實驗比較,取m=2,即用前兩年的碳排放強度預測第三年的碳排放強度.
根據已有的1960-2017年碳排放強度數據,經過數據預處理后,劃分訓練集和測試集,1960-2000年的數據集用于訓練模型,2001-2017年的數據用做測試,做連續滾動預測檢驗模型性能.為了比較模型Adaboost-SVR的預測能力,同時也用相同數據訓練了SVR、Adaboost-DT以及BP神經網絡作對比分析,其中Adaboost-DT是以決策樹回歸[22,23]作為基學習器訓練得到的模型.
本文選用均方根誤差(RMSE),平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、MSE(均方誤差)4類指標作為評價準則對誤差進行度量,計算方式如式(6)~(9).
(6)
(7)
(8)
(9)

表2列出了各個模型的評價指標值,根據RMSE,MAPE,MAE和MSE的值大小來看,Adaboost-SVR模型的RMSE,MAPE,MAE和MSE均低其他3種方法,預測效果明顯優于其他3種方法.若單從RMSE來看模型預測性能,Adaboost-SVR與Adaboost-DT相比性能提升了44%;與SVR相比提升了29%;與BP相比提升了45%.

表2 不同模型比較結果
圖2給出了不同方法下對碳排放強度的預測結果.實際的碳排放強度值用紅色線表示.從這個比較中可以看出,Adaboost-SVR明顯優于Adaboost-DT;與BP相比,雖然在2002年和2003年BP的預測值更加貼合實際值,但總體來說Adaboost-SVR預測效果更好;與SVR相比,雖然SVR模型也較好地擬合出了碳排放強度的下降趨勢,但預測精度低于Adaboost-SVR,說明Adaboost算法確實提升了SVR的預測精度.

年份/年
綜上所述,本文提出的Adaboost-SVR模型總體來說優于其他模型,可以很好地預測我國碳排放強度,在預測精度上較BP、Adaboost-DT和SVR模型有顯著提高,說明了該預測模型是切實有效的,可以通過預測結果調整國家宏觀政策,進而在2030之前實現我國提出的 “自主貢獻”目標.
利用Adaboost-SVR模型對我國未來幾年的碳排放強度進行預測,預測結果見表3.

表3 未來幾年碳排放強度預測值
根據預測結果顯示,2018年碳排放強度為7.268 t/萬美元,2022年預測值則降至5.488 t/萬美元,相對于2017年下降了2.614 t/萬美元.總體來看,未來幾年我國碳排放強度仍保持平緩下降趨勢.
當前我國經濟進入轉型期,處于后城市化和后工業化階段,因此經濟發展仍然需要消耗大量化石能源,進而導致碳排放量增加.雖然根據圖1可以看出我國的碳排放強度下降趨勢,但從圖3可以明顯看出國內生產總值增長曲線明顯比碳排放量曲線陡峭,因此碳排放強度下降主要原因在于我國經濟發展迅速,使得二氧化碳排放量的增長速度小于經濟增長速度.為了確保實現國家自主貢獻目標,即到2030 年單位 GDP 二氧化碳排放量比 2005 年下降 60%~65%,必須采取措施降低碳排放量.

年份/年
3.4.1 碳排放量驅動因素分析
根據LMDI模型,本文將我國每年碳排放變化量分解為四種效應[24],即人口規模效應、能源結構效應、能源消費強度效應以及經濟發展效應,這4種效應代表著影響我國碳排放的4種驅動因素.
根據圖4可以看出,4種碳排放驅動因素中,能源消費強度效應為負效應,是使碳排放量減少的關鍵因素,通過提高可再生能源的技術開發將有效降低碳排放量問題.在能源結構效應、經濟效應、人口效應3種效應中,經濟發展效應影響最大,表明我國要發展經濟能源需求極大;能源結構效應分解值時正時負,說明我國的產業調整力度還不夠大,煤炭在化石燃料中仍占較大比重,如果不對產業結構進行調整,碳排放量將持續上升,從2012年開始,能源結構效應出現了負值,說明能源結構有望成為抑制碳排放的強力因素;人口規模對碳排放有正向驅動作用,主要是因為人口增加導致的能源消耗增加,而且城市化導致大規模建造城市道路等基礎設施的水泥需求增長,這些都會直接產生碳排放.

年份/年
3.4.2 相關政策建議
從能源結構層面來說,我國應調整能源產業結構,鼓勵低碳經濟發展.政府部門應該從宏觀上調控政策,制定相應的碳管制措施,我國現有三大產業,第二產業帶來的污染最多,應盡快將我國產業結構從第二產業向第三產業轉變,強化人們的低碳理念,合理消費、綠色消費,不斷發展綠色農業,減少高含碳量生產資料的使用,減少以煤炭為主的能源消耗,大力實施“煤改電、煤改氣”政策.
從能源消費強度層面來講,應大力提高對可再生能源的技術開發,大力發展資源節約型新型能源,加大技術投資力度,我國技術型人才應積極參與低碳開發,國家應根據其貢獻給予相應獎勵,刺激高技術企業發展,其次可以引進其他國家的先進技術,與我國的實際情況相結合,構建屬于我們國家的低碳經濟發展技術.
從經濟發展來看,經濟發展勢必導致能源消耗,可以尋找合適的能源替代品,國家一級企業應考慮在不減緩經濟發展的前提下,最大程度減少碳排放,應促進天然氣應用,促進可再生能源利用,減少對化石能源的依賴.
自從我國提出以碳排放強度作為節能減排目標以來,有關于碳排放強度的研究已經成為熱點問題,本文對碳排放強度時間序列的研究轉化為監督學習,采用Adaboost-SVR模型預測長期趨勢,既保證了小樣本情況下的模型預測精度,又用Adaboost算法進一步提升了模型的泛化能力,MAPE,RMSE,MAE和MSE四個評價指標從多個角度表明組合模型優于Adaboost-DT模型、SVR模型、BP神經網絡模型,可以用來預測我國未來的碳排放強度.而在如何制定減排措施方面,從我國碳排放量的LMDI分解結果看,能源消費強度效應抑制碳排放量增長,而能源結構效應、經濟效應、人口效應是導致碳排放量增加的原因,應該據此實施合理高效的減排方案,例如調整產業結構,推動低碳工業發展,轉變能源利用結構,提高能源使用效率等具體減排措施.