高 迪,任庚坡,李琦芬,毛俊鵬,桂雄威
(1.上海電力大學, 上海 200090; 2.上海市節能監察中心, 上海 200083)
上海市作為長江流域經濟帶的骨干和“龍頭”,近年來能源需求也不斷提高。與日俱增的能源需求,不僅影響我市能源自身安全,而且會對全國能源生產與供給產生一定影響。響應綠色低碳號召,加強自身能源保障,是未來經濟社會發展所遵循的規律[1]。因此,把握未來能源需求趨勢,對上海市能源戰略的制定實施及經濟社會持續發展都具有重要意義。
為實現“十三五”時期上海工業綠色發展“雙控”目標的完成,本文嘗試從工業企業能源消費、工業固定資產投資項目能源消費及產調與技改能耗減少量3部分驅動因素入手調控上海市工業能源消費總量。采用ARIMA-BP神經網絡組合模型、情景分析法等能耗預測方法,綜合預測上海市工業能源消費總量的需求趨勢。
本文研究共涉及7個變量,分別為上海市工業能源消費、經濟水平(上海市生產總值)、產業結構(三次產業結構能源消費)、能源強度(單位產值能源消費)、能源消費結構(一次能源消費)、四大高載能行業能源消費以及固定資產投資項目新增能源消費量??紤]數據獲得性,本文選取的時間序列跨度為2000—2018年,數據主要來源于歷年《上海能源統計年鑒》、《上海統計年鑒》、固定資產投資項目能評管理系統及統計局官網公布信息,數據資料真實可靠,有據可依[2-3]。
目前在能源消費領域預測方法主要有回歸分析法、灰色預測法及時間序列法等,常用的能源消費預測方法特點,見表1。

表1 能源消費預測模型特點

續表(表1)
能源消費變化本身會受到很多外部因素的影響,如經濟水平(上海市生產總值)、產業結構(三次產業結構能源消費)、能源強度(單位產值能源消費)、能源消費結構(一次能源消費)及固定資產投資項目新增能源消費量等。根據各預測模型的優勢比較分析,并結合上海能源消費數據的特點,本文主要采用預測精度較高的時間序列法、人工神經網絡法、情景分析法等單一方法構建預測模型,并通過誤差絕對值的對比分析,最終確定構建組合模型進行預測,組合預測模型有效提高了單一模型的預測精度,擴大了單一模型適用范圍,且涉及參考的因素指標全面新穎、科學合理、方便快捷,適用于上海市工業能源消費預測。
通過對上海市相關能源消費監測統計部門的調研學習及歷年數據整理分析得知:上海市工業能源消費總量主要由3部分構成,即工業企業能源消費量E1、工業固定資產投資項目新增能源消費E2以及通過產業結構調整及節能技改能源消費減少量E3。則可設上海市能源消費總量主要構成關系式:
E=E1+E2-E3
(1)
通過上式可知:將3部分能源消費量通過不同方法逐一進行預測分析,最終將各部分預測值通過式(1)聯立即可得出上海市工業能源消費總量的預測結果。其中,預測上海市工業企業能源消費E1采用ARIMA-BP神經網絡組合預測模型;預測上海市工業固定資產投資項目新增能源消費E2采用情景分析法;工業產業結構調整及節能技改減少量E3可根據近10年上海市重點用能企業能源審計報告數據統計預算,綜合得出上海市工業能源消費總量的預測結果。
通過實證分析構建多個單一預測模型進行初步預測,并利用模型組合法提高單一模型精確度,最終作出最優化組合模型對上海市工業企業能源消費E1進行預測。
3.1.1時間序列法——ARIMA預測模型
自回歸移動平均模型(ARIMA) 由美國統計學家Box和Jenkins于20世紀70年代提出。ARIMA模型(autoregressive integrated moving average model)被廣泛用于時間序列預測分析,其實質是利用差分運算將非平穩時間序列轉化為平穩時間序列,再建立ARIMA模型并進行預測分析。在模型ARIMA(p,d,q) 中,p為自回歸階數,d為數據差分次數,q為移動平均階數[15]。
ARIMA(p,d,q)模型的基本形式如下:
ΔdXt=Φ1ΔdXt-1+Φt-2ΔdXt-2+…+
ΦpΔdXt-p+εt+θ1εt-1+
θ2εt-2+…+θqεt-q
(2)

選取2000—2018年上海市工業能源消費量作為隨機時間序列模型的樣本數據,將該序列數據導入Eviews 9.0中進行處理,利用ARIMA(p,d,q)模型對上海市工業企業能源消費E1進行預測。
1) 序列平穩性檢驗
對時間序列進行觀察,發現上海市工業能源消費量有明顯的波動趨勢,為非平穩序列。通過對能源消費量序列進行一階差分處理,利用 ADF(augment dikey-fuller)方法進行序列的單位根檢驗,結果見表2。

表2 一階差分序列的ADF檢驗
單位根檢驗結果說明非平穩序列經過一階差分后是平穩的,因此可以對模型定階為d=1。即對一階差分以后的平穩序列可以建立 ARMA(p,q)模型。
2) 模型識別與選擇
選擇AR(p)模型、MA(q)模型還是ARMA(p,q)模型,以及如何確定p、q值,通常利用自相關與偏自相關函數來識別。使用Eviews 9.0統計軟件對序列進行自相關和偏自相關分析,結果見圖1。

圖1 一階差分序列自相關與偏自相關
在自相關圖中,系數顯著不為零的階數為1、4、5;偏自相關圖中,系數顯著不為零的階數為1、2。即通過對多個 ARMA(p,q)模型的不斷嘗試比較,結果顯示 ARMA(4,2)模型自回歸及移動平均部分系數最為顯著,AIC值相對較小,模型擬合效果良好。故可建立上海市工業能源消費的ARIMA(4,1,2)模型,其參數估計結果見表3。

表3 差分序列模型的參數估計
3) 模型預測
運用Eviews9.0軟件對ARIMA(4,1,2)模型進行預測,由圖2可知模型不確定系數為0.4,即說明上海市工業能源消費ARIMA(4,1,2)預測模型擬合效果較好。

圖2 ARIMA(4,1,2)模型估計及預測
根據參數估計結果可得模型的口徑為
ΔXt=Φ1ΔXt-1+Φ2ΔXt-2+Φ3ΔXt-3+
Φ4ΔXt-4+εt+θ1εt-1+θ2εt-2
(3)
(1-B)Xt=-1.165 246(1-B)Xt-1+
0.017 732(1-B)Xt-2+
0.758 934(1-B)Xt-3+
0.232 667(1-B)Xt-4+
εt+1.954 687εt-1+
0.984 390εt-2
(4)
根據上式計算出上海市工業企業能源消費ARIMA(4,1,2)模型在2000—2018年中的預測值和相對誤差絕對值,見表4。

表4 ARIMA(4,1,2)模型能源消費預測
由ARIMA(4,1,2)模型預測結果可以發現:平均相對誤差絕對值為2.302%,擬合效果較好,精度較高。
3.1.2BP神經網絡預測模型
BP神經網絡是指運用誤差逆傳播(error back propagation)算法訓練的多層前饋神經網絡,基于梯度下降(gradient descent)策略,以目標的負梯度方向對參數進行調整,是目前為止最成功且應用最廣泛的神經網絡算法[16]。神經網絡由輸入層、一個或者多個Sigmoid隱層隱含層和輸出層3部分構成,見圖3。隱藏層的存在使網絡可以呈現和計算更加復雜的關聯模式,人工神經網絡的基本方法主要由網絡訓練和測試兩部分組成。

圖3 BP神經網絡預測模型示意圖
本文選取2000—2018年上海市工業企業能源消費量作為樣本數據,將該序列數據導入Matlab中進行網絡訓練,利用BP人工神經網絡模型對上海市工業企業能源消費進行預測。
建立 BP神經網絡模型可分以下幾步進行:
1) 歸一化處理
歸一化處理可避免由于出入向量的物理意義和單位不同對BP神經網絡產生影響。將輸入數據處理為區間[0,1]之間的數據,釆用公式:

(5)
2) 確定網絡層及輸入、輸出層神經元數
BP神經網絡是通過輸入層到輸出層的計算完成的。網絡層數越多需要的訓練時間越多,而訓練速度可通過增加隱含層節點個數來實現,因此選取含一個隱含層的3層神經網絡即可。
輸入、輸出層神經元數與樣本緊密相關,本文利用x(i-1),x(i-2),…,x(i-k)的信息預測i時刻的值,則輸出層神經元數為1;通過確定其他參數值,獲得輸入層神經元數為5,分別為上海市經濟水平、產業結構、能源強度、能源結構、四大高載能行業能源消費情況。
3) 確定隱含層神經元數
隱含層中神經元數的確定,關系到模型是否能夠有效完成映射。在建模時,首先根據公式初步確定隱含層神經元個數,然后對不同神經元數的網絡進行訓練對比誤差大小來確定隱含層的神經元數。通用的隱含層神經元數的確定經驗公式為:
(6)