吳禮斌,李 麗
(安徽財經大學a.統計與應用數學學院;b.數量經濟研究所,安徽 蚌埠 233042)
根據國家能源消耗的相關理論,能源消耗主要來自于原煤、原油、天然氣、水、電、核電和風電。按國家統計局統一分法,將原煤、原油、天然氣看成三大類,將水、電、核電和風電看成一類,在此基礎上,就將中國能源消耗數據看成了一個成分數據。成分數據是一類重要的經濟統計數據,Aitchison[1]對成分數據做對數比變換,把成分單形空間與歐幾里得空間聯系起來,從而使得變換后的數據分析可以采用經典的統計方法,而后在成分數據的單形空間中,定義了其上的加法,乘法,內積及距離。此后王惠文等人提出了球坐標變換,這種變換把成分數據映射到超球平面上。
在預測方面,賈立江[2]等學者利用灰色預測的方法,根據能源消耗的歷史數據的趨勢,推測未來各種一次性能源消耗。該文中的預測方法得到的結果比較理想,給我們提供了一種方法去幫助預測能源消耗結構。
Aitchison在1986年取得了成分數據統計分析方面的突出貢獻。他提出了一套成分數據變換的統計方法。
設成分數據向量

作對數比變換

變換(2)是由Aitchison提出的,稱為非對稱Logratio變換。記
Y=(y1,y2,…,ym-1)T∈Rm-1,其中yj∈(-∞,+∞)(j=1,2, …,m-1),
稱Y為對數比向量。
變換(2)的逆變換為

在王惠文[3]等人的研究中發現選用Logratio變換作為分析變量有許多便利之處。第一,成分數據從原來的m維空間被降低到m-1維空間,可消除原成分數據中的冗余維度;第二,由于 yj(j=1,2,…,m-1)在 (-∞,+∞)間內取值,這使模型的函數選擇更方便;第三,如果成分向量X服從m維加法邏輯正態分布,則對數比向量Y服從m-1維正態分布。第四,成分向量X=(x1,x2,…,xm)T中的各個分量具有對稱性,而Y=(y1,y2,…,ym-1)T的各個分量非對稱且獨立,因此對Y進行回歸建模分析就更能反映成分的特性,所建模型的可解釋性更強。
2002年,王惠文等對成分數據提出廣義球坐標變換的概念,并且把它應用于預測模型中。該法對成分數據進行了非線性降維,從而得到自由度與成分數據吻合的向量數據,并且克服了logration變換中零成分變換的困境。

式(5)表明球變換將m維向量 Z=(z1,z2,···,zm)∈Rm映射到超球面(1,θ2,···,θm)∈R×Θm-1,這 里(θ2,···,θm)∈Θm-1,空間 Θm-1是m-1維的,因此球變換也具有降維的效果。
灰色預測是基于灰色動態模型的一種預測方法,主要建模思想應用微分擬合法構建m階n個變量的微分方程,稱為GM(m,n)模型。由于m越大,計算越復雜,所以一般用灰色模型GM(1,n),本文選用n=1即GM(1,1)模型。

令Z1為X1的均值生成序列Z1=(z1(2),z1(3),···,z1(n))。
其中z1(k)=0.5x1(k)+0.5x1(k-1),(k=2,3,…,n),則GM(1,1)的灰微分方程模型為

其 中 (a,b) 為 參 數 。 記 Y=(x0(2),x0(3),…,x0(n))T,u=(a,b)T,B=(-z1(2),-z1(3),…,-z1(n))T, L=(1,1,…,1)T,B=(B0,L),若 (BTB)-1存在,
之內,則稱數據通過極比檢驗,此時可對數列X0建立模型GM(1,1)。如果極比檢驗不通過,就對數列X0做必要的變換處理,一般取適當的常數 c作平移變換 y0(k)=x0(k)+c,(k=1,2,···,n),得到新數列 Y0=(y0(1),y0(2),···,y0(n)),使其極比落入可容覆蓋的區間I內,然后對數列Y0建立模型GM(1,1)。
假設參考數列X0極比檢驗通過,利用一次累加生成1-AGO,設 X1為 X0的 AGO 序列 ,X1=(x1(1),x1(2),···,x1(n)),其中原始序列的預測值可表示為式(7):

組合預測方法一般首先采用n(n≥2)種不同的單預測模型進行多重預測,再用某一個標準來綜合若干單預測模型,最后利用模型進行組合預測計算。本文根據誤差平方和最小求權重來構建組合預測模型,并進行組合預測計算。求權重系數時,因成分數據是一個向量,預測值與真實值之間的誤差便不能簡單作差,可以通過計算預測值與真實值之間的Aitchison距離平方和最小求得。


預測作為分析的一種方法,給決策者以一定依據來作判斷,預測結果的好壞,直接影響到決策的正確與否。對于灰色預測中成分數據來講,根據成分數的單形空間中的距離定義,通過計算平均Aitchison距離誤差(MSD)進行預測效果評價,平均Aitchison距離誤差越大,預測效果越差。


能源消費總量是指一定時期內,全國各行業和居民生活消費的各種能源的總和。能源消費總量包括原煤和原油及其制品、天然氣、電力,不包括低熱值燃料、生物質能和太陽能等的利用。能源生產總量是指一定時期內,全國一次能源生產量的總和?;诖?,針對我國能源消耗結構分別做非對稱logration變換與球坐標變換,然后對變換后的數據進行單預測,最后進行組合預測,比較分析組合預測的效果。表1給出本文采用的數據。

表1 中國能源消耗結構數據及變換后的數據
表1數據來源于中國統計年鑒,2012年數據根據2012年能源統計公報計算得出的。表1給出了我國(1996~2012)能源消耗結構的成分數據和經過變換后的數據。表1中,x1、x2、x3、x4分別表示煤炭、石油、天然氣與水電、核電、風電三者的比重,對其做非對稱logration變換后的數據為 y1、y2、q2,做球坐標變換后的數據為q2、q3、q4。
基于表1中的數據,分別對 y1、y2、y3、q2、q3、q4做回歸預測,然后反變換到成分數據,得到我國能源消耗結構數據的擬合值。下面是兩種變換選擇的擬合函數。這里的t用年份序列號代替,即1~12
非對稱變換的一元線性回歸函數:

基于組合預測的有關理論,把非對稱logration變換后數據與球坐標變換后數據都進行一元線性回歸進行組合加權,求得組合權重 (β1,β2)=(0.12 ,088)時組合預測的預測誤差平方和最小,表明成分數據經過變換以后,組合預測結果依然比單預測結果較穩定。
一般情況下,灰色預測只是對每組數據進行分別預測,這里對能源消耗結構進行變換之后,把四種結構放在一起作為一個整體,利用灰色預測對四種結構進行預測。即該例我們采用了基于成分數據兩種變換之后再運用灰色系統對變換后的數據進行單預測與組合預測。
基于組合預測的相關理論,把兩種變換后數據進行灰色預測的結果進行簡單的線性組合,求得組合權重ω=(0.04,0.96)時組合預測的預測誤差平方和最小。下面的表2,分別是兩種變換后數據的單灰色預測擬合值和組合預測擬合值。

表2 各種預測方法的擬合值 (單位:%)
盡管表2已經給出了各種預測方法所得到的擬合值,但是每種方法隨著時間的推移,每年各種成分所占的比重的預測值與擬合值之間的誤差大小各不相同,整體的效果很難把握,也不能比較直觀的比較三種預測那種方法預測誤差較小,那種預測效果更好,因此下面給出各種預測值與實際值圖形表示,給出較為直觀的判斷。

圖1 兩種單預測與組合預測擬合圖
圖1給出了單預測與組合預測二的擬合值與真實值圖像表示,通過觀察圖形比較直觀的得出組合預測更接近真實值.但是這種判斷沒有客觀依據,沒有令人信服的依據。在此,根據本文前面部分的介紹,給出了一種判斷預測效果的定量表達,即MSD值。MSD值越大,說明該種預測方法的預測效果越差。

表3 各種預測的Aitchison距離誤差比較
表3給出了6種預測方法的擬合值與真實值之間的Aitchison距離,根據MSD可以看出組合預測優于其生成組合預測的單預測。由表4可以看出組合一預測MSD值為1.0125,是其中最小的,說明該種預測方法的均方誤差最小,即組合一預測效果最佳,利用組合一的預測模型對未來五年各種能源消耗量具體結果見表4所示。

表4 組合預測后五年預測值 (單位:%)
根據表4所預測的結果顯示:在未來5年煤炭的消耗量并沒有發生較大的變化,而其他三種能源消耗量卻發生了較大的變化;石油的消耗量有個明顯的下降,天然氣、水電、核電和風電有了明顯的上升趨勢。表明我國能源需求趨勢于再生能源,減少空氣污染,有利于環境綠化。
根據對我國能源消耗結構預測分析的方法,對我國能源生產結構進行組合預測,最優組合預測結果得到見表5,煤炭生產比例在未來短期內不會有太大的變化,但是其他三類能源生產比例卻有明顯的變化,石油比例下降,天然氣和水電、核電、風電的比例有顯著上升。

表5 能源生產結構預測 (單位:%)
比較表4和表5表明在未來5年內,我國煤炭出現少量的過剩,緩解由于石油供不應求的僵局,而我國的技術水平較低導致新生產的水電、核電、風電等新型能源供過于求,新型能源的使用量欠佳,在未來幾年我國不僅要研制新型能源的生產還要注重新型能源的有效消費方法。
本文主要結合成分數據的性質,利用成分數據的性質,把四種能源每年的的生產比重與消耗比重結合在一起,看成一個整體,這樣間接地包括四者之間的關系,該方法比單獨地對某種能源的單一預測,不考慮四者之間存在的關系的方法更具有信服力。關于能源消耗結構和生產結果進行組合預測的,把兩者進行比較可以對未來能源生產結構有目標的調整,防止有的能源生產過量有的能源生產不足導致兩種能源之間的再轉換,節約能源的消耗,減少因能源之間的再轉換帶來不必要的污染,從某種程度上看,這也是間接減少污染,節約能源。
在方法上,目前來說,對于能源消耗結構這樣的成分數據的單預測模型研究的很多,但是對于成分數據的組合預測模型的研究少之又少。這里是對中國能源消耗結構的成分數據的組合預測分析,同時運用Aitchison距離對組合預測誤差與單預測誤差做了比較。從具體的表和圖中可以看出組合預測的優越性。把組合預測技術應用到能源消耗結構數據的預測中,不僅可以提高能源消耗結構數據的預測精度,而且增強了模型的適用性。組合預測技術發展比較快,這里運用的組合預測技術比較簡單,只是運用了三種單預測模型,求解權重的方法比較簡單。在組合預測中,有很多種權重系數求解的方法,而對于能源消耗結構的成分數據的組合預測研究來說,有沒有一種方法可以在統計意義下做到最好,值得我們深入探究。
[1]Aitchison J.The Statistical Analysis of Compositional Data[M].London:Chapman and Hall,1986.
[2]賈立江,王紹華,范德成.考慮能源消耗對經濟靈敏度的能源結構預測[J].統計與決策,2012,(15).
[3]曹飛.陜西省能源消費的組合預測[J].環境科學與技術,2013,36(5).
[4]王惠文,黃薇.成分數據的線性回歸模型[J].系統工程,2003,21(2).