趙艷秉
(中國地質大學江城學院,湖北武漢430200)
利用虛擬變量對季節指數的估計*
趙艷秉
(中國地質大學江城學院,湖北武漢430200)
利用季節虛擬變量建立回歸模型,通過季節虛擬變量的參數估計間接地估計季節指數,并且利用模型進行了一些傳統的季節指數方法無法進行的推斷統計,是一種分析季節指數和季節變動的新思路.但是,由于時間序列數據直接應用到回歸模型會與古典假設不相符合,在參數估計以及推斷檢驗中就需要采用一些新的方法,這也正是利用季節虛擬變量估計季節指數時存在的問題,這個問題還有待于以后解決.
虛擬變量;季節指數;回歸模型
在現實的經濟生活中,由于受氣候條件、生產條件、節假日以及居民風俗習慣等因素的影響,使得一些經濟現象每年反復出現有規律的周期變動,而且每年變動的規律都大體相似,這種變動就是我們所說的季節變動,Franses認為“通常,當在某個季節的觀測值具有與其他季節的觀測值顯著不同的特征時,我們稱之為季節性”[1].雖然季節性是時間序列的四個重要特征之一,但大多數研究者在根據時間序列作長期趨勢分析時都將季節性當作一種“數據污染”,因而在對時間序列數據作進一步分析之前先將這種“數據污染”剔除,這也就是所謂的“季節調整”,而季節調整的方法經過研究者的不斷改善目前也發展到了X-12-AR IMA調整方法,并有相應的計算機調整程序.但實際上,季節性變動作為時間序列的四個重要特征之一,其意義不僅僅在于只是被當作干擾性因素被剔除,季節變動本身能夠給我們提供很多重要信息,因此,Miron(1996)就堅決認為應該對季節性建模而不是將它們從數據序列中剔除.[2]
對季節性建模,無非就是要估計季節變動的大小,也就是估計季節指數.通過季節指數的估計,我們就能得到對季節性以及季節變動大小的精確的估計與預測.一方面,我們可以在對過去的經濟活動于不同季節的觀測值的基礎上,將這些季節變化特征精確地測度出來;另一方面,又能對未來的經濟活動的季節性變動有一個較好的判斷(或預測).但存在的問題是,目前的對這種測度或預測的研究絕大部分是一些描述性的統計分析,事實上,很多時候我們希望能夠對季節指數進行一些推斷統計,以便更好地對季節性變動作出判斷,而利用季節虛擬變量建立回歸模型,不但可以通過對虛擬變量的參數估計間接地得到季節指數的估計值,同樣可以對季節性本身進行一些推斷統計.
在對季節指數的計算方法上,基本的思想是以各季的觀測值的平均數比上所有觀測值的總平均值,因此,各個季節的季節指數的平均值的均值應該是100%,而每個季節的季節波動的大小則通過該季節的季節指數與均值(也就是100%)的偏差程度來度量.而具體在計算各季平均值與總體平均值時,會根據數據特征有不同的方法,下面稍加介紹.
設觀測到的n年、m季的時間序列數據為{xi,j},i=1,2,…,n,j=1,2,…,m(下同).平均數季節指數法的主要思想是計算各年同季節(月、季度等)的平均值作為各季節的代表值,再計算出所有觀測數據的平均值,作為年度代表值,前者與后者之比即為各季節的季節指數,用公式表示為:


這種方法對季節時間序列有嚴格的假設,那就是原序列沒有明顯的長期趨勢和季節波動,因此這種方法在應用上非常有限.
在通常情況下,時間序列由四個主要因素構成,分別是長期趨勢T,季節變動S,循環波動C和不規則波動I,一般我們采用乘法模型構造一個完整的時間序列分解模型,即Yi=Ti×Si×Ci×Ii,在對含長期趨勢的季節時間序列進行處理時,一般并不直接將T和C剔除而得到S,首先通過移動平均消除季節波動S和不規則波動I,再將原序列Y除以移動平均趨勢項T×C,便可得到季節變動S和不規則變動I的相對數,再將這一相對數加以平均即可去掉不規則變動的影響,得到各個季節的相對數,即季節指數.在這一思想的基礎上,對長期趨勢的處理,有移動平均法和最小二乘法,所以在最終的季節指數也有所不同,下面分別加以介紹.
1.2.1 移動平均趨勢剔除法
移動平均趨勢剔除法的主要步驟如下.
首先,計算各個季度的移動平均數,由于季度周期(一般為4或12)是偶數,因此需再計算一次相鄰兩個數的平均才能使平均數位置對于各季度.
然后,用原序列數據除以趨勢值即可得到季節變動和不規則變動的相對數,適當調整后即可.
最后,利用平均數法去掉季節變動和不規則變動相對數中的不規則變動,即得到了季節指數.
1.2.2 最小二乘趨勢剔除法
這種方法與上一方法只是在趨勢的剔除上有所區別,用的是最小平方法求出一條趨勢線,求出相應的趨勢值,再從原序列中消除此趨勢,得到季節變動與不規則變動的相對數后,利用平均數法消除不規則變動后即可得到季節指數.在趨勢線的選擇上,利用估計標準誤差選擇最合適的趨勢線.
1.2.3 分解季節指數法
分解季節指數法的主要思想是將季節性時間序列看成是趨勢性和季節性的乘積,即Yi,j=Ti,jSi,j(i和j分別為年度和季度的下標).在前面幾種方法中,季節指數都是不變的,但在分解季節指數法中,季節指數和趨勢值一樣,都是時序t的回歸.這種方法中所包含的季節指數的具體求法是:
首先,根據原季節時間序列的時序圖,利用合理的季節趨勢模型求出各時期的趨勢估計值Tt;然后,計算各時期的季節相對最后,將不同季節的季節相對數分組,用每組季節相對數作因變量,年度為自變量,建立合理的模型,估計各年度各季節的季節指數Sj.
利用該模型可以對各個年度不同季節的季節指數進行估計,與前面方法得到結果不同的是該方法得到的同一季節的季節指數在不同年度是不同的.
溫特斯季節性指數平滑法是20世紀60年代初由溫特溫特斯(W inters)研究制定出來的一種較高級形式的指數平滑方法.這種方法最突出的優點是對具有趨勢變動和季節變動兩種因素的時間數列,分別對每種因素進行指數平滑,然后將各種因素的平滑結果結合起來,對原時間數列進行預測.這就擴大了指數平滑方法的應用范圍,提高了對兼有趨勢和季節變動兩種因素時間數列預測的準確性.季節性指數平滑方法有三個基本平滑公式.三個平滑公式分別對時間數列的三種因素進行.它們是:

(α,β,γ為平滑系數,需要預先設定)
通過第三個公式則可對季節指數進行測定.這種指數測度形式是將時間序列中的季節性和趨勢性結合起來考慮,而不是分開進行測度,體現了季節時間序列的各個因素的內部結構.
我們知道,季節指數實際上只是一種相對數,描述的是季節的不同對時間序列的影響,也就是說描述的是季節的重要性.因此我們按照回歸的思想,將原始數據作為因變量,以代表時間順序的年度數t為自變量描述序列的趨勢性變化的大小,同時將季節作為自變量去描述序列所受到的季節影響,季節指數即為季節變量前的估計參數.由于在回歸模型中,我們可以很容易地得到參數估計量的一些統計性質,因此,就得到了季節指數的一些統計性質.這種方法的主要步驟是,首先將長期趨勢從原序列中采用減法法則或乘法法則去掉,對剩下的純季節成分建立以季節變量為自變量的回歸模型.在將季節變量這類定性變量轉化為定量變量時,可以有兩種不同的方式,因此,在模型與估計上也稍有區別.
2.1.1 模型的構造
首先,根據原序列的時序圖的特點建立一個以時期t為自變量的模型,這個模型可以是線性模型,可以是非線性模型,我們以Tt=f(t)+μ,設每一期的估計值為T^t(t=1,2,…,n),這樣得到的實際上是一個時間序列的趨勢值.
然后,用原序列減去(或除以)T^t,得到新序列Y′t=Yt-T^t,這個新序列主要包括原序列的季節成分和不規則變動部分.
最后,對新序列建立以季節(這里的季節以季度為例)變量為自變量的模型,在將季節變量定量化時,采用下面的虛擬變量的形式:

所以,得到的季節虛擬變量模型為(我們處于研究目的在此假設模型服從古典假設,但事實上模型與古典假設有很多違背的地方):

整個包含長期趨勢和季節變化的模型為:

從模型中我們可以看出,β0描述的是第四季度對時間序列的影響,β0+β1、β0+β2、β0+β3分別描述的是第一、二、三季度的影響.因此四個季度的季節指數的計算公式分別是:

通過β0,β1,β2,β3的統計性質,我們即可得到S1,S2,S3,S4的統計性質.
2.1.2 模型的檢驗
通過求回歸模型的參數估計量的方式求季節指數的估計量是求季節指數的一種新的方式,通過這種方式,我們既可以求每個季節的季節指數的估計量,還可以對參數的顯著性進行檢驗,參數的顯著性檢驗實際上就是時間序列數據是否有顯著的季節變動的一種方法.
在一般情況下,季節性可以從簡單的時間序列圖中輕易地發現,但有些時候,判斷一個時間序列是否具有季節性可能需要其他一些辦法,例如當時間序列波動得異常厲害時,季節性高峰和低潮就不一定能從其他波動中區分開來,這時可以利用該序列原始數據的自相關函數圖來直觀地對是否存在季節性進行判斷.通過回歸參數顯著性檢驗的方法既可以檢驗不同季度之間是否有顯著變化,還可以檢驗整個序列的某個季度是否有一些季節變動、序列是否存在長期趨勢性.下面給出的是不同目的下的檢驗.
1)對整個時間序列是否存在顯著季節變化的檢驗
原假設H0◇βi=0,i=1,2,3,4
備選假設H1◇βi中至少一個不為0
我們利用偏F檢驗構造統計量:

式中SSE1(R)為在原假設成立的條件下擬合后的簡約模型Yt=f(t)+ξ的殘差平方和,SSE(F)為全模型Yt=f(t)+β0+β1Q1t+β2Q2t+β3Q3t+ξ的殘差平方和.利用統計量F的觀測值與臨界值相比較來判斷接受H0還是H1.
2)對相鄰的兩個季度之間是否有顯著季節變動的檢驗
對第一和第二季度之間是否存在顯著的季節變化的檢驗,原假設為H0◇β1=β2,備選假設為H1◇β1≠β2,檢驗所用的統計量為

式中SSE2(R)為原假設成立條件下擬合后的簡約模型Yt=β0+β1(Q1t+Q2t)+β3Q3t+ξ的殘差平方和.檢驗方法同上.
對第二和第三季度之間是否存在顯著的季節變化的檢驗,原假設為H0◇β2=β3,備選假設H1◇β2≠β3,檢驗所用的統計量為F=(SSE3(R)-SSE (F))/SSE(F)~F(1,n-4),其中SSE3(R)為原假設條件成立下擬合而成的簡約模型Yt=β0+β1Q1t+β2(Q2t+Q3t)+ξ的殘差平方和.檢驗方法同上.
對第三和第四季度之間是否有顯著季節變化的檢驗,原假設為H0◇β3=0,備選假設為H1◇β3≠0,檢驗所用的統計量為與前面的檢驗不同,這個檢驗是t檢驗(當然,t檢驗也可以轉換為偏F檢驗).
對第四和第一季度之間是否有顯著變化的檢驗,原假設為H0◇β1=0,備選假設為H1◇β1≠0,檢驗所用的統計量為
當然,我們也可以對一、三季度之間和二、四季度之間是否存在季節變化進行檢驗,但這兩個檢驗的實際意義不是很大,對二、四季度是否有顯著變化的檢驗,利用上面的模型,就是對假設β2=0的檢驗;而對一、三季度之間是否有顯著變化的檢驗,則是對線性約束條件β1=β3的檢驗.
3)對整個時間序列是否存在顯著長期趨勢的檢驗
原假設為H0◇f(t)=0,備選假設為H0◇f(t)≠0,實際上就是對前面的長期趨勢模型Tt=f(t)+ μ的顯著性的檢驗.
在將季節變量定量化時,還可以采取正弦曲線模型,其模型為:

在這個模型中,β0+β1描述的是第一季度對序列的影響,β0-β2、β0-β1、β0+β2描述的分別是第二、三、四季度對序列的影響.四個季度的季節指數的表達式分別是:

其檢驗方法與虛擬變量模型是類似的,在此不再加以說明.
利用季節虛擬變量建立回歸模型的方法,為我們提供了一種對季節指數和季節變動進行推斷的新思路、新途徑,但在實際應用中有許多要解決的具體問題.
首先,時間序列數據在一般情況下是不能滿足古典假設,因此,在對模型的虛擬變量的參數估計中,OLS方法是失效的;同時,相關的統計檢驗也是建立在古典假設的基礎上,需要加以改進.
其次,這種方法一般只適合于與自然季度(四個季度)完全吻合的季節變動的分析,而對于其他一些季節變動,比如傳統節日、股票市場的一些特殊現象則難以估計.
第三,該方法雖然能夠對以月度數據為基礎的季節變動的季節指數進行估計,但這種情況下要設立至少11(即12-1)個虛擬變量,對所觀測的序列的長度有較高的要求,如果序列長度不夠,則估計效果很差,甚至無法估計.
總之,季節虛擬變量回歸模型給出了估計季節指數和分析季節變動的一種新思路,只是這種方法在具體的應用中要適當加以改進.
[1]菲利普·漢斯·弗朗西斯.商業和經濟預測中的時間序列模型[M].封建強,譯.北京:中國人民大學版社,2002.
[2]Miron J A,Beaulieu J J.What Have Macroeconomists Learned about Business Cycles form the Study of Seasonal Cycles?[J].The Review of Economics and Statistics, 1996,78(1):54-66.
[3]賈俊平.統計學[M].第3版.北京:中國人民大學出版社,2007.
[4]W inters P.Forecasting sales by exponentiallyweightedmoving averages[J].Management Science,1960,6(3):324-342.
Use of D ichotomous Variables on the Est imated Seasonal I ndex
ZHAO Yan-bing
(Jiangcheng College,China University of Geosciences,Wuhan Hubei 430200,China)
The paper sets up a regression model by use of dichotomous variable,estimates the seasonal index indirectly by the parameter eatimation of seasonal dichotomous variable.W ith themodel some deduced statistics can be done,which traditional seasonal index eatimatingmethods cannot do.This is a new method and thought to analyze seasonal variation.But because of time series data can not be used in regression model owning to t ime series data not fit to th classic hypothesis,we should use a new method in parameter estimation and in deduction testing. This is the very problem produced when estimating seasoanl indexwith dichotomous variable.And it remains to be solved later.
dihotomous variable;seasonalindex;regression model
book=1,ebook=387
F224.0
A
1673-2103(2010)05-0024-04
2010-07-20
趙艷秉(1980-),女,山西忻州人,助教,碩士,研究方向:數量經濟學.