[摘要]探討了一類統(tǒng)計樣本的周期性與波動性成立的條件下,建立分段線性回歸方程,以此方法來進行分析預測。該方法較用全系列數(shù)據(jù)建立的一元線性回歸方法誤差更小,適合于經(jīng)濟活動中典型的時序列周期性樣本為基礎的預測。
[關鍵詞]預測 時序列 周期性樣本 分段回歸
一、引言
以時序列方法分析經(jīng)濟活動現(xiàn)象時,一般是以日、月、季、年等為統(tǒng)計單位,對觀察大量統(tǒng)計數(shù)據(jù)時,發(fā)現(xiàn)其中有些統(tǒng)計對象存在一定的周期現(xiàn)象,而在一個周期內又存在一定的波動性,如交通量、旅游人數(shù)、銷售量等。
利用統(tǒng)計數(shù)據(jù),建立適當預測模型,有線性回歸、功率譜分析、逐步回歸、長周期波以及神經(jīng)網(wǎng)絡方法等。但是譜分析方法和神經(jīng)網(wǎng)絡等方法要求時間序列數(shù)據(jù)到達觀測次數(shù),樣本數(shù)少則擬合不好,且要求數(shù)據(jù)符合靜態(tài)要求。簡單的線性回歸方法對明顯周期波動的時序列樣本預測存在較大的誤差。在其它因素沒有較大變化的前提下,本文提出時序列樣本的周期性與波動性成立時,建立分段回歸方程的預測方法。
1.時序列樣本的周期性分析
首先,觀測樣本的周期性,如圖1。估計周期的時間長度。將樣本按估計的周期分段,假設有l(wèi)段,如圖2。檢驗各段相互之間的相關性。其中第Xi、Xj段之間的相關系數(shù)為:
式1中,δxi、δxj為Xi、Xj段的標準差;n為每段觀測值數(shù)目,各段相等。
樣本的周期性可以由各樣本段的線性相關顯著性來檢驗。給定顯著性水平α,由t分布確定接受各段之間為線性相關假設所必須達到的相關系數(shù)為rα,當任意兩隊樣本的相關系數(shù)r>rα時,接受周期性假設,說明樣本呈現(xiàn)周期性,可以進行下一步處理。當r≤rα時,拒絕周期性假設,分段回歸方法將因為誤差增大而失效。
二、建立分段回歸方程
根據(jù)對應周期內各段在t1+(i-1)t周+Δt時點的時間ti和觀測值,分別建立n個一元線性回歸方程。
三、預測方法
設預測時點為T’,確定T’對應周期中的時點Δt和周期序數(shù)i:
i=(T’-Δt -t1)/t周(式5)
選擇Δt對應的第k個回歸方程,預測值為Y’,則有:
Y’=αk+βk i。 (式6)
四、模型顯著性檢驗
通過歷史數(shù)據(jù)與模型的預測計算值對比,對按分段法建立的模型進行總體均值一致性檢驗、方差檢驗和擬合優(yōu)度檢驗,以確定模型與實際情況相吻合。
1.總體均值一致性檢驗:
假設,給定顯著水平α,
(式中1、2分別指代預測值樣本和實際值樣本,下同)查t分布表,當時,接受原假設H0。
2.方差檢驗:
假設,給定顯著水平為α,
查F分布表,當,接受原假設H0。
3.擬合優(yōu)度檢驗:
假設H0:分段回歸方程符合實際規(guī)律,計算:
給定顯著水平為α,查X2分布表,當x2≤時,接受原假設H0,即分段回歸方程符合實際規(guī)律。
五、算例
數(shù)據(jù)來源于國家統(tǒng)計局發(fā)布的全社會客貨運量資料中的鐵路月進度指標(客貨合計)。假設鐵路客貨運輸需求增長速度與鐵路運力增加投入速度基本穩(wěn)定。預測2007年鐵路客貨發(fā)送量。
1.驗證月度運量的周期性
觀察發(fā)現(xiàn)客貨運量的總體趨勢是增加的,在每一年內不同月份有些許增減。按年度對比時,發(fā)現(xiàn)每年的運量曲線線形基本相似,以年度為周期,反復出現(xiàn),呈現(xiàn)周期性,如圖3。按式2,取顯著水平為α=0.05,計算各年度數(shù)據(jù)間的相關系數(shù),均大于rα,各年度按月份的統(tǒng)計數(shù)據(jù)呈現(xiàn)相關性。由于各個月份之間的運量不同,表現(xiàn)為波動,該波動具有規(guī)律,即以年為周期,呈周期性。以其它時間長檢驗,其周期性不成立。
2.預測模型的建立與擬合效果檢驗
按對應月份分別建立一元線性回歸方程,其中自變量t為年度值。通過2006年運量的實際值與模型對2006年運量的回歸計算值對比,進行檢驗。通過樣本總體均值一致性檢驗、方差檢驗、擬合優(yōu)度檢驗,說明按月份分別建立回歸方程符合實際規(guī)律。
3.預測2007年的鐵路客貨發(fā)送量
根據(jù)分段回歸方程,預測2007年1月的運量為:Y(2007年1月)=0.248×2007-494.174=3.562億噸。同理預測其它各月份的發(fā)送量依次分別為:3.46、3.59、3.57、3.76、3.62、3.83、3.95、3.70、3.76、3.78和3.80億噸。如圖4,可得出2007年發(fā)送量的預測值與歷年的實際值具有相似的波動性。
六、結語
歷史數(shù)據(jù)反映了人們需求的周期波動性,是安排生產(chǎn)與經(jīng)營活動的關鍵。比較用全系列數(shù)據(jù)的一元線性回歸方法與分段回歸方法的預測值與實際值的偏差,說明分段回歸方法遠遠優(yōu)于前者。分段回歸方法適合于呈一定周期性的樣本,簡便實用,其預測結果能較好地還原樣本的波動性,失真較小,能反映樣本的周期性與波動性。
參考文獻:
[1]吳翊:應用數(shù)理統(tǒng)計.國防科技大學出版社[M].北京1995
[2]任德亮等:建立鐵路貨運量季節(jié)性預測模型的研究.鐵道運輸與經(jīng)濟[J].第26卷第8期(65~67)
[3]陳友龍等:基于譜分析方法的中國旅游業(yè)波動周期研究.湖南社會科學[J].200512(103~107)
[4]徐梅等:經(jīng)濟波動隨機時間序列模型的比較研究.預測[J].2001年第6期(56~60)
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。