【摘要】R語言是一種自由的軟件編程語言與操作環境,在統計數據分析、數學建模,大規模計算等方面具有廣泛的應用。本文以我國財政收入的歷史月度數據為例,利用時間序列分析方法,建立相應的時序模型,借助于R語言對其進行處理和分析,從而得到財政收入的短期預測和發展趨勢的統計推斷。
【關鍵詞】財政收入 時間序列模型 R語言 回歸分析
【基金項目】江蘇省高校自然科學研究面上資助項目,項目號:18KJB110003。
【中圖分類號】G64 【文獻標識碼】A 【文章編號】2095-3089(2018)44-0223-02
1.問題的提出
財政收入,是指政府為履行其職能、實施公共政策和提供公共物品與服務需要而籌集的一切資金的總和,其表現形式為政府部門在一定時期內(通常是一年)所取得的貨幣收入[1]。財政收入水平,在很大程度上關系到一個國家的穩定與發展程度,因此,對一個國家的短期財政收入情況進行合理的預測對該國政府職能的履行具有重要的意義。短期預測就是人們根據事物過去發展變化的客觀過程和某些規律性,運用各種定性和定量分析方法,對事物近期可能出現的趨勢和可能達到的水平所進行的推測[2]。本文將借助于R語言[3-4],對我國財政收入歷史數據建立相應時間序列模型,并對財政收入情況進行短期預測,并做出合理的評價。
2.數據的搜集與處理
本文在國家統計局數據中心采集了2010年1月至2017年12月的政府財政收入數據(表1,單位:億元)。首先對上述96個月度數據進行描述性統計分析,利用R語言ts ( )函數和plot( )函數得到圖1,可以看出,從2010年1月至2016年12月具有明顯的線性增長趨勢,同時該組數據有以12個月為一個周期的季節變動,并且波動幅度隨著趨勢發生增長的變化。
3.建立經濟數學模型
3.1建立季節性交乘趨向預測模型[5]
首先對月度時間按照1到96排序作為自變量X,以財政收入Y為因變量,建立回歸模型,則財政收入Y與時間變量X之間的關系為:
這里?茁0+?茁1X表示Y隨X的變化而發生線性變化的部分, ?茁0,?茁1分別是截距項和回歸系數,?著是隨機誤差項,假設(x1,y1),(x2,y2),...,(xn,yn)是來自于(X,Y)的一組觀測值,即2010年1月至2016年12月的財政收入數據,那么,上述一元線性回歸模型可以表示為:
其中xt為時間編號,2010年1月記為1。利用R語言中的lm( )函數,可得到?茁0和?茁1的最小二乘估計0=7073.107, 1=81.625,則直線趨勢模型可記為:
接下來,需要對原時間序列數據剔除趨勢,得到新的序列數據,即,考慮季節調整因子,通過VA=yt/Vt,得到各月的季節調整因子FA1(季節指數,表2),因此,季節性交乘趨向模型可表示為:
最后評估模型的擬合和預測情況,通過代入2017年1月至2017年12月的月份編號,應用此模型對2017年1月至12月的財政收入數據進行預測,結果見表3。平均絕對誤差(Mean Absolute Deviation ,簡稱MAPE),是所有單個觀測值與算術平均值的偏差的絕對值的平均,2010年1月至2016年12月的MAPE值為4.77(%),而2017年月度數據的MAPE值為4.38(%)。
3.2建立線性平滑季節性交乘預測模型[5]
由圖1所示的時間序列,其線性趨勢并不是沿著一條固定直線變化,因此可以考慮采用線性平滑模型擬合其變化趨勢,這里仍選取2010年1月至2017年12月的數據,利用R軟件的lm( )函數,采用雙指數平滑法建立模型:
Wt+m=14798.02+61.51396m
這里m是超前預測的期數,2017年1月記為1,則m=1,2,...,12。類似于模型3.1,仍然需要對原數列剔除趨勢,得到新序列WA=y/Wt,然后再進行季節調整,得到各月份的調整因子FA2(表2),則線性平滑季節交乘模型為:
YBt=(14798.02+61.51396m)·FA2
計算2010年1月至2016年12月得到的MAPE值分別為4.56(%),這表明模型對歷史月度數據的擬合效果還可以,再利用該模型對2017年1月至12月做預測(表3),得到這一時期的結果為4.31(%),進一步的對2018年的財政收入進行預測,結果見圖2。
四、模型的評價與結論
本文利用時間序列的統計方法分別建立兩種數學模型,借助于R軟件,對國家財政收入的短期預測進行了研究,結果顯示,以上兩種模型均可以有效的擬合帶有周期變化的時間序列數據;并且可以做到較好的預測效果。R軟件可以利用各種軟件包,靈活處理這些數據,對建立數學模型,解決實際問題,具有很大的幫助。
參考文獻:
[1]財政收入.東方財富網 [引用日期2013-05-10].
[2]張從軍. 經濟應用模型[M].復旦大學出版社, 2008.
[3]薛毅,陳立萍.統計建模與R軟件[M].清華大學出版社, 2007.
[4]JonathanD.Cryer, Kung-SikChan. 時間序列分析及應用:R語言[M].機械工業出版社, 2011.
[5]馬佳羽,韓兆洲.復雜季節時間序列模型研究[J]. 統計與決策, 2017(6):27-30.
作者簡介:
王濤(1983年9月-),男,江蘇豐縣人,博士研究生,研究方向:概率統計。