劉茂茹,王豐效
基于GM(1,1)-神經網絡模型的安徽省財政收入預測
劉茂茹,王豐效
(喀什大學 數學與統計學院,新疆 喀什 844000)


財政收入是衡量一國政府財力的重要指標,政府在社會經濟活動中提供公共物品和服務的范圍和數量,在很大程度上決定于財政收入的充裕狀況,而地方財政是國家財政的重要組成部分,對財政收入進行合理的預測能夠有效了解地方經濟發展狀況.關于地方財政收入及其影響因素,文獻[1-4]討論了影響因素在時間或空間上改變時地方財政的變化情況,并提出地方財政收入結構優化的建設性思路,探求合理的收入制度.自鄧聚龍教授提出灰色系統理論以來,灰色預測模型及其改進模型在經濟領域得到了廣泛應用,主要因其能夠在數據量少、信息貧的情況下進行較為準確的預測,對灰色預測模型的改進和應用已被眾多學者所關注[5-7].神經網絡模型預測方法被廣泛應用于眾多領域[8-11],將灰色預測模型與神經網絡預測模型進行組合預測能夠得到較為準確的預測結果,眾多學者對于此組合預測模型也有著相應的研究[12-14].


相關數據來源于安徽省統計年鑒[15-24].
2010—2019年安徽省財政收入及其影響因素的相關數據見表1.

表1 2010—2019年安徽省財政收入及其影響因素的相關數據
數據質量分析是數據探索的前提,不可信的數據是無法得出可信的結論的.數據質量分析是以評估數據的正確性和有效性為目標,本文通過Python軟件對收集到的數據進行一系列數據質量分析,從而判斷用來預測安徽省財政收入的各影響因素是否有效.
1.2.1 缺失值分析 判斷變量中是否含有缺失值,無論是數據中記錄的缺失還是某個字段信息的缺失,都會影響分析結果的準確性.經Python代碼運行,發現安徽省影響財政收入的數據變量中不含有缺失值.


圖1 有異常值的箱線圖

圖2 修正過后的箱線圖
1.2.3 重復數據分析 重復性數據分析也是數據質量分析的一個關鍵要素,通過判斷安徽省財政收入影響因素中變量之間是否有重復性數據,來判別數據質量是否影響預測.經Python代碼分析,發現數據中并無重復性數據,符合數據質量要求.
把握數據整體的性質對于數據分析是否成功來說是至關重要的.使用統計量來檢查數據特征,主要是檢查數據的集中程度、離散程度和分布形狀,通過這些統計量可以識別數據集整體上的一些重要性質,對后續的數據分析,有較大的參考作用.本文采用描述性統計分析和相關性分析了解數據的結構與性質.
1.3.1 描述性統計分析 對數據進行描述性統計分析,結果見表2.

表2 描述性統計分析結果


圖3 熱力圖
Lasso回歸法的基本思想是在回歸系數的絕對值之和小于一個常數的約束條件下,使殘差平方和最小化,從而能夠產生某些嚴格等于0的回歸系數,得到可以解釋的模型,其數學表達式為


設原始數列為

經1-AGO后可得到
緊鄰均值生成為


最終得到灰色預測模型為
將經過Lasso特征選擇之后的變量代入編譯好的灰色預測模型中進行預測,預測出2020—2021年各影響因素的值(見表3).

表3 2020—2021年各影響因素灰色模型預測結果
為了了解模型是否通過檢驗,預測后采用后驗差檢驗法判斷模型精度.經Python代碼運行,得到各影響因素的模型精度都為“一級(好)”,即模型通過檢驗.
2.2.2 神經網絡預測模型 神經網絡結構包含輸入層、隱藏層(可以有多層)和輸出層.每一層當中包含很多存儲數據的節點,稱之為神經元,每一個神經元都與下一層所有神經元連接,每一對連接都有對應的一個參數.這種連接維持了神經元之間信息的傳遞,信息的傳遞其實就是一個數學計算過程.前向傳播過程輸入信息由輸入層→隱藏層→輸出層,后向傳播過程更新信息由輸出層→隱藏層→輸入層.預測時,輸入原始數據信息到輸入層,經過中間層的數學計算,得到輸出,即財政收入;訓練時,先進行前向傳輸預測得到財政收入輸出,然后根據輸出與實際的差距,進行后向傳播,這個過程會調整網絡之中的參數,從而使得下一次預測更為準確.


表4 2010—2021年安徽省財政收入神經網絡預測
由表4可以看出,已知的實際值與經過預測后得到的預測值相差較小,可認為模型擬合程度較好,經過灰色模型-神經網絡模型組合預測得到2020年安徽省財政收入為64 480 128萬元,2021年安徽省財政收入為70 866 816萬元.

[1] 劉明慧,黨立斌.地方財政收入的合意性:基于結構視角的分析[J].宏觀經濟研究,2014(8):10-20.
[2] 王克強,胡海生,劉紅梅.中國地方土地財政收入增長影響因素實證研究:基于1995—2008年中國省際面板數據的分析[J].財經研究,2012,38(4):112-122.
[3] 尚元君,殷瑞鋒.對地方政府財政收入能力影響因素的實證分析[J].中央財經大學學報,2009(5):12-15,42.
[4] 蘇永軍.中國地方政府收入行為與地方收入制度優化研究[D].上海:復旦大學,2006.
[5] 王豐效.修正GM(1,1)模型在銷售量預測中的應用[J].渭南師范學院學報,2003(5):10-11,58.
[6] 楊華龍,劉金霞,鄭斌.灰色預測GM(1,1)模型的改進及應用[J].數學的實踐與認識,2011,41(23):39-46.
[7] 盧懿.灰色預測模型的研究及其應用[D].杭州:浙江理工大學,2014.
[8] 徐黎明,王清,陳劍平,等.基于BP神經網絡的泥石流平均流速預測[J].吉林大學學報(地球科學版),2013,43(1):186-191.
[9] 范中洲,趙羿,周寧,等.基于灰色BP神經網絡組合模型的水上交通事故數預測[J].安全與環境學報,2020,20(3):857-861.
[10] 姚蘭,戎荷婷,褚超,等.基于人工神經網絡的工業供應鏈銷售預測方法[J].計算機與數字工程,2021,49(10):2057-2061,2144.
[11] 顧軍華,宋麗娟,宋潔,等.基于改進BP神經網絡的稅收收入預測模型[J].河北工業大學學報,2003(1):39-43.
[12] 王豐效.組合預測模型預測精度的貼近度評價法[J].統計與決策,2013(8):70-72.
[13] 王豐效.GM(1,1)組合預測模型及其應用[J].統計與決策,2006(21):142-143.
[14] 陳淑燕,王煒.交通量的灰色神經網絡預測方法[J].東南大學學報(自然科學版),2004(4):541-544.
[15] 安徽省統計局.2011[M].北京:中國統計出版社,2011.
[16] 安徽省統計局.2012[M].北京:中國統計出版社,2012.
[17] 安徽省統計局.2013[M].北京:中國統計出版社,2013.
[18] 安徽省統計局.2014[M].北京:中國統計出版社,2014.
[19] 安徽省統計局.2015[M].北京:中國統計出版社,2015.
[20] 安徽省統計局.2016[M].北京:中國統計出版社,2016.
[21] 安徽省統計局.2017[M].北京:中國統計出版社,2017.
[22] 安徽省統計局.2018[M].北京:中國統計出版社,2018.
[23] 安徽省統計局.2019[M].北京:中國統計出版社,2019.
[24] 安徽省統計局.2020[M].北京:中國統計出版社,2020.

LIU Maoru,WANG Fengxiao
(School of Mathematics and Statistics,Kashi University,Kashi 844000,China)


A
10.3969/j.issn.1007-9831.2022.06.004
1007-9831(2022)06-0017-06
2021-12-13
國家社會科學基金項目(11XTJ001)
劉茂茹(1998-),女,安徽合肥人,在讀碩士研究生,從事金融統計與風險管理研究.E-mail:411695188@qq.com
王豐效(1965-),男,陜西禮泉人,教授,從事應用概率統計研究.E-mail:fxw-hz@126.com