楊世娟,盧維學,方輝平(黃山學院 數學與統計學院,安徽黃山245041)
灰色系統與BP神經網絡組合模型及其應用
楊世娟,盧維學,方輝平
(黃山學院 數學與統計學院,安徽黃山245041)
影響財政收入的因素有很多,各因素之間信息重疊的現象較嚴重,文章通過逐步回歸選擇了影響財政收入的幾個顯著因素。又鑒于灰色系統對小樣本數據預測的優良特性,對每個選定的影響因素建立灰色預測GM(1,1)模型,得到各因素2015年、2016年的預測值。運用BP神經網絡模型對1995—2014年數據進行訓練,將灰色預測得到的預測值代入訓練好的網絡中,預測出2015年、2016年的安徽省的財政收入。
逐步回歸;灰色預測GM(1,1);BP神經網絡模型
財政收入的有效預測是加強宏觀經濟管理和提高決策水平的前提與基礎。且財政收入會受一般收入、政府性基金收入、經濟發展狀況、政府的相關政策以及征收管理等眾多因素的影響,因此要想科學有效地預測財政收入,就必須綜合考慮各種影響因素,建立科學的預測體系。
鑒于灰色模型在小樣本量數據預測中的優勢,本文采用灰色預測模型對樣本的數量進行擴張,再基于BP神經網絡對數據進行訓練、測試,預測出2015年、2016年的安徽省的財政收入,以供相應部門進行分析、決策。
1.1 灰色GM(1,1)模型
GM(1,1)具體步驟如下:
(1)累加生成
將原始數據X(0)=(x(0)(1),x(0)(2),…,x(0)(n))通過一階累加生成得到新的序列:
X(1)=(x(1)(1),x(1)(2),…,x(1)(n)),其中,

(2)灰導數與近鄰均值生成序列
x(1)的灰導數為:

定義近鄰均值生成序列:

(3)建立灰微分方程
一階累加生成序列X(1)具有指數增長規律,滿足微分方程:

其中,a與b為常數。

得到(2)式的解為:

(4)解白化微分方程
相對于灰微分方程,稱(1)式為白化微分方程,其解得結構如下:

還原后的序列值為:

1.2 BP神經網絡模型
設BP網絡輸入層m個神經元,輸出層n個神經元,隱層有p個神經元,輸入層節點記為d(i),i=1,2,…,m,隱層節點為d(j),j=1,2,…,p,輸出層節點為d(k),j=1,2,…,n。xi為d(i)的輸入值或輸出值,Hj、hj;Yk,yk分別為d(j)、d(k)的輸入或者輸出,y*k為d(k)的期望輸出。d(i),d(j)、d(j),d(k)之間的連接權分別記作ωij、ωjk。對于網絡隱層,有:

對于網絡輸出層,有


對此采用tan-sigmoid函數作為BP算法的的轉換函數,其特點是將(-∞,+∞)的輸入分別映射到區間(-1, 1),其中的輸入與輸出的關系正好可以反映單個神經元的響應特性,可以有效減少隱層的節點數、加快收斂速度和提高收斂精度。
2.1 灰色預測模型
灰色預測模型精度的檢驗一般有三種不同的方法,即殘差檢驗、關聯度檢驗和后驗差檢驗,對此運用殘差檢驗。
計算原始數列 x(0)(k)與模型計算值 x^(0)(k)的殘差δ(0)(k)和相對誤差M(0)(k),殘差δ(0)(k)=x(0)(k)-x^(0)(k),相對誤差M(0)(k)=δ(0)(k)/x(0)(k),一般認為M(0)(k)<0.2時,模型殘差檢驗是合格的。
2.2 BP神經網絡模型
BP神經網絡訓練后的實際輸出值與期望值直接的誤差E定義如下:

從(10)式知,調整權值可以改變誤差E,調整權數的目的是使誤差不斷減小,則有:Δwjk=-η?E/?wjk,Δwij=-η?E/?wij其中η∈(0,1)為反映學習速率的常數。
3.1 數據與指標選擇
從1994年開始,我國的財政體制發生了重大改革,開始實行分稅制財政體制,影響了財政收入數據的一致性,由此1994年前后的數據是有差異的,而且沒有找到合適的方法對前后數據進行量度統一,對此選擇安徽省1995—2014年數據。
影響財政收入的因素有很多,在諸多學者研究的基礎上,初步選取以下變量為影響因素:稅收收入X1、非稅收收入X2、地區生產總值X3、第一產業生產總值X4、第二產業生產總值X5、第三產業生產總值X6、全社會固定資產投資X7、就業人數X8、居民消費水平X9、城鎮居民人均可支配收入X10。
(1)相關分析
在定量數據預測過程中,相關系數可以用來描述變量之間的關系,可以初步判斷因變量與各個解釋變量之間的線性關系是否存在。如表1所示。

表1 財政收入及影響因子之間的相關系數
由表1發現,各變量與財政收入線性關系顯著,且呈現高度正相關關系,即所有變量暫時保留。由于各個影響因素之間都是高度相關,違背了回歸分析的基本假設,會導致一系列的錯誤,模型不通過。對此下面進行逐步回歸進行變量選擇。
(2)基于逐步回歸的變量選取
自變量的選擇涉及的計算量比較大,且過程繁瑣,利用逐步回歸法建立不同的模型,依據每個回歸系數的 p值,逐個剔除不顯著變量,直到模型中的指標變量都是影響預測對象的顯著因素為止。經過檢驗,通過檢驗的模型結果如表2所示。

表2 財政收入與各個影響因素的逐步回歸結果
由表2的結論,在逐步回歸過程中,變量X2、X3、X6、X7、X8、X9、X10被剔除,綜上,預測模型的變量選擇為X1、X4、X5。
(3)灰色預測模型
基于灰色預測模型理論,分別構建變量X1、X4、X5的預測模型。以X1為例,有:

利用該模型,可得出原序列擬合值,通過檢驗發現它們的殘差值均比較小,說明模型的精度較高。在此基礎上分別對2015年與2016年的變量X1、X4、X5進行預測,預測值與擬合圖如表3和圖1所示。

表3 各變量2015年與2016年預測值

圖1 X1、X4、X5預測值與真實值對比圖
3.2 BP神經網絡模型
由于BP神經網絡可以任意逼近非線性函數的特性,可以用來作經濟預測,下面就以財政收入作為研究數據,預測2015年、2016年的值。
(1)網絡的拓撲結構
由于影響財政收入的指標為X1、X4、X5三個,預測指標為財政收入一個,故選擇輸入節點為3,輸出節點為1。節點的作用函數選取Sigmoid型函數,模型采用三層網絡模型,其中隱層神經元12個,輸出神經元4個。
(2)數據處理
將原序列數據分成兩組,前組數據用來訓練,后組數據用來檢驗。但是為了使網絡權值都在[-1,1]之間,首先,必須把輸入數據進行規一化處理,歸一化公式為:其中xmax,xmin分別為原序列中的最大、最小值。
(3)網絡訓練
通過計算機編程不斷的模擬,得出最佳的模型設置。選擇自適應調整學習速率附加動量因子梯度下降反向傳播算法訓練函數,設置最大訓練步數1000步,訓練目標最小誤差為0.001,學習速率0.05,訓練效果顯示:經過1000步的訓練,網絡的均方誤差MSE=0.00833341小于0.01,達到了網絡的訓練要求。且網絡的收斂速度是先下降,后又開始增加,之后一直速度平穩,這說明BP神經網絡的中間層的神經數目選擇非常合適。下面就采用該種設置的模型作為預測的網絡模型,對此通過訓練給出財政收入2008—2014的預測值,并與真實值進行比較,如表4所示,并對其作圖(圖2)進行比較。

表4 真實值與預測值比較

圖2財政收入真實值與預測值對比
由表4發現,各年份真實值與擬合值之間的誤差都比較小,可以說明模型精度較高,對此預測出2015年、2016年財政收入的值分別為32940164.15、37820068.38。
本文應用了小樣本情景下預測效果優良的灰色預測模型來擴充樣本容量,再采用BP神經網絡給出各年份的擬合值,發現擬合效果較好,并對2015年、2016年的財政收入進行了預測。盡管上述模型對目標值的預測效果不錯,也對每個影響指標的預測值進行了合理的檢驗,但是否符合今后財政收入的實際還有待于實踐的檢驗。
[1]Liu S F,Forrest J.The Current Development Status on Grey System Theory[J].Journal of Grey System,2007,19(2).
[2]Guo B L,Guo L.A New APP Roaehto Visua lMotion Computation[J]. Joumal of Xidian University,1994,21(4).
[3]梅虎,朱金福,汪俠.基于灰色關聯分析的旅游景區顧客滿意度測評研究[J].旅游科學,2005,19(5).
[4]陳秀蓮.泛珠三角國際旅游產業結構實證分析——基于次區域理論和灰色關聯度的探討[J].國際經貿探索,2007,23(7).
[5]洪涓,張楠.北京市旅游服務貿易發展影響因素灰色關聯分析[J].經濟論壇,2008,(8).
[6]鄧聚龍.灰理論基礎[M].武漢:華中科技大學出版社,2002.
(責任編輯/易永生)
F222;C812
A
1002-6487(2016)24-0082-03
國家自然科學基金資助項目(11201088);安徽省高校優秀青年人才重點項目(gxyqZD2016300);安徽省教育廳自然科學研究項目(KJHS2016B04);黃山學院自然科學研究項目(2015xkj004;2015xkj005)
楊世娟(1988—),女,安徽安慶人,助教,研究方向:應用統計。
(通訊作者)盧維學(1989—),男,黑龍江依安人,助教,研究方向:數理統計。