【摘要】財政收入是衡量一國政府財力的重要指標。國家在社會活動中提供公共物品和服務,而這些公共物品與服務恰恰依賴于財政收入。本文通過對北京市歷年來的財政收入及各項數據的分析,建立了線性回歸模型,利用最小二乘法研究了財政收入的影響因素。通過逐步回歸模型,確定了對財政收入影響最顯著的因素,進行了相關的檢驗。最后對這些實證研究分析了其經濟學意義,提出了政策建議。
【關鍵詞】財政收入 地區生產總值 最小二乘法 逐步回歸
一、引言
財政收入是指政府為履行其職能、實施公共政策和提供公共物品與服務需要而集中的一切資金的總和。財政收入是衡量政府財力的重要指標,政府在社會經濟活動中提供公共物品和服務的范圍和數量,很大程度上取決于財政收入的充裕狀況。同時,財政收入也是政府對經濟實行宏觀調控的重要經濟杠桿,可以通過財政的增收和減收,發揮總量的調控作用。因此,對財政收入影響因素的研究能夠幫助政府很好的分析經濟狀況,為經濟決策的提出提供依據。
近年來,北京市的財政收入保持高速增長的姿態。但影響財政收入的因素很多,什么才是影響財政收入的關鍵因素也引起了很多學者的關注。文獻認為,財政收入的主要影響因素包括:第一產業增加值、第二產業增加值、第三產業增加值、就業人口總數和其他收入。文獻認為,財政收入的主要影響因素包括:重大工業項目、國民生產總值和產業結構。經過分析和結合北京市的實際情況,本文選擇了第一產業增加值、第二產業增加值、第三產業增加值、就業人口數和稅收收入作為初始的影響因素,并通過計量分析,找出了真正影響北京市財政收入的主要因素,并建立計量關系,經過統計檢驗結果表明模型能夠較好地解釋北京市財政收入的影響因素。
二、逐步回歸和多重共線性分析
(一)數據分析及解釋變量的提出
令Y表示財政收入,作為因變量,并定義五個解釋變量:X1表示第一產業增加值,X2表示第二產業增加值,X3表示第三產業增加值,X4表示就業人數,X5表示稅收。為了能夠量化研究影響北京市財政收入的因素,通過《北京統計年鑒2011》找到了1978-2010年的相關數據,具體數據見附錄。
為了能夠大致分析因變量Y和解釋變量之間的關系,首先我們利用原始數據做出了Y對X1,X2,…,X5的散點圖,如圖1所示。
從圖1可以發現,各解釋變量與因變量之間并不完全是線性關系,例如X2、X3、X5與Y之間有著較明顯的二次關系。因此,做如下定義:
則因變量Y和解釋變量X1,X2,…,X10之間均可能存在線性關系。但每一個解釋變量X1~X10不一定每項都對財政收入Y有顯著影響,并且各項內容之間也可能存在很強的相關性。為了能夠得到一個簡單有效對該問題進行數學描述,找到對財政收入有顯著影響的解釋變量,本文采用了逐步回歸的方法。
(二)逐步回歸模型的建立
雖然在2.1中給出了10個解釋變量,但是我們希望從中挑選出對因變量Y影響顯著的解釋變量來建立回歸模型,而影響不顯著的解釋變量都不選入模型。逐步回歸就是一種從眾多自變量中有效地選擇重要變量的方法。
逐步回歸的基本思路是,先確定一個包含若干自變量的初始集合,然后每次從集合外的變量中引入一個對因變量影響最大的,再對集合中的變量進行檢驗,從變得不顯著的變量中選出一個影響較小的,依此進行,直到不能引入和移除為止。引入和移除都以給定的顯著性水平為標準。
本文利用Matlab對以上10個解釋變量進行了逐步回歸。經過三次回歸檢驗,最終得到的回歸結果如圖2所示。
圖2 逐步回歸結果圖
從圖2可以得到,只有X2和X8的回歸系數對Y的影響是顯著的,因此回歸模型可以表示為:
Y=β0+β1X2+β2X8+u (1)
求解該模型的回歸系數估計值及置信區間(置信水平α=0.05)、檢驗統計量R2,F,p的結果如表1所示。
從表1可知,R2=0.9960指因變量Y的99.6%可有模型確定,F值遠遠超過F檢驗的零界值,p遠小于α,因而模型從整體上來看是可用的。需要注意的是,雖然β2的估計值的置信區間非常接近零,但是這是由于Y和X8之間的數量關系導致β2的估計值值很?。ń咏诹悖?,但是置信區間中不包含0,即影響是顯著的。
(三)逐步回歸結果的分析
在最終的回歸變量中只有X2和X8,為了分析其他變量沒有進入最終模型的原因,本文計算了Y,X1~X10的相關系數,得到11個變量的相關系數矩陣,如表2所示。
一般認為,兩個變量的相關系數超過0.85是才會有顯著的相關關系,由相關性系數矩陣可知,與Y相關關系顯著的只有X2,X3,X5,X6,X7,X8,X10,而X2和X7之間有平方關系(相關性系數r27=0.9583),所以只需要選其中的一個即可。同理,X3和X8中也只需要選擇一項即可。而X5和X2,X8的相關關系系數顯著(相關性系數r25=0.9713,r85=0.9749),即X5和X2,X8和之間存在多重共線性,應該從模型中去除,同理X6和X10也被從模型中去除。最終從對因變量的影響顯著水平來看,選擇了X2和X8作為解釋變量。
就業人口數與財政收入之間關系較小,這一點與圖1中,Y和X1,X4之間幾乎沒有線性關系相吻合。稅收收入對財政雖然有較大影響,但是與第二、第三產業增加值多重線性相關,也沒有選入模型。最終,財政收入與第二產業增加值線性相關,與第三產業增加值的平方線性相關。
三、自相關的檢驗及校正
經過以上分析,模型的擬合度很高。但是該模型并沒有考慮財政收入的數據是一個時間序列。實際上,對時間序列數據做回歸分析時,模型的隨機誤差項可能會存在相關性,違背了殘差對時間相互獨立的假設。如在第2部分的模型中,第二產業增長值和第三產業增長值平方之外的因素(比如政策等因素)對財政收入的影響包含在隨機誤差中,如果它的影響成為隨機誤差的主要部分,則由于政策等因素的連續性,它們對財政收入的影響也有時間上的延續,即隨機誤差會出現自相關性。
殘差可以作為隨機誤差ut的估計值,畫et~et-1的散點圖,能夠從直觀上判斷ut的自相關性。散點圖如圖3所示。
圖3 et~et-1的散點圖
從圖3可得,大部分的點都落在第1,3象限,表明ut存在正的相關性。為了量化確定隨機誤差是否存在自相關性,對殘差進行了D-W檢驗。D-W檢驗是一種常用的診斷自相關的統計方法,計算方法如式(2)所示。
根據DW的具體數值確定ut是否存在自相關,通過在給定的檢驗水平下,依照樣本容量和回歸變量數目,查D-W分布表,得到檢驗的臨界值dL和dU,然后通過圖4中DW所造的區間來決定。
通過計算可得,模型DW=1.1934,對于顯著性水平α=0.05,n=30,k=3,查表可得檢驗的臨界值dL=1.21和dH=1.65,根據圖4中可得DW
檢驗結果判定存在自相關,因此需要對該模型進行校正。首先要對自相關系數ρ進行估計,首先通過式(3)計算初始估計值。
(3)
然后做變換
Yt*=Yt-ρYt-1,Xit*=Xit-ρXi,t-1,i=2,8 (4)
則模型可以變換為:
Yt*=β0*+β1X2t*+β2X8t*+ut (5)
其中,β0*=β0(1-ρ),ut相互獨立且服從均值為零的正態分布。對該模型做最小二乘估計,并得到的估計值:
變形得到:
(6)
利用β0%,β2%和β8%計算殘差:
et%=Yt-β0%-β2%X2t-β8%X8t (7)
根據殘差e%t再次求ρ的估計值:
(8)
判斷是否滿足終止條件
當δ值小于0.001時得到的就是ρ的估計值,否則將ρ%代替,帶入式(4)進行迭代,直到計算結果滿足精度要求。
經過多次迭代之后,得到估計值=0.2369,帶入式(4)做變換,利用變換后的變量重建建立回歸模型,用最小二乘法求解該模型得到結果如表3所示。
再次對該模型做自相關檢驗,得到DW=1.3597,通過和臨界值dL=1.21和dH=1.65的比較,結合圖(4),自相關的校正模型在一定程度上改善了殘差的自相關性,但是由于DW值落在(dL,dH)區間,表示不能確定是否存在自相關,說明該方法還有一定的局限性,需要通過其他方面的分析進一步對模型進行改進和校正。
四、異方差的檢驗及校正
在線性模型的基本假設中,ut關于方差不變的假設不成立,其他假定不變的情形成為異方差。這是ut的方差在不同的時點取值相異,為了檢驗模型是否存在異方差性,做出殘差et和解釋變量X2的散點圖,如圖(5)所示。
圖5 殘差和解釋變量X2的散點圖
從圖中可以明顯看到,殘差在平均值兩側的分布情況隨著X2的增大而不斷變化,即很有可能存在異方差性。為了能夠量化檢驗異方差是否存在,將X2分成X2<1000(樣本容量為n1)和X2≥1000(樣本容量為n2)兩組,分別計算其方差,并定義F統計量如式(9)所示。
其中,σ21和σ22分別是第一、二組數據的方差。該統計量在誤差項一定的零假設下服從自由度為(n2-k,n1-k)的F分布。當F≥F(n2-k,n1-k)時,即認為存在異方差性,其中k是模型中包含參數的個數。經過計算,得到F=43.5076,經過查表得到F(12,16)=2.60,滿足異方差存在的零界條件,即模型存在異方差性。
求出模型的殘差et,并對式(10)運用最小二乘法確定參數估計值。
et2=α1+α2X2t*+α8X8t*+誤差項 (10)
根據參數的估計值,給出σt2的估計值:
(11)
利用σt2的估計值對模型進行變換得到:
(12)
對式(12)應用最小二乘法,求解得到結果表4所示。
再次計算F統計量,得到F=2.0324,小于零界檢驗值,可見異方差校正之后,可以認為模型不存在異方差性,并且DW值也得到改善,不再表現正相關性。所以兩次的校正之后模型能夠較正確全面的反應問題的實質。
五、結論及政策建議
綜合以上分析,認為以上模型能夠較好地反應影響北京市財政收入的主要因素,及它們之間的數量關系,將Yt*,X2t*和X8t*還原為原始變量Yt,X2t和X8t得到的結果為
從經濟學的角度來看,北京市的經濟以第二和第三產業為主,第一產業所占比例較低,對于財政收入的影響也較小。這也表明第三產業的增長將更快的促進財政收入的增加,北京政府為了提高財政收入,也應當首先以扶持二、三產業的發展為主,而加速二、三產業的發展,又應當以構建完善產業鏈,實現產業結構高級化為主。
參考文獻
[1] 郭亞偉,邵文宗.我國財政收入影響因素的多元計量分析[J].致富時代:下半月,2011,(8):8-8.
[2] 陳建華.衡陽市財政收入的影響因素研究[J].價值工程,2010,29(11):34-35.
[3] 姜啟源,謝金星,葉俊.數學模型(第三版)[M].北京:高等教育出版社,2003.
[4] 趙國慶.應用計量經濟學[M].北京:中國人民大學出版社,2011.
[5] 于秀琴.北京市統計年鑒.[Z].北京:北京市統計局,2011.
作者簡介:彭惟(1991-),女,漢族,北京理工大學人文與社會科學學院2009級本科學生,經濟學專業,研究方向:計量經濟學。
(責任編輯:龍大為)