【摘要】財政收入是衡量一國政府財力的重要指標(biāo)。國家在社會活動中提供公共物品和服務(wù),而這些公共物品與服務(wù)恰恰依賴于財政收入。本文通過對北京市歷年來的財政收入及各項數(shù)據(jù)的分析,建立了線性回歸模型,利用最小二乘法研究了財政收入的影響因素。通過逐步回歸模型,確定了對財政收入影響最顯著的因素,進(jìn)行了相關(guān)的檢驗。最后對這些實證研究分析了其經(jīng)濟學(xué)意義,提出了政策建議。
【關(guān)鍵詞】財政收入 地區(qū)生產(chǎn)總值 最小二乘法 逐步回歸
一、引言
財政收入是指政府為履行其職能、實施公共政策和提供公共物品與服務(wù)需要而集中的一切資金的總和。財政收入是衡量政府財力的重要指標(biāo),政府在社會經(jīng)濟活動中提供公共物品和服務(wù)的范圍和數(shù)量,很大程度上取決于財政收入的充裕狀況。同時,財政收入也是政府對經(jīng)濟實行宏觀調(diào)控的重要經(jīng)濟杠桿,可以通過財政的增收和減收,發(fā)揮總量的調(diào)控作用。因此,對財政收入影響因素的研究能夠幫助政府很好的分析經(jīng)濟狀況,為經(jīng)濟決策的提出提供依據(jù)。
近年來,北京市的財政收入保持高速增長的姿態(tài)。但影響財政收入的因素很多,什么才是影響財政收入的關(guān)鍵因素也引起了很多學(xué)者的關(guān)注。文獻(xiàn)認(rèn)為,財政收入的主要影響因素包括:第一產(chǎn)業(yè)增加值、第二產(chǎn)業(yè)增加值、第三產(chǎn)業(yè)增加值、就業(yè)人口總數(shù)和其他收入。文獻(xiàn)認(rèn)為,財政收入的主要影響因素包括:重大工業(yè)項目、國民生產(chǎn)總值和產(chǎn)業(yè)結(jié)構(gòu)。經(jīng)過分析和結(jié)合北京市的實際情況,本文選擇了第一產(chǎn)業(yè)增加值、第二產(chǎn)業(yè)增加值、第三產(chǎn)業(yè)增加值、就業(yè)人口數(shù)和稅收收入作為初始的影響因素,并通過計量分析,找出了真正影響北京市財政收入的主要因素,并建立計量關(guān)系,經(jīng)過統(tǒng)計檢驗結(jié)果表明模型能夠較好地解釋北京市財政收入的影響因素。
二、逐步回歸和多重共線性分析
(一)數(shù)據(jù)分析及解釋變量的提出
令Y表示財政收入,作為因變量,并定義五個解釋變量:X1表示第一產(chǎn)業(yè)增加值,X2表示第二產(chǎn)業(yè)增加值,X3表示第三產(chǎn)業(yè)增加值,X4表示就業(yè)人數(shù),X5表示稅收。為了能夠量化研究影響北京市財政收入的因素,通過《北京統(tǒng)計年鑒2011》找到了1978-2010年的相關(guān)數(shù)據(jù),具體數(shù)據(jù)見附錄。
為了能夠大致分析因變量Y和解釋變量之間的關(guān)系,首先我們利用原始數(shù)據(jù)做出了Y對X1,X2,…,X5的散點圖,如圖1所示。
從圖1可以發(fā)現(xiàn),各解釋變量與因變量之間并不完全是線性關(guān)系,例如X2、X3、X5與Y之間有著較明顯的二次關(guān)系。因此,做如下定義:
則因變量Y和解釋變量X1,X2,…,X10之間均可能存在線性關(guān)系。但每一個解釋變量X1~X10不一定每項都對財政收入Y有顯著影響,并且各項內(nèi)容之間也可能存在很強的相關(guān)性。為了能夠得到一個簡單有效對該問題進(jìn)行數(shù)學(xué)描述,找到對財政收入有顯著影響的解釋變量,本文采用了逐步回歸的方法。
(二)逐步回歸模型的建立
雖然在2.1中給出了10個解釋變量,但是我們希望從中挑選出對因變量Y影響顯著的解釋變量來建立回歸模型,而影響不顯著的解釋變量都不選入模型。逐步回歸就是一種從眾多自變量中有效地選擇重要變量的方法。
逐步回歸的基本思路是,先確定一個包含若干自變量的初始集合,然后每次從集合外的變量中引入一個對因變量影響最大的,再對集合中的變量進(jìn)行檢驗,從變得不顯著的變量中選出一個影響較小的,依此進(jìn)行,直到不能引入和移除為止。引入和移除都以給定的顯著性水平為標(biāo)準(zhǔn)。
本文利用Matlab對以上10個解釋變量進(jìn)行了逐步回歸。經(jīng)過三次回歸檢驗,最終得到的回歸結(jié)果如圖2所示。
圖2 逐步回歸結(jié)果圖
從圖2可以得到,只有X2和X8的回歸系數(shù)對Y的影響是顯著的,因此回歸模型可以表示為:
Y=β0+β1X2+β2X8+u (1)
求解該模型的回歸系數(shù)估計值及置信區(qū)間(置信水平α=0.05)、檢驗統(tǒng)計量R2,F(xiàn),p的結(jié)果如表1所示。
從表1可知,R2=0.9960指因變量Y的99.6%可有模型確定,F(xiàn)值遠(yuǎn)遠(yuǎn)超過F檢驗的零界值,p遠(yuǎn)小于α,因而模型從整體上來看是可用的。需要注意的是,雖然β2的估計值的置信區(qū)間非常接近零,但是這是由于Y和X8之間的數(shù)量關(guān)系導(dǎo)致β2的估計值值很小(接近于零),但是置信區(qū)間中不包含0,即影響是顯著的。
(三)逐步回歸結(jié)果的分析
在最終的回歸變量中只有X2和X8,為了分析其他變量沒有進(jìn)入最終模型的原因,本文計算了Y,X1~X10的相關(guān)系數(shù),得到11個變量的相關(guān)系數(shù)矩陣,如表2所示。
一般認(rèn)為,兩個變量的相關(guān)系數(shù)超過0.85是才會有顯著的相關(guān)關(guān)系,由相關(guān)性系數(shù)矩陣可知,與Y相關(guān)關(guān)系顯著的只有X2,X3,X5,X6,X7,X8,X10,而X2和X7之間有平方關(guān)系(相關(guān)性系數(shù)r27=0.9583),所以只需要選其中的一個即可。同理,X3和X8中也只需要選擇一項即可。而X5和X2,X8的相關(guān)關(guān)系系數(shù)顯著(相關(guān)性系數(shù)r25=0.9713,r85=0.9749),即X5和X2,X8和之間存在多重共線性,應(yīng)該從模型中去除,同理X6和X10也被從模型中去除。最終從對因變量的影響顯著水平來看,選擇了X2和X8作為解釋變量。
就業(yè)人口數(shù)與財政收入之間關(guān)系較小,這一點與圖1中,Y和X1,X4之間幾乎沒有線性關(guān)系相吻合。稅收收入對財政雖然有較大影響,但是與第二、第三產(chǎn)業(yè)增加值多重線性相關(guān),也沒有選入模型。最終,財政收入與第二產(chǎn)業(yè)增加值線性相關(guān),與第三產(chǎn)業(yè)增加值的平方線性相關(guān)。
三、自相關(guān)的檢驗及校正
經(jīng)過以上分析,模型的擬合度很高。但是該模型并沒有考慮財政收入的數(shù)據(jù)是一個時間序列。實際上,對時間序列數(shù)據(jù)做回歸分析時,模型的隨機誤差項可能會存在相關(guān)性,違背了殘差對時間相互獨立的假設(shè)。如在第2部分的模型中,第二產(chǎn)業(yè)增長值和第三產(chǎn)業(yè)增長值平方之外的因素(比如政策等因素)對財政收入的影響包含在隨機誤差中,如果它的影響成為隨機誤差的主要部分,則由于政策等因素的連續(xù)性,它們對財政收入的影響也有時間上的延續(xù),即隨機誤差會出現(xiàn)自相關(guān)性。
殘差可以作為隨機誤差ut的估計值,畫et~et-1的散點圖,能夠從直觀上判斷ut的自相關(guān)性。散點圖如圖3所示。
圖3 et~et-1的散點圖
從圖3可得,大部分的點都落在第1,3象限,表明ut存在正的相關(guān)性。為了量化確定隨機誤差是否存在自相關(guān)性,對殘差進(jìn)行了D-W檢驗。D-W檢驗是一種常用的診斷自相關(guān)的統(tǒng)計方法,計算方法如式(2)所示。
根據(jù)DW的具體數(shù)值確定ut是否存在自相關(guān),通過在給定的檢驗水平下,依照樣本容量和回歸變量數(shù)目,查D-W分布表,得到檢驗的臨界值dL和dU,然后通過圖4中DW所造的區(qū)間來決定。
通過計算可得,模型DW=1.1934,對于顯著性水平α=0.05,n=30,k=3,查表可得檢驗的臨界值dL=1.21和dH=1.65,根據(jù)圖4中可得DW
檢驗結(jié)果判定存在自相關(guān),因此需要對該模型進(jìn)行校正。首先要對自相關(guān)系數(shù)ρ進(jìn)行估計,首先通過式(3)計算初始估計值。
(3)
然后做變換
Yt*=Yt-ρYt-1,Xit*=Xit-ρXi,t-1,i=2,8 (4)
則模型可以變換為:
Yt*=β0*+β1X2t*+β2X8t*+ut (5)
其中,β0*=β0(1-ρ),ut相互獨立且服從均值為零的正態(tài)分布。對該模型做最小二乘估計,并得到的估計值:
變形得到:
(6)
利用β0%,β2%和β8%計算殘差:
et%=Yt-β0%-β2%X2t-β8%X8t (7)
根據(jù)殘差e%t再次求ρ的估計值:
(8)
判斷是否滿足終止條件
當(dāng)δ值小于0.001時得到的就是ρ的估計值,否則將ρ%代替,帶入式(4)進(jìn)行迭代,直到計算結(jié)果滿足精度要求。
經(jīng)過多次迭代之后,得到估計值=0.2369,帶入式(4)做變換,利用變換后的變量重建建立回歸模型,用最小二乘法求解該模型得到結(jié)果如表3所示。
再次對該模型做自相關(guān)檢驗,得到DW=1.3597,通過和臨界值dL=1.21和dH=1.65的比較,結(jié)合圖(4),自相關(guān)的校正模型在一定程度上改善了殘差的自相關(guān)性,但是由于DW值落在(dL,dH)區(qū)間,表示不能確定是否存在自相關(guān),說明該方法還有一定的局限性,需要通過其他方面的分析進(jìn)一步對模型進(jìn)行改進(jìn)和校正。
四、異方差的檢驗及校正
在線性模型的基本假設(shè)中,ut關(guān)于方差不變的假設(shè)不成立,其他假定不變的情形成為異方差。這是ut的方差在不同的時點取值相異,為了檢驗?zāi)P褪欠翊嬖诋惙讲钚裕龀鰵埐頴t和解釋變量X2的散點圖,如圖(5)所示。
圖5 殘差和解釋變量X2的散點圖
從圖中可以明顯看到,殘差在平均值兩側(cè)的分布情況隨著X2的增大而不斷變化,即很有可能存在異方差性。為了能夠量化檢驗異方差是否存在,將X2分成X2<1000(樣本容量為n1)和X2≥1000(樣本容量為n2)兩組,分別計算其方差,并定義F統(tǒng)計量如式(9)所示。
其中,σ21和σ22分別是第一、二組數(shù)據(jù)的方差。該統(tǒng)計量在誤差項一定的零假設(shè)下服從自由度為(n2-k,n1-k)的F分布。當(dāng)F≥F(n2-k,n1-k)時,即認(rèn)為存在異方差性,其中k是模型中包含參數(shù)的個數(shù)。經(jīng)過計算,得到F=43.5076,經(jīng)過查表得到F(12,16)=2.60,滿足異方差存在的零界條件,即模型存在異方差性。
求出模型的殘差et,并對式(10)運用最小二乘法確定參數(shù)估計值。
et2=α1+α2X2t*+α8X8t*+誤差項 (10)
根據(jù)參數(shù)的估計值,給出σt2的估計值:
(11)
利用σt2的估計值對模型進(jìn)行變換得到:
(12)
對式(12)應(yīng)用最小二乘法,求解得到結(jié)果表4所示。
再次計算F統(tǒng)計量,得到F=2.0324,小于零界檢驗值,可見異方差校正之后,可以認(rèn)為模型不存在異方差性,并且DW值也得到改善,不再表現(xiàn)正相關(guān)性。所以兩次的校正之后模型能夠較正確全面的反應(yīng)問題的實質(zhì)。
五、結(jié)論及政策建議
綜合以上分析,認(rèn)為以上模型能夠較好地反應(yīng)影響北京市財政收入的主要因素,及它們之間的數(shù)量關(guān)系,將Yt*,X2t*和X8t*還原為原始變量Yt,X2t和X8t得到的結(jié)果為
從經(jīng)濟學(xué)的角度來看,北京市的經(jīng)濟以第二和第三產(chǎn)業(yè)為主,第一產(chǎn)業(yè)所占比例較低,對于財政收入的影響也較小。這也表明第三產(chǎn)業(yè)的增長將更快的促進(jìn)財政收入的增加,北京政府為了提高財政收入,也應(yīng)當(dāng)首先以扶持二、三產(chǎn)業(yè)的發(fā)展為主,而加速二、三產(chǎn)業(yè)的發(fā)展,又應(yīng)當(dāng)以構(gòu)建完善產(chǎn)業(yè)鏈,實現(xiàn)產(chǎn)業(yè)結(jié)構(gòu)高級化為主。
參考文獻(xiàn)
[1] 郭亞偉,邵文宗.我國財政收入影響因素的多元計量分析[J].致富時代:下半月,2011,(8):8-8.
[2] 陳建華.衡陽市財政收入的影響因素研究[J].價值工程,2010,29(11):34-35.
[3] 姜啟源,謝金星,葉俊.數(shù)學(xué)模型(第三版)[M].北京:高等教育出版社,2003.
[4] 趙國慶.應(yīng)用計量經(jīng)濟學(xué)[M].北京:中國人民大學(xué)出版社,2011.
[5] 于秀琴.北京市統(tǒng)計年鑒.[Z].北京:北京市統(tǒng)計局,2011.
作者簡介:彭惟(1991-),女,漢族,北京理工大學(xué)人文與社會科學(xué)學(xué)院2009級本科學(xué)生,經(jīng)濟學(xué)專業(yè),研究方向:計量經(jīng)濟學(xué)。
(責(zé)任編輯:龍大為)