朱海龍,李萍萍
(安徽財經大學統計與應用數學學院,安徽 蚌埠 233030)
財政政策是地方政府進行宏觀經濟調控的主要手段,而財政收入分配是財政政策的重要組成部分,通過增減財政收入調節資源的合理配置和生產要素的流動來實現提高人民生活水平的目標。參照《基本公共服務領域中央與地方共同財政事權和支出責任劃分改革方案》對全國省份的劃分方法,安徽省的實際經濟發展水平及財力狀況位于第二檔,中央需要承擔的比例比較大。安徽省作為中部地區的經濟大省,在鄉村振興、脫貧攻堅及供給側結構性改革中擔負著十分重要的作用。在減稅降費的背景下,安徽省的財政收支矛盾越發尖銳。為了更有效地促進本地區的財政增收和改善人民的生活水平,探究影響財政收入的重要因素,有助于政策制定者更合理地利用地方財政收入,并實施相應的政策舉措。
國內學者對地方財政收入問題進行了大量研究,方法主要有:主成分分析、多元線性回歸分析、logistic回歸、灰色關聯分析、LASSO回歸、嶺回歸和逐步回歸法等。劉榮提出通過建立逐步回歸模型,分析影響我國財政收入的因素,并提出提高我國財政收入質量的政策和建議[1]。景宏軍等基于VAR模型分析地方財政收入的動態預測和結構[2]。趙海華認為財政收入及其影響因素呈非線性變化,提出基于灰色RBF神經網絡構建的財政收入模型[3]。隨著機器學習的發展,越來越多的學者通過機器學習中的一些算法,彌補傳統計量經濟學方法中的缺點。舒服華提出運用嶺回歸的方法分析影響武漢市稅收收入的因素,嶺回歸的方法可以有效解決變量之間共線性的問題[4]。董小剛等提出運用LASSO回歸、嶺回歸和Adaptive-LASSO回歸方法分析影響吉林省財政收入的因素,通過對比得出Adaptive-LASSO回歸擬合的模型較優[5]。徐子卿選取1995—2017年的貴州省財政收入及其他相關變量,通過Adaptive-LASSO回歸方法分析影響財政收入的主要因素,并建立BP神經網絡模型進行預測,預測效果良好[6]。丁先文等基于嶺回歸討論影響江蘇省財政收入的因素,研究發現與普通線性回歸相比,嶺回歸對各參數的估計更加具有精確性[7]。
地方財政收入是國家財政收入的重要組成部分,科學合理地分析影響地方財政收入的主要因素,能有效地避免預算收支規模的隨意性和盲目性,對宏觀經濟調控具有非常重要的現實意義和作用。雖然地方財政收入影響問題的相關研究已經取得一定成就,但在具體的影響因素分析過程中方法比較單一,模型可能存在過度擬合的情況,不能準確地反映模型的適用性。另外,在相關參數估計過程中,使用最小二乘法會受到變量的多重共線性影響,往往存在方差較大的問題,達不到降低維度的作用,導致回歸模型的精確度較差。為了減少模型過度擬合和多重共線性的問題,目前學者常采用嶺回歸和LASSO回歸方法進行相關問題的研究。基于上述分析,選取安徽省的財政收入及相關變量數據,建立嶺回歸和LASSO回歸模型,探究安徽省財政收入的影響因素。首先應用嶺回歸及LASSO回歸模型降低變量間共線性的影響,然后再進行變量選擇,最后對兩模型進行比較,分析影響財政收入的主要因素,并提出相關政策建議。
1962年,Hoerl首次提出嶺回歸,并在1970年和Kennard[8]進一步對嶺回歸模型做出了詳細討論,得出的結果為:自變量間存在多重共線性,嶺回歸是改良后的普通最小二乘估計,通過對最小二乘估計進行了改進,以達到消除共線性影響的效果。實際上,消除多重共線性的過程是一個自變量選元的過程。
嶺回歸是一種改良的最小二乘法,實際上是在線性回歸的損失函數后加一個L2正則化項。

公式(1)中,X是輸入的特征矩陣;y是輸出矩陣;w是模型的參數向量;C是大于零的常數。在公式(1)中加入拉格朗日乘子法,將有約束的優化問題轉換為公式(2)的無約束的懲罰函數優化問題。

嶺回歸的解為:

1996年Tibshirani[9]提出了最小絕對收縮和LASSO回歸作為嶺回歸的替代方法,LASSO回歸不會對參數施加二次懲罰,而是對壓縮回歸系數的絕對值進行懲罰。
LASSO回歸方法是在線性回歸模型中添加L1正則項作為懲罰項。LASSO回歸模型的懲罰函數壓縮回歸系數,將不相關變量精確收縮到零,改善了回歸模型中的多重共線性問題[10-11],定義為:

公式(3)中,β是n維參數向量;X是矩陣;Y是因變量;λ是收縮參數。LASSO在變量選擇上利用最小角度回歸(Lars)算法,可以有效地估計解的路徑[12]。Lars算法核心思想是提出一種新的求解路徑,即在已經入選的變量中,尋找一個新的路徑,使得在這個路徑上前進時,當前殘差與已入選變量的相關系數都是相同的,直到找出新的比當前殘差相關系數大的變量。LASSO是一種L1范數懲罰最小二乘算法,解決了以下優化問題:

公式(4)中,超參數λ∈(0,∞)是固定的,當λ的值趨于∞時,估計的系數縮小到零。λ越大,說明懲罰力度越大,模型中保留的變量就越少,以至于剛開始模型中沒有任何變量為顯著變量。但是,隨著λ的值減小,模型中保留的變量開始變多,回歸模型中依次出現顯著變量。也就是說,相對于超參數λ,LASSO程序可以解釋為逐步回歸,估計模型的參數會朝著零的方向進一步收縮[13]。當模型中存在無關或者相關系數較小的變量時,通過LASSO回歸,這些變量將會被篩除,從而提高模型的準確度和解釋度。許多文獻給予了LASSO回歸在變量選擇方面上的大量關注,然而,在實際情況下,不能完全期望得到一致的變量選擇和參數估計。
基于上述理論,設定具體的線性模型:

公式(5)中,Y是被解釋變量,即安徽省財政收入,為n×1維的列向量;X為n×p階的矩陣,由影響財政收入的有關的解釋變量組成;β為p×1維回歸系數;ε為隨機擾動項。
從模型的精確度和可信度從發,應該選取盡可能多的樣本。許多指標雖有較長時間跨度的記錄,但是前期的統計口徑和后續不一致,盲目選擇可能會帶來較大的偏差。基于以上想法,選取對安徽省1988—2019年財政收入影響較大的14個因素,利用嶺回歸和LASSO回歸方法對可能影響財政收入的因素進行分析和變量選擇。文章數據來源于《安徽統計年鑒2019》,共計32個年度,樣本容量為434,樣本量基本充足。
為研究影響安徽省財政收入的因素,將一般公共預算收入作為被解釋變量。本文在借鑒相關文獻的基礎上[4],對指標體系進行了創新改進,提出影響因素分別從經濟發展水平、產業結構、貿易程度、能源消耗和居民支出收入狀況方面來考慮,具體指標分別為地區生產總值(X1)、財政支出(X2)、第一產業增加值(X3)、第三產業與第二產業產值比(X4)、進出口總額(X5)、居民消費價格指數(X6)、電力消耗量(X7)、全社會固定資產投資額(X8)、城鎮單位就業人員數(X9)、常住人口數(X10)、城鎮單位就業人員工資總額(X11)、城鎮居民人均可支配收入(X12)、城鎮居民人均消費性支出(X13)和社會銷售品零售總額(X14),變量描述性統計分析如表1所列。

表1 變量描述性統計表
由于選取的14個變量的量綱不同,因此需要對原始數據進行標準化處理。同時,隨著時間的推移,財政收入顯著的時間趨勢使得變量間存在異方差性,為了消除異方差的影響,對財政收入數據進行對數化處理。
對所有變量進行線性回歸,雖然模型擬合度為99%,但大多數變量沒有通過顯著性檢驗。kappa值可以判斷變量間是否具有嚴重的多重共線性。如果k〈100,說明共線程度比較小;如果100〈k〈1 000,有較強的多重共線性;k>1 000說明存在嚴重的多重共線性。經過計算,k值等于205.153 7,說明該樣本存在較強的多重共線性。
方差膨脹因子(VIF)適用于檢驗變量共線性的強弱,大于10則說明存在嚴重的多重共線性。從表2可知,大部分變量存在顯著的多重共線性,只有少數變量不存在多重共線性,如:第三產業與第二產業產值比(X4)和居民消費價格指數(X6)。

表2 變量的多重共線性檢驗
嶺回歸是一種專門用于共線性數據分析的有偏估計回歸方法,實質上是改良的最小二乘估計法,通過放棄最小二乘的無偏估計,以損失部分信息、降低精度為代價獲得更加實際、可靠的回歸系數方法。通過R語言中ridge程序包中的linearRidge函數[14]可以自動進行嶺參數的選擇,根據嶺回歸模型給出的結果進行分析,結果如表3所列。

表3 嶺回歸分析結果
相較于普通回歸,嶺回歸方法中大部分的變量系數顯著提高,第一產業增加值(X3)、電力消耗量(X7)、城鎮單位就業人員數(X9)、常住人口數(X10)、城鎮居民人均可支配收入(X12)和城鎮居民人均消費性支出(X13)系數均提高。
標準化后的嶺回歸方程為:

經過標準化處理后,模型中的截距項無空值,因此從方程(6)可知:居民消費價格指數(X6)、城鎮單位就業人員工資總額(X11)和社會銷售品零售總額(X14)與安徽省財政收入呈現負相關關系,居民消費價格指數對安徽省財政收入有負影響;第一產業增加值(X3)、電力消耗量(X7)、城鎮單位就業人員數(X9)、常住人口數(X10)、城鎮居民人均可支配收入(X12)和城鎮居民人均消費性支出(X13)與安徽省財政收入呈正相關,當上述變量發生變動時會引起安徽省財政收入同方向變動。
LASSO回歸是一種相對較新的方法,其原理是在RSS最小化的計算中加入一個范數作為懲罰約束,目前被廣泛應用于參數估計和變量選擇,是在變量選擇和參數估計過程中同時進行的正則化方法。
與嶺回歸相似,LASSO回歸通過加入懲罰項將有約束的優化問題轉化為無約束的懲罰函數優化問題;不同的是,LASSO回歸雖然無法得到具有解析式的解,但其回歸結果有助于做出合適的特征選擇,具有一定的優越性。
文章選取常用的Cp統計量法進行系數選擇,運用R軟件中Lars算法進行LASSO回歸,從而得到相應的回歸結果[15]。
Cp統計量是用來衡量變量間多重共線性,其值越小,說明所選子集個數就越優[16]。表4反映了LASSO求解中Cp值的變化情況,其中Step表示步數,RSS表示殘差平方和,找到使Cp統計量達到最小值的步數,輸出所對應解釋變量的系數,并從中篩選出系數不為零的變量。可以看出,當變量選取到第22步時,Cp值取得最小值為12.676。

表4 LASSO求解中值的變化
圖1為LASSO回歸模型變量篩選的結果。圖1中底部橫軸表示模型系數比,右側縱軸數據表示對應解釋變量,左側縱軸數據表示標準化參數;虛線代表變量,豎線表示懲罰值。
篩選變量后,篩選出X1、X2、X3、X4、X6、X7、X8、X9、X10、X11、X12和X13共12個變量,再進行線性回歸,通過顯著性檢驗的變量有:X2、X3、X4、X6、X11和X12。表5反映的是LASSO回歸模型變量選擇結果。
LASSO回歸的表達式如方程(7)所示:

結合方程(7)和表5可以看出,運用LASSO回歸方法進行系數求解,可以有效解決模型中存在多重共線性的問題,同時,獲得具有較好泛化能力的回歸模型,也對研究影響財政收入的最佳變量集給出一定的參考。文章通過LASSO回歸選出了6個影響較大的變量:財政支出(X2)、第一產業增加值(X3)、第三產業與第二產業產值比(X4)、居民消費價格指數(X6)、城鎮單位就業人員工資總額(X11)和城鎮居民人均可支配收入(X12)。具有正向影響作用的解釋變量有:第一產業增加值(X3)和城鎮居民人均可支配收入(X12),具有負向影響作用的解釋變量有:財政支出(X2)、第三產業與第二產業產值比(X4)和居民消費價格指數(X6)。

圖1 LASSO回歸方法下的變量選擇

表5 LASSO的回歸變量選擇結果
運用嶺回歸模型和LASSO回歸模型進行變量選擇后,消除了變量間的多重共線性,通過對比模型檢驗及參數檢驗,選擇較優的模型。表6為LASSO回歸模型和嶺回歸模型的對比分析。對于表6的結果,從均方根誤差RMSE來看,嶺回歸的均方根誤差小,說明嶺回歸較優;但是從R2擬合優度來看,LASSO回歸的擬合優度數值較大,說明擬合效果較好。在實際檢驗中,使得AIC(最小信息準則)或SBC(施瓦茲的貝葉斯判別準則)達到最小的模型為相對最優模型,從AIC及SBC準則來看,LASSO回歸模型較優。

表6 模型對比分析表
文章運用嶺回歸和LASSO回歸方法進行變量選擇,將以地區生產總值、財政支出等14個影響因素作為解釋變量,財政收入作為被解釋變量構建回歸模型。通過模型對比分析可以看出,LASSO回歸模型相對較優,基于LASSO回歸結果得到如下結論:
(1)安徽省財政收入與城鎮單位就業人員數及常住人口數,存在顯著的正向影響。就業人數和常住人數的增加,使得勞動力增加,促進當地就業水平提高,推動當地的經濟發展,進一步引起財政收入的提高。常住人口數直接影響著居民的消費水平,城鎮就業人數的上升伴隨著居民消費水平的提高,間接增加財政收入。
(2)安徽省財政收入與第一產業產值存在正相關的關系。安徽省位于中原地帶,有富饒的水域等自然環境,因此農業就顯得至關重要,第一產業農業的產值越高,居民收入越高,消費水平也會隨之增長,最終導致財政收入增長。安徽省的財政收入與能源消費總量也存在著正相關的關系。能源消費總量越大,說明工廠等一些重工業基地越多,這些企業會產生大量的稅收,上繳的稅收也會引起財政收入的增加。安徽省財政收入和第三產業與第二產業產值比值存在著負相關的關系,第三產業與第二產業產值比值的提高會引起財政收入的減少。第三產業與第二產業比值提高,意味著服務業發展迅速,工業發展減緩,需提高產業結構逐步優化。
(3)財政收入與居民消費價格指數存在負相關的關系。值得注意的是,居民消費價格指數是一個滯后性的數據,不僅決定消費者日常花費的增減,也決定了經營者的經營成本,還影響著投資者的投資決策問題,更對政府的宏觀調控起著重大影響。居民消費價格指數的持續下行,會影響消費水平,進而影響財政收入。
通過上述結論,針對不同因素對安徽省財政收入的影響提出以下幾點建議:
(1)為吸引勞動力,吸引人才,省內需要不斷優化自身的生活環境和營商環境。在人才培養的過程中,根據新時代要求,布局新農業、新工科專業。培養人才后,通過落戶補貼等留住人才,促進人才作用長遠發展,真正做到人才強省、高水平的創新型省。另外,也要切實解決發展過程中遇到的不平衡不充分問題,就業人員工資和當地的財政有緊密的聯系,財力緊張的同時,提高資金的指向性,確保財政經濟運行的可持續性,保工資,保基本民生。從發展財政真正做到轉向民生財政,促進人口紅利走向素質紅利。
(2)加快工業化升級,結合產業結構的特點,通過引進更加高端的裝備和依托省內高校人才,在工業創新過程中,鼓勵新型材料和新能源的創新研發。當地政府需要制定合理的稅收政策,為產業結構創新升級提供源源不斷的動力,扶持相關產業的孵化和成型,推進相關稅收政策的改革,促進安徽省的第二產業朝著更高質量的發展。
(3)在當下以及未來的一段時間內,營造穩定的消費環境,使消費者可以放心消費,同時也要為非城鎮的居民設立消費場所,電商進村,快遞進鎮,拓展居民消費。鼓勵企業開展新興的線上線下相結合銷售形式,積極引導這些企業朝著健康綠色的方向發展,從而更好地促進省內的財政增收。