陳毓姍 程文淦
(華南理工大學公共管理學院,廣州 510641)
一個地區高等教育水平如何,很大程度上依賴與它的教育經費收入的高低。那么具體什么因素會影響該地區的教育經費收入呢?在以往的研究中大多只分析教育經費的來源[1],而沒有深層次的挖掘影響教育經費的因素。因此本文從計量經濟學的角度探索影響高等教育經費的因素,并進一步尋找合理的計量模型衡量他們之間客觀存在的定量關系。
用教育經費收入來衡量某地區的教育投資水平,主要有一下幾方面的原因:(1)某地區的教育經費收入主要來源有:國家財政性教育經費、預算內教育經費、社會捐贈經費、事業收入、學雜費以及其他教育經費等,因此教育經費全面的衡量了某個地區教育投資水平;(2)各地區每年普通高等教育經費收入數據都可以在《教育經費統計年鑒》,考慮到數據的完整性、準確性和可獲得性都是比較合理的。
什么因素會影響教育經費收入?首先想到的是當地的經濟水平,即地區生產總值GDP的高低會影響教育經費收入。地區GDP高的地區有能力投入較高的教育經費,GDP小的地區教育經費投入的能力相對較弱。除此之外,筆者認為,某地區的高等教育規模也會影響它的教育經費收入,因為教育規模大的地區需要投入更多的教育經費,教育規模小的地方需要投入的教育經費相對要小些。將教育規模指標具體化為該地區“普通高等學校在校生數”,以上兩指標的數據可以從歷年的《中國統計年鑒》中得到。因此本文將先后引入地區生產總值(GDP)和在校學生數兩個解釋變量,進行定量分析,探索它們與教育經費收入之間的數量關系。最后為了研究個別地區的教育經費收入情況還引入了虛擬變量進行分析。
首先只以GDP為解釋變量,構造一元線性回歸模型。為了考察各地區高等教育經費收入與該地區生產總值的關系,從《中國統計年鑒2009》和《中國教育經費統計年鑒2009》收集了中國內地31個省2008年的“高等教育經費收入”和“GDP”截面數據進行分析。
3.1.1 建立一元線性回歸模型
本例中我們假設擬建立如下一元回歸模型:

將31個地區的數據輸入SPSS進行回歸分析,得到如下分析結果:

3.1.2 模型檢驗
從回歸結果看,模型擬合并不是非常理想。可決系數R2=0.199,表明我國各地區高等教育經費收入變化大約有20%可由當地的生產總值GDP來解釋。從斜率項的t檢驗來看,大于5%顯著性水平下自由度為31-2=29的臨界值t0.025(29) =2.045,且該斜率滿足0<0.009<1,符合實際情況,實際上該斜率的意義可以理解為全國平均水平的高等教育經費收入占GDP的比重為0.9%。另外 F=7.227> F0.05(1,29)=4.18,也是顯著的。
3.1.3 異方差性檢驗與修正
是什么原因導致模型的擬合效果不是非常理想呢?由于采用的是截面數據,所以異方差性可能是原因所在。在此采用圖示法對異方差性進行檢驗,如圖1所示:

圖1 異方差性檢驗圖
從圖1我們可以看出,存在遞增型的異方差。這說明生產總值較大的省份教育經費支出的變化范圍也越大。針對存在的異方差性,我們采用加權最小二乘法(WLS)。首先計算出隨機干擾項方差2,然后采用SPSS對每一項賦予相應的權重,最后加入權重項對原始數據重新進行回歸分析。得到如下結果:

從WLS的分析結果來看,模型達到了很好的擬合優度,可決系數R2=0.968,從斜率項的t檢驗來看,大于5%顯著性水平下自由度為n-2=29的臨界值t0.025(29) =2.045。
3.2.1 建立模型
引起異方差的原因有多種,根據實際情況我們推測引起異方差的原因可能是缺少解釋變量。事實上北京市之所以有極高的教育經費,一個原因就是其高等教育規模非常大。我國各地區高等教育發展不平衡,規模大小不一,因此高等教育規模也是影響教育經費收入的一個重要原因。教育規模用“在校生數”來表示,加入這個解釋變量后重新建立模型:

3.2.2 模型檢驗
將《中國統計年鑒2009》和《中國教育經費統計年鑒2009》中31個省2008年的“高等教育經費收入”、“地區GDP”以及“在校生數”輸入SPSS,進行二元回歸分析,得到如下結果:

從上述結果看,模型擬合得并不理想。R2=0.548,只有58.4% 能有回歸項來解釋。F=16.998>F0.05(2,28)=3.37,回歸總體顯著性通過檢驗。但是、、t檢驗的p值分別為0.324,0.054,0.285,大于0.05,三者皆未不顯著。但是毫無疑問引入“在校生數”這個解釋變量之后擬合優度有了很大的提高,因此我們認為新引入的解釋變量是有效的,模型的擬合優度仍然不高或許還有其他原因。
3.3.1 建立雙對數模型
在研究居民食品消費需求函數模型中,根據恩格爾定律有:隨著居民消費支出的增加,居民對食品的消費支出也增加,但是食品消費支出比例會逐漸下降。借鑒這個道理,我們有理由認為:隨著地區生產總值的提高,教育經費收入會增加,但是教育經費收入占地區生產總值的比例會下降;隨著高等教育規模(在校生數)的增加,教育經費收入會增加,但是增加的幅度逐漸減小。也就是說教育經費和GDP以及在校生數之間成冪函數的變化關系,根據這個推理有:

經對數變換,可用如下雙對數線性回歸模型進行估計:

將上述各變量求對數之后的數據輸入SPSS重新分析,得到如下結果:

從回歸結果來看,經過對數處理后的模型擬合結果比單純的線性回歸效果要好很多,有了顯著提高,可決系數達到R2=0.876,也就是說被解釋變量有87.6%的變化可以由解釋變來解釋;另外t檢驗和F檢驗在0.05的顯著性水平下也是非常顯著的,且F檢驗在0.01的置信水平下仍然通過檢驗。
3.3.2 虛擬變量的引入
在上述異方差性檢驗中,發現樣本中有一個點的殘差現狀高于其他地區,而這個樣本點是北京,表明除地區GDP和教育規模因素的影響外,北京的教育經費收入仍然遠遠高于其他地區的教育經費收入。其原因在于,北京作為我國的政治、文化中心,政府高度關注的政策導向是北京教育經費收入高的一個重要原因,因此在此引入虛擬變量D

采用加法方式進入虛擬變量,重新構造模型:

將數據輸入SPSS進行分析,得到如下結果:

從擬合優度判斷,引入虛擬變量之后,模型的擬合效果進一步提高,調整的可決系數從0.867提高到0.923,達到了很好的擬合效果。從F檢驗判斷,F= 120.219>F0.05(3,27)=2.96,總體線性檢驗非常顯著,另外單個變量、、、的t檢驗也非常顯著,p值分別為0.000、0.002、0.019和0.000。
因而北京的教育經費收入模型可以寫為:

其他地區教育經費收入模型可以寫為:

本文從計量經濟學的角度,以我國各地區普通高等教育經費收入為被解釋變量,以地區生產總值和普通高校在校學生數為解釋變量,以2008年各地區的數據為樣本,進行探討分析,確定了相對比較合理的計量經濟學模型,分析了各變量之間的數量關系,并利用模型進行了預測。
4.1 首先采用一元線性回歸,以各地區生產總值為解釋變量,分析它對教育經費收入的影響,結果發現,模型擬合效果并不理想,解釋變量對被解釋變量的解釋程度只有20%,并存在異方差。
4.2 接著引入第二個解釋變量“普通高校在校生數”,利用二元線性回歸分析,結果發現,擬合優度有了很大的提高,解釋程度從20%提高到了51%。即使如此,模型的效果仍然不是很理想。
4.3 考慮到模型設定偏差也會引起異方差性,在此借鑒恩格爾定律構造了冪函數形式的數學模型,利用雙對數線性回歸模型進行分析。發現該模型的效果比二元線性回歸的效果要好得多,擬合優度提高到了87%。
4.4 在對雙對數模型進行統計檢驗時發現,北京的殘差平方和要比其他的地方大得多,模型對北京的擬合效果很低,引起這個原因是因為北京作為我國的政治、文化中心,在教育經費收入方面有很多的優惠政策。因此引入了虛擬變量D,重新構造模型進行擬合,發現模型的擬合效果進一步提高,解釋變量對被解釋變量的解釋程度達到了93%。因為虛擬變量的引入使得北京的計量模型和其他地區略有不同。
但本文仍然還有一些不足,如果模型中能夠引入解釋變量的滯后期和被解釋變量的滯后期,或許能取得更好的效果,使模型更加準確,預測功能更強,這些也是本文可以拓展的研究領域。
[1] 梁仕仁,黃婧.高等教育來源多元化:回顧、比較與分析.民辦高等教育研究.2006,(03).