[摘 要] 本文運用偏最小二乘回歸方法對四川省農業生產投入要素結構進行了分析,得出除人員投入因素外其它生產要素都與農業產出成正相關,特別是機械能源和資金投入對農業產出具有顯著影響,而土地因素影響較小。
[關鍵詞] 農業生產 投入要素結構 偏最小二乘回歸(Partial Least Square)
四川省是我國的農業大省,2009農業總產值占GDP比重的26.07%,全省農民人均純收入4462.1元,比上年增長8.3%,說明促進農業增長仍然是四川農民的促進增收的主要途徑之一。但由于四川省土地狀況除成都平原外多為丘陵和山地,人均耕地少,基礎設施薄弱,自然災害頻發,雖然近年來政府對農業投入逐年加大,但產出效益并沒有顯著提高。因此不能僅僅依靠增加農業生產要素的投入,還要注重農業生產投入要素結構的優化。農業生產投入要素結構的變化對農業生產具有重要影響,有研究發現生產要素投入結構的變化是反映技術變動和發展方向的一個主要指標,土地密集型作物(如糧食)生產的資金(尤其是機械)對勞動的替代趨勢極為顯著,而勞動密集作物(如園藝作物)生產的勞動與資金很難替代。
一、研究方法
1.變量和數據處理
本文在有關農業投入結構和產出要素研究的基礎上,結合四川省農業生產的實際情況,依據《四川統計年鑒》的有關數據,從產值與產量方面確定了農林牧漁總產值和單位面積農作物產量(包括糧食、油料、棉花、甘蔗、麻類)兩個產出指標,從人員、物質和資金方面確定了農業從業人員、農作物播種面積、農業機械總動力、化肥施用量、農業生產用電和農業資金投入(包括財政支出中用于農業支出、金融機構農業貸款)六個投入指標進行分析,從數據的可獲得性及研究的現實性和科學性出發,本文確定研究的時期為1990到2008共19年的數據,具體數據略。
2.自變量的共線性分析
從相關系數(表1)可以看出,變量間的相關性較高,直接運用普通最小二乘法建立以產出指標為因變量,投入指標為自變量的線性回歸方程,可能存在多重共線性問題。這里直接建立回歸方程,并計算變量膨脹因子(VIF: Variance Inflation),結果如表2。
表1 指標相關系數
x1x2x3x4x5x6y1y2
x11
x20.66301
x30.75710.92541
x40.63410.98380.95681
x5-0.6192-0.9803-0.9457-0.99061
x60.59770.98910.87950.9587-0.95931
y10.67880.97290.90340.9460-0.93410.97051
y20.26710.60440.65350.6439-0.64500.61720.57311
方程一的擬合優度R-Square還是不錯的,但是兩個方程中各變量的顯著性均通不過檢驗,而且各變量的膨脹因子都大于10,最大的VIF(X2)達455.1936。從而得出,自變量存在著嚴重的共線性,不宜用普通最小二乘法進行分析。加上因變量為兩個,所以本文選擇偏最小二乘回歸法對農業投入產出結構因素進行分析。
3.偏最小二乘回歸法
偏最小二乘回歸(Partial Least-Squares -regression,PLS)方法是S.Wold和C.Albano提出的一種新型的多元統計數據分析方法。該方法將多元線性回歸分析、變量的主成分分析和變量間的典型相關分析有機結合起來,在一個算法下同時實現了回歸建模、數據結構簡化和兩組變量間的相關分析,適宜處理樣本容量小、自變量多、變量間存在嚴重多重相關性的統計問題。
其建模步驟包括:首先,采用主成分分析與典型相關分析的思想分別提取因變量和自變量的主成分,即偏最小二乘因子,這不僅保證了提取的成分盡可能多地保留原始變量的信息且保持相互獨立,而且使自變量與因變量的相關性最大;然后,采用普通最小二乘法建立回歸方程,因成分間已不存在多重共線性,此時采用普通最小二乘估計所得結果穩定性較好。由此可見,偏最小二乘回歸集中了主成分分析、典型性相關分析及普通多元回歸分析的優點。
二、研究結果
本文利用統計分析軟件SAS中PLS過程來完成偏最小二乘回歸,結果如下。
1.PLS成分
輸出結果顯示,自變量組提取的第k個成分可解釋變差的百分比分別為81.7960%,14.8532%,2.88115%,0.3805%,0.0637%,0.0250。可解釋因變量組 變差的百分比分別為57.3511%,1.2731%,3.9880%,2.8071%,0.1725。由此可見對Y的解釋能力已非常微弱,可初步直觀地判斷只需提取一個成分就已足夠了。為準確,再使用“舍一交叉驗證法”進行交叉驗證,計算結果如表3。可見當取一個偏最小二乘因子時,得到的預測殘差平方和的均方差(PRESS)最小,其值為0.7473。
表3 交叉驗證法確定成分抽取數
Number of Extracted Factors0123456
Root Mean PRESS1.066670.747265*0.8462680.8475330.8988110.9552131.053714
注:右上角帶“*”為最小PRESS。
此時,提取的偏最小二乘因子為
(右上角帶“*”的變量表示標準化變量)。
2.PLS回歸結果
PLS回歸的參數估計如表4。
表4 偏最小二乘回歸方程的參數估計
標準化回歸方程原始變量回歸方程
y1y2y1y2
Intercept00-1396.9657995.76
x10.0838780.038932.326844.20348
x20.1975060.0916680.298760.53808
x30.189010.0877254.252567.66409
x40.1981680.0919754.605518.31994
x5-0.18743-0.08699-0.41891-0.75676
x60.1902070.088280.621631.12299
3.變量投影重要性指標
在PLS中,用變量投影的重要性指標VIP(Variable Importance in Projection)來測度自變量Xi在解釋因變量Y時作用的重要性。一般情況下VIP指標值應大于0.8,當小于該值時,可認為自變量對因變量的解釋是很微弱的,可不納入PLS方程中,計算結果如圖1。
圖1 變量投影重要性指標
三、結果分析
1.從PLS回歸方程發現農林牧漁產值和單位面積農作物產量都同農作物播種面積、農業機械總動力、化肥施用量、農業生產用電和農業資金投入要素成正相關,而同農業從業人員量成負相關。從回歸方程系數看,對產值和產量的邊際貢獻最大的是農業生產用電量,其次是化肥施用量。這與現代農業的發展趨勢是一致的。從歷年數據不難看出,在農業產值和單位面積產量穩步增長的同時,農業從業人員在逐步減少,而其它投入要素卻大幅增長,特別是電力投入增長了近四倍。出現這一情況的原因在于大量農村人口從事非農產業,特別是農民工的發展與壯大,從而在農村中出現大量農業兼營人員和非農人員,而真正的純農業生產人員逐步減少。而隨著農業機械化的推廣,農業生產、加工機械大量普及,導致對能源動力的需求大大增加。同時,農業種植技術的提高和土地生產能力的降低又增強了對化肥的需求。現代農業不僅依靠生產技術水平的提高,還要求較高水平的經營與管理,這總體來看,隨著農業生產現代化水平的不斷提高,農業生產對勞動力需求正在被機械能源等科技力量和資本力量所替換。
2.偏最小二乘因子系數表明,農業機械總動力、化肥施用量、農業生產用電、農業從業人員和農業資金投入對農業產出的解釋作用較大,這與VIP指標顯示結果一致。其中農業機械總動力和農業生產用電作用最大,據此可以將偏最小二乘因子命名為“動力投入因子”。這說明,農業生產中機械和能源的投入起著至關重要的作用,這與現代農業中農業機械化要求是一致的。
但是農作物播種面積的投入作用最低,根據VIP理論,其值小于0.8就可以將其不納入到PLS回歸方程中,可見土地的投入對農業產出起的作用微小。這似乎與理論不符,其實不然。從農作物播種面積的絕對數看,2000年以前逐年增加,之后出現下降趨,但總體沒有多大變化。這與我國農業政策有關,最近幾年我們國家從可持續發展角度出發提出了退耕還林(草)工程,一部分農作物播種面積被林(草)地面積所替代,而在之前,我們過多地強調糧食安全而大量開荒種地。在投入大量增加時,由于播種面積幾乎不變,這就導致農業投入的結構變化基本由機械能源資金等要素的變化來詮釋,這表明四川省動力投入在一定程度上可以替代土地的要素投入。
四、結論
本文選取了四川省90年到08年19年農業投入產出數據,運用偏最小二乘回歸法對四川省農業投入結構變化與產出的影響進行了分析,分析表明農業產出同投入結構有關重大關系,農業產出同農作物播種面積、農業機械總動力、化肥施用量、農業生產用電和農業資金投入成正相關,而同農業從業人員投入成負相關。因此,一方面應進一步加大這方面的投入,推進農業機械化和現代化,同時加快農村剩余勞動力轉移;另一方面在保證糧食安全的同時,應繼續堅持退耕還林工程,實現農業生產的可持續發展。
參考文獻:
[1] 胡瑞法 黃季混:農業生產投入要素結構變化與農業技術變動趨勢[J].中國農村觀察,2001(6)
[2] 顧俊龍:農業投入與產出結構變化及其影響因素研究[J].山西財經大學學報,2006,28(5)
[3]劉 巖:我國農業投入結構合理化問題研究[J].農業經濟,2005(5)
[4]王惠文:偏最小二乘方法及其應用[M].北京:國防工業出版社,1999