999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

嶺回歸和主成分回歸下的農業總產值因素分析

2017-03-31 08:53:00董小剛林詩明王純杰
長春工業大學學報 2017年1期
關鍵詞:農業影響分析

董小剛, 趙 浪, 林詩明, 王純杰

(長春工業大學 基礎科學學院, 吉林 長春 130012)

?

嶺回歸和主成分回歸下的農業總產值因素分析

董小剛, 趙 浪, 林詩明, 王純杰

(長春工業大學 基礎科學學院, 吉林 長春 130012)

選取7個影響吉林省農業總產值的因素,運用SAS軟件建立了農業總產值的多元回歸模型。為解決經典線性回歸模型的多重共線性問題, 運用主成分回歸模型和嶺回歸模型對其進行了修正,最后對這兩個修正模型進行了比較分析,得出嶺回歸模型相對較優的結論。

SAS軟件; 多重共線性; 主成分回歸; 嶺回歸

0 引 言

吉林省地處中國東北中部地區,擁有遼闊的平原地帶和富饒的水域環境等自然資源,素有“黑土地之鄉”的美稱,其人均耕地面積處于全國前列,是中國重要的糧食生產基地之一。無論是從地理位置還是從擁有的自然資源來看,吉林省都具有高效農業發展的優勢,了解吉林省農業總產值的影響因素,提出有利于吉林省農業發展的政策建議,有效促進農業的發展,這對吉林省以及全國都有重要的影響。文中將通過建立多元線性回歸模型分析影響吉林省農業總產值的影響因素。

1 影響因素的選取與數據的來源

很多因素影響農業總產值,哪些才是主要的影響因素,這又是一個復雜的問題。由于農業發展直接影響國民生活,因此影響農業產值因素的分析一直以來備受關注,梅玟[1]從時間序列分析的角度研究了政策因素對安徽省農業產值增長的制約;湯鵬主[2]采用協整分析方法,并基于VAR模型對變量建立脈沖響應函數和進行方差分解,對財政支農支出和農業產值兩者的關系進行了研究;孫楊[3]通過線性回歸的方式研究了農業機械化水平對農業總產值的影響;高雯[4]對農業總產值與化肥施用量、農用機械總動力、有效灌溉面積、成災面積進行了回歸分析;張溥[5]分析了中國農業產值影響因素并對影響因素與農業產值之間進行了多元回歸分析;鐘雅珊[6]通過多元對數計量經濟模型研究了農業生產總值與農用機械總動力、第一產業就業人數、財政對農業的支出的關系。上述研究中,涉及對農業總產值的影響因素相當有限,難以看出這些因素綜合起來對農業總產值的影響,文中將對被解釋變量為農業總產值,解釋變量為7個對農業總產值影響較大的因素進行多元回歸分析。即:農業總產值Y為被解釋變量,指從事農林牧漁業總產值[3-6];農業從業人員X1,指從事農林牧漁業的勞動者人數;農作物播種面積X2,指實際播種或移植有農作物的面積;有效灌溉面積X3,指具有一定水源配套設備的耕地面積;農業機械總動力X4,指主要用于農林牧漁業的各種動力總和;農村用電量X5,指農村范圍內從事生產經營、日常生活用電總量;化肥使用量X6,指本年內實際用于農業生產的化肥數量;財政支農支出X7,指國家財政對農村各項生產的支出。文中影響因素指標和數據皆來源《吉林省統計年鑒2015》,數據分析均在SAS9.4環境中[7]實現。

2 多元線性回歸模型分析

[8]

對農業總產值增長的研究方法多種多樣,有采用柯布—道格拉斯生產函數模型[9],有采用脈沖響應函數方法來分析[10],也有基于灰色關聯度分析[11];常見的是采用逐步回歸分析的方法來分析[12-14]。文中分別采用了主成分回歸和嶺回歸兩種方法來對影響農業總產值因素進行分析,并對這兩種方法進行比較分析。

首先,對被解釋變量Y和各個解釋變量Xi進行相關分析,從輸出的結果可以看出,被解釋變量與解釋變量之間具有很大的相關性,除了Y和X1的相關系數為0.5左右,其余的都為0.9左右,其中Y與X4的相關系數甚至高達0.992;再通過繪制散點圖,考察被解釋變量Y隨各解釋變量Xi的變化情況。從被解釋變量與各個解釋變量的“散點圖矩陣”也可以看出,除了解釋變量X1外,被解釋變量Y與其他的解釋變量Xi均成線性趨勢關系,說明可以考慮建立一個多元線性回歸模型。再對各個解釋變量間進行相關分析,從輸出的相關系數矩陣可以看出,各相關系數對應的P值都很小,說明各個解釋變量之間是顯著相關的。

設被解釋變量Y與解釋變量X1,X2,…,X7的多元線性回歸模型的一般形式為:

式中:β0,β1,β2,…,β7----未知參數;

β0----回歸常數;

β1,β2,…,β7----回歸系數;

ε----隨機誤差。

運用普通最小二乘估計的方法求得各個參數估計值。擬合出回歸模型:

0.077 3X3+0.298 7X4+50.167 3X5+

由方差分析表可知,F統計量的值為1 051.99,所對應的P值<0.000 1,說明模型整體擬合得很好;復決定系數R2=0.996 2,調整后的R2=0.995 3,說明模型對樣本的擬合效果很好。再由參數估計表知,解釋變量X2,X3,X4,X6,X7的t檢驗統計量所對應的P值均>0.05,說明這些變量對被解釋變量影響不顯著。在上述分析中已知各個解釋變量之間具有很大的相關性,則出現解釋變量檢驗效果不顯著可能是存在多重共線性的緣故。

共線性診斷見表1。

根據spearman相關系數表知樣本等級相關系數rs的t檢驗統計量所對應的P值均>0.05,說明不存在異方差性;由Durbin-Watson D診斷表知DW=1.778,經查DW檢驗表知dL=0.877,dU=1.749,dU

表1 共線性診斷

3 主成分回歸和嶺回歸分析

考慮到各個解釋變量之間的單位不同,先把原始數據標準化,這樣可以消除量綱對數據結構的影響。

3.1 主成分回歸

主成分回歸方法與普通最小二乘回歸方法不同,當存在多重共線性關系時,主成分回歸是以犧牲無偏性換取方差的大幅度減小,最終降低均方誤差,達到回歸估計最優的目的;主成分回歸主要運用主成分分析里面降維思想,由于主成分分析是在不至于損失太多信息的情況下利用正交旋轉變換把多個指標轉化為幾個綜合指標,且各個綜合指標之間互不相關,所以再用這些綜合指標來進行回歸分析就很好地消除了多重共線性帶來的影響。

相關矩陣的特征值見表2。

表2 相關矩陣的特征值

表2中,最大的特征值為5.817 588 52,最小的是0.004 657 35。再看看累積貢獻率,第一個主成分為83.11%,說明第一個主成分里面包含了原始數據里面的83.11%的信息量,前兩個主成分的累積含有原始數據里面的95.85%的信息量。所以取兩個主成分就足夠。即:

Z1= 0.254 386STDX1+0.385 153STDX2+0.393 001STDX3+0.407 750STDX4+

Z2= 0.825 713STDX1-0.273 124STDX2+0.109 378STDX3-0.176 918STDX4-

再用Y對這兩個主成分Z1,Z2作普通最小二乘回歸,得到主成分回歸方程為:

從方差分析表可以看出,F統計量的值為1 223.46,其P值<0.000 1,說明該模型整體擬合得很好;復決定系數R2=0.986 3,調整后的R2=0.985 5,說明這個模型對樣本的擬合效果很好。再由參數估計表知,Z1,Z2的t檢驗統計量的P值均<0.01,即參數通過檢驗。綜上所述,該主成分回歸模型可行,該模型為:

將Z1,Z2代入上式即得標準化的主成分回歸方程:

還原為原始數據的主成分回歸方程為:

從模型(8)可知,X1每增加一個單位,Y就減少0.616 45個單位;X2每增加一個單位,Y就增加0.219 09個單位;X3每增加一個單位,Y就增加0.263 75個單位;X4每增加一個單位,Y就增加0.219 09個單位;X5每增加一個單位,Y就增加12.606 3個單位;X6每增加一個單位,Y就增加1.116 61個單位;X7每增加一個單位,Y就增加1.862 83個單位。說明農業總產值與農業從業人員(X1)表現出負相關的關系,農業總產值與其他影響因素都表現為正相關的關系,且在各個因素中,農村用電量(X5)對農業總產值的影響處于最大,化肥使用量(X6)和財政支農支出(X7)對農業總產值的影響也很大。農業總產值實際值與主成分回歸擬合值的對比折線圖如圖1所示。

圖1 農業總產值實際值與主成分回歸擬合值的對比折線圖

從圖中可以看出,該模型擬合出來的值與實際值接近。

3.2 嶺回歸分析

嶺回歸(ridge regression)是對普通最小二乘估計的一種改進方法,由霍爾(A.E.Hoerl)在1962年首次提出來,1970年霍爾又和肯納德(Kennard)對嶺估計給予了詳細討論。當解釋變量間存在多重共線性,|X′X|≈0時,如果把一個正常數矩陣kI(k>0)加到X′X中,則X′X+kI接近奇異的程度就會比X′X接近奇異的程度小很多,進而改進普通最小二乘估計,達到消除共線性影響的效果。用嶺回歸方法消除多重共線性的問題,其實就是一種解釋變量選元過程。嶺跡圖如圖2所示。

由圖2可以看出,當k值較小時,X5的標準化嶺回歸系數的絕對值比較大,并且隨著k的增大而迅速減小,根據原則二[8]將X5剔除;X3的標準化嶺回歸系數相對穩定并且系數的絕對值比較小,則根據原則一[8]可將其剔除;同樣,可將變量X2剔除。再對剩余的變量X1,X4,X6,X7重新作嶺回歸分析,嶺跡圖如圖3所示。

圖2 嶺跡圖

圖3 重嶺回歸嶺跡圖

從圖3可以看出,嶺回歸模型的嶺參數k處于0.20~0.30時,嶺參數基本處于穩定狀態,因此取嶺參數k=0.25,此時Y對X1,X4,X6,X7標準化后嶺回歸方程為:

由方差分析表可知,F統計量的值為1 115.07,所對應的P值<0.000 1,說明嶺回歸模型整體擬合效果很好;復決定系數R2=0.992 9,調整后的R2=0.992 0,說明此模型對已知樣本的擬合效果非常好。再由參數估計表知,X1,X4,X6,X7的t檢驗統計量的P值均<0.01,即參數通過檢驗。綜上所述,此嶺回歸模型可行。再對模型進行多重共線性檢驗,見表3。

表3 共線性診斷

由表3可知,最大方差膨脹值和最大條件指數分別為28.139 32和12.649 29,這比普通最小二乘回歸下的最大方差膨脹值(145.814 65)和最大條件指數(139.486 75)有了很大的減少,說明嶺回歸模型在很大程度上消除了多重共線性的影響。

由模型(9)可知,X1每增加一個單位,Y就減少0.007 02個單位;X4每增加一個單位,Y就增加0.356 02個單位;X6每增加一個單位,Y就增加0.273 53個單位;X7每增加一個單位,Y就增加0.318 85個單位。說明農業總產值Y和農業從業人員(X1)存在著負相關關系,農業機械總動力(X4)、化肥使用量(X6)、財政支農支出(X7)為影響農業總產值Y的主要因素。農業總產值實際值與嶺回歸擬合值的對比折線圖如圖4所示。

圖4 農業總產值實際值與嶺回歸擬合值的對比折線圖

從圖中可以看出,該模型擬合出來的值與實際值接近。

3.3 模型對比分析

在上述分析中,分別運用了主成分回歸法和嶺回歸法來消除多重共線性的影響,最終得出兩個模型,見表4。

表4 解釋變量選擇準則

從模型檢驗和參數檢驗來看,各個檢驗統計量的P值均<0.01,說明模型與參數均通過檢驗;從C(p)準則來看,2.000 0<4.000 0,說明主成分回歸模型相對較優;從R2準則來看,0.986 3<0.992 9,說明嶺回歸模型相對較優;從AIC準則來看,-151.455 1>-171.012 0,說明嶺回歸模型相對較優。并且嶺回歸的變量解釋更加符合實際,綜上分析,嶺回歸模型相對較優,即:

因此,影響農業總產值Y的主要因素有農業機械總動力(X4)、化肥使用量(X6)、財政支農支出(X7)。而農業總產值Y受農業從業人員因素(X1)的影響很小,并且農業總產值Y和農業從業人員因素(X1)表現出負相關的關系。

4 結論與建議

4.1 農業勞動力投入

從模型(10)可以看出,農業總產值和農業從業人員存在著負相關的關系,且系數絕對值較小,反映出勞動力過剩、利用效率低下的狀況。進入21世紀以來,科技快速發展,農業機械化水平越來越高,逐漸取代了手工勞動,農業從業人員的增加不再是拉動農業產值的重要途徑。為了解決這一問題,政府應該拓寬農村從業人員的工作渠道,轉移一定量的農業勞動力到其他產業,并對繼續從事農業的勞動力進行培訓教育,使其掌握先進的技術來提高農業產出。

4.2 農業機械總動力

從模型(10)可以看出,農業總產值和農業機械總動力存在著正相關的關系,且系數絕對值最大,表明了農用機械總動力對農業總產值有著最大的影響,農業機械化是現代農業科技水平的表現,也是農業產值增加的關鍵。因此,吉林省政府應該加大對大型拖拉機、收割機、農藥噴灑機等大型機械設備的投入,來大幅度提高農業生產率和生產力水平。

4.3 財政支農支出

從模型(10)可以看出,農業總產值和財政支農支出存在著正相關的關系,且系數的絕對值第二大,表明財政支農支出對農業總產值起著至關重要的影響,增加農業財政支出力度會引起農業總產值的增加。因此,吉林省政府應該加大對農業的財政傾斜力度,保持對農業補貼的持續、穩定增長,并對吉林省財政支農支出的結構進行調整,對財政支農支出資金的管理體制進行完善。同時,積極引導社會力量投資于農業的生產、技術開發、新品種推廣,以彌補國家財政的不足。

4.4 化肥使用量

從模型(10)可以看出,農業總產值和化肥的使用量存在著正相關的關系,且系數的絕對值第三大,表明化肥使用量對農業總產值的影響較大,增加化肥的投入量會引起農業產值的增加。但在實際中,我們不僅不能大規模的增加化肥的投入量,反而應該對其采取謹慎的態度,合理施用。過量施肥會增加不必要的成本,降低了農作物的產出,更為嚴重的是導致了土地鹽堿化、土壤肥力的下降,不利于農業的可持續發展。因此,化肥的使用必須合理,在保證農產品需要的基礎上,對化肥實行有效配置,對氮磷鉀合理配置,提高化肥的利用率,保證農業總產值的穩定增長。

[1] 梅玟.安徽省農業產值增長制約因素的相關分析[J].技術經濟,2006,25(7):84-86.

[2] 湯鵬主.財政支農支出和農業產值增長的關系[J].現代經濟探討,2008(8):71-75.

[3] 孫楊.農業總產值影響因素的分析:以機械總動力為影響因子[J].內蒙古科技與經濟,2008(11):2-3.

[4] 高雯.我國“兩型”農業發展影響因素分析[J].安徽農業科學,2011,39(27):17049-17051.

[5] 張溥.中國農業產值影響因素分析[J].商場現代化,2013(5):106-107.

[6] 鐘雅珊.農業總產值的影響因素綜合分析[J].經濟研究,2013(29):56-60.

[7] 夏坤莊.深入解析SAS[M].北京:機械工業出版社,2015:442-469.

[8] 何曉群.應用回歸分析[M].4版.北京:中國人民大學出版社,2015:57-203.

[9] 漆文萍.農業總產值指數影響因素的模型分析:以江西省為例[J].南昌大學學報,2005,36(4):67-72.

[10] 李國璋.我國農業產值的影響因素分析[J].統計與決策,2007(22):83-85.

[11] 徐靜.吉林省農業產業結構的灰色關聯度分析[J].企業導報,2013(23):159-160.

[12] 迪娜·帕夏爾汗.影響新疆農林牧漁產值增長因素的逐步回歸分析法:基于1979-2013年時間序列數據[J].新疆農業科技,2015(3):1-3.

[13] 呂海燕.基于逐步回歸分析的河南糧食產量因素研究[J].河南科學,2013,31(12):2133-2136.

[14] 王純杰,董小剛,陳嘉,等.基于分位數回歸的長春市職工工資水平的分析[J].長春工業大學學報:自然科學版,2010,31(4):367-373.

Agriculture output factor analysis with ridge regression and principal component regression

DONG Xiaogang, ZHAO Lang, LIN Shiming, WANG Chunjie

(School of Basic Sciences, Changchun University of Technology, Changchun 130012, China)

Seven factors influencing agricultural output of Jilin Province are selected and then the multiple regression model for the output is established with SAS software. To solve the multicollinearity problem in the classical linear regression model, we adjust the model with both the principal component regression and ridge regression model. The improved the models are compared and it comes to a conclusion that the ridge regression has better performance.

SAS software; multicollinearity; principal component regression; ridge regression.

10.15923/j.cnki.cn22-1382/t.2017.1.01

2016-10-17

國家自然科學基金資助項目(11301037,11571051); 吉林省教育廳“十三五”規劃項目(2016317)

董小剛(1961-),男,漢族,吉林長春人,長春工業大學教授,博士,主要從事數理統計方向研究,E-mail:dongxiaogang@ccut.edu.cn.

C 812

A

1674-1374(2017)01-0001-07

猜你喜歡
農業影響分析
國內農業
今日農業(2022年1期)2022-11-16 21:20:05
國內農業
今日農業(2022年3期)2022-11-16 13:13:50
國內農業
今日農業(2022年2期)2022-11-16 12:29:47
是什么影響了滑動摩擦力的大小
擦亮“國”字招牌 發揮農業領跑作用
今日農業(2021年14期)2021-11-25 23:57:29
哪些顧慮影響擔當?
當代陜西(2021年2期)2021-03-29 07:41:24
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
擴鏈劑聯用對PETG擴鏈反應與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
主站蜘蛛池模板: 亚洲无码一区在线观看| 欧美福利在线观看| 精品无码一区二区三区电影| 欧美三级视频在线播放| 日本欧美在线观看| 国产精品免费入口视频| 九九精品在线观看| 免费国产小视频在线观看| 欧美成人午夜视频| 夜夜拍夜夜爽| 综合人妻久久一区二区精品 | 国产在线拍偷自揄拍精品| 久久精品国产精品青草app| 久爱午夜精品免费视频| 成人夜夜嗨| 全部免费特黄特色大片视频| 极品国产在线| 激情亚洲天堂| 欧美日本一区二区三区免费| 免费av一区二区三区在线| 亚洲无码视频喷水| 亚洲精品爱草草视频在线| 最新国产精品鲁鲁免费视频| 精品国产免费观看一区| 九九热精品视频在线| 国产丝袜啪啪| 日韩专区欧美| 亚洲成人一区二区三区| 日韩精品亚洲精品第一页| 国产97视频在线| 欧美一区二区三区不卡免费| 久久福利网| 色国产视频| 色婷婷色丁香| 国产精品三级专区| 亚洲AV永久无码精品古装片| 无码AV日韩一二三区| 欧美国产视频| 日本亚洲欧美在线| 毛片最新网址| 2022国产91精品久久久久久| 91青青草视频在线观看的| 国产性爱网站| 中文成人在线| 为你提供最新久久精品久久综合| 999国内精品久久免费视频| 国产微拍精品| 人妻丰满熟妇αv无码| 91丝袜美腿高跟国产极品老师| av尤物免费在线观看| 国产欧美日韩精品综合在线| 中文字幕亚洲第一| 欧美福利在线播放| 亚洲综合片| 国产菊爆视频在线观看| 亚洲日本韩在线观看| 久久久四虎成人永久免费网站| 亚洲天堂久久新| 亚洲国产91人成在线| 国产精品免费露脸视频| 狼友av永久网站免费观看| 亚洲香蕉久久| 91精品国产无线乱码在线| 亚洲人成影视在线观看| 毛片免费网址| 亚洲一区二区日韩欧美gif| 国产你懂得| 一级成人欧美一区在线观看 | 国产精品久线在线观看| 无码区日韩专区免费系列| 国产亚洲视频播放9000| 老司机午夜精品网站在线观看| 国模粉嫩小泬视频在线观看| 中文字幕波多野不卡一区| 丝袜美女被出水视频一区| 亚洲 成人国产| 婷婷六月在线| 波多野结衣一区二区三视频 | 精品成人一区二区三区电影| 国产成人精品一区二区免费看京| 午夜精品久久久久久久99热下载| 国产精品熟女亚洲AV麻豆|