施靈萍 嚴麗玉



摘 要:本文選取15個指標來探究我國農業發展狀況,通過星象圖初步分析我國農業的發展特征。使用SPSS軟件對變量做面板數據的因子分析,對2018年的農業指標進行word聚類分析,將我國31個省市農業發展狀況劃分成五類。根據農業發展狀況分析我國農業現階段存在的問題,并提出建議,從而進一步了解我國農業的發展狀況。
關鍵詞:農業;指標;因子分析;聚類分析
A Comprehensive Analysis of Chinas Agricultural Development
Shi Lingping1.2 Yan Liyu1
1.Xiamen Institute of technology FujianXiamen 361000;2.Fuqing SanShan Middle School FujianFuqing 350000
Abstract:In this text,15 indicators were selected to explore the status of agriculture development in China.The characteristics of agricultural development is preliminarily analyzed by thestar chart.Using SPSS software for doing factor analysis of panel data.The agricultural indicators in 2018 were analyzed by word cluster analysis,the agricultural development status of 31 provinces and cities in China was divided into five categories.According to the agricultural development situation,this paper analyzes the existing problems of China's agriculture at this stage,and puts forward suggestions,so as to have a further understanding of the development situation of China's agriculture.
Keywords:agricultural;index;factor analysis;cluster analysis
一、緒論
農業作為我國三大產業的基礎產業,其重要性不言而喻。“十三五”綱要指出我國農業發展的進程是實現中國夢的基礎。中國是人口大國,農業的發展狀況與民生問題息息相關,了解我國農業發展進程,有利于促進我國經濟發展。本文對農業的研究范圍是狹義的農業。在國家統計局官網中搜集2014—2018年與農業相關的地區分省份年度數據,通過多元統計方法說明我國農業發展狀況,并提出相關建議。
二、農業指標的選取分析
依據指標選取原則,結合農業發展的特征,從農業生產、農業科技、農業社會發展水平中[1]選取了15個指標作為研究變量,構建指標變量表如下:
三、數據預處理
(一)數據的描述性分析
通過對比2014—2018年各地區的星象圖[2],發現各地區逐年的圖像無明顯變化,認為我國各地區的農業發展具有相對的穩定性。但各地區圖像形狀大小存在較大的差異,可知我國各地區農業發展不均衡。
(二)數據標準化處理
為深入了解我國農業發展狀況,對原變量數據進行Z-score標準化,其公式[3]如下:
Zij=Xij-Xj-Sj
其中,Xij是第i個樣本的第j個變量的原始值,Zij是Xij標準化后的值,Xj-是第j個變量的均值,Sj是第j個變量的標準差。
四、因子分析
(一)KMO和Bartlett球度檢驗
各指標間存在較大的相關性時,因子分析才有科學意義。運用SPSS軟件對2014—2018年的變量數據做KMO和Bartlett球度檢驗,結果詳見下表:
檢驗結果顯示,2014—2018年的KMO值均大于0.77,并且Bartlett球度檢驗結果小于顯著性水平(α=0.5),說明對2014—2018年的指標變量進行因子分析具有一定的依據性。
(二)因子分析
1.模型建立
因子分析最主要的思想就是降維,通過研究變量間的相關性,把相關性較大的變量歸為一類,最終轉變為較少的因子,并且這些因子之間不存在線性關系。由此,建立R型因子分析模型[4]如下:
x1=a11F1+a12F2+…+a1mFm+ε1
x2=a21F1+a22F2+…+a2mFm+ε2
xp=ap1F1+ap2F2+…+apmFm+εp
Fi是公共因子,aij為因子載荷。因子載荷是第i個變量在第j個公共因子上的占比,能夠反映變量在公共因子上的依賴程度。
2.提取公共因子
根據特征值大于1的抽取原則[4],對比主成分法與極大似然估計法提取的累計貢獻率,發現主成分法的累積貢獻率大于極大似然法的累計貢獻率,因此選擇主成分法計算因子載荷,提取的公因子數為3。
3.因子旋轉
為使各變量在各主因子上的載荷呈現出明顯的大小差異,需進行因子旋轉。在多元統計分析中,最大方差正交旋轉法[10]是因子旋轉方法中使用最廣泛的。