胡春月
多元統計方法在分析全國主要農產品中的應用
胡春月
(貴州財經大學貴州貴陽550025)
中國是一個農業大國,農業關系到國計民生,是國民經濟的支柱產業,但是長期以來我國農業一直存在著地區發展不平衡的現象。在我國的不同地區,主要農產品發展存在著明顯差異,需要對各地區的主要農產品發展做出恰當的評價。文章選取8個指標來分析我國主要農產品發展狀況,分別為人均糧食產量、人均棉花產量、人均油料產量、人均糖料產量、人均水果產量、人均園林水果產量、人均瓜果類產量、人均蔬菜產量。利用主成分分析,將這8個變量降維,通過聚類分析,將特征相似的地區歸類。基于上述分析,結合我國國情提出了一些建議。
主成分分析;聚類分析;主要農產品
農業是國民經濟的基礎,國家經濟發展的程度,往往與農業有著緊密的聯系。主要農產品產量是農業發展的重要組成部分,反映出一個地區乃至國家的農業發展水平,一個地區及國家的農業發展水平又影響著主要農產品的產量。
韓翊(2019)通過比較優勢分析法,對內蒙古12種主要農產品的效率優勢指數、規模優勢指數、綜合優勢指數進行計算,選擇出葵花籽、莜麥、甜菜、谷子、馬鈴薯、胡麻籽為內蒙古優勢特色農產品[1];張曼琳等(2018)選取2001年—2015年新疆統計年鑒相關數據,在協整分析上建立自回歸模型,利用新疆糧食和棉花產量數據對新疆農民純收入進行實證分析,得出新疆糧食產量對農民純收入提升有促進作用,棉花產量對農民純收入提升有阻礙作用的結果[2]。
分析和研究我國各地區主要農產品產量的側重點,對國家主要農產品投入具有重要意義,有助于了解我國農業的發展分布情況,降低相關政策在制定和實施中的盲目性,有助于完善欠發達地區的農業發展政策。本文采用的多元統計分析方法在現實問題的處理中應用非常廣泛,如劉娜等(2014)將多元統計分析方法應用于重要質量控制中心研究[3],李曉芬等(2008)利用多元統計分析方法對辣椒品種的耐鹽性進行了評價[4]。本文選用2018年《中國統計年鑒》中反映我國按人口平均的主要農產品產量的8個指標的數據來進行分析并建立模型,根據模型借助R軟件進行逐步分析。
1.1.1 主成分分析方法
主成分分析方法的本質是“降維”,將高維數據有效地轉化為低維數據來處理,揭示變量之間的內在聯系,進而分析解決實際問題[5]。
1.1.2 主成分分析模型
1.2.1 聚類分析方法
把要研究的我國31個省(區、市)(不含港、澳、臺)按照一定的標準分為若干類,本文采用的是按照變量對觀測值進行聚類,樣品間的靠近程度通常用距離來衡量。
1.2.2 聚類分析模型
全髖關節置換術聯合阿侖膦酸鈉片對股骨頸骨折的療效及對骨密度水平的影響 ………………………… 劉克春等(9):1278
根據所收集的指標數據,借助R統計軟件工具計算各成分的貢獻率,結果如表1。
表1成分貢獻率
12345678 貢獻率/%40.86221.05712.63410.9797.3304.2842.8540.000 累積貢獻率/%40.86261.92074.55385.53292.86297.146100.000100.000
由表1數據可知,前4個主成分反映了信息的85.532%,可以作為評價31個地區按人口平均的主要農產品產量的綜合變量。這4個主成分的系數矩陣如表2。
表2系數矩陣
第一主成分 -0.333 -0.239-0.532-0.472-0.414-0.384 第二主成分0.555 0.600-0.253-0.119-0.3040.3390.214 第三主成分0.1840.665-0.254-0.499 -0.444 第四主成分0.5970.107 0.666 -0.193-0.380
根據表2,得到4個主成分函數分別如下:



第一主成分對應的系數主要為負,且各系數的差別不大,反映了一個地區的主要農產品產量的總體均衡情況;第二主成分對應的系數符號有正有負,反映了主食和輔食的類別差異;第三主成分把棉花和其他主要農產品區分開來,可以理解為經濟作物因子;第四主成分把糧食和糖料與其他主要農產品區分開來,可以理解為主食產品中的兩大類。我國31個地區各主成分得分情況如表3所示。
表3主成分得分情況
第一主成分第二主成分第三主成分第四主成分 第一主成分第二主成分第三主成分第四主成分 北京2.274-1.5520.723-0.113湖北-0.3101.251-0.768-0.565 天津1.968-1.2570.606-0.140湖南0.1460.601-0.367-0.449 河北-0.2490.074-0.325-0.543廣東0.764-1.4070.030-0.003 山西0.604-1.3240.6540.219廣西-3.584-2.412-2.9992.898 內蒙古0.3153.438-0.6061.573海南-2.639-1.193-0.213-0.665 遼寧0.233-0.1350.140-0.093重慶0.292-0.184-0.447-0.562 吉林1.6601.5980.7531.507四川0.4440.550-0.548-0.272 黑龍江1.8901.4971.3782.470貴州0.3300.315-0.875-0.809 上海2.201-1.4030.609-0.198云南0.120-1.036-0.5990.670 江蘇0.1640.353-0.344-0.833西藏2.180-0.4330.2860.062 浙江0.817-0.9800.277-0.548陜西-2.228-1.2320.270-0.326 安徽0.9530.4790.2490.196甘肅-0.4940.322-0.032-0.424 福建0.539-1.3970.164-0.400青海1.9320.382-0.245-0.184 江西0.6030.0740.1840.050寧夏-1.8591.263-0.179-1.326 山東-1.5180.931-0.611-0.928新疆-5.9450.0743.6910.548 河南-1.6032.742-0.858-0.814
從第一主成分來看,新疆和廣西的主要農產品平均產量總體較為均衡且較高,而北京和上海比較低;從第二主成分來看,內蒙古和河南的主要農產品平均產量在主食方面的產量比較高,而廣西輔食方面的平均產量比較高;從第三主成分來看,新疆是棉花平均產量最高的省份;從第四主成分來看,廣西在主食產品中的兩大類即糧食和糖料的平均產量比較高。
本文采用歐氏聚類計算相似矩陣,并采用系統聚類方法中的最大距離法聚類,結果如圖1所示。

圖1 聚類分析圖
取合并聚類為800,則31個地區可以分為4類,以下從聚類的結果分析各類地區按人口平均的主要農產品產量的特征。
第一類:廣西單獨為一類。從第一主成分主要農產品產量總體情況來看,其主成分預測值為負,且絕對值較大,這說明廣西按人口平均的主要農產品產量總體比較高;第二主成分其預測值為負值,且絕對值較大,這說明廣西主要生產輔食類農產品,且產量也較高;第三、第四主成分預測值絕對值較大,故將其單獨分為一類是合理的。
第二類:黑龍江、內蒙古、吉林分為一類。從主成分來看,三個省份的主成分得分預測值的絕對值排名比較靠前;結合實際情況來看,三個省一直以來都是我國的農業大省,且都盛產小麥、玉米等主要農產品,尤其是黑龍江耕地多且黑土地肥沃,人口稀少,機械化水平較高。
第三類:安徽、山西、甘肅、遼寧、江西、云南、貴州、江蘇、河北、湖北、重慶、湖南、四川、河南、山東、寧夏、新疆、海南、陜西分為一類。其中,山東、河南等省份雖然也是我國的農業大省,但是其人口眾多,故其按人口平均的主要農產品產量也略有遜色。
第三類:廣東、浙江、福建、北京、上海、西藏、天津、青海分為一類。其中廣東、浙江、福建、北京、上海、天津是中國工商業比較發達的地區,城市建筑面積占比較大,其發展的優勢不在農業方面。而西藏和青海地區土地較為貧瘠,適合一些水果的種植和畜牧業的發展。
按人口平均的主要農產品產量從總體上來說,廣西的人均糖料產量發展特別突出,其他各方面也均衡發展,平均產量總體較高。其他土地肥沃,耕地面積寬廣的地區,如黑龍江、內蒙古、吉林、河南、山東等地更是我國主要農產品發展的主力軍。其中黑龍江的人均糧食產量在全國遙遙領先,新疆的人均棉花產量是其他省份的兩百多倍,我國的人均糖料產量主要來源于廣西。
綜上所述,我國主要農產品發展的地區土地較為肥沃,耕地面積大,機械化和技術化水平較高,而工業、服務業發達的地區如北京、上海、天津因受地域的限制,主要農產品的產量較少。所以,在土地肥沃的平原地區,應當加快提高農業機械的創新水平,扎實推動規模化生產,保持農業產業持續發展;對于山地較多的地區,可以根據當地的氣候變化特點,種植合適的農作物,進行試點示范,提高農作物的生產力。山地地區有待提高的主要農產品發展空間較大,應鼓勵和支持培育農業合作組織,選拔有能力的專業人才來帶動農業合作組織的發展。
[1]韓翊.內蒙古特色農產品產業化發展研究[D].太原:山西農業大學.2019.
[2]張曼琳,董璐璐.新疆主要農產品產量對農村居民純收入的影響[J].新疆農墾科技,2018,41(11):50-52.
[3]劉娜,李軍,李寶國.多元統計分析在中藥質量控制中的應用和思考[J].中國中藥雜志,2014,39(21):4268-4271.
[4]李曉芬,尚慶茂,張志剛,等.多元統計分析方法在辣椒品種耐鹽性評價中的應用[J].園藝學報,2008(3):351-356.
[5]費宇.多元統計分析[M].北京:中國人民大學出版社,2014.
10.3969/j.issn.2095-1205.2022.06.39
F222.1
A
2095-1205(2022)06-119-04
胡春月(1994- ),女,漢族,貴州畢節人,碩士在讀,研究方向為大數據分析。