999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林下的云南省耕地利用效率測算及基尼系數分析

2023-12-29 00:00:00李昊勛鄭宏剛劉淑霞趙昊陳冉
湖北農業科學 2023年7期

摘要:以2011—2020年云南省16個地州市為研究對象,對地均農業機械動力、地均勞動力等10個指標進行數據收集,在R語言中的隨機森林算法下得到指標權重進而得出16個地州市的耕地利用效率;并根據基尼系數平均差公式計算得到6組不同區域之間的耕地利用效率基尼系數。結果表明,迪慶藏族自治州、德宏傣族景頗族自治州、怒江傈僳族自治州、大理白族自治州在2011—2020年平均耕地利用效率較高,普洱市、臨滄市平均耕地利用效率相對偏低;滇中和滇西相比其他5組不同區域的耕地利用效率基尼系數整體在減小,而滇中和滇南以及滇南和滇北的平均基尼系數是6組不同區域平均基尼系數中最小的2組。

關鍵詞:耕地利用效率;隨機森林;基尼系數;云南省

中圖分類號:F301.21" " " " "文獻標識碼:A

文章編號:0439-8114(2023)07-0032-06

DOI:10.14088/j.cnki.issn0439-8114.2023.07.006 開放科學(資源服務)標識碼(OSID):

Abstract: Taking 16 autonomous prefectures and cities of Yunnan Province from 2011 to 2020 as the research object, data of 10 indicators such as agricultural machinery power and labor force per land was collected, and the weights of these indicators were obtained by using the random forest algorithm in R language. On the basis of this, the cultivated land use efficiency of the 16 prefectures and cities was obtained. The Gini coefficients of cultivated land use efficiency among six groups of different regions were calculated according to the Gini coefficient mean difference formula. The results showed the average cultivated land utilization efficiency of Diqing Tibetan Autonomous Prefecture, Dehong Dai and Jingpo Autonomous Prefecture, Nujiang Lisu Autonomous Prefecture, and Dali Bai Autonomous Prefecture was high from 2011 to 2020, while the average cultivated land utilization efficiency of Pu’er City and Lincang City was relatively low; compared with other five groups of different regions, the Gini coefficient of cultivated land utilization efficiency of central and western Yunnan decreased as a whole, while the average Gini coefficients of central and southern Yunan, and southern and northern Yunnan" were the smallest in the 6 groups of different regions.

Key words: cultivated land use efficiency; random forest; Gini coefficient; Yunan Province

耕地是一種為人類提供糧食作物的特定資源和生產要素,也是人類賴以生存和保證社會生產發展、國家糧食穩定和生態穩定可持續的重要基礎之一,始終是不可替代的農業生產資料[1,2]。目前,隨著糧食安全戰略的推進,耕地利用效率的研究與實踐存在著一系列問題,如何精準分析耕地利用率的現狀及其影響因子是眾多學者研究的主題之一,也是當前土地工作的重點。研究分析區域耕地利用效率情況及對糧食生產的影響,鑒別和分析主要的影響因素,對實施耕地糧食戰略措施和開展耕地有效利用保護等工作提供依據有重要現實意義。

不少學者針對耕地利用問題及其利用效率從不同的角度進行了研究和探索,在研究方法和模型上,多采用DEA模型評價法、AHP法、灰色關聯法、PCA法和Super-SBM模型評價法等[3-8]。此外,一些學者還集中于耕地利用效率評價、區域差異等領域研究[9-11]。這些研究方法主觀因素影響較大,同時一些模型在做回歸分析和分類分析中也存在過擬合的現象。目前,以機器學習為理論研究的人工智能算法已經被運用于一些評價模型和預測模型的構建中[12],它是一種多領域交叉的學科,主要包括了神經網絡、隨機森林、決策樹算法、支持向量機等算法。機器學習算法對很多種資料可以產生高準確度的分析和探索,同時也能深入挖掘數據,避免受主觀因素的影響。

本研究在對機器學習研究的基礎上,采用機器學習中的隨機森林算法,以2011—2020年云南省16個地州市為樣本構建耕地利用效率的隨機森林模型計算指標權重和耕地利用效率,并且通過基尼指數直接算法求出不同區域間的耕地利用效率基尼系數來分析和研究耕地利用系統的動態性、影響性和不同的差異性等特點[13],為更好地推進耕地利用保護和充分利用耕地提供一定的理論和建議。

1 研究區域概況與數據來源

1.1 研究區域概況

云南省地處中國西南邊陲,位于東經97°31′—106°11′、北緯21°08′—29°15′,北回歸線橫貫南部,北依亞洲大陸,南連東南亞半島,處在東南季風和西南季風控制之下,同時受西藏高原區的影響,形成了復雜多樣的自然地理環境。云南省行政區內現設16個州(市),共有129個縣(市、區),國土總面積39.4萬km2。其中,耕地面積占全省總面積的15.97%[13]。

云南省高原特色農業、東北大農業、江浙集約農業和京津滬都市農業是中國現代農業發展的4種模式,且云南省的糧食產量在全國13個主產區之外穩居首位,因此糧食的產量離不開耕地的有效利用,研究云南省耕地利用效率水平對提高本省乃至全國糧食產量研究有重要意義。

1.2 數據來源

數據來源于2011—2020年的《中國城市統計年鑒》《云南省統計年鑒》《云南省政府經濟與社會發展報告》以及云南省農業農村廳和云南省昆明市、曲靖市、玉溪市、保山市、昭通市、普洱市、麗江市、臨滄市、楚雄彝族自治州(簡稱楚雄州)、紅河哈尼族彝族自治州(簡稱紅河州)、文山壯族苗族自治州(簡稱文山州)、西雙版納傣族自治州(簡稱西雙版納州)、大理白族自治州(簡稱大理州)、德宏傣族景頗族自治州(簡稱德宏州)、怒江傈僳族自治州(簡稱怒江州)、迪慶藏族自治州(簡稱迪慶州)16個州(市)的官方統計資料。

2 指標體系構建與研究方法

2.1 指標體系構建

對耕地利用效率指標的選取國內外許多學者基本都是從投入和產出2個方面來構建指標體系[14-16],并且應遵循數據的科學性、可獲取性、全面性等原則[17]。

本研究除了采用耕地投入因素和耕地產出因素指標外,還加入耕地利用因素和耕地可持續性因素指標。耕地投入因素主要體現為投入相關的勞動力、資本等;耕地利用因素為在不同區域耕地質量和不同耕地水平條件下對耕地的利用程度;耕地產出因素主要表現為對耕地的投入后所產生的耕地收益;耕地可持續性因素是在滿足自己需求的同時所能擁有利用資源的安全基準前提。以地均農業機械動力、地均勞動力、地均化肥施用量為云南省州(市)耕地利用效率投入水平指標;以耕地灌溉指數和耕地復種指數為耕地利用程度指標;以糧食單位面積產量、農民人均農業產值、單位面積農業產值為耕地產出效益指標;以人均耕地面積和糧食安全系數為耕地可持續性指標來構建云南省耕地利用效率評價指標體系(表1)。

2.2 研究方法

2.2.1 隨機森林法 隨機森林(Random forest,RF)指的是由Breiman[18]于2001年提出的利用多棵樹對樣本進行訓練并預測的一種分類器,具有可以處理大量的輸入變量、模型計算穩定性強等特點,由于其良好的性能表現,在統計、農業、醫學等許多領域的問題解決中都取得了不錯的效果[19-22]。

隨機森林分類的基本思想:首先,利用Bootstrap抽樣從原始訓練集抽取N個樣本訓練集,每個樣本訓練集的大小約為原始數據集的2/3;其次,為每個訓練集分別建立分類樹,產生由n棵分類樹組成的森林,在每棵樹生長過程中,從全部M個特征變量中隨機抽選m(m≤M)個特征變量,在這m個屬性中根據Gini指數最小原則選出最優屬性進行內部節點分支[23];最后,集合N棵決策樹的預測結果,采用投票的方式決定新樣本的類別。每次抽樣約有1/3的數據未被抽中,利用這部分袋外數據(Out-of-bag)進行無偏估計產生OOB誤差[24]。以袋外數據為基礎,運用Gini指數計算各指標的指標權重,計算公式如式(1)所示。

式中,n表示地區數,本研究把云南省16個州(市)按地理區域分為滇中、滇西、滇北和滇南4個地區,故n=4;μ為平均耕地利用效率;xi和 xj分別表示地區i和j的耕地利用效率;G表示基尼系數(不同于隨機森林中的Gini指數),且G∈(0,1)。

3 結果與分析

3.1 隨機森林算法結果

隨機森林一般是基于R語言或Python平臺進行的,本研究選取R語言作為隨機森林算法的基本運行平臺。首先,根據表1的10項指標在2011—2020年的數據生成160組原始數據集,利用Bootstrap抽樣技術從中抽取大約60%的數據集作為訓練集,剩下的數據集作為測試集。

在R語言中安裝radomForest程序包,且區分了訓練集和測試集后,以16個州(市)為因變量、10項指標數據為自變量進行初次建模分類學習,對指標屬性特征進行多次采樣學習,本研究做的是分類分析,則m設定為變量個數的平方根,此時分類樹的數目n=500,節點分裂時輸入的特征變量個數m=3,OOB誤差為2.08%。同時在confusion matrix函數監督下進行樣本的訓練,訓練樣本的置信區間在[0.892,0.996],模型擬合度較好,且學習精度為96.88%,Kappa值為96.67%。經過多次調試和參數敏感性分析,當分類樹設置為默認值500時,RF模型在建模訓練過程中輸出Gini指數減少值,如表2所示。

求取平均值后即得到各評價指標的平均權重,如圖1所示。在RF分類模型識別下農民人均農業產值和單位面積農業產值被認為是不重要的2個指標,二者總權重比例僅為6.84%;地均勞動力、地均農業機械總動力、糧食單位面積產量、人均耕地面積和耕地復種指數是影響耕地利用效率較重要的5個指標,總權重達0.66,其他指標權重處于中間水平。

3.2 各州(市)耕地利用效率結果分析

利用隨機森林算出的指標權重計算2011—2020年云南省16個州(市)的耕地利用效率(表3),以2011年、2015年和2020年為研究時點,利用ArcGIS 10.5平臺的自然間斷分級法將其空間可視化,依次劃分為低效率區[0.000~0.150]、中效率區(0.150~0.200]、中高效率區(0.200~0.250]、高效率區(0.250~0.300],如圖2所示。

從表3可以看出,時序變化上,云南省平均耕地利用效率總體呈波動上升態勢,從2011年的0.182上升到2020年的0.226,整個云南省平均耕地利用效率提高了0.044;除西雙版納州和怒江州外,其他各州(市)的耕地利用效率指數在10年內也表現出不同程度的增長趨勢。其中,大理州的絕對增長趨勢最大,由研究初期2011年的0.187增長至末期2020年的0.277,其次分別是楚雄州、玉溪市、紅河州和德宏州,分別由2011年的 0.177、0.183、0.144、0.227變化為2020 年的 0.260、 0.250、0.198、0.282。從各州(市)歷年耕地利用平均效率來看,迪慶州、德宏州、怒江州、大理州在2011—2020年耕地利用平均效率較高,分別為0.279、0.265、0.250、0.230。普洱市、臨滄市的平均耕地利用效率相對偏低,分別為0.157、0.158。

由圖2可知,2011—2020年保山市、德宏州、迪慶州、大理州、楚雄州耕地利用效率由中效率區和中高效率區變成了高效率區,耕地利用效率逐年提高。中高效率區和高效率區呈北多南少的趨勢,在一定程度上也與當地的耕地政策、經濟發展水平以及氣候和土壤有密切關系。

3.3 區域耕地利用效率差異分析

從云南省地理位置區域分析,將云南省16個州(市)分為滇中(昆明市、曲靖市、玉溪市、楚雄州)、滇南(普洱市、紅河州、文山州、西雙版納州)、滇西(保山市、麗江市、臨滄市、大理州、德宏州、怒江州)、滇北(昭通市、迪慶州)4個區域。根據表3和基尼系數平均差公式,得到6組不同區域之間的耕地利用效率基尼系數(表4)來分析相連區域和不相連區域之間的耕地利用效率差距。

由表4可知,6組區域的基尼系數為0.003 9~0.032 1,整體值低于0.1(基尼系數越低,不同區域耕地利用效率差距越小),不同地區之間耕地利用效率相互影響較穩定,在云南省整體范圍內影響較小,地區差距不大。除了2020年的滇中和滇西兩區域之間的基尼系數相比2011年減少外,其余5組區域2020年的基尼系數均比2011年有所增加,在一定程度上和當地耕地與經濟政策有關。此外,滇西在滇中城市群的影響和帶動下,經濟水平得到發展,耕地生產要素的投入得到加強,使得滇中和滇西的耕地利用效率差距整體呈減小趨勢,可以看出滇中和滇西之間的耕地利用效率的地區差距有所緩解。滇中和滇南以及滇南和滇北的平均基尼系數分別為0.005 0和0.009 0,是6組區域平均基尼系數中較小的兩組,可以看出10年內滇中和滇南以及滇南和滇北之間區域耕地利用效率差距每年都不是很大,一方面是由于滇中和滇南經濟之間相互帶動作用較小,另一方面是由滇南和滇北整體在耕地中投入的經濟水平或耕地利用相關政策相似等因素導致的。

4 小結與討論

在探究云南省各州(市)耕地利用效率以及不同區域耕地利用效率差距時,收集相應的數據資料以及選取相對應的評價指標來構建隨機森林模型是主要的前提步驟,然后分析不同區域之間的耕地利用效率基尼系數。通過隨機森林算法,在2011—2020年將云南省各州(市)相應的指標數據分類建模,最后得到Gini指數后算出權重,得出地均勞動力、地均農業機械總動力、糧食單位面積產量、人均耕地面積和耕地復種指數是影響耕地利用效率較重要的5個指標,農民人均農業產值和單位面積農業產值則是不重要的2個指標。同時,通過ArcGIS的空間可視化能很好地看出云南省各州(市)耕地利用效率間的差異,其中,迪慶州、德宏州、怒江州、大理州在2011—2020年平均耕地利用效率較高,普洱市、臨滄市的平均耕地利用效率相對偏低。

此外,將云南省16個州(市)分為滇中、滇南、滇西、滇北4個區域,利用基尼系數平均差公式得到6組不同區域的耕地利用效率基尼系數。從4個區域之間的耕地利用效率基尼系數來看,滇中和滇西相較其他5組不同區域的耕地利用效率基尼系數整體在減小,而滇中和滇南以及滇南和滇北的平均基尼系數是6組不同區域平均基尼系數中較小的2組。耕地利用效率基尼系數越小,地區耕地利用效率差距越小,這不僅與不同區域經濟帶動有關,而且還與當地對耕地投入的水平以及耕地措施等因素有關。

雖然隨機森林模型在數據集上表現良好,不容易陷入過擬合,泛化能力強,但是在本研究中構建的隨機森林模型主要針對一些確定性、人為干預的因素對耕地利用效率的影響,在沒有其他自然環境等因素影響下這是一個指標未優化的簡化模型。一些社會經濟、自然環境因素和各州(市)的耕地政策等因素也會對耕地利用效率有影響。雖然能夠得到16個州(市)的耕地利用效率,但要分析相連區域和不相連區域之間耕地利用效率的差距,只有耕地利用效率值是遠遠不夠的,因此耕地利用效率基尼系數是評價區域耕地利用效率差距的重要指標。今后還應該對區域耕地利用效率基尼系數再做具體分析,即把6組不同區域之間的耕地用效率基尼系數再分解成滇中、滇西、滇南和滇北4個區域單獨相互比較,這樣才能更好地分析各州(市)的耕地利用效率在4個區域之間交錯程度的大小,從而更好地提出相鄰州(市)耕地管理利用措施,使得云南省各州(市)耕地利用效率整體差距逐漸減少。

參考文獻:

[1] 朱紅波.中國耕地資源安全研究[D].武漢:華中農業大學, 2006.

[2] 盧新海, 匡 兵, 李 菁.碳排放約束下耕地利用效率的區域差異及其影響因素[J].自然資源學報, 2018, 33(4): 657-668.

[3] 何 登,楊如軍,詹長根.基于DEA模型的耕地利用效率評價[J].江蘇農業科學, 2018, 46(4): 327-330.

[4] KAIYONG W, PENGYAN Z. The research on impact factors and characteristic of cultivated land resources use efficiency—Take Henan Province, China as a case study[J]. IERI procedia, 2013, 5:2-9.

[5] PANG Y Y, WANG X J. Land-use efficiency in Shandong (China): Empirical analysis based on a super-SBM model[J]. Sustainability, 2020, 12(24): 10618.

[6] 李 強, 彭文英, 王建強,等.鄉鎮企業發達區耕地健康評價與驅動機理研究[J].自然資源學報, 2015, 30(9): 1499-1510.

[7] 楊 倩.基于層次分析法的畢節市耕地利用效益評價研究[J].國土與自然資源研究, 2021(3): 5-7.

[8] 陳海喜,鐘九生,蘭安軍, 等.基于灰色關聯模型的貴州省耕地利用效率及其影響因素研究[J].貴州科學,2018, 36(6): 61-68.

[9] 吳昊玥, 黃瀚蛟, 何艷秋,等.凈碳排放約束下的中國耕地利用效率評價及空間關聯研究[J].浙江農業學報, 2019, 31(9): 1563-1574.

[10] 何 婷.平涼市崆峒區耕地利用效率時空差異及影響因素分析[D].蘭州:甘肅農業大學, 2018.

[11] JIANG G, ZHANG R, MA W, et al. Cultivated land productivity potential improvement in land consolidation schemes in Shenyang, China: Assessment and policy implications[J]. Land use policy, 2017, 68:80-88.

[12] 陳丹玲, 盧新海, 匡 兵.基于隨機森林的耕地利用效率測度模型構建及其應用[J].自然資源學報,2019,34(6):1345-1356.

[13] 張耿杰, 劉淑霞, 曾維軍, 等.云南省耕地利用等別與生態環境空間分布特征[J].水土保持研究, 2016, 23(2): 275-279.

[14] RICCETTO S, DAVIS A S, GUAN K, et al. Integrated assessment of crop production and resource use efficiency indicators for the U.S. Corn Belt [J]. Global food security, 2020, 24:100339.

[15] 徐 秋, 雷國平, 楊厚翔.黑龍江省耕地利用效率時空差異及影響因素研究[J].中國農業資源與區劃, 2017, 38(12): 33-40.

[16] 張曉雨.碳排放約束下中國耕地利用效率研究[D].天津:天津商業大學, 2020.

[17] 竇旺勝, 王成新, 王召漢.山東省耕地資源利用效率研究[J].中國環境管理干部學院學報, 2019, 29(2): 39-43.

[18] BREIMAN L. Random forests[J]. Machine learning,2001,45(1):5-32.

[19] ZHANG H, WU P, YIN A, et al. Prediction of soil organic carbon in an intensively managed reclamation zone of eastern China: A comparison of multiple linear regressions and the random forest model[J]. Science of the total environment, 2017, 592:704-713.

[20] 林子聰, 任向寧, 朱阿興, 等.基于隨機森林算法的耕地質量定級指標體系研究[J].華南農業大學學報, 2020, 41(4): 38-48.

[21] WARD M M, PAJEVIC S, DREYFUSS J, et al. Short-term prediction of mortality in patients with systemic lupus erythematosus: Classification of outcomes using random forests[J]. Arthritis and rheumatism, 2006, 55(1):74-80.

[22] 張 雷, 王琳琳, 張旭東, 等.隨機森林算法基本思想及其在生態學中的應用——以云南松分布模擬為例[J]. 生態學報, 2014, 34(3): 650-659.

[23] 馬 玥, 姜琦剛, 孟治國, 等.基于隨機森林算法的農耕區土地利用分類研究[J].農業機械學報, 2016, 47(1): 297-303.

[24] 呂紅燕, 馮 倩.隨機森林算法研究綜述[J].河北省科學院學報, 2019, 36(3): 37-41.

[25] 王 麗, 周 勇, 李 晴, 等.基于隨機森林的耕地質量評價智能模型及其應用研究[J].土壤學報,2022,59(5):1279-1292.

[26] 何幫強, 洪興建.基尼系數計算與分解方法研究綜述[J].統計與決策, 2016(14): 13-17.

[27] 鐘曉青,張萬明,李萌萌.基于生態容量的廣東省資源環境基尼系數計算與分析——與張音波等商榷[J]. 生態學報,2008,28(9):4486-4493.

[28] 張文逸, 翁 敏.基于基尼系數的青海省公路空間分布格局研究[J].地理空間信息,2016,14(2):94-98,9.

主站蜘蛛池模板: 国产日韩久久久久无码精品| 丁香综合在线| 婷婷六月综合网| 日韩人妻精品一区| 国产成人精品一区二区免费看京| 日韩国产精品无码一区二区三区| 亚洲欧洲自拍拍偷午夜色| 亚洲视频a| 性做久久久久久久免费看| 这里只有精品在线| 亚洲欧美另类专区| 四虎精品国产AV二区| jizz在线免费播放| 亚洲天堂精品在线观看| 久久综合亚洲色一区二区三区| 2021天堂在线亚洲精品专区| 女人18毛片水真多国产| 3344在线观看无码| 亚洲精品色AV无码看| 国产青青草视频| 国产麻豆福利av在线播放| 99视频精品全国免费品| 五月天福利视频| 中文字幕在线欧美| 久久久久久久久久国产精品| 国产亚洲精品97AA片在线播放| 国产精品亚洲综合久久小说| 亚洲av中文无码乱人伦在线r| 99热这里只有免费国产精品 | 精品视频免费在线| 视频二区亚洲精品| 久久精品亚洲中文字幕乱码| 国产福利一区视频| 天天躁夜夜躁狠狠躁躁88| 欧美成人一级| 国产最新无码专区在线| 曰韩免费无码AV一区二区| 高清乱码精品福利在线视频| 99这里只有精品在线| 欧美中文字幕在线播放| 日本影院一区| 久久久久无码精品国产免费| 国产精品亚欧美一区二区| 精品天海翼一区二区| 日韩成人在线一区二区| 久久毛片基地| 伊人福利视频| 亚洲最大情网站在线观看| 欧美亚洲国产视频| 日本不卡在线视频| 国产精品视频观看裸模| 亚洲国产91人成在线| 99久久精品久久久久久婷婷| 2019年国产精品自拍不卡| 99成人在线观看| 天天综合色网| 国产在线八区| 国产精品女在线观看| 国产96在线 | 欧美日韩国产综合视频在线观看| 亚洲成a人在线观看| 红杏AV在线无码| 99er精品视频| 亚洲精品无码高潮喷水A| 亚洲国产亚综合在线区| 毛片免费在线视频| 色噜噜在线观看| 久久大香伊蕉在人线观看热2| a在线观看免费| 激情综合婷婷丁香五月尤物| 亚洲国产成人精品一二区 | 色综合中文综合网| 欧日韩在线不卡视频| 中日韩一区二区三区中文免费视频| 国产黑丝视频在线观看| 国产精品女熟高潮视频| 成人免费一级片| 激情爆乳一区二区| 2021国产精品自产拍在线| 国产精品无码一二三视频| 性激烈欧美三级在线播放| 三上悠亚在线精品二区|