聶偉,戴天城,范誠峰,蔣劍軍
(銅陵學院數學與計算機學院,安徽銅陵 244061)
隨著我國數字經濟的快速增長,推動數字鄉村建設已成為鄉村振興以及農業現代化發展的戰略重點以及優先發展方向。2022年4月中央網信辦等部門聯合印發《2022年數字鄉村發展工作要點》,推動著我國農業邁向數字化、信息化以及網絡化發展的新時代。
我國農業發展經歷了農業時代、工業時代,正在邁入數字時代。從生產要素看,三個時代的區別是:農業時代主要受限于“勞動力”和“農耕土地”;工業時代則受制于“資本”和“核心技術”;數字時代數據成為“21世紀的新型能源”。

圖1 農業生產要素進程圖
因此,近年來農業數字化水平發展成為研究熱點,主要有三個方向:1)農業數字化的影響。楊果[1]分析出我國農業正處于應對綜合成本上升等相關因素影響的關鍵時期,且影響因素主要有提速、解放和發展農業生產力等三方面;劉雷[2]發現流通產業、流通渠道和流通基礎設施三個細分維度的數字化水平,能賦能我國農業現代化建設;2)農業數字化發展路徑引導。李建軍等[3]認為我國應加強智慧農業創新實踐的基礎設施以及關鍵核心技術創新,以促使智慧農業真正成為農業現代化的新引擎;尹燕瀛等[4]基于農業數字化發展取得的主要成效,提出了加大數字基礎設施建設力度、補齊數據共享體系管理短板、著力提升農村農民數字化素養水平的發展路徑,實現農業的現代化;3)為農業建設建言獻策。樊祥成[5]為推動農業數字化相關研究創建了“三農”研究學術交流平臺,集中展示“三農”領域的重要研究成果,帶動“三農”研究的熱潮。
上述文獻關于農業數字化的研究主要是基于某些方向,難以對農業數字化的影響進行深度挖掘。本文提出一種農業數字化發展研究方案,利用自1985年至2020年全國內地31個省級行政單位的“三農”面板數據,運用主成分分析法提取214個影響因素的主成分,建立對應分析模型,宏觀地分析內地31個省域農業發展水平與主成分之間的對應關系,借此對省域農業數字化發展路徑提出建議。
本文主要對內地31 個省級行政單位的農村數字化水平進行研究,為此從國家統計局[6]及百度百科等權威的數據網站搜集了自1985至2020年間31個省級行政單位的農業數字化水平及相關214 個影響因素[7-10]的面板數據,預處理后的數據已上傳百度網盤。
本文主要研究內地省域農業數字化發展水平,研究路線是:設定主題→影響因素設計→數據采集→主成分分析→對應分析→結論與建議。研究路線框圖如圖2所示:

圖2 研究流程圖
本文以省域鄉村數字化發展水平為被解釋變量,影響因素有214個,維度過大,不利于因果關系分析,應用主成分分析[11-13]進行降維。
2.1.1 主成分的貢獻
利用Python計算出主成分的貢獻值、貢獻率及累計貢獻率,結果見表1:

表1 主成分的貢獻
2.1.2 提取主成分
由表1,以累計貢獻率0.9提取了24個主成分,主成分與原始變量的關系如式(1)所示:
2.1.3 主成分得分
31個省級行政單位在24個主成分上的得分見表2:

表2 各省級行政單位在24個主成分上的得分
本文以表2 構建31 個省域與24 個主成分之間的對應關系。表2可視為“主成分”和“省域”兩個屬性變量的列聯表,主成分的取值為Zi,i=1,2,...,24,省域取值為“安徽、...、重慶”。
2.2.1 模型慣量及X2(卡方)分解檢驗
總X2統計量是檢驗省域和主成分這兩個屬性變量是否相關的統計量。表3 表明,總X2統計量為19902.96323,該值度量了行點(省)和列點(主成分)之間是否互不相關性,按總X2統計量的分解結果可知,前11 維可解釋行點和列點之間互不相關性的85.14%,足以證明行點和列點之間的獨立性。

表3 檢驗變量值
2.2.2 地區農業數字化發展水平相似性分析
計算表2 對應的行輪廓和列輪廓,并可視化地對應分析散布圖:
從圖3可直觀看出,31個省域在各主成分上的發展狀況及存在的差異,可將省域和主成分對應起來分為四類,并由相應的主成分來描述。

圖3 對應分析散布圖
第一類,有5個省份:山東、河南、河北、黑龍江、遼寧。這5 個省份的農村數字化發展水平由主成分Z5,Z12,Z16,Z17,Z21,Z24描述。這6 個主成分主要提取的是X28(衛生院個數,信息提取率41.75%)、X76(成災面積/洪澇災面積,信息提取率39.56%)、X71(受災面積/洪澇災面積,信息提取率38.02%)的信息,即這5省在衛生醫療以及洪澇災害等方面數字化水平有超38%的相似性。
第二類,有11個省級行政單位:新疆、內蒙古、吉林、陜西、山西、甘肅、寧夏、上海、天津、青海、西藏。這11個省級行政單位的農村數字化發展水平由主成分Z3,Z6,Z7,Z10,Z11,Z13,Z14,Z18,Z20,Z23描述。這10 個主成分主要提取的是X37(農墾系統國有農場/耕地面積,信息提取率76.49%)、X39(農墾系統國有農場/大中型拖拉機,信息提取率73.27%)的信息,即這11 個省級行政單位在農墾系統國有農場的耕地面積及大中型機械等方面數字化建設水平高度相似(相似性超73%)。
第三類,有6 個省份:安徽、江蘇、湖北、湖南、四川、廣東。這6個省份的農村數字化發展水平由主成分Z1,Z15,Z19描述。這3個主成分主要提取的是X18(農用化肥施用量,信息提取率82.58%) 、X188(肉類總產量/豬牛羊肉產量,信息提取率78.47%)的信息,即這6個省份在農用化肥及豬牛羊肉等肉類總產量方面數字化建設水平高度相似(相似性超78%)。
第四類,有9個省級行政單位:北京、云南、江西、廣西、浙江、福建、貴州、重慶、海南。這9個省級行政單位的農村數字化發展水平由主成分Z2,Z4,Z8,Z9,Z22描述。這5個主成分主要提取的是X198(水產品產量,信息提取率95.84%)、X166(糧食單位面積產量,信息提取率93.42%) 、X91等(農林牧漁業,平均信息提取率92.10%)的信息,即這9 個省級行政單位在水產品產量、糧食產量、農林牧漁業等方面數字化建設水平具有一致性(相似性超92%)。
當前正處于推進數字中國建設的關鍵時期,農業數字化發展水平影響因素研究對我國數字農村建設有著極其重要的現實意義。本文使用主成分分析法與對應分析法將內地31個省級行政單位與24個融合特征分為以下四類。
第一類包括5個省份:山東、河南、河北、黑龍江、遼寧。這5個省份在衛生醫療以及洪澇災害等方面數字化建設水平有相似性,相似性超38%。
第二類包括11個省級行政單位:新疆、內蒙古、吉林、陜西、山西、甘肅、寧夏、上海、天津、青海、西藏。這11個省級行政單位在農墾系統國有農場的耕地面積及大中型機械等方面數字化建設水平高度相似,相似性超73%。
第三類包括6個省份:安徽、江蘇、湖北、湖南、四川、廣東。這6個省份在農用化肥及豬牛羊肉等肉類總產量方面數字化建設水平高度相似,相似性超78%。
第四類包括9個省級行政單位:北京、云南、江西、廣西、浙江、福建、貴州、重慶、海南。這9個省級行政單位在水產品產量、糧食產量、農林牧漁業等方面數字化建設水平具有一致性,相似性超92%。
內地31 個省級行政單位農業數字化發展水平的這個分類特征對引導數字農村建設有現實的指導意義。
本文通過主成分分析和對應分析將內地31 個省級行政單位按農業數字化發展水平影響因素分為四類,很明顯四類的農業特色鮮明。本文基于這一實證分析結果,在數字中國建設全國一盤棋的大局下提出如下發展路徑建議,見表4。

表4 各類區域發展路徑建議
本文提出的發展路徑建議,本質上是區域的特色發展建議,“發展特長、發揮優勢”是數字鄉村建設的長效機制。