摘要:基于問卷調研數據,從農業信息化基礎設施建設、人才隊伍建設、發展環境建設和信息資源建設等4個方面篩選整理了18個具體評價指標,在此基礎上采用聚類分析法將我國26個省份依照農業信息化發展水平分為6類,對分類結果進行了分析,并提出了縮小區域農業信息化發展水平差距、提高農業信息化發展水平的相關政策建議。
關鍵詞:聚類分析;農業信息化;發展水平;評價研究;省際差異;政策建議
中圖分類號: S126文獻標志碼: A文章編號:1002-1302(2014)09-0462-04
收稿日期:2013-11-04
基金項目:北京市農林科學院科技創新能力建設專項;“三電合一”農業信息服務項目。
作者簡介:崔利國(1987—),男,河北邢臺人,碩士,助理工程師,研究方向為農業農村信息化發展戰略。Tel:(010)51503643;E-mail:cuilg@nercita.org.cn。
通信作者:李瑾,博士,副研究員,研究方向為農業與農村信息化。E-mail:lij@nercita.org.cn。農業信息化正在成為我國實現農業現代化的重要途徑,在提高農業生產效率、增加農民收入、保障國家糧食安全、推進城鎮化建設等方面均發揮了積極影響。2005年以來,中央一號文件均從不同角度對農業信息化建設作出指示,各地政府、科研院所和涉農企業也在推進農業信息化工作方面熱情高漲,農業信息化評價研究也成為近年來學術研究的熱點。近年來,不少學者對我國農業信息化發展水平進行了研究,研究方向主要分為2個方面:一是農業信息化發展水平評價體系的理論研究,并基于構建的評價體系對全國或某一地區的農業信息化發展水平進行定量研究[1-5]。有學者從農業信息化基礎設施、技術裝備、應用水平、主體水平、農業信息化對農業發展的貢獻以及農業信息化政策環境等方面篩選了24個指標,初步建立了農業信息化發展水平評價體系[6]。二是對地區間農業信息化發展水平的評價研究。如有學者基于信息資源、信息應用、信息產業和信息人才等指標對山區縣域農村信息化發展水平進行了研究[7],也有學者采取線性加權函數法和層次分析法對地市級農業信息化發展水平展開評價和分析[8]。此外,還有學者利用神經網絡模型對省際間信息化發展水平進行綜合評價與分析[9],這對比較我國省際間農業信息化發展水平具有借鑒意義。目前,我國在農業信息水平評價研究方面處于探索期,官方和學術界還沒有形成權威的評價指標和完善的評價體系。學者們在研究農業信息化發展水平上主要是從地區經濟發展水平、農業信息化基礎設施建設、農業信息資源開發利用、農業信息技術和裝備應用水平以及農業信息化人才隊伍建設等方面著手,但由于指標選擇上存在不一致,分析結果也往往存在差異。本研究參考已有學者的研究結論和指標體系建立方法,并結合已有的調研數據對我國主要省份的農業信息化發展水平進行比較研究,目的在于分析各個省份的農業信息化發展水平及其在全國所處的地位,為國家農業信息化主管部門和地方政府制定針對性的農業信息化發展戰略提供支撐。
1研究方法與數據說明
1.1研究方法
1.1.1聚類分析方法概述農業信息化水平評價方法有神經網絡模型[9]、因子分析法[10]和主成分分析法[11]等,盡管這些方法能夠對多個對象的農業信息化水平進行較為客觀的評價,但這些方法僅限于通過排序比較省際間農業信息化水平而不能有效地歸類并尋找同類水平之間的共性和不同類水平之間的差異性,但聚類分析方法卻可以解決這一問題,因此本研究選擇聚類分析法來對我國各地區農業信息化發展水平進行評價研究。
自古以來,人們所講的“物以類聚,人以群分”說的就是聚類,而在現代社會聚類分析是數據挖掘的一種方法,是指把整個數據分成不同的組,并使組與組之間的差距盡可能大,組內數據的差異盡可能小。聚類分析根據研究對象的不同分為Q型聚類分析和R型聚類分析,Q型聚類是指對樣品進行聚類,R型聚類是指對變量進行聚類[12]。聚類不同于日常所說的分類,因為在分析之前并沒有具體的劃分標準,屬于一種無監督學習[13]。聚類分析用于研究地區某一指標發展水平的文獻也有很多[10-11,14-15],而隨著我國農業信息化水平的不斷提高和研究的不斷深入,采用聚類分析等定量分析工具對我國各省份農業信息化發展水平進行評價和比較成為推動我國農業信息化水平持續發展的重要環節和手段,當前已經成為非常迫切的一個問題。
1.1.2聚類分析方法的數學步驟在聚類分析中,通常用G表示類,其中包含m個變量,一般用xi=(i=1,2,…,m)來表示,dij表示變量xi與xj之間的距離,DKL表示類GK與類GL之間的距離。類與類之間定義距離的方法有很多,常用的系統聚類方法有最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、可變法和離差平方和法等,本研究采用類平均法來定義類與類間的距離,因為類平均法很好地利用了所有樣品之間的信息,在很多情況下它被認為是一種比較好的系統聚類法。類平均法定義的類GK與類GL之間的平方距離為:
1.2數據說明
1.2.1數據來源本研究所用數據來自農業部農業農村信息化發展戰略研究課題組問卷調研,問卷內容主要涵蓋農業信息化基礎設施建設、農業信息化人才建設、農業信息化發展環境、農業信息資源建設等4個方面,數據為2012年的省級面板數據。調研范圍涵蓋大陸全部30個?。ㄊ小^),但由于部分省份的重要變量缺失,研究過程中剔除了河北、云南、新疆和廣西4個省份,具體研究中只包括26個省份的樣本數據。
1.2.2變量設定從已有的研究成果中不難發現,農業信息化技術應用水平是衡量一個地區農業信息化發展水平的重要指標之一,本研究在樣本數據選擇上并沒有選擇農業信息化技術應用情況的主要原因在于從調查問卷整理的數據結果中,關于農業信息化技術應用水平的調查選項不多,調查數據也不理想,導致在實際操作的時候數據確實無法使用,其他相關統計指標如表1所示。表1農業信息化發展水平評價指標
目標層準則層指標層農業信息化發展水平農業信息化基礎設施建設固定電話普及率移動電話普及率電腦普及率已接入有線電視行政村比重接通寬帶的鄉鎮比重光纖傳輸網是否到村農業信息化人才建設農業信息中心工作人員數量農業信息化發展環境農業農村信息化資金投入是否成立縣級農業農村信息化工作領導小組是否制定全省相關農業農村信息化工程規劃是否建立了農業農村信息化建設資金統籌管理制度農業行政主管部門是否有農業農村信息化投入專項是否設有農業農村信息化行政管理機構是否有兼職管理員農業信息資源建設有無獨立農口政府網站農業數據庫數量數據年增長率是否建有內部網絡辦公平臺
由于上述指標是由多個要素構成的,各個要素數據具有不同的單位和量綱,其數值的變異很大,這會對分類結果產生一定的影響。因此,在進行聚類分析之前,首先要對聚類要素進行一定的預處理,消除各個要素之間的量綱差異。聚類分析中常用的數據預處理方法有中心化變換、規格化變換和標準化變換,本研究采用標準化變換對數據進行預處理,變換公式為:
2實證分析
采用MATLAB R2012b軟件首先對樣本數據進行標準化變換,之后運用類平均法將26個省份間的歐式距離進行測算,并在此基礎上創建系統聚類樹(圖1)。
根據圖1的聚類結果并結合我國各?。ㄊ?、區)農業農村信息化發展實際經驗,本研究將26個省(市、區)的農業信息化發展水平從高到低歸納為6類(表2),具體分類結果如下:
摘要:基于問卷調研數據,從農業信息化基礎設施建設、人才隊伍建設、發展環境建設和信息資源建設等4個方面篩選整理了18個具體評價指標,在此基礎上采用聚類分析法將我國26個省份依照農業信息化發展水平分為6類,對分類結果進行了分析,并提出了縮小區域農業信息化發展水平差距、提高農業信息化發展水平的相關政策建議。
關鍵詞:聚類分析;農業信息化;發展水平;評價研究;省際差異;政策建議
中圖分類號: S126文獻標志碼: A文章編號:1002-1302(2014)09-0462-04
收稿日期:2013-11-04
基金項目:北京市農林科學院科技創新能力建設專項;“三電合一”農業信息服務項目。
作者簡介:崔利國(1987—),男,河北邢臺人,碩士,助理工程師,研究方向為農業農村信息化發展戰略。Tel:(010)51503643;E-mail:cuilg@nercita.org.cn。
通信作者:李瑾,博士,副研究員,研究方向為農業與農村信息化。E-mail:lij@nercita.org.cn。農業信息化正在成為我國實現農業現代化的重要途徑,在提高農業生產效率、增加農民收入、保障國家糧食安全、推進城鎮化建設等方面均發揮了積極影響。2005年以來,中央一號文件均從不同角度對農業信息化建設作出指示,各地政府、科研院所和涉農企業也在推進農業信息化工作方面熱情高漲,農業信息化評價研究也成為近年來學術研究的熱點。近年來,不少學者對我國農業信息化發展水平進行了研究,研究方向主要分為2個方面:一是農業信息化發展水平評價體系的理論研究,并基于構建的評價體系對全國或某一地區的農業信息化發展水平進行定量研究[1-5]。有學者從農業信息化基礎設施、技術裝備、應用水平、主體水平、農業信息化對農業發展的貢獻以及農業信息化政策環境等方面篩選了24個指標,初步建立了農業信息化發展水平評價體系[6]。二是對地區間農業信息化發展水平的評價研究。如有學者基于信息資源、信息應用、信息產業和信息人才等指標對山區縣域農村信息化發展水平進行了研究[7],也有學者采取線性加權函數法和層次分析法對地市級農業信息化發展水平展開評價和分析[8]。此外,還有學者利用神經網絡模型對省際間信息化發展水平進行綜合評價與分析[9],這對比較我國省際間農業信息化發展水平具有借鑒意義。目前,我國在農業信息水平評價研究方面處于探索期,官方和學術界還沒有形成權威的評價指標和完善的評價體系。學者們在研究農業信息化發展水平上主要是從地區經濟發展水平、農業信息化基礎設施建設、農業信息資源開發利用、農業信息技術和裝備應用水平以及農業信息化人才隊伍建設等方面著手,但由于指標選擇上存在不一致,分析結果也往往存在差異。本研究參考已有學者的研究結論和指標體系建立方法,并結合已有的調研數據對我國主要省份的農業信息化發展水平進行比較研究,目的在于分析各個省份的農業信息化發展水平及其在全國所處的地位,為國家農業信息化主管部門和地方政府制定針對性的農業信息化發展戰略提供支撐。
1研究方法與數據說明
1.1研究方法
1.1.1聚類分析方法概述農業信息化水平評價方法有神經網絡模型[9]、因子分析法[10]和主成分分析法[11]等,盡管這些方法能夠對多個對象的農業信息化水平進行較為客觀的評價,但這些方法僅限于通過排序比較省際間農業信息化水平而不能有效地歸類并尋找同類水平之間的共性和不同類水平之間的差異性,但聚類分析方法卻可以解決這一問題,因此本研究選擇聚類分析法來對我國各地區農業信息化發展水平進行評價研究。
自古以來,人們所講的“物以類聚,人以群分”說的就是聚類,而在現代社會聚類分析是數據挖掘的一種方法,是指把整個數據分成不同的組,并使組與組之間的差距盡可能大,組內數據的差異盡可能小。聚類分析根據研究對象的不同分為Q型聚類分析和R型聚類分析,Q型聚類是指對樣品進行聚類,R型聚類是指對變量進行聚類[12]。聚類不同于日常所說的分類,因為在分析之前并沒有具體的劃分標準,屬于一種無監督學習[13]。聚類分析用于研究地區某一指標發展水平的文獻也有很多[10-11,14-15],而隨著我國農業信息化水平的不斷提高和研究的不斷深入,采用聚類分析等定量分析工具對我國各省份農業信息化發展水平進行評價和比較成為推動我國農業信息化水平持續發展的重要環節和手段,當前已經成為非常迫切的一個問題。
1.1.2聚類分析方法的數學步驟在聚類分析中,通常用G表示類,其中包含m個變量,一般用xi=(i=1,2,…,m)來表示,dij表示變量xi與xj之間的距離,DKL表示類GK與類GL之間的距離。類與類之間定義距離的方法有很多,常用的系統聚類方法有最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、可變法和離差平方和法等,本研究采用類平均法來定義類與類間的距離,因為類平均法很好地利用了所有樣品之間的信息,在很多情況下它被認為是一種比較好的系統聚類法。類平均法定義的類GK與類GL之間的平方距離為:
1.2數據說明
1.2.1數據來源本研究所用數據來自農業部農業農村信息化發展戰略研究課題組問卷調研,問卷內容主要涵蓋農業信息化基礎設施建設、農業信息化人才建設、農業信息化發展環境、農業信息資源建設等4個方面,數據為2012年的省級面板數據。調研范圍涵蓋大陸全部30個?。ㄊ?、區),但由于部分省份的重要變量缺失,研究過程中剔除了河北、云南、新疆和廣西4個省份,具體研究中只包括26個省份的樣本數據。
1.2.2變量設定從已有的研究成果中不難發現,農業信息化技術應用水平是衡量一個地區農業信息化發展水平的重要指標之一,本研究在樣本數據選擇上并沒有選擇農業信息化技術應用情況的主要原因在于從調查問卷整理的數據結果中,關于農業信息化技術應用水平的調查選項不多,調查數據也不理想,導致在實際操作的時候數據確實無法使用,其他相關統計指標如表1所示。表1農業信息化發展水平評價指標
目標層準則層指標層農業信息化發展水平農業信息化基礎設施建設固定電話普及率移動電話普及率電腦普及率已接入有線電視行政村比重接通寬帶的鄉鎮比重光纖傳輸網是否到村農業信息化人才建設農業信息中心工作人員數量農業信息化發展環境農業農村信息化資金投入是否成立縣級農業農村信息化工作領導小組是否制定全省相關農業農村信息化工程規劃是否建立了農業農村信息化建設資金統籌管理制度農業行政主管部門是否有農業農村信息化投入專項是否設有農業農村信息化行政管理機構是否有兼職管理員農業信息資源建設有無獨立農口政府網站農業數據庫數量數據年增長率是否建有內部網絡辦公平臺
由于上述指標是由多個要素構成的,各個要素數據具有不同的單位和量綱,其數值的變異很大,這會對分類結果產生一定的影響。因此,在進行聚類分析之前,首先要對聚類要素進行一定的預處理,消除各個要素之間的量綱差異。聚類分析中常用的數據預處理方法有中心化變換、規格化變換和標準化變換,本研究采用標準化變換對數據進行預處理,變換公式為:
2實證分析
采用MATLAB R2012b軟件首先對樣本數據進行標準化變換,之后運用類平均法將26個省份間的歐式距離進行測算,并在此基礎上創建系統聚類樹(圖1)。
根據圖1的聚類結果并結合我國各?。ㄊ小^)農業農村信息化發展實際經驗,本研究將26個?。ㄊ小^)的農業信息化發展水平從高到低歸納為6類(表2),具體分類結果如下:
摘要:基于問卷調研數據,從農業信息化基礎設施建設、人才隊伍建設、發展環境建設和信息資源建設等4個方面篩選整理了18個具體評價指標,在此基礎上采用聚類分析法將我國26個省份依照農業信息化發展水平分為6類,對分類結果進行了分析,并提出了縮小區域農業信息化發展水平差距、提高農業信息化發展水平的相關政策建議。
關鍵詞:聚類分析;農業信息化;發展水平;評價研究;省際差異;政策建議
中圖分類號: S126文獻標志碼: A文章編號:1002-1302(2014)09-0462-04
收稿日期:2013-11-04
基金項目:北京市農林科學院科技創新能力建設專項;“三電合一”農業信息服務項目。
作者簡介:崔利國(1987—),男,河北邢臺人,碩士,助理工程師,研究方向為農業農村信息化發展戰略。Tel:(010)51503643;E-mail:cuilg@nercita.org.cn。
通信作者:李瑾,博士,副研究員,研究方向為農業與農村信息化。E-mail:lij@nercita.org.cn。農業信息化正在成為我國實現農業現代化的重要途徑,在提高農業生產效率、增加農民收入、保障國家糧食安全、推進城鎮化建設等方面均發揮了積極影響。2005年以來,中央一號文件均從不同角度對農業信息化建設作出指示,各地政府、科研院所和涉農企業也在推進農業信息化工作方面熱情高漲,農業信息化評價研究也成為近年來學術研究的熱點。近年來,不少學者對我國農業信息化發展水平進行了研究,研究方向主要分為2個方面:一是農業信息化發展水平評價體系的理論研究,并基于構建的評價體系對全國或某一地區的農業信息化發展水平進行定量研究[1-5]。有學者從農業信息化基礎設施、技術裝備、應用水平、主體水平、農業信息化對農業發展的貢獻以及農業信息化政策環境等方面篩選了24個指標,初步建立了農業信息化發展水平評價體系[6]。二是對地區間農業信息化發展水平的評價研究。如有學者基于信息資源、信息應用、信息產業和信息人才等指標對山區縣域農村信息化發展水平進行了研究[7],也有學者采取線性加權函數法和層次分析法對地市級農業信息化發展水平展開評價和分析[8]。此外,還有學者利用神經網絡模型對省際間信息化發展水平進行綜合評價與分析[9],這對比較我國省際間農業信息化發展水平具有借鑒意義。目前,我國在農業信息水平評價研究方面處于探索期,官方和學術界還沒有形成權威的評價指標和完善的評價體系。學者們在研究農業信息化發展水平上主要是從地區經濟發展水平、農業信息化基礎設施建設、農業信息資源開發利用、農業信息技術和裝備應用水平以及農業信息化人才隊伍建設等方面著手,但由于指標選擇上存在不一致,分析結果也往往存在差異。本研究參考已有學者的研究結論和指標體系建立方法,并結合已有的調研數據對我國主要省份的農業信息化發展水平進行比較研究,目的在于分析各個省份的農業信息化發展水平及其在全國所處的地位,為國家農業信息化主管部門和地方政府制定針對性的農業信息化發展戰略提供支撐。
1研究方法與數據說明
1.1研究方法
1.1.1聚類分析方法概述農業信息化水平評價方法有神經網絡模型[9]、因子分析法[10]和主成分分析法[11]等,盡管這些方法能夠對多個對象的農業信息化水平進行較為客觀的評價,但這些方法僅限于通過排序比較省際間農業信息化水平而不能有效地歸類并尋找同類水平之間的共性和不同類水平之間的差異性,但聚類分析方法卻可以解決這一問題,因此本研究選擇聚類分析法來對我國各地區農業信息化發展水平進行評價研究。
自古以來,人們所講的“物以類聚,人以群分”說的就是聚類,而在現代社會聚類分析是數據挖掘的一種方法,是指把整個數據分成不同的組,并使組與組之間的差距盡可能大,組內數據的差異盡可能小。聚類分析根據研究對象的不同分為Q型聚類分析和R型聚類分析,Q型聚類是指對樣品進行聚類,R型聚類是指對變量進行聚類[12]。聚類不同于日常所說的分類,因為在分析之前并沒有具體的劃分標準,屬于一種無監督學習[13]。聚類分析用于研究地區某一指標發展水平的文獻也有很多[10-11,14-15],而隨著我國農業信息化水平的不斷提高和研究的不斷深入,采用聚類分析等定量分析工具對我國各省份農業信息化發展水平進行評價和比較成為推動我國農業信息化水平持續發展的重要環節和手段,當前已經成為非常迫切的一個問題。
1.1.2聚類分析方法的數學步驟在聚類分析中,通常用G表示類,其中包含m個變量,一般用xi=(i=1,2,…,m)來表示,dij表示變量xi與xj之間的距離,DKL表示類GK與類GL之間的距離。類與類之間定義距離的方法有很多,常用的系統聚類方法有最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、可變法和離差平方和法等,本研究采用類平均法來定義類與類間的距離,因為類平均法很好地利用了所有樣品之間的信息,在很多情況下它被認為是一種比較好的系統聚類法。類平均法定義的類GK與類GL之間的平方距離為:
1.2數據說明
1.2.1數據來源本研究所用數據來自農業部農業農村信息化發展戰略研究課題組問卷調研,問卷內容主要涵蓋農業信息化基礎設施建設、農業信息化人才建設、農業信息化發展環境、農業信息資源建設等4個方面,數據為2012年的省級面板數據。調研范圍涵蓋大陸全部30個?。ㄊ小^),但由于部分省份的重要變量缺失,研究過程中剔除了河北、云南、新疆和廣西4個省份,具體研究中只包括26個省份的樣本數據。
1.2.2變量設定從已有的研究成果中不難發現,農業信息化技術應用水平是衡量一個地區農業信息化發展水平的重要指標之一,本研究在樣本數據選擇上并沒有選擇農業信息化技術應用情況的主要原因在于從調查問卷整理的數據結果中,關于農業信息化技術應用水平的調查選項不多,調查數據也不理想,導致在實際操作的時候數據確實無法使用,其他相關統計指標如表1所示。表1農業信息化發展水平評價指標
目標層準則層指標層農業信息化發展水平農業信息化基礎設施建設固定電話普及率移動電話普及率電腦普及率已接入有線電視行政村比重接通寬帶的鄉鎮比重光纖傳輸網是否到村農業信息化人才建設農業信息中心工作人員數量農業信息化發展環境農業農村信息化資金投入是否成立縣級農業農村信息化工作領導小組是否制定全省相關農業農村信息化工程規劃是否建立了農業農村信息化建設資金統籌管理制度農業行政主管部門是否有農業農村信息化投入專項是否設有農業農村信息化行政管理機構是否有兼職管理員農業信息資源建設有無獨立農口政府網站農業數據庫數量數據年增長率是否建有內部網絡辦公平臺
由于上述指標是由多個要素構成的,各個要素數據具有不同的單位和量綱,其數值的變異很大,這會對分類結果產生一定的影響。因此,在進行聚類分析之前,首先要對聚類要素進行一定的預處理,消除各個要素之間的量綱差異。聚類分析中常用的數據預處理方法有中心化變換、規格化變換和標準化變換,本研究采用標準化變換對數據進行預處理,變換公式為:
2實證分析
采用MATLAB R2012b軟件首先對樣本數據進行標準化變換,之后運用類平均法將26個省份間的歐式距離進行測算,并在此基礎上創建系統聚類樹(圖1)。
根據圖1的聚類結果并結合我國各?。ㄊ?、區)農業農村信息化發展實際經驗,本研究將26個?。ㄊ?、區)的農業信息化發展水平從高到低歸納為6類(表2),具體分類結果如下: