999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CART決策樹回歸的鄉村信息化水平測度模型研究

2020-08-13 07:05:14申媛媛鄔錦雯劉鑫東
科技管理研究 2020年14期
關鍵詞:信息化水平農村

申媛媛,鄔錦雯,劉鑫東

(1.中山大學附屬第三醫院,廣東廣州 510630;2.華南師范大學經濟與管理學院,廣東廣州 510006)

2014—2019年,我國連續16年發布中央一號文件聚焦“三農”,強調“三農”問題是“重中之重”。信息技術的突飛猛進在一定程度上推動了農村發展變革,特別是信息化建設方面,加強農村信息化建設是促進農村經濟社會發展、新農村建設的重要內容。我國關于信息化建設的工作從未懈怠,《國家信息化發展戰略綱要》指出我國信息化發展已經取得了長足的進展,特別是在電子商務、網民上網比重、電子信息產品等發展規模上均處于世界領先。信息革命為我國鄉村振興戰略的實施提供了重要的歷史發展機遇[1]。因此,本文在深刻認識農村信息化地位和作用的基礎上,構建適應社會發展的鄉村信息化測度模型,以期客觀、全面評價我國鄉村信息化程度,更好、更快地推進農村信息化建設的步伐。

1 我國農村信息化發展研究現狀

關于我國信息化水平測度理論和方法的研究開始于20世紀80年代,國內學者主要集中于信息化測度方法和指標體系構建的研究中,具有代表性的測度方法有用于信息化水平測度的信息化綜合指數法(CIIC)、基于RITE模型改進的信息化指數模型、綜合信息產業力度法等[2-4]。2001年,我國頒布了《國家信息化指標構成方案》,提出了衡量國家信息化發展水平的綜合評價指標體系——中國信息化水平綜合評價指標體系,包括六大類20項指標[5]。南京大學教授鄭建明[6]在《中國社會信息化進程測度報告》中對日本RITE模型進一步繼承挖掘和發展,基于國情,對指標進行適時化和本土化的修正完善使得計算方法更具科學性和適用性,然而隨著時間的推移,部分指標已不能滿足現代信息化社會的需求,國內研究者們根據我國農村發展現狀、經濟發展差異性和現實條件的局限性采取不同的測試方法,如,劉世洪等[7-8]研究提出農村信息化的六大要素,運用德爾菲法確定權重,通過建立綜合指數比較分析各區域農村信息化發展的差異,但也不可避免地存在部分數據采集困難的問題;馬秀霞[9]從農村信息資源、信息裝備及基本設施建設、主體水平、經濟與社會環境等方面進行考慮構建了指數測評模型,對寧夏農村地區的信息化水平進行研究與評價;盧麗娜等[10-11]以國家信息化六要素為基礎,采用德爾菲法和層次分析法確定各項指標的權重,其中部分指標有交叉,數據收集也較為復雜;馬守軍[12]根據當前研究情況,運用德爾菲法確定了4個一級指標和18個二級指標,用綜合指數法研究農村信息化發展水平,其中部分指標統計標準不同,利用起來較難。

在關于農村信息化水平測度實證研究中,黃志文[13]以北京2006年的數據為參考,通過對我國東、中、西和東北4個區域各項分類指數的加權平均,分析各地區間的發展差異及影響因素;楊玉建等[14]為說明區位對于農村農業信息化發展是重要因素,通過建立空間自相關模型分析黃河三角洲19個縣域的農村農業信息化水平;成巍等[15]則運用波特拉法和模糊層次分析法,以2011年的數據為參考,對華東6省1市的農村信息化水平進行了測度和評價,得出提高農村信息化水平的主要影響因素;崔利國等[16]利用問卷調查的方式采集數據,通過對我國26個省份進行聚類分析,將農村信息化水平分為6類,并對結果進行進一步分析。

綜上所述,現階段我國對農村信息化測度的評價研究集中在農村信息化建設水平的測評,即對農村信息化建設現狀的分析和評價,若以中國知網數據庫檢索,以“農村信息化水平測度”“農村信息化測度”為關鍵詞,相關文章只有11篇,最新的文獻停在2015年;其次,社會信息化發展迅速,新指標應適應新的社會發展,傳統的指標篩選方法也急需改進。本文選取我國31個省級行政區2017年的數據,首次運用CART決策樹算法,對初始評價指標進行篩選,采用因子分析、聚類分析方法構建農村信息化水平測度指標體系,對我國農村信息化水平進行討論與分析。

2 模型構建

2.1 初始指標

農村信息化是指在農村生產、生活、管理等各個方面普及和利用通信、網絡、計算機等技術的過程。對于農村信息化水平評價指標的選取,本文在國家信息化指標體系的基礎上,參考國家信息化指標構成方案、國家統計局關于縣域社會經濟統計指標體系、《中國社會信息化進程測度報告》中的評價指標體系[17-19],借鑒楊誠等[20]、盧麗娜等[10-11]構建的指標體系,選取更適合的、與當前社會緊密相關的指標,編制農村信息化測度模型的宏觀指標,由4個維度18個指標組成,如表1所示。

表1 農村信息化水平測度模型初始指標

表1(續)

2.2 模型設計

CART決策樹算法是在決策樹中比較典型的算法,一般將其稱為分類回歸樹,是一種高效準確的分類方法[28-29]。主要構造流程為:生成決策樹和決策樹剪枝。生成CART決策樹就是遞歸構建二叉決策樹的過程,它既可以用于分類也可以用于回歸。對于分類樹,CART用Gini系數最小化準則;對于回歸樹,采用平方誤差最小化原則來選取特征,生成二叉樹。對決策樹剪枝,特征值屬性可以實現多次使用,同時也能夠實現對連續值、缺失值進行有效處理[30]。因此,本文根據CART決策樹算法的特點和優勢,將其應用在指標變量重要性判斷和分類上。

CART回歸樹生成算法如下:

式(1)中:f代表模型輸出的回歸樹值;M代表輸入空間劃分的M個區域;R代表單元數據集;m為將輸入空間劃分的單元個數,即R1,R2,...,Rm;I代表常數;cm為每個單元固定的輸出值,這樣就可以得到輸出值和實際值的誤差。

用平方誤差最小的準則求解每個單元上的最優輸出值:

式(2)中:y代表輸出變量;x代表輸入變量。

對于空間的劃分,采用啟發式的方法,選擇第j個變量(農村信息化初始指標)作為切分變量,和它取的值s(初始指標對應的具體數值)作為切分點,并定義兩個區域:

式(3)(4)中:j代表切分變量;s代表切分變量對應的取值,即切分點。

首先,確定最優切分變量(最優初始指標)和最優切分點(最優初始指標數值)。即要找到兩個區域的代表值c1和c2(根據最優初始指標和最優初始指標數值)使各自區間上的平方差最小。求解過程如下:

其次,遍歷所有輸入變量(初始指標),找到最優切分變量(最優初始指標),構成一個對,依次將輸入空間劃分為兩個區域(兩個節點):

最后,對每個區域重復上述劃分過程,直到滿足停止條件為止。這樣即生成回歸樹,這樣的回歸樹通常被稱為最小二乘樹。

基于以上算法梳理,為研究鄉村生產力水平與農村信息化發展關系,探討與生產力密切相關的信息化指標變量,本文通過SPSS Modeler軟件構建測度指標模型,選取2014—2017年數據進行研究。另外,以國家統計局官網、《中國統計年鑒》、《中國農村統計年鑒》、政府網站及工作報告、農業普查報告等作為數據來源,采集2017年我國31個省份(未含港澳臺地區,以下簡稱“樣本省份”)的數據,對我國農村信息化水平進行比較研究。

3 數據分析

3.1 CART法指標篩選

(1)提取數據。將2015—2017年樣本省份的農村信息化指標數據導入,分別使用源節點和表格節點讀取文件中的數據和輸出數據。

(2)構建數據流。首先,接入類型節點,讀取變量值,將初始指標生產總值字段設置為目標,以體現當前生產力發展下信息化的指標水平和重要性,其他初始指標設為輸入,分析指標的分類情況和模型構建;其次,接入分區節點,設置訓練集和測試集,分別給予70%和30% 的樣本;最后,設置農村信息化指標模型參數,目標變量為生產總值,預測變量為17項信息化指標。

(3)輸出預測結果。在模型塊節點后添加分析節點后,可以看到農村信息化指標模型在訓練集及測試集中的預測準確率。其中,訓練集的線性相關高達98%,而測試集的線性相關達到95.2%。預測準確度優良,模型擬合度較好,如表2所示。

表2 2017年樣本省份農村生產總值準確性輸出結果

(4)決策結果的樹形圖。決策樹結果圖展現了農村信息化初始指標重要性的排序和分類,根據圖1可知,以生產總值為目標變量,初始指標農村寬帶接入用戶、電信業務總量、鄉村人口等7個指標在支點分類上出現,這些指標大部分為信息基礎設施建設指標,說明7個初始指標與生產總值密切相關,并在社會信息化的發展中起著重要的作用。

圖1 2017年樣本省份農村信息化決策結果

(5)預測指標重要性。預測變量農村信息化指標的重要性涉及到自變量和因變量相關的檢驗概率值,即地區生產總值與農村信息化指標相關性較的強弱,如圖2所示共有10個初始指標,包括:電信業務總量、農業機械總動力、鄉村人口等,這些指標同樣在社會信息化發展的過程中發揮著重要的作用。

圖2 2017年樣本省份農村信息化水平評價指標重要性測評結果

根據以上指標的分類情況和重要性排序(見圖1、圖2),剔除3個指標(村衛生室數、已通郵的行政村比重、農村固定電話用戶數),最終建立農村信息化水平測度指標模型,其中劃分4個一級指標,如表3所示。

表3 農村信息化水平評價指標體系

3.2 因子分析

(1)指標相關性及適用性檢驗。因子分析法的主要思想是用較少數的因子去描述多個變量之間的關系,運用降維的思想原理研究眾多變量中的相互依賴關系,探求分析數據中的基本結構[31]。根據因子分析法的相關標準,本文各指標數據的KOM值和P值均滿足條件(見表4),表明各類指標之間的相關性較強,適合做因子分析。

表4 樣本省份農村信息化水平評價指標數據的KMO和Bartlett檢驗結果

(2)提取公因子。采用因子分析法降低評價指標數據的維度后,得到公因子載荷矩陣,基于特征值大于1、方差累計貢獻率大于70%的原則提取公因子,根據總方差解釋,前4個公因子的累計方差貢獻率已達到79.774%,說明這些公因子可以反映原來15個指標數據的大部分信息,因此,選擇前4個公因子用以研究樣本省份農村信息化水平現狀,從而更好地對各省份進行準確、全面地評價。

運用Kaiser標準化的正交旋轉法,建立起公因子載荷矩陣(見表5),并且在第6次旋轉迭代后進行收斂,使各個變量在某一公因子上具有較高載荷,有利于對主成分進行命名與解釋。

表5 樣本省份農村信息化水平評價指標的公因子旋轉成分矩陣

基于表5,將降維后的公因子根據指標的歸類和特征進行重新劃分和命名(見表6)。

表6 樣本省份農村信息化水平評價指標的主成分分類與命名

(3)因子得分與結果排名。根據各變量因子得分系數和標準化的值,使用回歸分析法計算各公因子得分排名情況;4個公因子的方差貢獻率分別為38.695%、25.874%、9.123%、7.032%,將其作為公因子得分權數。因此,樣本省份農村信息化綜合得分為:F=0.386 95×F1+0.258 74×F2+0.091 23×F3+0.070 32×F4。根據各個因子和綜合因子得分,可得出樣本省份農村信息化水平綜合排名,如表7所示。

表7 2017年樣本省份農村信息化水平評價得分及排名

3.3 聚類分析

為進一步挖掘我國各區域農村信息化發展水平的差異,本文將因子分析得到的4個公共因子作為自變量,對樣本省份農村信息化樣本數據進行聚類分析,如圖3所示。

圖3 2017年樣本省份農村信息化水平聚類結果

為保證各個分類之間的差異性,從我國信息化水平建設情況的實際出發,將樣本省份的信息化水平分為5類進行分析討論(見表8)。

表8 2017年樣本省份農村信息化水平分類結果

3.4 因子和聚類分析結果討論

根據因子和聚類分析結果可以看出,樣本省份農村信息化建設水平分為五大類:

(1)屬于第一類是江蘇、廣東,為農村信息化建設水平因子分析綜合排名前兩位。江蘇省位于我國東南沿海地區,是我國經濟最活躍省份之一,其因子分析綜合排名第一,在其他公因子排名上均處于前五,在農村信息化建設中總體水平較高。廣東省位于我國華南沿海地區,具有人口基數龐大、電子商務發達等優勢,其因子分析綜合排名第二,在信息化應用建設方面排名第一,隨著粵港澳大灣區建設的推動,未來廣東省在農村信息化建設方面將會承載更多的資源和機遇,迎來更廣闊的發展空間。

(2)屬于第二類是北京、天津、浙江、上海。這一類地區屬于我國經濟發達地區,信息化發展水平總體較高。浙江省的農村信息化發展水平在全國領先,其因子分析綜合排名第三,在信息化資源建設方面排名第一;北京、天津、上海3市的因子分析綜合排名均處于前八的位置。由此可見,地區經濟發達能夠為農村信息化建設提供優良的發展環境及技術支持。

(3)屬于第三類的包括山東、河南、山西、遼寧等大部分省份。作為農業大省的山東和河南兩省近年來也在不斷地加強農村信息化建設,山東省積極推進國家農村農業信息化示范建設,河南也強調以農業信息化為“三農”破題[32];另外,貴州、海南、云南、青海、寧夏、廣西、湖南等省份主要位于內陸和西部地區,信息化水平建設處于一般的位置,政府應結合實際著重提高農村信息化水平。

(4)屬于第四類的是內蒙古自治區,其在信息化資源建設方面排在全國第六,農村基礎設施和信息化資訊環境方面排名居中,但在信息化應用建設方面排名最末,側面反映其農村現代信息化發展水平較低,這不僅與當地經濟發展水平有關,也與其地理位置有密切聯系。

(5)屬于第五類的是新疆、西藏自治區。作為西部內陸地區,新疆和西藏一直是國家重點扶持經濟發展對象,這兩個地區的自然條件也較為惡劣,農村信息化建設相對落后的局面也在預料之中。這些地區的農村信息化發展只能穩中求進,盡快縮小與其他省份的差距。

4 結論與展望

4.1 結論

本文在對我國農村信息化宏觀測度研究中,首先運用CART回歸樹算法,將原來的18個農村信息化水平初始評價指標篩選為15個,確定農村信息化水平測度模型,分為4個維度,將第一維度命名為信息基礎設施建設、第二維度命名為信息資源、第三維度命名為信息化環境建設、第四維度命名為信息資訊環境。其中:第一維度包括鄉村人口、廣播節目綜合人口覆蓋率、電視節目綜合人口覆蓋率、電信業務總量;第二維度包括移動電話用戶數、計算機用戶數、彩色電視機用戶數、固定電話用戶數、農村投遞線路、已通郵的行政村比重;第三維度包括開通互聯網寬帶業務的行政村比重、農業機械總動力、農村寬帶接入用戶;第四維度包括村衛生室、交通通信支出、教育文化娛樂支出、醫療保健支出、生產總值。

4.2 評價模型解釋與啟示

(1)模型預測準確率高,可以導向鄉村振興發展目標。本研究應用CART回歸算法建立的農村信息化水平評價決策樹模型對我國31個樣本省份農村信息化水平測度的準確率達到95.2%,其中,電信業務總量指標最重要,鄉村人口、開通寬帶業務的行政村比重等指標比較重要,農村寬帶接入用戶數、農村投遞線路等指標較為重要。說明我國農村信息技術水平不斷提高,基礎設施建設也在不斷地完善,電子商務、互聯網等發展使人們獲得信息越來越高效和便捷,以地區生產總值為目標變量可以導向鄉村振興戰略。

(2)我國農村信息化區域發展差異明顯。根據模型構成和因子分析情況,我國農村信息化建設水平存在明顯的區域性特征:江蘇、廣東、浙江的綜合排名為前三,均位于華東、華南沿海地區;其次排名較為靠前的是山東、北京、天津、上海,這些地區經濟發展迅速,信息化水平建設程度高;但是縱觀四川、江西等地區,經濟發展位于全國較前、居中的位置,雖然在信息化基礎設施建設、信息化應用建設方面的公因子排名靠前,但是農村信息化總體發展水平較為落后,與地區經濟發展有較大差異。因此,應該以長三角、珠三角等城市群為引領,發揮城市群、大灣區的輻射帶動作用,加大對偏遠地區農村信息資源的投入,在信息基礎設施建設和信息資源環境方面,因地制宜。

猜你喜歡
信息化水平農村
農村積分制治理何以成功
今日農業(2022年1期)2022-11-16 21:20:05
張水平作品
“煤超瘋”不消停 今冬農村取暖怎么辦
今日農業(2021年21期)2022-01-12 06:32:04
月“睹”教育信息化
幼兒教育信息化策略初探
甘肅教育(2020年18期)2020-10-28 09:06:02
加強上下聯動 提升人大履職水平
人大建設(2019年12期)2019-05-21 02:55:32
信息化是醫改的重要支撐
中國衛生(2014年1期)2014-11-12 13:16:34
信息化
江蘇年鑒(2014年0期)2014-03-11 17:09:40
在農村采訪中的那些事
中國記者(2014年2期)2014-03-01 01:38:08
贊農村“五老”
中國火炬(2011年5期)2011-07-25 10:27:55
主站蜘蛛池模板: 亚洲h视频在线| 欧美专区日韩专区| 美女裸体18禁网站| 精品一区国产精品| 黄色网页在线观看| 91精品国产丝袜| 久久精品国产精品青草app| 韩日免费小视频| 97se亚洲综合不卡| 伊人激情综合网| 区国产精品搜索视频| 看国产一级毛片| 国产精品香蕉| 美女啪啪无遮挡| 国产精品尹人在线观看| 毛片在线看网站| 72种姿势欧美久久久久大黄蕉| 日韩免费成人| 久久免费精品琪琪| 国产无码精品在线播放| 日本高清成本人视频一区| 青青草原国产一区二区| 91在线无码精品秘九色APP| 国产91小视频在线观看| 国产精品第一区| 综1合AV在线播放| 国产精品视频a| 国产精品一区在线观看你懂的| 国产男人的天堂| 欧美精品另类| 97综合久久| 91精品免费高清在线| 国产午夜精品鲁丝片| 亚洲综合第一区| 亚洲欧美日韩综合二区三区| 国产www网站| 日a本亚洲中文在线观看| 久久综合九九亚洲一区| 亚洲一区二区三区在线视频| 亚洲成人精品在线| 欧美福利在线播放| 天天爽免费视频| 亚洲高清中文字幕在线看不卡| 毛片免费高清免费| 国产乱子伦手机在线| 久久精品国产精品国产一区| 男人天堂亚洲天堂| 国产 在线视频无码| 欧美另类精品一区二区三区| 九一九色国产| 久草中文网| 亚洲无码电影| 91福利在线看| 中文字幕乱妇无码AV在线| 亚洲精品高清视频| 日韩精品专区免费无码aⅴ| 69av在线| 国产新AV天堂| 亚洲AV一二三区无码AV蜜桃| 91色爱欧美精品www| 久草青青在线视频| 永久毛片在线播| 国产精品极品美女自在线网站| 综合色天天| 亚洲欧美一区二区三区图片| 成人毛片在线播放| 又猛又黄又爽无遮挡的视频网站| 激情网址在线观看| 成年人国产视频| 国产精品亚洲精品爽爽| 亚洲欧美日韩中文字幕在线一区| 欧洲高清无码在线| 人妻无码一区二区视频| 久久伊人操| 国产小视频在线高清播放| 国产午夜精品一区二区三区软件| 久久综合一个色综合网| 亚洲黄网在线| 欧美激情视频二区| 欧美精品一二三区| 欧美精品二区| 少妇精品网站|