999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量回歸與地統計學的農民收入預測

2014-04-29 00:00:00張弘楊陳淵袁哲明
安徽農業科學 2014年30期

摘要 農民收入既受其自身動態時序特性的影響,又與國家政策、農產品產量、天氣等多種人為因素和自然因素關系密切,是一種典型的多維時間序列數據。該研究以國民總收入、鄉村人口等11個可能與農民收入相關的影響因子為自變量,農村居民家庭平均每人純收入為因變量,基于1982~2011年我國相關統計數據,采用支持向量回歸與地統計學非線性時間序列預測模型對農民收入進行分析。結果表明:非線性時間序列預測模型大幅度提高了農民收入預測精度;農民的主要收入來源已不是糧食生產,而是向其他農業生產、進城務工等方面轉移。

關鍵詞 農民收入;預測;地統計學;多維時間序列;支持向量機

中圖分類號S-9文獻標識碼A文章編號0517-6611(2014)30-10759-03

作者簡介張弘楊(1990- ),男,湖南衡陽人,碩士研究生,研究方向:生物信息。*通訊作者,教授,博士生導師,從事生物信息研究。

我國是一個農業大國,農業的發展、農民的生活狀態影響著我國現代化建設的進程。農民收入是反映農業發展與農民生活狀態的重要標志。隨著我國現代化建設的飛速發展,農民收入水平也得到了大幅度的提升,2012年農村居民人均純收入已經達到7 916元。農民收入數據是一種典型的多維時間序列,既受其自身動態時序特性的影響,又與國家政策、農產品產量、天氣等多種人為因素和自然因素關系密切,具有明顯的復雜非線性特性。分析農民收入的關鍵影響因素,為“三農”政策的制定等提供有效的指導,是大力發展農業、提高農民生活水平的根本,是實現和諧社會主義與全面小康生活的關鍵[1]。

國內學者已有許多關于農民收入的研究。宋委倩通過統計分析認為影響諸城市農民收入的主要因素有地區經濟發展水平、農產品價格和農業生產資料價格、農業產業結構和經營水平、二三產業發展水平、農村勞動力轉移和農民自身素質技能[2]。盧立香認為農村物質資本投資、農戶人力資本投資、產業結構變化和農村剩余勞動力轉移是影響我國農民收入增長的最直接因素,并據此建立向量自回歸模型,檢驗結果表明上述4個因素與農民收入之間均存在著顯著的相關性[3]。鄭素芳等選取影響我國農民收入的農產品產量、農產品價格、人均播種面積等指標,運用計量模型從定量的角度對各種因素進行綜合分析,得出提高農民收入的主要因素是農民的非農業收入和農產品價格[1]。王亞娜等運用逐步回歸法,分析了影響農民收入的因素,結果表明,農村剩余勞動力的轉移和農民的受教育水平對農民人均純收入的影響最顯著[4]。郭慶春采用BP神經網絡對農民收入進行建模分析,認為農民收入主要受鄉村就業人員數、農村固定資產投資、農作物總播種面積的影響[5]。

但已有研究主要是利用線性模型進行分析,未充分考慮農民收入數據的復雜非線性特性,得出的結論難免有失偏頗。因此,筆者擬針對農民收入數據非線性時間序列的特性,采用非線性支持向量機和地統計學方法綜合分析我國農民收入的影響因素,并結合統計數據,預測我國農民收入。

1變量選取、數據來源與研究方法

從收集的大量影響因素中挑選出與農民收入密切相關的關鍵因子是農民收入水平預測的一個關鍵點與難點。目標變量拓階是反映時間序列自身動態時序特性的有效手段,傳統的帶控制項的自回歸滑動平均模型(Controlled Autoregressive Integrating Moving Average,CARMA)和帶受控項的自回歸模型(Controlled Autoregressive,CA)等多維時間序列分析方法都屬于線性模型[6-8],通過線性方法逐步比較實現拓階過程,費時耗力,不能有效地反映數據的非線性特征。人工神經網絡(Artificial Neural Networks,ANN)模型具有非常優異的非線性逼近能力,但存在易陷入局部最小、過學習等缺陷[9-10]。支持向量機(Support Vector Machine,SVM)基于統計學習理論,具有非線性優點[11-12],并且能有效防止過學習,在眾多領域取得了較好的應用效果。且基于地統計學[13-14](Geostatistics,GS)采用直接拓階方法,以一維GS的變程作為時間序列的后效時間長度(動態時序性),具有速度快、全局最優的優點。筆者擬結合SVM,以模型交叉測試均方根誤差(Root Mean Squared Error,RMSE)最小為標準,采用非線性汰選方法對所選全部因子實施多輪評估,逐個剔除次要因子,確定關鍵因子。

1.1變量選取和數據來源近年來我國積極轉變農業發展方式、發展現代農業、統籌城鄉發展和推進農業建設,影響農民收入的因素日益復雜。預測農民收入,采用不同方法所考慮的因素各不相同。如宋委倩選取農產品價格和農業生產資料價格等進行統計分析[2],盧立香選取農村固定資產投資、農村人口數和產業結構等因素進行回歸分析[3],王亞娜等選取人均農業基本建設投資、人均農業各稅稅費、人均農業貸款額、人均農業年財政支農額等7個指標建立農民收入影響因素計量模型[4]。

結合已有文獻,參照郭慶春等的研究[5],該研究選取國民總收入(x1)、鄉村人口(x2)、農村農戶固定資產投資額(x3)、鄉村從業人員(x4)、農林牧漁業總產值(x5)、農業機械總動力(x6)、有效灌溉面積(x7)、農用化肥施用折純量(x8)、農作物總播種面積(x9)、糧食產量(x10)、受災面積(x11)等11個可能與農民收入相關的影響因子,然后從中篩選真正影響農民收入的主要因子。各因子說明如下:國民總收入包含了農民收入,農民收入對國民總收入有一定程度的影響;鄉村人口以農民為主,是考慮農民收入問題的基數;農村農戶固定資產投資額是指在農村建造和購置固定資產的經濟活動,一定程度上反映了農民收入的高低;鄉村從業人員是指鄉村人口中16歲以上實際參加生產經營活動并取得實物或貨幣收人的人員,是農民收入獲取的重要部分;農林牧漁業總產值是傳統農業構成農民收入的重要部分;農業機械總動力代表著農業機械化程度,是現代農業發展的代表,關系著農業生產效率,也關系著農民收入的高低;有效灌溉面積是灌溉工程或設備已經配備,能夠進行正常灌溉的水田和水澆地面積之和,是現代農業發展的重要指標;農用化肥施用折純量指實際用于農業生產的化肥數,與農業生產息息相關;農作物總播種面積直接關系著農作物的產量,與農民收入應該為正相關;糧食產量帶來的收入,在現在依然是農民收入的主體部分;受災面積也直接關系著農作物的產量,與農民收入負相關。

因為農村農戶固定資產投資額等部分數據自1982年才有系統的統計,所以該研究選用1982~2011年的數據建模,數據來源于國家統計局網站。

1.2研究方法

1.2.1數據平穩化處理。農民收入數據呈明顯上升趨勢,因此宜在數據建模之前以對數線性去趨勢(Loglinear Detrending,LLD)平穩化法對30年的目標變量進行平穩化處理[15]。

首先是對目標變量取對數,并進行先行擬合:

可得對數線性去趨勢平穩化后的新目標變量,后續建模都基于平穩化后的新目標變量展開。

1.2.2基于GS的目標變量拓階。對于在空間分布上既有結構性又有隨機性的自然現象,可以通過GS分析其結構性,計算數據的半變異函數值,并給出其區域化變化趨勢[13-14]。對某一觀察數據f(xi),其半變異函數值r(h)可由下式計算:

式中,h代表兩個樣本之間的間隔距離;f(xi)與f(xi+h)分別表示樣本xi和樣本xi+h的真實觀察值;N(h) 表示間隔距離為h時的所有樣本對數。

若以間隔距離h為橫軸,r(h)值為縱軸作圖,r(h)隨著h的增大逐步增大,當r(h)趨向于穩定時對應的間隔距離h被定義為變程a。變程a代表當數據間隔距離達到a后,該數據之間的空間相關性消失。該研究基于地統計學(GS)對一維時間序列進行分析,以變程a來反映時間序列的后效時間長度,設定間隔大于變程a的兩年之間不存在相關性,以變程a作為拓階次數。

初始多維時間序列經平穩化處理后,變為(yt,xtj),t=1,2,…,30; j=1,2,…,11。首先對一維時間序列y求半變異函數,時間間隔h以一年為分隔(取值為1~15),確定該一維時間序列的后效時間長度a。根據GS原理,對目標變量y拓a階。拓階后的數據樣本數變為(30-a);自變量個數為(11+a)。

1.2.3基于SVM的非線性變量汰選。采用LIBSVM平臺對模型拓階[16],若數據包含N個樣本,P個自變量,基于SVM訓練精度RMSE最小原則可對全部P個變量實施非線性篩選,去除無用、冗余的變量,選出影響農民收入的關鍵因子。具體過程如下:

第一步,以全部P個自變量構建SVM模型,并獲得交叉測試精度RMSEall。

第二步,依次剔除第i個自變量,重新構建SVM模型,得到交叉測試精度RMSE-i。

第三步,如果min[RMSE-i]

第四步,重復第一至三步驟(此時自變量變為P-1),直到沒有自變量可篩選為止,最終的保留變量即為關鍵因子,用于一步預測建模。

1.2.4評價指標與參比模型。通過模型評價,可以驗證預測模型的有效性以及篩選因子的可信性。多數模型驗證方法采用擬合結果作為評價標準,但對時間序列模型而言,應該以其實際預測性能進行評價,而非回代擬合。

預測結果評價指標采用均方根誤差:

為對比新模型的有效性,筆者另設置了3個參比模型:①SVM模型,直接以初始數據構建SVM一步預測模型,目標變量不進行平穩化,不進行拓階,也不實施自變量篩選;②SVMLLD模型,以平穩化后的數據構建SVM模型,既不進行拓階也不實施自變量篩選;③SVMGS模型,對平穩化后的目標變量以GS進行快速拓階,但不進行自變量篩選。

2結果與分析

筆者首先對平穩化后的目標變量進行GS分析,以一年為間隔作為h,其半變異函數圖見圖1。

由表1可知,SVM模型以初始數據構建一步預測模型,沒有考慮其自身時序動態特性,也沒有對初始自變量進行篩選,對帶有明顯上升趨勢目標變量也未進行平穩化處理,其預測精度最差,平均預測差異超過1 000元;與SVM模型相比,SVMLLD模型對初始目標變量進行了平穩化處理,其一步預測精度得到了大幅度提高,平均預測差異縮小到482元水平。顯然對于農民收入水平這類帶有明顯趨勢的時間序列數據,進行平穩化處理能有效提高其預測精度。SVMGS模型對平穩化后的目標變量進行拓階處理,考慮了目標變量自身的時序動態,相比SVM模型與SVMLLD模型,其一步預測結果有了明顯提高,預測誤差下降到400元以下。

SVMGSfilter模型在SVM模型基礎上對自變量進行篩選,去除部分冗余自變量,保留了鄉村人口(x2)、農村農戶固定投資額(x3)、鄉村從業人員(x4)、農林牧漁業總產值(x5)等4個變量,拓階所得最近5年的農村居民家庭平均每人純收入(x1′~x5′)9個重要因子,進一步簡化模型。基于該9個重要因子,以1982~2006年數據構建SVM一步預測模型,預測2007~2011年農民收入,平均預測誤差僅為304.78元,相比其他模型,預測精度有了明顯提高。

鄉村人口、農村農戶固定投資額、鄉村從業人員、農林牧漁業總產值等4個重要指標,其變化趨勢與農村民收入趨勢見圖2。圖中所用數據均經過平穩化處理。

3結論與啟示

上述研究結合SVM與GS,針對農民收入水平發展了一種高精度的非線性時間序列預測SVMGSfilter模型,結果表明:SVMGSfilter模型非線性時間序列預測模型較參比模型大幅度提高了農民收入預測精度;農民的主要收入來源已不是糧食生產,而是向其他農業生產和進城務工等方面轉移。

提高農民收入是實現全民小康的關鍵。從該研究結論可知,農民的收入結構主要分為糧食生產、農副產品、進城務工3大部分。政府提高農民收入需要從以上3個方面著手。首先,需要集中力量提高農村務農農民的收入水平。每年數千億的農業補貼是政府對農業支持的手段之一,但補貼范圍太廣導致重點不突出、以價格補貼為主的補貼方式致使效果不明顯。尤其是補貼范圍過大,每公頃土地上的補貼僅1 500~3 000元,可謂杯水車薪。因為部分農民已進城務工放棄農業生產,如果能削減這部分補貼,集中到扎根土地的農民身上,其補貼效果可能會更加明顯,對提高務農收入、提升農業的吸引力具有促進作用。第二,完善相關政策以解決農民工問題。進城務工已經是一部分農民收入的主要來源,但目前大部分地區針對農民工的政策還不完善,導致農民工進城難、收入低、缺乏保障。

主站蜘蛛池模板: 国产va在线观看| 亚洲香蕉久久| www.日韩三级| 亚洲精品日产精品乱码不卡| 久久网欧美| 久久这里只有精品66| 亚洲激情99| 中文字幕啪啪| 91麻豆精品国产91久久久久| 亚洲IV视频免费在线光看| 欧美日韩在线亚洲国产人| 亚洲a级毛片| 2020国产精品视频| 五月天综合婷婷| 国内精品九九久久久精品| 免费在线看黄网址| 精品久久香蕉国产线看观看gif| 日韩欧美国产区| 91偷拍一区| 精品亚洲麻豆1区2区3区| 欧美日韩免费| 日本午夜三级| 免费中文字幕一级毛片| 毛片大全免费观看| 亚洲精选高清无码| 思思热在线视频精品| 日本尹人综合香蕉在线观看| 热久久这里是精品6免费观看| 波多野结衣国产精品| 亚洲第一香蕉视频| 久久综合色播五月男人的天堂| 成人午夜免费观看| 午夜福利无码一区二区| 天堂成人在线| 亚洲91在线精品| 毛片网站在线播放| 欧美成人免费一区在线播放| 国产高清色视频免费看的网址| 97亚洲色综久久精品| 99在线观看免费视频| 中文纯内无码H| 国产剧情国内精品原创| 国产女人爽到高潮的免费视频| 欧美精品伊人久久| 国产福利免费视频| 亚洲日韩AV无码精品| 九色在线观看视频| 国产毛片片精品天天看视频| 日韩天堂视频| 天天色综合4| 在线视频亚洲色图| 成人一级黄色毛片| 国产精品一线天| 欧美视频在线第一页| 欧美国产精品不卡在线观看| 国产视频入口| 国产人在线成免费视频| 亚洲一级毛片| 国产成人综合亚洲网址| 99热精品久久| 亚洲av无码专区久久蜜芽| 日韩久久精品无码aV| 国产三级精品三级在线观看| 欧美精品在线视频观看| 欧美另类一区| 精品色综合| 国产亚洲精| 中文字幕在线不卡视频| 青青草国产在线视频| 亚洲精品无码AⅤ片青青在线观看| 91精品国产自产91精品资源| 在线播放真实国产乱子伦| 婷婷色婷婷| 欧美一级夜夜爽www| 99国产精品一区二区| 久久精品人人做人人爽97| 欧美激情网址| 久久夜夜视频| 天天摸天天操免费播放小视频| 国产毛片网站| 乱人伦99久久| 91精品在线视频观看|