呂洋洋,王福林,李志遠,趙逸翔
(東北農業大學 工程學院,哈爾濱 150030)
我國作為農業人口大國,農村人口占全國人口的比例高達2/3。自實施農村土地經營制度及實現大面積農業機械化以來,涌現出了數以億計的農村剩余勞動力。農村剩余勞動力是指超過農村產業需求的一部分勞動力,是一個相對和動態的概念。農村剩余勞動力的多少會隨著耕地面積、機械化程度、種植結構等條件的變化而變化。它的存在及其在全國的大量無序流動將帶來許多經濟和社會問題。為了從根本上解決“三農”問題,首先必須要科學估算農村剩余勞動力數量。近年來,學者們對農村剩余量的估算做了大量的研究,其使用的方法和結果不盡相同,但大多數學者都沒有考慮機械化程度對農村剩余勞動力數量的影響[1-3]。
在農業生產過程當中,農業機械發揮著無人不曉的作用,如提高農業抵抗自然災害的能力、改善生產條件、減弱農業勞動強度及提高勞動生產率[4]。農業機械與農業勞動力之間存在明顯的替代現象,農業機械化水平的不斷提高,將加速中國農業剩余勞動力的產生[5]。本文推導建立了勞均可承擔耕地面積與農業機械化程度的模型,并在此基礎上給出了模型中參數的獲取和處理方法。以黑龍江省紅星隆分局八五四農場為研究對象,調查了該農場10 100個勞動力在農業機械化程度是0和100%時可承擔的耕地面積大小,最后利用準確的數據及研究模型得出寶清縣在不同農業機械化程度下農民種植水田可承擔的勞均耕地面積。
由農業機械化程度的定義[6]可知,設S為耕地面積,s1為機械化的作業面積,x為機械化程度,則

(1)
s1=s·x
(2)
所以,人畜力完成的作業面積s2為
s2=s-s1=s(1-x)
(3)
則
s=s1+s2=s·x+s·(1-x)
(4)
如果L(x)代表農業機械化程度是x時所需勞動力數量,則每公頃耕地面積在農業機械化程度100%時所需的勞動力數量為m,在機械化程度0時所需的勞動力數量為n,則
L(x)=m·s1+n·s2=m·s·x+n·s·(1-x)
(5)
令l(x)為勞均可負擔耕地面積,則
(6)
將公式(5)代入公式(6)得
(7)
在農業機械化程度100%時,每個勞動力的耕地面積為
(8)
農業機械化程度0時,每個勞動力的耕地面積為
(9)
將公式(8)和公式(9)代入公式(7)得
(10)
公式(10)是平均各勞動力的耕地面積l(x)與農業機械化程度x之間關系的模型。在該模型中,有兩個參數l(100%)和l(0)。
模型中有兩個參數:農業機械化程度100%時的平均各勞動力可負擔耕地面積l(100%)和機械化程度0時平均各勞動力可負擔耕地面積l(0)。
對于l(100%)和l(0)這兩個參數,雖然不能在統計資料中通過查詢得到,但可通過深入生產實際進行走訪調研的方式來獲得。有兩種具體的方法來確定:一是通過對農村的走訪調研直接確定l(100%)和l(0)的值;二是調查當前機械化水平下勞動力所能承擔的耕地面積,然后對機械化程度和各勞動力所能承擔的耕地面積這兩組數據進行回歸分析,通過建立的回歸模型求出上述兩個參數的值。需要指出的是:不管采取哪一種獲取辦法,調研樣本一定要足夠多,起碼應不小于50個,而且要對樣本進行統計檢驗。如果檢驗結果不通過,則需要增加樣本的數量,直到可以通過統計檢驗為止。此外,在走訪調研中需要注意的是:首先在走訪調研之前,要將調查表格設計完全;其次,要明確指出勞動力可承擔的耕地面積是在耕作最忙碌的時刻確定的,即投入的勞動力數目是最多的時候確定的;最后,如果避免不了必要的季節性雇工,那么雇傭的勞動力數量應該加入到勞動力的需求數量之中。
數據測量常因干擾數據的存在使正常數據發生偏離,進而會給后續的分析帶來很多麻煩甚至嚴重后果。為了提高數據的可靠性,不能從主觀上剔除異常數據,需要進行統計檢驗,根據統計規律判斷是否有異常數據。如果有異常數據,則應從中刪除[7]。
分布檢驗的常用方法是χ2檢驗[10],其基本思路是:將隨機測試的所有結果Ω劃分為k個互不兼容事件A1,A2,…Ai,…,Ak(A1∪A2∪…∪Ai∪…∪Ak=Ω),Ai∩Aj=?,i≠j,i,j=1,2,…,k。于是,在假設H0下,可以計算pi=P(Ai),i,j=1,2,…,k。顯然,在n次試驗中,事件Ai的頻率ni/n和pi是不同的。若假設H0成立,則差異一般不顯著;若H0不成立,則這種差異就顯著。
基于這種想法,采用皮爾遜統計量,即

(11)
式(11)作為衡量檢驗假設H0與實際吻合程度的尺度。
假設總體X的理論分布是函數F(x),x1,x2,…,xn是來自F(x)的樣本,F0(x)是預先給定的一個分布函數,則
H0:F(x)=F0(x),H1:F(x)≠F0(x)
(12)
χ2檢驗法的具體操作步驟如下:
1)樣本數值分為k個互不相交的區間(a0,a1],(a1,a2],…,(ai-1,ai],…,(ak-1,ak]。其中,-∞ 2)計算樣本中落入每一區間(ai-1,ai](i=1,2,…,k)中的數量ni,ni稱為實測頻數。 3)求理論分布下落在(ai-1,ai]內的概率,當假設H0為真時,X落在(ai-1,ai]內的概率為pi=P(ai-1 “且要異論相攪”,“事為之防,曲為之制”,乃是宋代統治者鞏固其集權統治的“家法”,后世即便具有改革要求的君主也都不能不遵守此一“家法”,其負面影響不可避免: 4)做統計量,即 (13) 根據皮爾遜定理知χ2~χ2(k-r-1),r是F0(x)中被估計參數的個數。 6)由樣本數據計算出統計量χ2的值。 χ2檢驗法是在n趨向于無窮大時推導出來的,所以在實際應用過程中要保證n一定要足夠大及npi不能過小這兩個基本條件。正常情況下,樣本容量要滿足n≥50,?npi≥5的要求,最好達到npi≥10的要求。如果滿足不了上述要求,就應當適當地合并區間以達到要求。 計量測量不但對數據的精確性有很高的要求,且在得到大量數據后還需要有效地剔除其中的異常數據,從而保證得到有效性的數據。 假定各勞動力承擔的耕地面積抽樣數據經過檢驗后服從正態分布,則記為X~N(μ,σ2),μ表示每個勞動力耕地面積的數學期望,σ2表示每個勞動力承擔耕地面積的方差。因此,根據數理統計學原理,隨機變量X的概率密度為 (14) 其中,μ、σ(σ>0)是兩個常數,稱X為服從參數是μ和σ的正態分布,記作X~N(μ,σ2)。它的分布函數為 (15) 當μ=0、σ=1時,則X服從標準正態分布。用φ(x)和Φ(x)分別表示其概率密度和分布函數,即 (16) (17) (18) (19) 依照上述原則,樣本中任意一個觀測數據與該樣本的期望值μ的差值的絕對值小于3σ的概率可以表示為 (20) 目前,世界上許多國家對質量控制的標準各有不同,但大多數是以μ+3σ為界。即當樣本的觀測值在區間[μ±3σ]范圍內,可認為該觀測值正常;若樣本的觀測值不在這個區間范圍內,則可以認為該觀測值異常,應予以剔除。該異常值的剔除方法叫作3σ原則。本文按照上述異常數據的剔除方法,剔除了實例中的每個勞動力可負擔的耕地面積中的異常數據。 (21) (22) (23) (24) 通過對黑龍江省紅星隆分局八五四農場10個生產隊100個勞動力的調研,按從小到大排序,得到農業機械化程度為0時各勞動力耕地面積的大小如表1所示,農業機械化程度為100%時各勞動力耕地面積的大小如表2所示。 利用表1中的數據可計算出農業機械化程度為0時每個勞動力耕地面積的平均值和標準差為 (25) σ(0)≈0.2402 (26) 表1 當機械化程度為0時各勞動力負擔耕地面積的調查表 表2 當機械化程度為100%時各勞動力可負擔耕地面積的調查表 續表2 利用表2中的數據可計算出機械化程度為100%時每個勞動力可承擔耕地面積的平均數和標準差為 (27) σ(100%)≈0.8592 (28) 假定每個勞動力可負擔耕地面積的數值服從正態分布,由于正態分布函數的定義域是(-∞,+∞),所以將表1中的100個數據被劃分為7個區間:第1個區間是(-∞,1.12],最后1個區間是(1.72,+∞),其余5個區間按組距0.12進行劃分。將表2中的100個樣本數據也劃分為7個區間:第1個區間是(-∞,4.11],最后1個區間是(5.81,+∞),其余5個區間按組距0.34劃分。 當假設H0成立時,表1樣本數據ξ落在各區間的概率估值為 pi(0)=P(0){ai-1(0)<ξ(0)≤ai(0)} (29) 當假設H0成立時,表2樣本數據ξ落在各區間的概率估值為 pi(100%) =P(100%){ai-1(100%)<ξ(100%)≤ai(100%)} (30) 當i=1,2,…,k時,可分別計算出pi(0)和pi(100%)的值,其結果如表3和表4所示。當機械化程度為0時,其χ2值為 (31) 其自由度是K-r-1=7-2-1=4,如果取α=0.05,通過查詢χ2分布表得 (32) 表3 機械化程度為0時各勞動力負擔耕地面積的χ2檢驗計算表 續表3 μ(0)±3σ(0)=1.4686±3×0.2402 =[0.7480,2.1892] (33) 所以,表1中的2.19、2.19和2.31這3個數據為異常數據,應予以剔除。剔除后,機械化為0時勞均可負擔耕地面積為 =1.4451≈1.45hm2 (34) 表4 機械化程度為100%時各勞動力負擔耕地面積的χ2檢驗計算表 同理,χ2=3.306 8<9.488,所以接受H0。即當機械化程度為100%時,每個勞動力可負擔的耕地面積也符合正態分布,則 μ(100%)±3σ(100%)=5.0012±3×0.8592 =[2.4236,7.5788] (35) 所以,表2中的7.59和7.91這兩個數據為異常數據,應予以剔除。剔除后,機械化為100%時勞均可負擔耕地面積為 (36) 將l(0)=1.45hm2和l(100%)=4.95hm2代入上述公式(10),經整理得 (37) 用式(37)可計算不同農業機械化程度下平均各勞動力可負擔耕地面積的大小,結果如表5所示。 表5 不同機械化程度下平均各勞動力可負擔耕地面積 1)建立了平均各勞動力可負擔耕地面積與農業機械化程度之間的關系模型。 2)給出了獲取、檢驗模型參數的方法及異常數據剔除、整理的方法,并經分布檢驗得出每個勞動力可承擔的耕地面積大小在種植業機械化程度為0和100%時均符合正態分布。 3)通過剔除調研數據中的異常數據,分別整理出機械程度為0和100%時人均耕地面積為1.45hm2和4.95hm2。 4)根據模型,計算給出了黑龍江省紅星隆分局八五四農場的勞動力在不同機械化程度下的勞均可負擔耕地面積。
4 異常數據的剔除方法



5 數據整理方法

6 實例計算











7 結論