康建偉
(河南工業(yè)大學(xué)電氣工程學(xué)院,河南 鄭州 450001)
基于灰色模型的農(nóng)民工資性收入預(yù)測(cè)
康建偉
(河南工業(yè)大學(xué)電氣工程學(xué)院,河南 鄭州 450001)
運(yùn)用灰色系統(tǒng)理論及方法,通過對(duì)河南省近年農(nóng)民工工資性收入數(shù)據(jù)序列采取不同長(zhǎng)度序列的方法進(jìn)行逐一新陳代謝,分別建立GM(1,1)模型,在matlab環(huán)境下利用建立的模型進(jìn)行預(yù)測(cè),將預(yù)測(cè)值與實(shí)際值進(jìn)行誤差比較,通過比較不同長(zhǎng)度序列的誤差平均值,選取誤差平均值最小的序列長(zhǎng)度值,并以2011年和2012年為例進(jìn)行實(shí)證分析。
GM(1,1)模型;工資性收入;農(nóng)民工;灰色系統(tǒng)
改革開放以來(lái),農(nóng)民工資性收入已經(jīng)成為農(nóng)民收入的新生源泉和增收的主要?jiǎng)恿Γ⑶夜べY性收入在農(nóng)民總收入中的比重呈逐年增加的趨勢(shì)。一般來(lái)說(shuō),一個(gè)地區(qū)的經(jīng)濟(jì)越發(fā)達(dá),工業(yè)化程度越高,城鄉(xiāng)收入差距越大,農(nóng)村的工業(yè)化程度越高,當(dāng)?shù)剞r(nóng)民的工資性收入就越高,因此,為把握某一個(gè)地區(qū)的農(nóng)民工工資性收入的未來(lái)發(fā)展趨勢(shì),有必要對(duì)其進(jìn)行預(yù)測(cè)。
由于農(nóng)民工工資性收入受多種因素的制約,有的因素是確定的,有的因素是不確定的。而建立在灰色系統(tǒng)理論上的灰色預(yù)測(cè)就是針對(duì)信息不完全系統(tǒng),通過對(duì)原始數(shù)據(jù)進(jìn)行生成處理,建立灰色預(yù)測(cè)模型,從而實(shí)現(xiàn)系統(tǒng)發(fā)展預(yù)測(cè)的一種方法,因此,可以將農(nóng)民工工資性收入作為一個(gè)灰色系統(tǒng),采用灰色預(yù)測(cè)的方法來(lái)預(yù)測(cè)。
GM(1,1)模型是灰色模型中最常用的一種,建模過程表述如下,首先,通過對(duì)原始隨機(jī)時(shí)間序列X(0)進(jìn)行一次累加生成一個(gè)新序列X(1);其次,將序列X(1)用一個(gè)一階線性微分方程的解來(lái)逼近;然后,根據(jù)微分方程的解即可對(duì)序列X(1)的數(shù)據(jù)進(jìn)行擬合;最后,對(duì)序列X(1)的擬合值進(jìn)行一次累減即可求得序列X(0)的擬合值,實(shí)現(xiàn)對(duì)原始隨機(jī)序列的預(yù)測(cè)。
GM(1,1)模型的計(jì)算過程如下。假定一個(gè)原始隨機(jī)時(shí)間序列X(0),其一次累加生成序列X(1),其中,,k=1,2,…,n。


用最小二乘法求得

其中,

通過微分方程解可以得到X(1)序列的擬合序列,通過一次累減得到的擬合序列,其中,

在灰色系統(tǒng)的發(fā)展過程中,新因素會(huì)進(jìn)入,影響系統(tǒng)的發(fā)展進(jìn)程并可能呈加強(qiáng)的趨勢(shì),同時(shí),舊因素會(huì)減弱,減弱甚至不影響系統(tǒng)的發(fā)展,因此,在實(shí)際的灰色建模過程中,實(shí)際的原始數(shù)據(jù)不一定全部用來(lái)建模,同時(shí),不同長(zhǎng)度的原始序列建模后所得的模型也不一定相同,因而模型的預(yù)測(cè)值也會(huì)不同,所以,為了提高模型的預(yù)測(cè)精度,需要對(duì)原始數(shù)據(jù)進(jìn)行篩選。
一個(gè)模型預(yù)測(cè)的準(zhǔn)確度越高,其預(yù)測(cè)值與實(shí)際值之間的誤差就會(huì)越小,因此,可以用預(yù)測(cè)值與實(shí)際值之差與實(shí)際值的比值(稱為相對(duì)誤差)來(lái)衡量模型的準(zhǔn)確程度,進(jìn)而可用某一定長(zhǎng)序列所有相對(duì)誤差的平均值來(lái)表示該定長(zhǎng)序列所建立模型的準(zhǔn)確程度,平均相對(duì)誤差越小,該定長(zhǎng)序列所建立模型的準(zhǔn)確度越高。
例如,當(dāng)長(zhǎng)度定為3時(shí),取初始數(shù)列X中的x(1)x(2)x(3),3個(gè)數(shù)據(jù)作為一個(gè)原始序列,建立GM(1,1)模型,預(yù)測(cè)該序列的下一個(gè)擬合值,并與初始序列X中的x(4)相比較得到一個(gè)相對(duì)誤差;通過逐一新陳代謝,將x(4)加入同時(shí)將x(1)移除x(1),x(2),x(3)序列,構(gòu)成一個(gè)新的長(zhǎng)度仍為3的原始數(shù)列x(4),x(3),x(2),通過建模可以得到該序列的下一個(gè)擬合值,并與初始序列X中的x(5)相比較得到一個(gè)相對(duì)誤差;依次類推,直到原始數(shù)列為,通過建模得到該序列的下一擬合值,并與初始序列X中的x(n)相比較得到一個(gè)相對(duì)誤差,通過相對(duì)誤差組求取算術(shù)平均值得到長(zhǎng)度為3時(shí)的平均相對(duì)誤差。
同理,可以得到序列長(zhǎng)度為i時(shí)的平均相對(duì)誤差△i,通過比較不同長(zhǎng)度的平均相對(duì)誤差,選擇平均相對(duì)誤差最小的序列長(zhǎng)度對(duì)初始數(shù)列X進(jìn)行預(yù)測(cè)。
3.12011年工資性收入預(yù)測(cè)
選取2011年之前某一段時(shí)間的工資性收入數(shù)據(jù)作為原始數(shù)據(jù)序列。比如,以河南省2000~2010年農(nóng)民工工資性收入為選取對(duì)象,具體數(shù)據(jù)見表1所示(數(shù)據(jù)來(lái)源于河南統(tǒng)計(jì)網(wǎng)分年度年鑒)。

表1 河南省2000~2010年農(nóng)民工工資性收入
首先,對(duì)河南省2000~2010年農(nóng)民工工資性收入進(jìn)行數(shù)據(jù)篩選,選取序列長(zhǎng)度為3~10時(shí),在matlab環(huán)境下,分別計(jì)算定長(zhǎng)序列的平均相對(duì)誤差,結(jié)果如表2所示。

表2 不同長(zhǎng)度序列的平均相對(duì)誤差
從表2可以看出,平均相對(duì)誤差較小者為序列長(zhǎng)度為10時(shí),平均誤差為0.1%。也就是說(shuō),用2000~2009年的收入作為原始數(shù)據(jù)對(duì)2010年的收入進(jìn)行預(yù)測(cè)時(shí),模型的準(zhǔn)確度較高,誤差不高于0.1%。
因此,根據(jù)逐一新陳代謝方法,可以利用2001~2010年的收入作為原始數(shù)據(jù)進(jìn)行建模,對(duì)2011年的工資性收入做出預(yù)測(cè),得到的預(yù)測(cè)值為2279。
通過對(duì)比2011年河南省農(nóng)民工工資性收入,發(fā)現(xiàn)利用2001~2010年的收入作為原始數(shù)據(jù)建立的模型相對(duì)于利用2000~2009年的收入作為原始數(shù)據(jù)建立的模型精度要高,根據(jù)表3中的平均誤差,與實(shí)際值的誤差應(yīng)不高于0.1%,但是實(shí)際誤差為9.7%,遠(yuǎn)高于0.1%,主要原因在于2011年工資標(biāo)準(zhǔn)提高拉動(dòng)了工資性收入快速增長(zhǎng),而利用2001~2010年的收入作為原始數(shù)據(jù)建立的模型中顯然不能考慮這方面的因素。(河南省調(diào)查總隊(duì)統(tǒng)計(jì)顯示,2011年河南省農(nóng)民工工資性收入為2524元;2011年部分區(qū)縣農(nóng)民工打零工的日工資比去年同期增加10~30元,建筑大工、小工日薪均比去年增加了20~30元。)
3.22012年工資性收入預(yù)測(cè)
利用2000~2011年農(nóng)民工工資性收入作為原始數(shù)據(jù)序列,選取序列長(zhǎng)度為3~11時(shí),在matlab環(huán)境下,分別計(jì)算定長(zhǎng)序列的平均相對(duì)誤差,結(jié)果如表3所示。

表3 不同長(zhǎng)度序列的平均相對(duì)誤差
從表3可以看出,平均相對(duì)誤差較小者為序列長(zhǎng)度為10時(shí),模型的準(zhǔn)確度較高,誤差為4.89%。也就是說(shuō),用2002~2011年的收入作為原始數(shù)據(jù)對(duì)2012年的收入進(jìn)行預(yù)測(cè)時(shí),準(zhǔn)確度較高,誤差為4.89%。
現(xiàn)以這組數(shù)據(jù)作為原始數(shù)據(jù),建立GM(1,1)模型,對(duì)2012年的工資性收入做出預(yù)測(cè),得到預(yù)測(cè)值為2845,因此,2012年河南省農(nóng)民工工資性收入預(yù)測(cè)值為2845元,考慮到4.89%的誤差,2012年的收入范圍應(yīng)在2712元~2991元之間。而根據(jù)河南省統(tǒng)計(jì)年鑒顯示,2012年農(nóng)民工資性收入為2989元,在預(yù)測(cè)范圍之內(nèi)。
在灰色系統(tǒng)的發(fā)展過程中,由于影響因素的不斷更新,新因素的影響不斷加強(qiáng),老因素的影響不斷減弱,因此,在灰色建模過程中,實(shí)際的原始數(shù)據(jù)不一定全部用來(lái)建模,同時(shí),不同長(zhǎng)度的原始序列建模后所得模型的預(yù)測(cè)值也會(huì)不同,為了提高模型的預(yù)測(cè)精度,通過比較不同長(zhǎng)度序列預(yù)測(cè)的相對(duì)誤差值來(lái)選擇原始數(shù)據(jù)序列的長(zhǎng)度。
通過對(duì)河南省歷年農(nóng)民工工資性收入的原始數(shù)據(jù)序列采取不等長(zhǎng)度序列的方法進(jìn)行新陳代謝,分別建立GM(1,1)模型,在matlab環(huán)境下利用該模型進(jìn)行預(yù)測(cè),將預(yù)測(cè)值與實(shí)際值進(jìn)行誤差比較,通過比較不同長(zhǎng)度序列的相對(duì)誤差平均值,選取相對(duì)誤差平均值最小的序列長(zhǎng)度值。
通過比較2011年及2012年的預(yù)測(cè)值及實(shí)際值可以發(fā)現(xiàn),在大幅度提高農(nóng)民工工資標(biāo)準(zhǔn)的2011年,預(yù)測(cè)偏差較大,主要在于以前年份影響工資收入的因素中不含有這個(gè)因素;而在2012年,預(yù)測(cè)偏差較小,說(shuō)明改進(jìn)后模型的適用性。
[1] 楊云善.農(nóng)民工資性收入變動(dòng)趨勢(shì)分析[J].河南社會(huì)科學(xué), 2011,19(1):211-213.
[2] 肖云,李先福.基于優(yōu)化的灰色GM模型的滑坡預(yù)測(cè)[J].武漢工程大學(xué)學(xué)報(bào),2012,34(1):31-35.
[3] 李工農(nóng).經(jīng)濟(jì)預(yù)測(cè)與決策及 matlab實(shí)現(xiàn)[M].北京:清華大學(xué)出版社,2007.
The forecasting of income of wage of migrant worker based on gray model
In the paper, based on gray system theory and method, the data of income of wage of migrant worker of Henan province in recent years is used for setting up GM(1,1) model by the different sequence length. The model is simulated by matlab and used for forecasting of income of wage of migrant worker, the sequence length that the average ratio of the difference between the forecast value and the actual value and the actual value is smallest is selected. The model is verified by the forecast data and actual data of 2011 and 2012.
GM(1,1) model; income of wage;migrant worker;gray system
O14
A
1008-1151(2015)04-0135-02
2015-03-13
康建偉(1979-),男,河南商丘人,河南工業(yè)大學(xué)電氣工程學(xué)院講師,研究方向?yàn)殡姎夤こ獭⒔Ec分析。