侯宏濤
(鄭州工業應用技術學院基礎教學部,河南鄭州 451150)
基于收入分組數據擬合洛倫茲曲線新模型
侯宏濤
(鄭州工業應用技術學院基礎教學部,河南鄭州 451150)
洛倫茲曲線的準確度關系到基尼系數的精度,結合2006年湖北省農村和城鎮的收入分組數據,分別針對性地提出一個洛倫茲曲線新模型。通過對2種新模型的初次分析,從擬合度上可以表明擬合效果很好。新模型擬合效果從全部模型來看還是相當好的。
洛倫茲曲線;Matlab;曲線擬合;誤差分析;模型對比
隨著經濟的發展,國家之間、國內社會成員之間收入分配差距日益擴大,貧富差距問題已成為人們日益關心和爭論的熱門話題[1]。
洛侖茲曲線與基尼系數分別是國際上用來衡量一個國家或地區經濟部門專門化(集中化)程度及國民收入分配不平等(貧富分化)程度的坐標圖形和分析指標。不僅可以用來靜態地刻畫一個國家或地區的財富分配情況及社會穩定性,而且可以用于檢驗政府政策在調節收入分配上的作用。基尼系數可以把分析結果用一束精確的具體數據表示出來,具有可量化性和確切性。然而,這一精確的數字是建立在擁有準確的洛倫茲曲線之上的。由此可見,洛倫茲曲線和基尼系數存在著密切的內在聯系。
本文通過2006年湖北省農村、城鎮的收入分組數據(見表1),分別針對性地擬合出適合農村的洛倫茲曲線模型和適合城鎮的洛倫茲曲線模型。
1.1 農村收入分組數據的洛倫茲曲線模型
2006年湖北省農村收入分組數據如表1所示。表1中,[xi,xi+1]為收入區間,單位為元;fi是該區間內的人口比例;IUi(Income Uunits)是所調查收入區間在[xi,xi+1]的單位數目;CAi(Class Average)是這些單位在區間[xi,xi+1]的平均收入;pi是[0,xi+1]中人口比例;Li是[0,xi+1]中人口擁有的總收入比例,因此(pi,Li)是洛倫茲曲線上的點。首先畫出數據散點圖,如圖1所示。

表1 農村收入分組數據

圖1 農村收入數據散點圖


結合表1的數據,用最小二乘法Matlab實現,可以分別求出α、β、γ、η的值:

將所建立的新模型應用于表1的數據,繪制出農村收入數據模型擬合曲線,如圖2所示。然后再通過Excel運用回歸分析法做回歸統計,結果如表2所示。

表2 農村收入數據模型曲線回歸統計值

圖2 農村收入數據模型擬合曲線圖
從圖2擬合曲線可以直觀看出,擬合曲線非常接近數值點;從表2回歸統計值可以看出,擬合度R2=0.999 999 13,擬合效果很好。
1)基于ACP100S直流蒸汽發生器(once-through steam generator,OTSG)最低穩定運行功率的要求,ACP100S反應堆功率控制和給水控制系統自動控制范圍為20%滿功率(full power,FP)~100%FP.
1.2 城鎮收入分組數據的洛倫茲曲線模型2006年湖北省城鎮收入分組數據如表3所示。

表3 城鎮收入分組數據
將農村收入分組數據稍作修正,建立城鎮收入分組數據的模型為:

用同樣的方法求出:

將所建立的新模型應用于表3的數據,繪制出城鎮收入數據模型擬合曲線如圖3所示。然后再通過Excel運用回歸分析法做回歸統計,結果如表4所示。

圖3 城鎮收入數據模型擬合曲線圖

表4 城鎮收入數據模型曲線回歸統計值
從圖3擬合曲線可以直觀看出,擬合曲線非常接近數值點;從表4回歸統計值可以看出,擬合度R2=0.999 998 504,擬合效果很好。

第3種模型,

第5種模型,

第6種模型,

第7種模型,

第8種模型,

第9種模型,

分析表5數據,可以得出如下結論:①第2種模型的城鎮收入分組數據的最大絕對誤差、平均絕對誤差、均方誤差均大于本文模型,農村收入分組數據的平均絕對誤差小于新模型,然而最大絕對誤差、均方誤差卻大于新模型,從其擬合度0.999 998 882小于新模型可以看出,第2種模型擬合效果不如新模型;②第9種模型的農村收入分組數據的最大絕大誤差雖然小于新模型,但是平均絕對誤差、均方誤差卻大于新模型,這說明新模型的擬合效果還是要好些,從其擬合度0.999 998 117小于新模型可以看出;③第10種模型的城鎮收入分組數據最大絕大誤差雖然小于新模型,但是平均絕對誤差、均方誤差卻大于新模型,這說明新模型的擬合效果較好些,從其擬合度0.999 998 437小于新模型可以看出;④第11、12、13種模型的城鎮收入分組數據最大絕對誤差、平均絕對誤差、均方誤差均大于本文模型,但是農村收入分組數據最大絕對誤差、平均絕對誤差、均方誤差均小于本文模型,盡管如此,二者誤差數據數值很接近,這可能是因為農村收入的離散性比城鎮要大,故此產生一些偏差。
結合上述分析,第1種模型到第10種模型的擬合精度沒有新模型效果好,第11種模型到第13模型的農村收入分組數據最大絕對誤差、平均絕對誤差、均方誤差均小于本文模型,但是城鎮收入分組數據最大絕對誤差、平均絕對誤差、均方誤差均大于本文模型。從整體效果來看,本文對農村和城鎮收入分組數據各提出的一個新模型,擬合效果較好。

表5 模型誤差數據對比
[1]李聰睿.計算基尼系數的算法研究及其應用[J].廣東工業大學學報,2005(2):125-128.
The Fitting New Model of Lorenz Curve Based on Revenue Packet Data
Hou Hongtao
(The Department of Fundamental Education,Zhengzhou University of Industrial Technology,Zhengzhou Henan 451150)
Accuracy of Gini Coefficient is closely related to the accuracy of the lorenz curve,combined with 2006 revenue of Hubei rural and urban packet data,a new model of lorenz curve was respectively proposed.Through the analysis of the two new models,from the fitting degree,it could be shown that the fitting effect was very good.comparative results showed that new model fitting effect among all models was still quite good.
lorenz curve;Matlab;curve-fitting;error analysis;model compare
F126.2
A
1003-5168(2016)11-0045-03
2016-10-08
侯宏濤(1988-),男,碩士,助教,研究方向:物理教學與實驗。