杜文超,劉亞相
(西北農林科技大學 理學院,陜西 楊凌 712100)
新Lorenz曲線模型及應用
杜文超,劉亞相
(西北農林科技大學 理學院,陜西 楊凌 712100)
Lorenz曲線作為分析國家收入分配狀況的重要工具,近年來得到廣大學者的關注和廣泛應用。文章提出了新的Lorenz曲線模型,通過Monte Carlo數值模擬及實際應用分析,并與十個經典的Lorenz曲線模型作對比,來說明新模型的優越性和合理性。
Lorenz曲線;新模型;數值模擬;實際應用
在經濟學研究領域,Lorenz曲線是分析國民收入和財富分配狀況的重要工具,并受到廣泛應用。Lorenz曲線首先由Max Otto Lorenz提出,隨后受到許多學者的關注。目前,Lorenz曲線模型的建立主要有3種方法:幾何算法、曲線擬合法和分布函數法。本文討論的內容屬于曲線擬合法,基于前人的研究,根據Lorenz曲線所具有的性質,構造了新的Lorenz曲線模型。
1.1 orenz曲線的定義
Lorenz曲線L(p)表示的是收入小于或等于x的人口所擁有的收入占總收入的比例,即:

其中,μ是平均收入,x表示收入,f(x)是收入分配的密度函數。記收入分布函數為F(x),p=F(x)表示收入小于或等于x的人口比例,F-1(p)表示F(x)的反函數,那么Lorenz曲線還可以表示為:

1.2 Lorenz曲線的性質
由定義可知Lorenz曲線L(p)具有如下性質,
性質1也是使函數L() p成為Lorenz曲線的充分必要條件。1999年Jose-Maria Sarabia等人研究了Lorenz曲線的衍生模型,提出如下性質:
性 質2:若 L(p )是 一 個Lorenz曲 線 ,考 慮Lα(p)=pαL(p),α≥0,
當α≥1時,Lα(p)是一個Lorenz曲線;
當0<α≤1,且L?(p)≥0時,Lα(p)是一個Lorenz曲線。
2011年,王祖祥等人在Sarabia等人研究的基礎上,進一步分析了Lorenz曲線,擴充了Lorenz曲線的性質,提出性質3。
性質3:假設 f(p)和g(p)都是Lorenz曲線。那么L(p)=f(p)αg(p)υ也是Lorenz曲線,只要下面任一條件成立:
①α≥1,υ≥1;
[ ]
0,1上遞增;
1.3 新模型的構建
Kakwani和Podder(1923)提出了較早的Lorenz曲線模型:

隨后,Rasche et al(1980)、Gupta(1984)、Chotikapanich(1993)、Jose-Maria Sarabia和Enrique Castillo(1997)相繼提出如下Lorenz曲線的經典模型:

2009年,Wang等人根據Schader和Schmid于1994年提出的模型

在模型(7)的基礎上用e-γp替換了ηpγ,提出了如下模型:

并指出該模型比基于Pareto分布而得到的Lorenz曲線基礎模型:

具有更高的擬合精度。此外,國內外學者還提出了許多衍生的Lorenz曲線模型,例如:

本文利用Lorenz曲線的性質,基于前人提出的基礎模型,構造了如下四個新模型:

令f(p)=1-e-ap(1 -p)b,g(p)=1-(1-p)c。則當0<b≤1,0≤a+b≤時,f(p)為Lorenz曲線模型(8)且f?(p)≥0;當0<c≤1時,g(p)為Lorenz曲線基礎模型(10);當0<c≤1,d≥1時,g(p)d為Lorenz曲線模型(5)。由 Lorenz曲線的性質 1可知,當 0<b≤1,0≤a+b≤, 0<c≤1 時 , 均 有f′(p)≥0,f″(p)≥0,g′(p)≥0,g″(p)≥0,進而當m∈[0 ,1]時有 L11′(p)≥0,L11′(p)≥0,p∈[0 ,1] 。且 L11(p)滿足L11(0)=0,L11(1)=1。故L11(p)為Lorenz曲線模型。同理可知當0<b≤1,0≤a+b≤,0<c≤1,d≥1,m∈[0 ,1]時,L12(p)也為Lorenz曲線模型。再根據性質3可得,當0<b≤1,0≤a+b≤,0<c≤1,d≥1時,L13(p)為Lorenz曲線模型;當0<b≤1,0≤a+b≤,0<c≤1,d≥1時,L(p)也為Lorenz曲線模型。14
基于Monte Carlo數值模型,對本文提出的四個Lorenz曲線新模型與已有的十個經典Lorenz曲線模型的擬合結果進行對比,來表明其擬合效果。
成邦文(2005)指出,社會經濟規模指標近似服從對數正態分布。由此,本文假定收入變量X~lnN(μ ,σ),F(x)為X的分布函數,則Lorenz曲線上任一點所對應的橫坐標滿足p=F(x),且Lorenz曲線滿足L(p)=Φ(Φ-1(p)-σ),其中Φ與Φ-1分別表示標準正態分布函數及其逆函數。由Lorenz曲線與收入分布函數之間關系,利用Monte Carlo數值模擬方法,生成服從對數正態分布的隨機數,再分別計算收入分布函數值及Lorenz曲線函數值,進而估計Lorenz曲線模型。
本文采用最常用的三個指標來比較擬合效果:均方根誤差(RMSE)、平均絕對誤差(MAE)以及最大絕對誤差(MAS)。為使得模擬結果不失一般性,本文取μ=0,σ=1,模擬100次,結果如圖1至圖3所示。圖1至圖3分別給出了模型L1~L14擬合效果指標RMSE、MAE、MAS的箱線圖。在圖中,箱線圖的高低代表了模型擬合誤差的大小,箱體觸須的長短則代表了模型擬合效果的穩定程度。在圖1中,本文提出的模型L14擬合效果最好,其次為L12、L13和L7;在圖2中,L14仍表現最佳,其次為L12和L13;在圖3中,模型L14要較之其他模型有明顯的優勢,其次為L12和L13。綜合圖1至圖3,可以看出本文提出的模型L14具有非常好的擬合效果,并且擬合結果穩定;其次,本文提出的模型L12、L13相較于已有模型也具有較好的擬合效果,L11略次之。

圖1 均方根誤差箱線圖

圖2 平均絕對誤差箱線圖

圖3 最大絕對誤差箱線圖
本文選用2013年第十屆華為杯全國研究生數學建模競賽“中等收入定位與人口度量模型研究”中的數據來檢驗模型實用性。本文所使用的原始數據見表1至表3所示。其中,競賽E題表1收入分配分組數據用來比較新模型與已有模型的擬合效果;表2和表3收入分配分組數據則用來檢驗新模型對Lorenz曲線的描述能力。

表1 收入分配分組數據

表2 收入分配分組數據(地區A,年份之一)

表3 收入分配分組數據(地區A,年份之二)
3.1 擬合效果比較
運用Lorenz曲線模型L1(p)~L14(p)分別對競賽E題中的表1收入分配分組數據進行擬合,擬合效果如表4所示。從表中可以看出,擬合效果最好的為本文提出的四個模型L11(p)、L12(p)、L13(p)、L14(p),并且相較于已有模型,具有明顯的優越性,其中L14(p)表現最佳,誤差最小。

表4 Lorenz曲線模型擬合結果
3.2 新模型實際應用
為更好地說明新模型的優越性和合理性,本文選用L12(p)和L14(p)模型對競賽E題中表2和表3收入分配分組數據進行擬合,從而檢驗新模型的實用性及對Lorenz曲線的描述能力。
L12(p)、L14(p)對地區A在年份一和年份二的收入分配分組數據擬合效果如圖4和圖5所示,其中黑色實線是真實Lorenz曲線,黑色虛線是模型擬合的Lorenz曲線。

圖4 地區A在 L12(p)模型下擬合的Lorenz曲線
從圖4和圖5中可以看出L12(p)與L14(p)模型擬合出的Lorenz曲線幾乎與真實Lorenz曲線完全重合。在圖4中,新模型L12(p)對年份一和年份二數據的擬合都表現出當p=0.7至p=0.9時誤差變大,該模型低估了高分位點的總收入比重,因此由該模型計算的Gini系數將比真實值偏大。在圖5中,新模型L14(p)對數據的擬合也出現了低估高分位點總收入比重的情況;在年份一中,當p處于0.8附近時,該情況表現明顯;在年份二中,該情況得到明顯的改觀,擬合曲線幾乎完全逼近真實曲線。總體來說,新模型L12(p)和L14(p)均具有很好的擬合效果,都能夠幾乎準確的表現真實Lorenz曲線,其中L14(p)表現更好,誤差更小。

圖5 地區A在L14(p)模型下擬合的Lorenz曲線
本文利用Lorenz曲線的性質,在前人研究的基礎上,提出了四個新Lorenz曲線模型,通過數值模擬和實際應用,新模型較之已有模型,表現出明顯的優越性和有效性,新模型能很好的逼近真實Lorenz曲線,更加精確地描述真實Lorenz曲線,反映收入分布狀況。新模型對于計算Gini系數以及更深一步的研究,具有很好的利用價值和參考意義。
[1]Ogwang J,Rao U L G.Hybrid Models of the Lorenz Curve[J].Econom?ics Letters,2000,(69).
[2]Sarabia J M,Castillo E,Pascual M,et al.Mixture Lorenz Curves[J].Eco?nomics Letters,2005,(89).
[3]Wang Z X,Ng Y K,Smyth R.A General Method for Creating Lorenz Curves[J].Review of Income and Wealth,2011,57(3).
[4]Wang Z X,Smyth R.A Hybrid Method for Creating Lorenz Curves[J]. Economics Letters,2015,(129).
[5]許啟發.一個新的Lorenz曲線模型[J].數量經濟技術經濟研究, 2014,(11).
[6]成邦文.基于對數正態分布的洛倫茲曲線與基尼系數[J].數量經濟技術經濟研究,2005,(2).
[7]楊寶瑩.廣義Lorenz曲線的非參數統計推斷[J].中國科學:數學, 2012,(3).
(責任編輯/浩 天)
F222.3
A
1002-6487(2016)23-0077-03
杜文超(1991—),女,黑龍江伊春人,碩士研究生,研究方向:居民收入分配及消費。
(通訊作者)劉亞相(1962—),男,陜西寶雞人,博士,教授,研究方向:博弈論、金融數學、經濟數學。