一、引言
對(duì)單變量的分析,平均數(shù)只能給出一個(gè)大致的概括性描述,并且常常提供的是不確切的信息。例如,一個(gè)社會(huì)收入存在著“二八”現(xiàn)象,即收入分布為20%的人口擁有80%的財(cái)富,收入差距較大,貧富不均。如果按社會(huì)人均收入來(lái)確定累進(jìn)的個(gè)人所得稅起征標(biāo)準(zhǔn),那么,20%的富裕人口不會(huì)因稅賦而降低個(gè)人福利,但是80%的低收入人口將會(huì)因此稅賦而大大降低個(gè)人福利。因此,按社會(huì)平均收入設(shè)計(jì)稅收制度,非但沒有起到“劫富濟(jì)窮”,相反卻“劫窮濟(jì)富”。平均收入看似公平,其實(shí)足不公平的。如果,同時(shí)參考中位數(shù)、眾數(shù)、四分位點(diǎn)等趨勢(shì)標(biāo),根據(jù)不同分位點(diǎn)的收入狀況制定個(gè)人所得稅課收標(biāo)準(zhǔn),那么問(wèn)題就解決了。可見,平均數(shù)與分位位數(shù),在實(shí)際應(yīng)用中存在很大的差異。下面的例子進(jìn)一步說(shuō)明二者的不同。關(guān)于分位點(diǎn)回歸方法及其新近的應(yīng)用例子,可參考Buchinskv(2000)和Koenker(2005)所作的綜述。本節(jié)通過(guò)一個(gè)經(jīng)典的經(jīng)濟(jì)學(xué)例子來(lái)說(shuō)明分位點(diǎn)回歸的基本思想,并與傳統(tǒng)的OLS對(duì)比,來(lái)考察二者的差別。該例子源于Roger Koenker和Kevin F.HaUock(2001)。
1857年,恩格爾利用235戶歐洲工人階層家庭調(diào)查資料,分析了家庭食品支出與家庭收入之間的關(guān)系,總結(jié)出了恩格爾定律。OLS結(jié)果與分位點(diǎn)回歸結(jié)果有下圖給出。其中OIS回歸線為著名的恩格爾曲線。橫軸為家庭收入,縱軸為食物支出。分別給出了(0.05,0.1,0.25,0.5,0.75,0.9,0.95)分位點(diǎn)回歸贏線。分位點(diǎn)擬合直線為中位數(shù)同歸直線,由實(shí)線表示。OIS擬合線為當(dāng)中的虛線。其余為6條其他分位點(diǎn)回歸擬合直線。該圖清楚地表明,隨著家庭收入的增加,食物支出增加存在發(fā)散的趨勢(shì)。分位點(diǎn)回歸擬合線之間的距離表明食物支出的條件分布是向左偏態(tài)的。在低分位點(diǎn)上,擬合線分得很開,意味著分布密度低且尾部較長(zhǎng);在高分位點(diǎn)上,擬合線較密集,意味著分布密度高且尾部較短。分位數(shù)回歸與傳統(tǒng)OIS結(jié)果見下圖。我們發(fā)現(xiàn)中位數(shù)擬合線和均值擬合線(即OLS擬合線)是完全不同的兩條線。二者存在顯著差異的原因可以從兩方面加以解釋。一是條件分布密度是非對(duì)稱,只有在對(duì)稱分柿下中位數(shù)才與均值相同;二是OLS明顯受到兩個(gè)異常點(diǎn)的影響,這兩個(gè)點(diǎn)是高收入但低食物支出家庭。從上述對(duì)比分析可以得到這樣的結(jié)論:基于該樣本,OLS估計(jì)是不穩(wěn)健的,對(duì)于相對(duì)貧窮的家庭,OLS估計(jì)是相當(dāng)差的。因?yàn)镺LS擬合線經(jīng)過(guò)的點(diǎn)都高于家庭收入很低的樣本點(diǎn)。
這個(gè)例子說(shuō)明,分位點(diǎn)回歸克服了OLS估計(jì)的不穩(wěn)健性缺陷,更重要的是分位點(diǎn)回歸提供了有關(guān)樣本的全面而具體的細(xì)節(jié)描述,而OLS僅僅是一個(gè)大致的輪廓式的影像。所以,對(duì)于微觀領(lǐng)域的大樣本量的個(gè)體數(shù)據(jù),例如,家庭問(wèn)卷、人口調(diào)查、勞動(dòng)力、企業(yè)等數(shù)據(jù),個(gè)體間存在著顯著差異,分位點(diǎn)回歸將是一個(gè)非常有效和簡(jiǎn)單的數(shù)據(jù)分析方法。
二、傳統(tǒng)OLS方法
為了理解分位點(diǎn)回歸,我們?cè)诖艘肫胀ㄗ钚《朔?OLS)。
注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文”