來江濤,胡學平
(安慶師范大學數理學院,安徽安慶 246011)
恩格爾系數(Engel's Coefficient)是個人或者家庭生活消費中,食品煙酒支出所占消費總支出的比重。1857年,統計學家恩斯特·恩格爾(Ernst Engel)在研究居民家庭收入的增長對食品消費支出的影響時,得出一個重要的規律:隨著可支配收入的增加,其中用于個人食品消費支出比例將隨之降低,這一規律被稱為恩格爾定律(Engel's Law)。
利用逐步回歸法和倒數變換法建立新的恩格爾系數模型,計算得出更符合我國居民生活水平的恩格爾系數,從而準確衡量我國居民的真實生活水平并找到相關影響因素。
張榮山[1]認為在傳統消費習慣的影響下,教育支出、住房支出、醫療支出費用等其他方面消費的上漲,收入水平停滯不前,統計方法的落后以及貧富差距的加大這5 個主要因素的影響下,使落后的城鎮居民的恩格爾系數發生失靈。王少飛[2]提出,隨著我國經濟水平的提高,居民生活消費習慣和理念也發生變化,用恩格爾系數來衡量居民生活水平,在我國是否還適用,值得我們認真考慮。謝清心[3]提出了膳食結構對恩格爾系數的局限性分析,并剔除了膳食結構影響因素。盛萬里[4]基于2002 年—2017 年我國城鄉居民的恩格爾系數的分析,研究我國城鄉消費結構的地區差異及其演化,指出了恩格爾系數的地域及城鄉差異確實顯著。陳夢根[5-6]首先進行了恩格爾定律在中國的適用性研究,并討論了恩格爾系數變動的主要原因。在此基礎上,引入三種擴展模型研究,結論表現為恩格爾系數與人均可支配收入之間存在反向增長的關系,同時顯示出食品價格與恩格爾系數之間的正向增長的關系,又引入地區生產總值、城鎮人口比等其他控制變量,引入控制變量在一定程度上將弱化居民可支配和物價指數對恩格爾系數的影響。舒群[7]分別從宏微觀角度和時間序列角度研究了地域差別、房價、可支配收入等經濟要素與恩格爾系數之間的相關關系。顧愷[8]通過研究發現,2000—2015 年間,榆林市農村居民消費水平越來越高,可支配收入和消費支出日益增加,領先陜西省其他城市,人均消費支出從2000—2015 年,15 年之間增加了7 600 元,食品煙酒支出在消費結構各項指標中比重最大,教育文化娛樂支出和住房支出也在逐年遞增。運用計量的方法,趙鑫[9]消除了物價指數和福利政策對恩格爾系數的影響,指出并解決了恩格爾系數不適用于我國實際情況的問題。
恩格爾系數被國際組織(FAO)用來衡量居民家庭富裕程度:恩格爾系數低于30% 為最富裕,30%~40%為富裕,40%~50%為小康,50%~59%為溫飽,59%以上為貧困水平(Houthakker,1987)[10]。
如果依照FAO 的衡量標準,從圖1 可得,2001 年我國已經邁入小康水平,2002—2015 年我國已經處于富裕程度,2016 年以后我國更是踏入了最富裕階段。
根據中國家庭收入階層劃分標準(2022 年中國最新家庭收入階級表)將我國家庭等級劃分為赤窮(家庭年收入1 萬以下)、很窮(1~3 萬)、貧窮(3~8萬)、小康(8~15萬)、富裕(15萬以上),以此衡量我國居民的生活貧富狀況。2014年到2020年以來中國人均可支配收入依次為20 167元、21 966元、23 821元、25 973 元、28 228 元、30 732 元、32 188 元,按照一個家庭四口之家的配置,合約8~13 萬元,可以說全國都進入了小康家庭的行列,但是根據上述FAO 的衡量標準:2002 年以后我國已經從富裕程度到2016 年跨入最富裕程度截然不符。
2020 年全國31 個省、市、自治區(不含港澳臺)居民人均消費支出主要有食品支出、衣著支出、居住支出、生活用品支出、交通支出、教育支出、醫療支出及其他支出等8 項指標數據。這八項指標從衣食住行等各方面進行考慮,根據這些數據,采用k均值聚類法進行分類,k取4。
采用k均值聚類法,根據31個省市的八項消費指標,將相似的對象歸到同一個簇中,我國居民的消費支出被分為四個類:
第一類:天津江蘇浙江福建廣東;
第二類:河北山西吉林黑龍江河南廣西貴州云南西藏陜西甘肅青海寧夏新疆;
第三類:湖南海南重慶四川山東湖北內蒙古遼寧安徽江西;
第四類:北京上海。
通過2020年中國恩格爾系數和聚類分析的結果可以看出,大多數分為一類的省市恩格爾系數是相近的,這說明恩格爾系數在我國大部分省市是基本適用的。由表1 可以看出,天津市、江蘇省和浙江省的恩格爾系數均在30%以下,而福建省和廣東省的恩格爾系數分別為33.4%和33.8%,這明顯與聚類分析得出的結果不符。我國北京、上海、陜西、山東等17 個省市的恩格爾系數均小于30%,如果以國際上用恩格爾系數劃定貧富水平的標準去衡量,這些省市已經跨入了最富裕階段,而經濟發達,GDΡ 排名第一的廣東省的恩格爾系數卻大于30%,都已經超出了全國平均恩格爾系數,這明顯與我國的實際情況不相符。綜上所述,恩格爾系數在我國具有一定的局限性,因此引入其他的控制變量對傳統的恩格爾系數進行修正。
最簡單的恩格爾系數修正方法是從人均收入與消費支出的相關關系的角度出發進行考慮,Ogburn[11]以qi=ai+bi y為基準模型,其中qi為食品消費支出,y為人均收入,對各國多組數據進行實證研究,結果顯示誤差偏大,模型擬合效果不理想。
一些研究者對居民可支配收入取對數,研究其對恩格爾系數的影響,Working(1943)[12]提出:wi=ai+biln(y),其中wi為恩格爾系數,y為人均收入。Leser[13]研究發現該模型估計誤差較小其擬合效果相對簡單線性模型較優,這一方法被稱為Working-Leser 模型。
Leser[13]還在Working-Leser模型的基礎之上進行了簡單修正,即wi=ai+biln(y) +ci y-1,在對收入取對數的基礎上,又進行倒數變換,對模型進行擬合研究之后,發現這一模型擬合效果好于上述模型,這就是著名的Rank-three 模型。
傳統恩格爾系數的計算只由人均食品消費支出和居民消費總支出決定,上述研究也只引入了人均收入這一變量,但消費結構也是影響食品消費的主要因素。為了使恩格爾系數能正確評估居民的生活水平,在研究人均收入對恩格爾系數的基礎上引入消費結構,以及其他相關控制變量進行逐步修正。出于全面的考慮,先對簡單線性模型、Working-Leser模型和Rank-three 模型這三種模型進行比較,再做適當修正后對實際問題進行實證研究,模型基本形式見表2。

表2 修正模型公式表
上述模型中,x1表示解釋變量居民收入,z表示其它控制指標變量,y表示因變量恩格爾系數,ε為殘差項。
由于國家統計局統計年鑒數據只更新到2021年,所以使用選取2020 年31 個省市截面數據為樣本,數據均來源于《中國統計年鑒2021》,相關變量說明如下:
恩格爾系數:2020年各省市恩格爾系數y根據各地區人均食品消費支出和人均消費總支出計算得到,計算公式為:
人均收入:用我國2020 年分地區居民人均可支配收入數據表示因變量居民收入,單位為元。
消費結構:居民日常的消費離不開吃穿住行,所以引入衣著支出(元)、居住支出(元)和交通通訊(元)等解釋變量;一個城市的前進也離不開福利政策和教育文化的發展,所以引入醫療保健(元)和教育支出(元)解釋變量;最后引入居民日常生活用品(元)。
其他控制變量:將分地區生產總值(GDΡ)、社會消費品總額、私家車擁有量、各省市人口數量、各省市平均城市房價、人員工資等指標作為其他控制變量,并對各解釋變量進行了標準化處理。
首先用上述三種簡單模型研究居民收入對恩格爾系數的影響。由表3 可知,模型1 中收入(income)的估計 系數為-1.244e-06 模型2 中log(income)的估計系數值為-0.104,均通過了5%的置信水平檢驗,模型3 中log(income)的估計系數值為-0.468,通過了置信水平為10%的顯著性檢驗,收入倒數的系數估計值為-5 677.216,沒有通過置信水平為10%的顯著性檢驗。三個模型調整后的R2均較小,比較而言,模型3 的調整后的R2最大,結合其它評價指標AIC、D-W 統計量、BΡ 統計量、F統計量而言,Rank-three 模型的擬合效果略好于其他兩個模型。從分析結果來看,income 前面的估計系數均為負數,說明恩格爾系數與收入水平呈現負相關關系,符合恩格爾系數定律的基本概述,但數值較小,對其影響不夠顯著。因此,下面引入分地區生產總值(GDΡ)、社會消費品總額、私家車擁有量、各省市人口數量、各省市平均房價、人員工資等指標,對恩格爾系數的影響進行深入研究。

表3 居民收入與恩格爾系數的相關關系分析表
根據上面三個改進模型引入消費結構和其他變量研究對恩格爾系數的影響,研究中采用逐步回歸法以及對因變量進行倒數變換,來解決各變量之間的多重共線性問題,依次納入不同變量,得到如下結果:
上述模型中,x1表示食品支出,x2表示衣著支出,x3表示居住支出,x4表示日常生活用品,x5表示交通通訊支出,x6表示教育支出,x7表示醫療支出,x8表示其他支出,x9表示地區生產總值,x10表示社會消費品總額,x11表示私家車擁有量,x12表示各省市人口數量,x13各省市平均房價,x14人員工資,ε2表示誤差。
如結果可知,F-統計量的P值檢驗為0.000,模型整體顯著性水平較高;調整后的R2值為0.771,表明模型的擬合效果較好;變量的t檢驗P值均小于0.05,均可通過t值的顯著性檢驗,說明得到的模型不存在多重共線性問題,D-W 統計量的P值檢驗也大于0.05,即模型也不存在自相關性;BΡ 統計量檢驗得到P=0.278,異方差檢驗值大于0.05,說明在95%的置信水平下修正后的模型不存在異方差性,說明得到的解釋變量可以很好解釋對恩格爾系數的影響。
從修正后的模型中可以看出,衣著支出、居住支出、教育支出、醫療保健、私家車擁有量、就業人員工資的不斷增加是造成恩格爾系數下降的主要原因,隨著居民生活水平的顯著提高,居民在購買房產、購買車輛、教育、醫療保健方面的追求越來越高,居民在這方面的支出就會大幅提高,在可支配收入一定的情況下,在食品消費方面的支出就會減少,恩格爾系數就會隨之降低。而隨著個人可支配收入和生活耐用品消費的增加,居民的飲食消費習慣也會隨之改變,生活消費會從溫飽型轉變為營養性,主食會從谷物食品轉變為肉乳品,而且會對蔬菜水果食物進行一定量的儲蓄,從而增加了在食品消費的支出,導致恩格爾系數的上升。
將31個省市地區人均可支配收入,衣著支出,住房支出,生活用品及服務支出,教育支出,醫療保健支出,私家車擁有量,人口數量,人員工資等指標2020 年的數據帶入修正后的模型中,可以計算出各省市修正后的恩格爾系數。
從表4 可以得知,修正后的模型計算得到的2020 年31 個省市的恩格爾系數比傳統算法(食品消費支出/消費總支出)的數值要高,根據傳統計算得到的恩格爾系數反應出我國居民家庭已經處于富裕和最富裕狀態(40%以下),而修正后的恩格爾系數僅處在小康水平(40%~50%),真實反映了我國居民的真實生活水平。我國正處于社會主義初級階段,作為發展中國家,與世界上其他發達國家的醫療、福利、住房政策,消費習慣還是出入比較大的,而且我國的人均GDΡ 還是很低的,應客觀分析恩格爾系數下降背后隱藏的真實原因,不能用傳統恩格爾系數衡量我國居民家庭的富裕程度,單單以數值下降去判斷我國的實際國情。基于修正后的模型計算實際的恩格爾系數可以真實地反映我國居民家庭富裕程度,同時可以為相關政府工作人員提供參考價值。

表4 恩格爾系數對比表 單位:%