999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GAMLSS模型的不同收入群體邊際消費傾向研究

2021-10-21 11:07:54馮鈺雯
統計理論與實踐 2021年9期
關鍵詞:模型

王 超 張 雨 滕 嬋 馮鈺雯

(安陽師范學院 數學與統計學院,河南 安陽 455000)

一、引言

邊際消費傾向研究的核心問題之一是消費函數的設定。多數研究設定采用線性回歸的設定形式(胡靜嫻,2010;陳訓波和周偉,2013)[1][2]。線性回歸模型通常以誤差項服從正態分布為假定前提,也就意味著消費水平服從正態分布。而現實情況是,居民消費水平可能并不服從正態分布。金春雨和程浩等繪制了中國各省農村居民人均消費核密度圖,發現中國各省農村居民人均消費呈現典型的右偏特征[3]。這就意味著,如果采用默認的正態分布進行參數擬合勢必會與現實情況產生較大不適。為此,學術界嘗試改變傳統的模型設定形式以適應這種情形。

部分研究將非參數回歸技術引入居民消費邊際傾向研究之中(龍健顏和盧素等,2011;黃金波和李仲飛,2014;錢明輝和胡日東等,2018;趙衛亞,2005)[4][5][6][7]。非參數回歸不需要模型滿足線性的假設前提,即不需要事先假定消費水平服從正態分布,因而可以靈活地探測數據間的復雜關系。但該模型設定有一種天然不足,就是當模型中自變量數目較多時,模型的估計方差會加大,導致回歸系數的估計準確度很差。另外,非參數回歸中自變量與因變量間關系的解釋也有難度。所以,多數使用非參數回歸技術的研究僅僅是將居民收入作為影響居民消費水平的唯一因素。

為了解決這一問題,部分研究采用了半參數回歸技術研究居民邊際消費傾向(婁峰和李雪松,2009;田鳳平和周先波等,2013)[8][9]。這種設定形式介于參數設定與非參數設定之間,即對影響居民消費的部分變量采用線性設定形式,部分變量采用非參數設定形式。由于該設定形式需要使用最小二乘法估計線性設定變量的參數,也意味著居民消費水平滿足正態性的假定,從邏輯上講,這種設定形式依然與現實不符。

首次考慮被研究現象統計分布特征的理論回歸模型當屬廣義線性模型(Generalized Linear Model,GLM),該模型假定待研究現象(如消費)服從指數型分布。該模型并非直接在解釋變量與被解釋變量之間建立聯系,而是通過連接函數在兩者之間建立聯系。連接函數的形式依被解釋變量所屬具體分布函數進行確定。當指數型分布為正態分布時,被解釋變量的期望正好為連接函數,此時該設定與普通的線性回歸模型是一致的。這意味著連續響應的普通回歸模型是廣義線性模型的特殊情形。由于該類模型的前提條件為指數型分布,理論上只有某些特殊的情形才滿足這一條件。如對右偏型數據進行分析時,由于存在較少數量的右偏性質的指數型分布,所以這種模型在居民邊際消費傾向研究中使用較少。

為了使模型設定更加靈活,以揭示自變量的非線性效應,將非參數設定形式的自變量引入就成為廣義線性模型的一種自然擴展。這種擴展被稱為廣義可加模型(Generalized Additive Models,GAM),該模型由Hastie和Tibshirani于1990年提出。由于遵循了廣義線性模型的理論框架,因此廣義可加模型也需要因變量服從指數族分布形態,極大地限制了其他非指數族分布現象的建模,客觀上為該模型的擴展提供了潛在可能。2005年,Rigby和Stasinopoulos提出了包含位置、規模和形狀的廣義可加模型(Generalized Additive Models for Location,Scale,and Shape,GAMLSS),很好地解決了非指數族分布現象的建模問題[10]。

經過文獻梳理,發現現有關于居民家庭邊際消費傾向的研究多集中于線性模型的設定形式,且以被解釋變量服從正態分布為假設前提條件,鮮有文獻集中于消費分布的探討。本文針對以往研究存在的不足,從以下三個方面進行改進。

第一,普通線性回歸模型的設定形式并不能客觀反映居民消費水平的真實狀況,客觀識別并確定消費性支出的分布狀況是構建消費支出模型的邏輯前提。

第二,將包含位置、規模以及形狀參數在內的廣義可加模型(GAMLSS)引入居民消費支出模型構建之中。這種設定形式既可以考慮消費支出的具體分布,又可以探究其微觀影響因素。

第三,基于不同收入群體消費行為異質性的特征,本文嘗試在GAMLSS框架下探討影響不同消費群體消費水平的微觀因素。

二、GAMLSS模型

如前所述,為了彌補傳統的線性模型因變量多限于正態分布假定的現實困境,廣義線性模型、廣義可加線性模型相繼被提出。但不論是廣義線性模型還是廣義可加線性模型,皆以因變量分布為指數型分布形態作為前提假設條件,給該模型的現實應用帶來挑戰。一方面是符合指數型分布族的分布類型較少,通常以正態分布、泊松分布、二項分布、Gamma分布等為主;二是現實中非指數型類分布經常出現,如一些表示效率的現象常呈現出右偏特征,如果針對這種現象進行建模,則應該選用與之相對應的右偏分布。為此,Rigby和Stasinopoulos于2005年提出了包含位置、規模和形狀的廣義可加模型(Generalized Additive Models for Location,Scale,and Shape,GAMLSS)。

(一)GAMLSS模型的一般形式

假設觀測值yi(i=1,2,…,n)具有參數為θi=(θ1i,θ2i,θ3i,θ4i)=(μi,σi,υi,τi)的概率密度函數f(yi|θi)。其中μi、σi分別代表位置參數(通常代表均值)和規模參數(通常代表標準差),υi、τi代表形狀參數,常表示偏度和峰度。GAMLSS模型的一般形式為:

令yT=(y1,y2,…,yn)為n維響應變量,令k=1,2,…,p,令gk(θi)為與分布f(yi|θi)有關的單調連接函數,設定為:

其中θk和ηk為長度為n的向量,Xk為維數已知矩陣,Zjk為維數為n×qjk的矩陣,γjk是維數為qjk的隨機變量。

式(1)中,ηk(k=1,2,…,p)是由參數成分 Xkβk和可加成分Zjkγjk兩部分組成。其中Xkβk為解釋變量的線性函數,Zjkγjk為隨機變量的線性函數(也可視為隨機效應)。GAMLSS包含幾種重要的模型。

當 Jk=0(k=1,2,…,p)時,模型 GAMLSS 簡化為參數模型:

當Zjk=In(In為n×n的單位矩陣),γjk=hjk=hjk(Xjk),可以得到半參數可加形式的GAMLSS模型:

式(3)中,hjk=hjk(Xjk)為解釋變量Xjk的未知函數(局部線性光滑、樣條等),且hjk=hjk(Xjk)為函數hjk在Xjk處的估計值向量。

(二)GAMLSS模型的特點

GAMLSS模型的特點主要體現在三個方面:一是GAMLSS模型所用分布形式更多樣,既包括傳統的指數型分布,也包括大量的非指數型分布;既包括對稱性分布,也包括大量具有度偏度和峰度的非對稱性分布;既包括離散型分布,也包括連續性分布;既可使用單一分布,也可使用混合分布。二是GAMLSS模型允許針對位置參數(通常是平均值)、規模參數(通常是方差)以及形狀參數(通常是偏度和峰度)分別獨立進行建模。三是GAMLSS模型中參數模型的設定形式更多樣。既可以是線性,也可以是非線性;既可以是參數形式,也可以是可加非參數形式(如參數樣條、懲罰樣條或局部加權回歸等)。

GAMLSS這種獨特的設定形式便于精準描述各個參數的影響因素的方向和程度。

(三)GAMLSS模型的估計和檢驗

由于GAMLSS模型不但可以對位置參數、規模參數和形狀參數分別設定,也可以有多種候選分布選擇,因此理論上而言,GAMLSS模型存在多種可能的設定形式。為解決模型的選擇問題,基于極大似然估計(或極大似然估計的思想),Rigby和 Stasinopoulos(2005)提出使用廣義赤池信息量(Generalized Akaike Information Criterion,GAIC) 和施瓦茨貝葉斯準則(SchwarzBayesian Criterion,SBC)兩種統計量進行模型選擇。所用公式分別為:

上式中,L為對數似然函數值,k為過擬合懲罰參數,N為模型擬合參數。通常GAIC和SBC越小,表示模型擬合越好。

三、基于GAMLSS模型的不同收入群體邊際消費傾向研究

(一)統計資料來源

使用北京大學社會調查中心發布的中國家庭綜合調查數據(CFPS)2010年調查資料。由于本文研究家庭消費行為及其微觀影響因素,因此本文僅使用CFPS 2010中的家庭問卷以及成人問卷。

(二)不同收入群體的劃分

綜合看,現有文獻采用相對標準界定中等收入者居多。本文采用[0.75倍收入中位數,2倍收入中位數]標準界定中等收入群體。則低于0.75倍收入中位數者為低收入群體,高于2倍收入中位數者為高收入群體。

(三)數據的描述統計分析

表1為城鎮居民家庭不同收入級別人均消費性支出的描述統計結果??梢钥闯?,在被調查的4294戶城鎮居民家庭中,低收入、中等收入以及高收入家庭數量分別為1638戶、1782戶以及874戶,占比分別為38.14%、41.50%以及20.36%。三種層次的家庭消費性支出均值分別為5666.20元、9274.76元以及17065.70元,標準差分別為4468.51元、5729.54元以及11865.55元。三種層次家庭消費性支出的中位數分別為4504.50元、8102.15元和13956.67元。三種層次家庭消費性支出的偏度系數最小值為2.63,最大值為3.77,屬于嚴重右偏特征,三種層次家庭消費性支出的峰度系數最小值為14.05,最大值為23.18,屬于高度尖峰特征。取對數后,三種層次的家庭消費性支出均值分別為8.40、8.98以及9.57,標準差分別為0.66、0.57以及0.59。三種層次家庭消費性支出的中位數分別為8.41、9.00、9.54。低收入和中等收入層次家庭消費性支出偏度系數發生了質的改變,由原來的正偏,變成了負偏。而高收入群體家庭消費性支出偏度系數較之前降低了很多,達到0.06,接近對稱。三種層次家庭消費性支出的峰度系數下降明顯,但仍然呈現尖峰特征。

表1 城鎮居民家庭人均消費性支出描述統計

(四)人均消費性支出的正態性檢驗

表2、表3是城鎮居民家庭人均消費性支出正態性檢驗結果。采用了四種統計分析中常用的正態性檢驗方法,每種方法給出了檢驗統計量的數值,以及與之對應的P值。四種正態性檢驗的原假設都是假設研究數據服從正態分布,備擇假設是研究數據不服從正態分布。表2中,所有檢驗的P值皆為0,說明城鎮居民家庭人均消費性支出不服從正態性檢驗;表3中,檢驗的P值最大為0.0571,最小為0.0000,說明在10%的顯著性水平下,城鎮居民家庭人均消費性支出取對數后依然不服從正態分布。這與表1中的結果是一致的。這意味著在對居民家庭人均消費性支出數據建模時,應該考慮非正態性分布。

表2 城鎮居民家庭人均消費性支出正態性檢驗

表3 城鎮居民家庭人均消費性支出正態性檢驗(取對數后)

(五)居民家庭人均消費性支出統計分布的選擇

由于本文對人均消費數據進行建模,且家庭人均消費額一般大于1。因此,不論是原始數據,還是經過對數性變換數據,家庭人均消費皆大于0。所以理論上來說,應該選擇定義域為正數的分布函數作為候選分布。目前,gamlss軟件包中定義域為正實數的分布函數共有23種①這23種分布包括指數分布(EXP)、伽瑪分布(GA)、逆高斯分布(IG)、兩種類型對數正態分布(LOGNO,LOGNO2)、三種類型的威布爾分布(WEI,WEI2,WEI3)、逆伽瑪分布(IGAMMA)、兩種帕累托分布(PARETO2,PARETO2o)、廣義帕累托分布(GP)、兩種 Box-Cox轉換的 Cole&Green分布(BCCG,BCCGo)、指數正態分布(exGAUS)、廣義伽瑪分布(GG)、廣義逆高斯分布(GIG)、對數正態分布(LNO)、兩種類型的 Box-Cox轉換的 t分布(BCTo,BCT)、兩種類型的 Box-Cox轉換冪指數分布(BCPEo,BCPE)、廣義貝塔 II型分布(GB2)等。。

首先使用fitDist函數,對23種分布做出選擇,判斷哪種分布類型更適合我國居民人均消費數據。這些分布的具體分布形式可參見Mikis和Robert等(2017)[11]。所有的分布參數求解皆使用極大似然估計方法,優劣選擇的判斷規則是GAIC最小者為最佳分布,表4給出了按照GAIC大小排列的四種候選分布擬合結果??梢园l現,適合中國居民家庭人均消費性支出的分布類型集中于廣義貝塔II型分布(GB2)、兩種類型的Box-Cox轉換的t分布(BCTo,BCT)、兩種類型的Box-Cox轉換冪指數分布(BCPEo,BCPE)等三類共五種統計分布中,且這五種分布類型皆有四個參數。

表4 中國城鎮居民家庭人均消費性支出分布擬合選擇

在八種數據類型擬合中,有五種情形以廣義貝塔II型分布(GB2)為最優,三種情形以Box-Cox轉換的t分布(BCTo)為最優,綜合判斷,本文選擇廣義貝塔II型分布(GB2)度量中國居民家庭人均消費性支出。

(六)統計模型的構建

根據 Mikis和 Robert等(2017),gamlss軟件包中廣義貝塔 II型分布(GB2)的密度函數 GB2(μ,σ,υ,τ)為:

這意味著 GB2(μ,σ,υ,τ)的期望值的對數 log[E(Y)]與 log(μ)之間存在穩定的數量關系,任何關于log(μ)的函數設定形式等價于關于 log[E(Y)]的函數設定形式。

GB2(μ,σ,υ,τ)存在四個參數連接函數設定選擇,而且每個參數的連接函數皆可設定為或線性、或可加、或線性與可加的綜合。再加上可加項又存在三次樣條、懲罰樣條、分形樣條、多項式等多種設定形式選擇,所以理論上而言,存在多種候選設定形式。由于本文的主要目的是研究居民邊際消費傾向以及影響居民消費支出水平的家庭因素,因此將研究重點集中于參數μ和σ。將參數μ的連接函數設定為對數形式,且既受到家庭人均純收入的影響,也受到家庭變量的影響;將參數σ的連接函數設定為對數形式,且僅受到家庭人均純收入的影響①戶主年齡在一定程度上能夠代表家庭所處的生命周期。;將參數υ和τ的連接函數設定為常數形式②gamlss軟件包中的GB2(μ,σ,υ,τ)的默認連接函數皆為對數形式。綜合比較之后,本文將參數υ和τ的連接函數設定為常數。,且不受任何解釋變量的影響。綜上,本文所用模型設定為:

結合公式(9),可知模型(10)中參數 α1即為邊際消費傾向,本文預計不同收入層次家庭的邊際消費傾向是不一樣的。式(10)中∑βiXi一項的設定目的是引入除家庭人均純收入之外的更多的解釋變量。參考有關文獻,本文所用解釋變量的設定如表5所示。解釋變量分為戶主特征和家庭特征等兩個方面,共有9個變量。需要說明的是,CFPS(2010)家庭問卷調查中并無戶主這一項,對于2010年度調查資料,本文使用“誰是家庭主事者”來代替戶主。

表5 解釋變量設定

(七)模型估計結果

使用 R 軟件包 gamlss,基于 GB2(μ,σ,υ,τ)分布,得到模型的估計結果,結果如表6至表7所示。從中可以發現:

表6 中國居民家庭人均消費性支出GAMLSS回歸結果分析

表7 中國居民家庭人均消費性支出線性回歸結果分析

(續表)

(1)整體看,居民家庭人均純收入對居民家庭人均消費性支出具有顯著正向影響。除此以外,戶主受教育程度對居民家庭人均消費性支出具有顯著正向影響,而家庭人口規模對居民家庭人均消費性支出具有顯著負向影響。分收入層次看,戶主年齡、戶主健康狀況、家庭資產對中、高收入群體家庭人均消費性支出具有顯著影響。而家中勞動年齡人口數僅對中、低收入家庭人均消費性支出具有顯著影響。

(2)GAMLSS回歸結果與線性回歸結果差異性與家庭收入層次有直接關系。低收入家庭邊際消費傾向系數要高于線性回歸結果,而中等收入、高收入家庭邊際消費傾向系數要低于線性回歸結果。

(3)三種收入層次家庭的邊際消費傾向由低到高順序為:低收入群體、高收入群體、中等收入群體。該結果與楊汝岱和朱詩娥(2007)③楊汝岱和朱詩娥(2007)中假定,城鄉居民邊際消費傾向一致,兩者的差別是通過一個城鄉虛擬變量界定的,也就是假定城鄉對消費的影響僅僅體現在截距項,而非斜率項。有關中等收入群體的邊際消費傾向最高、低收入和高收入邊際消費傾向較低的“倒U”型特征研究結果是一樣的[12]。但與趙昕東和李林(2016)④趙昕東和李林(2016)中對不同收入群體的分類并沒有按照收入標準,而是按照消費水平高低將家庭十等分。研究結論不一致[13]。

四、結論

構建合理有序的收入分配格局,實現各收入群體均等分享經濟社會發展成果,已成為國內外學術界和政府關注的熱點。邊際消費傾向的研究當屬該研究領域的重要方向之一。針對傳統的模型構建皆以居民消費水平為正態分布為假定條件的不足,本文將包含位置、規模以及形狀參數在內的廣義可加模型(GAMLSS)引入居民消費支出模型構建之中,研究不同收入群體邊際消費傾向問題。結果發現:

(1)居民家庭人均純收入對家庭人均消費性支出具有顯著影響,這與傳統經濟學理論是一致的。除此以外,戶主年齡、戶主受教育程度、戶主健康狀況、家庭資產等家庭微觀變量對家庭人均消費性支出具有不同程度的影響。

(2)居民消費支出水平的分布狀況會對邊際消費傾向產生顯著影響。不考慮居民消費支出的具體分布而直接采用正態分布,會低估低收入家庭邊際消費傾向系數,高估中、高收入家庭邊際消費傾向系數。

(3)整體看,不同收入群體家庭邊際消費傾向分別呈“倒U”型特征。

該項研究的現實意義在于,合理有序的居民收入分配格局是激發居民消費行為的主導因素。不同收入群體共享經濟發展成果的政策配套應從經濟層面、社會層面等多個角度切入。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产性生大片免费观看性欧美| 日韩A∨精品日韩精品无码| 99re精彩视频| 欧美午夜网站| 欧美α片免费观看| 国产精品视频观看裸模 | 97青草最新免费精品视频| 免费高清毛片| 日韩欧美成人高清在线观看| 日韩在线中文| 国产日本欧美亚洲精品视| 久久亚洲日本不卡一区二区| 国产精品视频第一专区| 99久久99这里只有免费的精品| 欧美精品黑人粗大| 青青草国产在线视频| 亚洲欧洲天堂色AV| 色窝窝免费一区二区三区| 一级爆乳无码av| 国产无人区一区二区三区| 四虎永久在线精品国产免费| 67194亚洲无码| 2020国产在线视精品在| 亚洲成人网在线观看| a级毛片免费网站| 9久久伊人精品综合| 国产不卡网| 久久9966精品国产免费| 在线高清亚洲精品二区| 在线观看国产精品一区| a毛片在线播放| 日韩天堂视频| 成人一级黄色毛片| 在线亚洲小视频| 亚洲无码91视频| 日韩欧美中文字幕在线精品| 最新国产精品第1页| 超清无码一区二区三区| 美女被躁出白浆视频播放| 色妞永久免费视频| 中文国产成人精品久久一| 免费国产无遮挡又黄又爽| 国产麻豆va精品视频| 国产又爽又黄无遮挡免费观看| 国产精品综合久久久| 国产三级韩国三级理| 99久久国产综合精品2023| 一区二区三区国产精品视频| 国产欧美日韩在线一区| 九九热在线视频| av天堂最新版在线| 精品国产亚洲人成在线| 日本亚洲成高清一区二区三区| 日韩精品一区二区三区免费| 久久一色本道亚洲| 欧美狠狠干| 狠狠色婷婷丁香综合久久韩国| 欧美激情一区二区三区成人| 免费无码又爽又黄又刺激网站| 欧美一级大片在线观看| 国产经典免费播放视频| 国产玖玖玖精品视频| 五月天在线网站| 久久国产亚洲偷自| 在线播放国产一区| 视频一区视频二区日韩专区| 91毛片网| 精品亚洲国产成人AV| 久久久久国产精品熟女影院| 十八禁美女裸体网站| 中文字幕av一区二区三区欲色| 自拍欧美亚洲| 亚洲香蕉在线| 午夜性爽视频男人的天堂| 在线国产资源| 国产一区二区精品福利| 久久大香伊蕉在人线观看热2| 一本综合久久| 伊人成色综合网| 亚洲一区二区三区中文字幕5566| 高清无码一本到东京热| 欧美国产精品拍自|