蔡超 王樂華
(山東工商學院統計學院,山東 煙臺 264005)
家庭財富積累是一個家庭生活和發展的物質基礎,關系著家庭福利水平的高低。改革開放以來,中國居民家庭財富大幅增加[1],但居民家庭財富差距較大且呈上升趨勢[2-3]。黨的二十大報告要求“著力促進全體人民共同富裕,堅決防止兩極分化”,實現共同富裕的核心是縮小家庭財富差距。要想縮小家庭財富差距,首先需要明晰家庭財富的積累路徑。因此,有必要研究家庭財富積累的主要影響因素,尋找促進家庭財富積累持續增長、縮小財富差距的新動力。
已有文獻基于微觀數據實證研究了家庭投資和人口特征對家庭財富積累的影響。如Heo和Grable等(2017)[4]、宋寶琳(2021)[5]的研究表明風險投資不但能夠增加居民家庭財富積累,還能為家庭提供更多的生活保障。尹志超和張號棟(2017)[6]、胡振(2018)[7]的研究表明居民金融素養的提升能夠顯著促進家庭財富增長。羅楚亮(2012)[8]的研究表明收入增長能夠促進居民財富增長。
已有研究發現個體的行為和決策易受群體中其他個體行為決策的影響[9-10],將這種他人行為或思想對個體行為決策的影響稱為鄰里效應。眾多學者展開對鄰里效應的研究,如余麗甜和詹宇波(2018)[11]指出家庭教育支出存在鄰里效應,學歷水平的1/5可歸因于社區鄰里效應。岳華和王海燕等(2021)[12]指出家庭風險金融投資存在鄰里效應。謝堊和宋顏群(2021)[13]研究了收入的社區鄰里效應,指出鄰里效應對居民收入的影響程度較大。社區鄰里效應對家庭教育、家庭風險投資、個體收入等都有重要影響,而家庭教育、家庭風險投資和個體收入等對家庭財富積累至關重要,因此,本文推斷家庭財富積累也可能存在鄰里效應。
然而,目前少有文獻從家庭財富積累是否存在鄰里效應這個角度展開研究。中國是典型的關系型社會,人與人之間、家庭與家庭之間的交流比較頻繁,使中國居民的家庭投資、支出等行為易受他人行為的影響[14-15]。家庭財富積累的鄰里效應可能來源于以下三種機制:一是家庭投資理財觀念在與其他家庭交流過程中會受到影響,其投資理財的方式與群體中其他家庭趨同。二是人都具有從眾心理,家庭投資理財行為會模仿社區中其他家庭,從而產生從眾效應或跟風效應[16]。三是財富積累正逐漸成為劃分各個社會群體的重要指標[17]。可見,無論哪種機制,都會使我國居民家庭的財富積累與群體平均財富積累表現出正相關關系。
基于以上分析,本文從家庭財富積累是否存在鄰里效應這一視角展開研究。謝堊和宋顏群(2020)[18]指出鄰里效應具有非線性特征,因此本文在探究鄰里效應對家庭財富積累的影響時,采用分位數回歸梯度提升樹模型這一非線性回歸模型進行分析。分位數回歸梯度提升樹模型一是能夠利用其非線性回歸模型優勢,挖掘鄰里效應對家庭財富積累的非線性影響;二是克服了線性分位數回歸模型估計性能差的局限,增強了鄰里效應對家庭財富積累的估計能力。
與現有文獻相比,本文的邊際貢獻如下:一是從家庭財富積累是否存在鄰里效應這一新角度開展研究,豐富了家庭財富積累的相關研究。二是采用前沿的分位數回歸梯度提升樹模型,規避了傳統線性分位數回歸模型的缺陷,更好地探究鄰里效應和家庭財富積累之間的非線性關系。
線性分位數回歸模型由Koenker和Bassett(1978)[19]提出,其描述了解釋變量與響應變量之間在不同分位點下的線性關系。線性分位數回歸模型不需要滿足最小二乘回歸模型設定的假定條件,具有更強的穩健性,是一種流行且有效的統計分析方法。假設有訓練集,其中yi為響應變量,為解釋變量,在τ(0<τ<1)分位點處,線性分位數回歸模型可以由下式求解:
其中,β為系數向量,ρτ(u)=u(τ-I(u<0)),I(·)為示性函數。
Zheng(2012)[20]和Yuan(2015)[21]提出的分位數回歸梯度提升樹模型(QRGBT,QuantileRegressionGradient Boosting Trees)是梯度提升樹模型在分位數回歸框架下的擴展,是一種準確有效的非線性回歸模型。分位數回歸梯度提升樹模型通過不斷迭代,利用損失函數的負梯度來擬合生成多個分位數回歸樹,最終將所有分位數回歸樹的結果線性相加得到分位數回歸梯度提升樹模型。生成分位數回歸梯度提升樹模型的算法具體步驟如下:
步驟2:對于m=1,2,…,n
(a)計算負梯度
步驟3:重復步驟2,共迭代M次,f[M](τ|xi)即為分位數回歸梯度提升樹模型的最終估計值。
為增強分位數回歸梯度提升樹模型的可解釋性,本文采用變量相對重要性測度來進一步挖掘模型背后的經濟學內涵。變量相對重要性測度是度量解釋變量對響應變量的影響程度。Friedman(2001)[22]指出如果在模型中改變某個變量的值,其他變量不變時模型的擬合能力變化較大,則其相對重要性較大。記,…,xi,j=x,…,xi,p)為第j個變量為正常數據時分位數回歸梯度提升樹模型的估計值為第j個變量為擾動數據時分位數回歸梯度提升樹模型的估計值,定義下式為第j個變量的重要性測度:
為減少隨機性影響,計算100次式(3)的均值作為第j個變量的重要性測度值。本文通過計算變量相對重要性來測度鄰里效應對家庭財富積累的影響程度。
本文還希望基于分位數回歸梯度提升樹模型的估計挖掘出一些解釋性意義,因此進一步引入偏相依關系來度量解釋變量在不同水平下對響應變量的影響方向和大小,同時揭示變量之間的非線性關系。第j個變量Xj的偏相依關系測度的方法為:剔除Xj的重復值并按照升序排列,記為,并將其依次代入下式計算Xj在不同取值下的偏相依關系值:
本文數據來自2018年中國家庭追蹤調查數據(CFPS),樣本覆蓋31個省(區、市)。刪除主要變量缺失的樣本后,最終得到9321個有效家庭樣本。
將家庭總資產定義為家庭財富積累,并計算家庭財富積累的鄰里效應(以下簡稱“鄰里效應”)。根據中國家庭追蹤調查數據中的社區編碼,將居住在同一農村或同一城市社區的家庭都歸類為同一社區,將鄰里效應定義為同社區家庭平均財富規模(不包括相應的家庭)。
除此之外,本文還控制了一系列可能影響家庭財富積累的其他因素,包括家庭收入、家庭人口規模、家庭居住地(城鎮=1,農村=0)、家庭所在地區(東部=1,中西部=0)、戶主年齡、戶主性別(男性=1,女性=0)和戶主受教育程度(文盲=0、小學=6、初中=9、高中、中專及技校=12、大學專科=15,大學本科=16、研究生及以上=19)。表1報告了變量含義及描述統計結果。從表1可知,家庭財富積累為尖峰右偏數據,且離散程度較大,這說明我國家庭財富積累存在較大差距。

表1 變量含義及描述性統計
本文首先構建了只包含家庭財富積累和家庭、個人特征但不含鄰里效應的基準模型(以下簡稱“基準模型”)。其次,在基準模型的基礎上,加入了鄰里效應,構建鄰里效應模型(以下簡稱“鄰里效應模型”)。兩個模型的構建如表2所示。

表2 模型構建
基于上述模型,首先,使用線性分位數回歸模型(LQR)和分位數回歸梯度提升樹模型(QRGBT)分別對兩個模型進行擬合。其次,由擬合結果計算分位數平均絕對誤差(QAAE)和擬合優度R1,一是評估分位數回歸梯度提升樹模型是否比線性分位數回歸模型更能提升估計性能,二是評估鄰里效應模型是否比基準模型更能提升估計性能。
表3報告了線性分位數回歸模型和分位數回歸梯度提升樹模型分別對基準模型和鄰里效應模型進行擬合的結果。由表3可知,第一,無論是基準模型還是鄰里效應模型,在五個分位點處,分位數回歸梯度提升樹模型的QAAE值都小于線性分位數回歸模型,且分位數回歸梯度提升樹模型的R1值都大于線性分位數回歸模型,說明分位數回歸梯度提升樹模型更能提升估計性能。第二,在五個分位點處,鄰里效應模型的擬合優度都大于基準模型,且鄰里效應模型的估計誤差也都小于基準模型。說明鄰里效應模型對家庭財富積累的估計能力遠遠大于基準模型,其原因可能為同一社區居民的金融素養、教育偏好、信息獲取渠道等因素存在相似性,使同一社區居民的投資行為、財富積累模式等也存在相似性,因此,鄰里效應模型對家庭財富積累的估計能力優于基準模型。

表3 主要擬合結果
表4報告了解釋變量對家庭財富積累影響的重要程度。由表4可知,第一,鄰里效應對家庭財富積累的影響程度最大、家庭收入次之,而其他諸如家庭人口規模、居住地、地區、年齡、性別、受教育程度等變量的權重較小。可能原因在于,首先,對于多數普通居民來說,現階段財富積累的載體仍以住房為主,同一社區的居民所處地段環境與房產價格相似,因此鄰里效應對家庭財富積累的影響是最強的。其次,工資收入的儲蓄是家庭財富積累的主要途徑,因此工資收入對家庭財富的積累是非常關鍵的因素。第二,從不同分位點上看,在低分位點處,鄰里效應的相對重要性程度較高,而在中分位點、高分位點處,鄰里效應的相對重要性程度降低,即在家庭財富積累較少時鄰里效應的影響更大。其原因可能是財富較少的家庭會面臨更大的資源限制和經濟機會不足,鄰里效應對這些家庭來說可能更為重要,鄰居之間的相互支持和資源共享可以提供更多的經濟機會和資源,幫助他們改善經濟狀況。相比而言,財富較多的家庭已經擁有更多的經濟資源和機會,對鄰里效應的依賴相對較小。

表4 各變量相對重要性權重(%)
基于變量的重要性分析,繼續探究鄰里效應和家庭財富積累的具體關聯,采用偏相依關系圖來考察鄰里效應對家庭財富積累的影響。圖1展示了在不同分位點處鄰里效應對家庭財富積累的影響,其中橫軸為鄰里效應,縱軸為家庭財富積累。

圖1 偏相依關系圖
從圖1可以看出,鄰里效應對家庭財富積累的影響具有明顯的非線性特征。第一,當鄰里效應逐漸增加時,前期(鄰里效應為0—450萬元)家庭財富積累增長較快,但后期(鄰里效應為450萬元—900萬元)逐漸趨于平穩。這可能是由于財富積累較少時更需要鄰里之間的相互支持和資源共享,而隨著家庭財富的不斷增加,更依賴個人的資源和能力來積累財富。第二,不同分位點處,鄰里效應對家庭財富積累的影響不同。在中高分位點處,鄰里效應對家庭財富積累的影響較強;在低分位點處,鄰里效應對家庭財富積累的影響較弱。其原因可能是財富積累較高的家庭往往具有較強的社交關系和社會資本網絡,鄰里之間的互動和信息共享可能更有利于家庭財富的積累;相反,財富較少的家庭往往存在較弱的社會資本網絡和社交關系,這可能限制了鄰里效應對財富積累的影響。
將數據按照家庭財富積累的升序進行排列,刪除家庭財富積累值前5%和后5%的數據,對數據進行縮尾處理后再進行估計。表5報告了數據縮尾處理后估計誤差和擬合優度的結果。由表5可知,對數據縮尾處理后,分位數回歸梯度提升樹模型仍優于線性分位數回歸模型,鄰里效應模型仍優于基準模型,通過了穩健性檢驗。

表5 數據縮尾處理后主要擬合結果
分位數回歸森林(QRF,Quantile Regression Forest)同樣是基于樹的集成方法,采用這一方法進行穩健性檢驗。表6報告了更換機器學習方法后的估計誤差和擬合優度結果。由表6可知,相較于線性分位數回歸模型,分位數回歸森林模型的估計能力有所提高,這與QRGBT的表現基本一致,表明模型是穩定的。

表6 更換機器學習方法后主要擬合效果
本文基于2018年中國家庭追蹤調查數據,采用分位數回歸梯度提升樹模型研究鄰里效應對家庭財富積累的非線性影響,討論了鄰里效應能否較大程度地估計家庭財富積累,分析了鄰里效應對家庭財富積累的影響程度及影響模式。研究發現:第一,在不同分位點處,鄰里效應都能更好地估計家庭財富積累;第二,在眾多解釋變量中,鄰里效應對家庭財富積累的影響最強,且鄰里效應在財富積累較少的家庭里影響更大;第三,鄰里效應和家庭財富積累之間的關系呈現出非線性特點,且在財富積累較多的家庭里非線性特征更為明顯。本文不僅從鄰里效應這個全新視角對中國家庭財富積累的影響因素進行研究,豐富了家庭財富積累這一領域的文獻,而且采用前沿的分位數回歸梯度提升樹方法規避了傳統線性模型的缺陷,更加適用于分析變量之間的非線性和交互關系。◆