宦穎潔
殘疾人作為社會群體中的一員,由于身心發展的某些缺陷等,參與社會生活面臨著一些困難和障礙,導致其貧困的風險加大,貧困人口占比相對較高,實現殘疾人精準脫貧是打贏精準脫貧攻堅戰、全面建成小康社會的關鍵。我國殘疾人扶貧開發取得階段性成效,習近平主席提出“精準扶貧”是今后扶貧的最主要方向。目前“精準扶貧”尚處于探索階段,亟須相關理論與實證研究的指導。因此,充分認識殘疾人貧困狀況,并開展對影響殘疾人貧困因素的研究,是幫助殘疾人盡快脫貧,實現貧困殘疾人的可持續精準扶貧的關鍵。
由已有文獻可知,國內學者也十分關注對殘疾人貧困影響因素的研究。萬海遠等采用Probit、工具變量與分位數回歸等方法,研究了貧困殘疾人性別、受教育程度、家庭常住人口、參加農村合作養老保險情況、所在地區等因素對殘疾人收入的影響。廖娟從多維貧困的角度分析,發現教育、醫保、衛生設施、就業是導致殘疾人多維貧困的主要因素,并使用Logistic模型檢驗因素的顯著性。本研究也主要從以上方面研究影響殘疾人貧困的影響因素,但對于因素的劃分更為細致,以期向更精準的扶貧靠攏。在個體特征的基礎上加入殘疾類型、殘疾等級等指標;在社會特征中加入托養、康復、文化體育等指標;在環境特征中加入社區服務等指標。此外,采用Lasso-logistic模型,可緩解由變量間的多重共線性導致的部分變量不顯著問題,提高模型的解釋性和預測準確性。
數據來源于某地區2017年全國殘疾人基本服務狀況與需求信息動態更新調查,共計1998個殘疾人樣本。以年齡在16~60 歲的殘疾人為研究對象,得到最終樣本1164 個。
收入貧困測算是傳統的貧困發生率測算方法,即用國家統計局公布的貧困線作為是否貧困的界限,年收入處于貧困線以上的設定為非貧困人口,處于貧困線以下的即為貧困人口。調查數據中城鎮家庭收入狀況部分為:①低于低保標準;②低于低收入標準或低保邊緣標準;③其他。農村家庭收入狀況部分為:①國家建檔立卡貧困人口;②其他貧困人口;③其他。本研究以①和②為貧困線標準測定該地區的收入貧困發生率,同時分別對城鎮地區和農村地區進行測算,如表1所示。

表1收入貧困發生率(%)
影響殘疾人貧困的因素是多方面的,本研究結合相關文獻,從殘疾人基本個體特征、社會特征和環境特征三個維度,選取23個影響因素作為自變量。具體變量解釋及賦值如表2所示。

表2 變量選擇及賦值

續表
Lasso 方法是Tibshirani在Breiman 的Non -negative Garrote 法基礎上提出的,它的特點是在擬合模型的同時進行變量篩選和參數估計,由于所使用的調節參數能連續變化,因而變量選擇更穩定;允許盡可能多地選取自變量,排除因先入為主而遺漏的變量,同時還剔除變量之間的線性關系,減小了偏差,最后將對因變量不具有顯著影響的變量系數壓縮為零,以此來實現對變量的選擇。因此,為了獲取解釋能力較強的模型,使用Logistic模型下的Lasso方法。
假設有一組獨立同分布的觀測值(Xi,yi),i=1,2,…,n,其中Xi=(xi1,xi2,…,xip)和yi分別為自變量和因變量的觀測值,且yi為二元離散型因變量。其Logistic回歸模型可定義為式(1)。

則Lasso-Logistic模型的回歸參數估計可表示為式(2)。

其中,λ表示調節參數。采用廣義交叉驗證法選取最優的λ值,防止模型過于復雜而引起的過擬合。廣義交叉驗證的GCV統計量為式(3)所示。

其中,p(λ)=tr{X(XTX+λ(diag(β^1,…,β^p))-1)-1則使GCV 達到最小時的λ為最優的λ值,其估計值為式(4)所示。

根據Tibshirani的取值經驗,選取使得模型誤差最小的λ值所對應的回歸系數,給出殘疾人陷入收入貧困的影響因素,其參數β的估計值見表3。
1.變量選擇
基于R 軟件建立Lasso-logistic模型,通過廣義交叉驗證,得到模型的log(λ)與變量個數走勢圖如圖3所示。圖3的橫坐標為log(λ)值,縱坐標反映了模型誤差的變化情況,最上方給出了與log(λ)值相對應的選擇出來變量的數目,圖中左側虛線表示模型誤差最小時的log(λ)值,其對應顯著變量個數為29,右側虛線表示模型最簡單時的λ值。模型的系數解路徑圖如圖4 所示,橫坐標代表了log(λ)值的變化,縱坐標是各變量的系數,顯示了變量篩選過程。隨著λ值變大,有的變量系數被壓縮為零,模型選擇的自變量個數減少。因此,不同于傳統AIC、BIC等選擇變量的方法,Lasso 方法選擇變量是一個連續、有序的過程,降低了模型的預測誤差。

圖1 log(λ)與變量數走勢

圖2模型系數解路徑
2.模型估計

表3回歸結果
個體特征方面,由于30~45歲的殘疾人面臨家庭生活的壓力,因此更加容易陷入貧困;45 ~60歲的殘疾人由于喪失一定的勞動能力,在勞動力市場中不具有競爭優勢,因此也易于陷入貧困;由于男性面臨著養家糊口的壓力,因此相對于女性來說,更加陷于貧困;已婚有配偶的殘疾人在62.5%的程度上更加不容易陷入貧困,這可能與配偶的家庭支持相關,喪偶和離異的殘疾人由于生活和精神的雙重壓力,陷入貧困的概率分別為16.9%和21.4%;受教育程度每增加一個單位,貧困的概率就減少19.7%;精神殘疾相對于多重殘疾來說,在36.2%的程度上影響了貧困程度。另外,殘疾等級和就業與貧困呈反向關系。
社會特征方面,殘疾人參加醫療保險中貧困的概率所占比重最高,其次是醫療保險補貼,說明醫療保險在一定程度上起到了緩解殘疾人“看病貴”的現象;養老保險補貼對于老年殘疾人的生活起到了一定的生活保障作用;提供的文化體育服務越多,越易于陷入貧困,這可能與殘疾人本身的知識文化素養有關;而殘疾人越沒有家庭方面的保障,越需要在養老保險中投入,因而保險在生活支出所占的比重比較大,也容易陷入貧困;殘疾人參加的托養服務比例每增加一個單位,貧困的概率就減少28.4%。
環境特征方面,其中戶口類別、是否有體育健身指導人員與貧困呈現正向關系。由于戶口在農村,殘疾人可以獲得農作物方面的收入,相對來說的貧困線也較城市為低;而戶口為非農業的殘疾人生活成本更高,更易于陷入貧困。不住在敬老院的殘疾人更易陷入貧困,這可能是由于不住在敬老院缺乏一定生活保障,缺乏家庭的物質支撐。另外,沒有住房的殘疾人陷入貧困的概率是其他殘疾人的0.808 倍,說明有房產給了殘疾人一定的保障,且不需要租房等額外支出。
3.穩健性檢驗
為了評估模型的準確性,考慮通過評估所建模型的預測能力來間接驗證模型的有效性,測試Lasso-Logistic回歸所建模型的預測準確率。選取樣本數據的2/3為用于建模的訓練集,余下的數據為用于評估模型的測試集,通過R 軟件計算測試集ROC曲線下的面積,即AUC 值,衡量模型的準確率。表4給出了對樣本數據進行100 次隨機取樣后計算所得訓練集和測試集的AUC均值及其均值檢驗(mu >0.5)的P值。表4的計算結果表明:無論在訓練集還是在測試集中,模型的預測準確率均高達75%以上,具有很強的解釋能力。且模型在進行100 次隨機取樣后測試集的AUC均值仍大于0.5,說明隨著樣本的變化,模型能保持一個比較一致、穩定的解釋,具有穩健性。

表4模型預測準確率(%)
從上述研究結論看,未來政府的扶貧政策應更多地瞄準殘疾人群體,尤其是殘疾人群體,并且對貧困殘疾人實行精準扶貧的對策。
第一,教育和就業限制了殘疾人群體的收入能力,因此要從根本上改變殘疾人的貧困狀況,還需要從提升他們的能力方面著手,改變其人力資本積累狀況,提升就業能力,這樣才能有效消除殘疾人的“收入障礙”,改變貧困現狀。一方面,加大農村特殊教育和貧困殘疾人家庭教育救助力度,消除貧困代際傳遞。另一方面,千方百計促進有就業條件的農村貧困殘疾人就業增收,確保穩定脫貧,各級財政扶貧資金投入的產業扶貧項目要將貧困殘疾人或殘疾人家庭納入其中。
第二,從殘疾人基本生活、養老、醫療和住房方面來說,提高已納入最低生活保障制度殘疾人的最低生活保障金標準,對依靠家庭供養的成年無業重度殘疾人全部納入最低生活保障制度。為貧困殘疾人按照不低于城鄉基本養老保險第二檔的標準代繳城鄉居民基本養老保險個人參保費并提高養老待遇;制定殘疾人醫療保險報銷專項目錄和貧困殘疾人醫療救助專項目錄;對自籌資金困難的貧困殘疾人危房戶和無房戶的基本住房給予兜底保障,對農村貧困殘疾人無房戶實施基本住房保障交鑰匙工程;加快建立貧困殘疾人生活補貼和重度殘疾人護理補貼制度。
第三,環境衛生、健康對貧困有重要影響,但是普惠性公共服務性政策對緩解低收入殘疾人的貧困作用有限。對于極端弱勢群體,應有針對性地采用瞄準式、救助式保護扶貧政策。很多殘疾人因為參與政策的“門檻”過高而被排斥在項目之外。政策的實施和殘疾人的選擇機制,實際上產生出一種對絕對貧困殘疾人的排擠效應,導致絕對貧困殘疾人難以享受到扶貧政策帶來的優惠。