李玥霖 雷 穎 史瑋東
(重慶郵電大學 計算機科學與技術學院,重慶 400065)
提高幫扶成效,可使群眾生活切實得到改善,其中對扶貧效果的評價較為關鍵。目前較為流行的評價角度有對扶貧績效進行量化和對被幫扶群眾滿意度進行量化兩種方式。
對扶貧績效進行量化,即對被評價單位的經濟、文化、教育、環境等各個方面的各項具體指標進行收集處理,再根據建立的某個評價體系進行評價,這個評價體系往往是使用主成分分析法或層次分析法所建立的。如使用層次分析法對以金融機構主導的金融扶貧模式進行評價[1],這種評價區分度較高,模型容易理解,但是所用模型主觀性較強,不具有普適性;或使用時序主成分分析法對云南省扶貧績效進行評價[2],這種評價較為充分地利用了已知數據,所得結果較為準確,但是其使用的模型基于數據特征進行評價,無法給出具體意義。對扶貧績效進行量化的主要步驟是搜集并分析數據、構建評價指標體系、利用評價指標體系進行評價,其中,評價指標體系的構建較為關鍵,不同的構建方法會對評價效果產生較大影響。
對幫扶群眾滿意度進行量化,一般是通過發放調查問卷的方式對群眾意見進行收集,再對收集而來的意見進行分析評價。如對湖北省神農架區域內貧困人口滿意度進行調查,進而分析當地貧困人口的收益感知、滿意度與參與意愿[3]。這些結論對扶貧決策具有重要意義。與僅對扶貧績效進行量化評價相比,量化評價幫扶群眾滿意度獲得的信息含義更為豐富、更能代表群眾的切實需求;但其主觀性較強,調查難度較大、成本較高。
上述研究從兩個評價角度對扶貧工作進行量化,只能簡單對扶貧單位進行排序,對政策方向提供的幫助較少。本文借助機器學習方法對西南某地區群眾滿意度與扶貧績效各維度數據進行建模,進而對所得模型進行處理和分析。旨在對扶貧績效與幫扶群眾滿意度的關系進行探究,從而得出群眾感知明顯的幫扶方向,為政策制定提供依據。本文還對扶貧單位按照扶貧類型進行分類,使用雷達圖較為直觀地橫向比較不同類型扶貧單位的滿意度構成差異,從而為根據幫扶類型精準決策提供政策依據。
為了獲取被幫扶群眾滿意度情況,了解貧困村村民對扶貧政策的評價程度,調查小組列出了7個不同的指標,根據隨機分發的調查問卷得到村民對各個指標的滿意程度(見表1),對其結果按百分制進行評價,最終評分以各指標權重加權平均計算,再對最終評分進行歸一化處理。

表1 群眾滿意度調查問卷得分情況
對滿意度調查獲取的有效記錄中,總體滿意度的數據峰度與偏度絕對值接近0,標準差為4.81,數據較為集中,眾數與中位數相等,近似呈現略扁平的正態分布形態,因此,有95%的把握保證調查得到的數據真實可靠。
本小組在兩個時間點對西南某地區貧困村進行調研,把幫扶單位分為5個類型,從村民經濟收入、產業發展情況、住房環境、教育及文化、基礎設施5個維度對被幫扶對象進行單獨評分。
觀察所得初始數據,發現有部分記錄存在數據部分缺失、取值錯誤等問題,將這些記錄舍去。
由于不同的評價指標具有不同的量綱和量綱單位,這種情況有較大可能對數據分析的結果產生不必要的影響。為了消除這種影響,考慮對原始數據進行歸一化處理:
進行min-max標準化,將結果值映射到(0,1),轉換函數如下:

式(1)中max是樣本數據的最大值,min是樣本數據的最小值。
假設群眾滿意度數據與扶貧單位各項指標存在線性關系,即

式(2)中,y是上文得到的群眾滿意度,x1,x2,x3,x4,x5是上文得到的5個維度的扶貧單位指標,分別對應各村莊的村民經濟收入、產業發展情況、住房環境、教育及文化、基礎設施5個維度評分。ω1,ω2,ω3,ω4,ω5為擬合出的相關系數,實際意義為各扶貧單位的具體指標對群眾滿意度的貢獻情況。ω0在本模型中無實際意義。
本文采用sklearn中的線性回歸方法,對上述模型進行擬合,從而得到不同幫扶單位在5個評價維度上的貢獻程度,并借助雷達圖來反映5種不同類型的幫扶單位在各維度貢獻情況的異同。
sklearn,全稱是Scikit-learn,是機器學習領域中最著名的python模塊之一[4],它對常見的機器學習方法進行了封裝,具有簡單高效、適用于多種復雜環境的特點。
sklearn中的線性回歸被定義為擬合函數是:

擬合系數為:

的線性模型,擬合的線性模型為:

目的在于最小化樣本集中觀測點和線性近似的預測點之間的殘差平方和,可以利用平方和最小來控制其損失。
因此,只需解決下面的問題:

式(6)中ω是線性模型的截距。
第1類幫扶單位類型:
(ω0,ω1,ω2,ω3,ω4,ω5)= [-0.188 4,-0.0649825,0.1182644, 1.4743704, -0.01950562, 0.1603619]
第2類幫扶單位類型:
(ω0,ω1,ω2,ω3,ω4,ω5) = [0.1439,-0.049974,-0.5081879, 0.7499256,0.175443, 0.3503649]
第3類幫扶單位類型:
(ω0,ω1,ω2,ω3,ω4,ω5)=[1.0836, 0.5333999,0.2556599, -0.0395506, 0.1092588, 0.059687]
第4類幫扶單位類型:
(ω0,ω1,ω2,ω3,ω4,ω5) =[0.6151, -0.7978457,-0.2297925, 0.5616852,-0.0791224, -0.0999094]
第5類幫扶單位類型:
(ω0,ω1,ω2,ω3,ω4,ω5)= [0.2150, -0.2275529,0.0320203, -0.15191834,-0.02787831, -0.03356937]
上述5組數據的雷達圖如圖1所示:

圖1 各幫扶單位具體得分雷達圖
觀察各幫扶單位得分,發現各個系數大小分布較均勻,說明模型假設的線性關系符合數據實際情況,模型擬合較好。
分析上述所得結果,結合圖1,不難發現雷達圖中各幫扶單位整體來說在住房環境、教育及文化兩個維度的表現較突出,即大部分扶貧單位在住房環境、教育及文化這兩項上的得分較高,說明在住房環境、教育及文化上的改善群眾較為滿意;而在產業發展情況、基礎設施這兩項上的得分則普遍較低,說明扶貧單位在提高產業發展水平、改善基礎設施這幾個具體類別上仍然有較大的提升空間。
不僅如此,不同扶貧單位的扶貧特點也存在較大差異,這一點可以從不同類型的雷達圖形狀得知。如類型1、2、4扶貧單位所對應的雷達圖形狀在住房環境維度較為突出,這一方面說明該類扶貧單位在產業發展、住房環境方面的幫扶切實有效、成果突出,群眾較為滿意;另一方面也表現出其在其他方面的幫扶成果不顯著,甚至低于平均水平。類型3的扶貧單位所對應的雷達圖形狀在教育及文化維度較為突出,說明該類扶貧單位教育及文化方面幫扶成果村民較為滿意。而類型5的扶貧單位雷達圖形狀較均勻,說明村民在5個方面都較為滿意。
由上述結果分析得知,貧困群眾對住房環境、教育及文化、村民經濟收入的提升較為滿意,而產業發展、基礎設施的提升不能有效提高群眾的滿意度。貧困群眾長期處于生活艱難的狀況,渴望與自身生活息息相關的方面發生改變,希望得到實際能感受到的好處,這也就是住房環境、教育及文化、經濟收入這些實實在在的方面能夠有效提升群眾滿意度的原因之一。但是,要想真正實現長期脫貧不返貧,產業發展與基礎設施的提升也是必不可少的。因此,在脫貧攻堅工作中,扶貧單位不僅要在住房環境、教育及文化、村民經濟收入等群眾喜聞樂見、看得到的方面下苦功,提升群眾獲得感[5],而且要在產業發展、基礎設施建設上發力改善,為脫貧人口長遠發展打下堅實基礎。
本文對扶貧績效與受幫扶群眾滿意度關系分別進行量化分析,并使用機器學習方法對扶貧績效與受幫扶群眾滿意度的關系進行了探究,定量分析了與受幫扶群眾滿意度聯系最為緊密的扶貧工作維度,能夠為提升困難群眾獲得感和打贏脫貧攻堅戰提供參考。