陳欣蔚
華東師范大學數學科學學院 上海 201100
定點幫扶單位是鄉村振興不可或缺的重要力量。為了實現更平衡、更充分的發展,幫扶單位需要在居民收入(SR)、產業發展(CY)、居住環境(HJ)、文化教育(WJ)、基礎設施(SS)這些方面進行努力。建立一個科學的績效評估方法非常重要,將科學的評估體系納入鄉村振興戰略可以激發幫扶單位的積極主動性和農村發展的內生動力,從而提升幫扶工作的科學性、規范性、有效性。
為了分析2015年和2020年各項指標:SR、CY、HJ、WJ、SS以及總分之間的相關性,需要先對各項數據的正態性進行檢驗,以確定用何種相關系數。根據Kolmogorov-Smirnov檢驗可知2015年和2020年各項指標以及總分的數據都不符合正態分布,所以采用斯皮爾曼相關系數法和非參數檢驗法對數據組間的相關性進行分析。
設為樣本量,為兩組數據間的等級差,斯皮爾曼相關系數的計算公式為:

(1)
利用Matlab計算出2015年和2020年五項評價指標以及總分對應數據之間的斯皮爾曼相關系數和p值(括號中)為:0.5401(0)、0.6556(0)、0.8001(0)、0.6708(0)、0.6358(0)、0.8197(0)。
p值都為0,遠小于0.05,顯著性水平高,數據組間有明顯關系。再觀察斯皮爾曼相關系數:2015年和2020年居住環境和總分的相關系數超過0.8,相關性強;產業環境、文化教育和基礎設施的相關系數落入0.6~0.7,相關性較強;居民收入的相關系數落入0.5~0.6,相對其他指標相關性一般。
同樣,還可以得到2015年及2020年各指標兩兩之間的斯皮爾曼相關系數。以2020年的指標為縱軸,將結果用相關系數矩陣熱力圖表示,見圖1。

圖1 斯皮爾曼相關系數矩陣熱力圖
斯皮爾曼系數都為正,因此當任何一個指標增長時,其他指標也會隨之增長。2020年各項指標與2015年的產業發展相關性較強,2020年產業發展、居住環境、文化教育與基礎設施四項指標與五年前的產業發展相關系數都在0.6以上。
在顯著性水平為0.05時,用Matlab對2015年和2020年五個指標以及總分對應的數據組之間作雙側符號檢驗,檢驗的p值結果見表1。

表1 2015年和2020年各對應指標的符號檢驗p值
檢驗的p值都小于0.05,因此2015年和2020年各項指標的數據之間都有顯著的差異,被幫扶的村莊在居民收入、產業發展、居住環境、文化教育、基礎設施五個方面都有較為顯著地提升。
Roger Koenker和Gilbert Bassett在1978年提出分位數回歸模型。分位數回歸利用解釋變量和被解釋變量的條件分位數進行建模。不同于傳統的經典回歸模型,它的應用范圍更加廣泛,穩健性也更強。它能充分體現整個分布的各部分的信息,更精確地描述解釋變量對被解釋變量條件分布形狀和變化范圍的影響。
假定隨機變量的概率分布函數為:
()=(≤)
(2)
對于0<<1,定義的分位數:
()={:()≥}
(3)
給定的個觀測值,相對應的分位數為:
()={:()≥}
(4)
它可以等價地轉化為求一個最優化問題:


(5)
其中()=(-1(<0))是“校驗函數”,其對正值和負值進行不對稱的加權。
分位數回歸即是對前述簡單形式的擴展。若的條件分位數由個解釋變量的線性組合表示,可定義的條件分位數:

(6)
其中()是與分位相關的系數向量。分位數回歸參數估計量為:

(7)
以2020年和2015年的總分分別作為目標變量和協變量。采用SPSS進行分位數回歸分析,給出在分位點為0.05、0.25、0.50、0.75、0.95的回歸系數估計結果(見表2)以及分位數回歸擬合圖(見圖2)。

表2 不同分位點回歸的斜率估計

圖2 分位數回歸擬合圖
由表2和圖2可知,隨著分位數的增加,截距越大,而斜率估計值越小。意味著基礎薄弱的村莊,即2015年總分較低的村莊進步幅度較大。而原本情況較好,即2015年總分較高的村莊進步幅度相對沒有那么顯著。
僅考慮2020年各村莊的總分并不能反映鄉村振興的成效,因為各個村莊的基礎情況不同,不能忽略幫扶單位對基礎較弱的村莊所做出的努力。由此還需考慮各個村莊在居民收入、產業發展、居住環境、文化教育、基礎設施五個方面的提升幅度,用TOPSIS法結合熵權法給出32165個村莊的綜合成績。
TOPSIS法是一種多目標決策分析技術,根據參與評價的對象與理想解的接近程度進行打分,評價對象越逼近理想解則打分越高。
參與評價的對象集為32165個村莊=(,,…,),指標集為SR、CY、HJ、WJ、SS在2015年和2020年的評分之差=(,,…,),村莊對指標的值記為(=1,2,…,32165;=1,2,3,4,5),決策矩陣即為=()。
SR、CY、HJ、WJ、SS都是效益型指標,標準化形式為:

(8)
從而得到標準化決策矩陣=()。
專家打分法等其他賦權方式具有太大的主觀隨意性,采用熵權法更為客觀,且具有更強的可行度、移植性和再現性。
用Matlab計算得出SR、CY、HJ、WJ、SS五個指標的權重分別為:0.2002、0.2001、0.2000、0.1998、0.2000。
加權決策矩陣=()由各指標權重值與無量綱化決策矩陣相乘得到:
=·(=1,2,…,32165;=1,2,3,4,5)
(9)
w=(0.2002,0.2001,0.2000,0.1998,0.2000).

(10)

(11)

(12)

(13)
各村莊與正理想解的相對貼近度為:

(14)
運用Matlab得到在該TOPSIS模型下32165個村莊的綜合得分,在此列出綜合成績前十的村莊,如表3。

表3 綜合成績前十名的村莊
由1.2節分析已知2015年和2020年的總分數據有較強的相關性,因此以各類型幫扶單位2015年的總分作為自變量,2020年的總分作為因變量建立一元回歸模型:
=+
(15)
利用Matlab進行實現,結果見表4。

表4 一元回歸結果
K值可以反映各類型的幫扶單位從2015年到2020年的總分進步幅度,由表可知:幫扶成效由大到小的幫扶單位排序依次為類型2、類型1、類型3、類型4、類型6、類型5。
4.2.1 1—6類型單位幫扶績效
用層次聚類法研究幫扶單位的成效大小以1—6類型單位對應幫扶村莊的綜合評分,以及2015和2020年總分之差兩組數據的平均值作為衡量各類型幫扶單位幫扶績效的兩項指標。對指標數據進行標準化變換:

(16)
采用最短距離法。首先計算樣本點兩兩之間的歐氏距離,得到一個上(下)三角距離矩陣;然后找出距離矩陣中非零的最小元素,將相應的兩類合并成為一個新類;接著用類平均法計算新類與其他類的距離,再按類間距離度量準則合并成新的一類,如此重復下去,直到所有的樣本合成一類為止。
用Matlab進行實現,得到層次聚類圖,如圖3。

圖3 1—6類型幫扶單位層次聚類圖
根據以上層次聚類圖可知,若確定類別數為3,則類型5和類型6的幫扶單位自成一類;類型1、類型2、類型3、類型4的幫扶單位共同組成第三類。
因此,當我們將六個類型的幫扶單位的成效劃分為“優”“良”“差”三級時,結合4.1中得到的k值,可以將1—6類型單位分別定級為“優、優、優、優、差、良”。
4.2.2 1—6類型單位幫扶績效
對0—159幫扶單位對應村莊的綜合評分,以及2015和2020年總分之差兩組數據各自的平均值作為衡量各類型幫扶單位幫扶績效的兩項指標,利用最短距離法層次聚類,可以對幫扶單位做出評級,見表5。

表5 幫扶單位(0-159)績效評級表
本文首先定性地對2015年和2020年各項指標及總分數據組進行分析:使用Spearman相關系數分析各組數據間的相關性,結果顯示2015年和2020年各指標間都呈現正相關的關系,且各指標間的相關性總體來說較強;使用非參數檢驗法分析各指標和總分從2015年到2020年的差異性,發現2015年和2020年各指標的數據都有顯著的差異性,幫扶成效明顯。
接著定量地對幫扶單位的績效進行評價。本文從兩個角度對幫扶績效做出評價,一個是多準則決策方法,另一個是最小二乘回歸。利用TOPSIS法計算出了各村莊綜合成績;利用一元線性回歸模型計算出可以反映各類型幫扶單位所幫扶村莊的進步幅度的K值,由此對1—6類型的幫扶單位的績效進行排名。通常,國家需要對幫扶單位進行定級,建立層次聚類模型分別對1—6類型以及編號0—159的幫扶單位的幫扶成效定級為“優”“良”“差”。
在幫扶工作方面,各幫扶單位根據績效評估的結果要分析工作中的優勢和不足,繼續揚長補短。短期眼光放在提高居民收入上;長遠目光要擺在發展產業、文化教育和加大基礎設施投入上,這對居民收入的提高有間接性的幫助作用。促進村莊產業振興尤為重要,政府等單位應幫助促進農村產業的發展。一方面是農業生產方式的改變,要轉型升級傳統的農業生產方式,打造特色農產品,幫助滯銷農產品的銷售;另一方面要發展新興產業,發掘本地特色資源,實施休閑農業和鄉村旅游精品工程。產業發展的進步也能推進鄉村人才振興,減小城鄉差距,促進村莊可持續發展。
在績效評價體系構建方面,本文主要從調研所得客觀數據出發得出各村莊綜合成績的算法。但是,“數量性”精準并不是最真正意義上的精準,每個村莊的特征不同,每個幫扶單位的表現形式也不同,因此不能用統一化的績效計算公式以一概全。在實際生活中,我們的評價原則要求主觀與客觀相結合。在調研時還需了解村莊百姓真正的需求、對幫扶單位幫扶態度、幫扶工作的滿意度以及相關領域專家的評價等主觀因素。