基于動態綜合評價的面板數據聚類方法

2024-04-18 07:37:32梁錦玲鄧光明

統計與決策 2024年6期

關鍵詞：評價

梁錦玲，鄧光明,b

（桂林理工大學a.理學院；b.應用統計研究所，廣西桂林 541006）

0 引言

隨著數據收集便利程度的不斷提高，面板數據在計量建模相關領域得到了廣泛的應用[1]。由于其特殊的數據結構和數據特征，學者們也嘗試將面板數據引入多元統計分析中[2]。從多元統計角度出發，面板數據聚類的思路主要有：一是從聚類原理出發[3—6]，構造新的統計量和相應聚類算法測度樣本相似性。李因果和何曉群（2010）[3]從樣本指標的水平值、增量值、波動特征等方面考慮，構造了“綜合”距離函數和相應聚類方法測度樣本相似性。二是對面板數據進行降維[7—11]。王澤東和鄧光明（2019）[8]采用主成分分析法計算得到樣本的綜合得分序列，并構造了綜合趨勢距離度量時間序列的相似性，此方法能較好地捕捉樣本發展趨勢的變化，也彌補了DTW 法的不足。以上兩種方法均是從面板數據指標維度降維，也有學者從時間維度降維。如黨耀國和侯荻青（2016）[9]提取樣本在絕對水平、波動、趨勢、分布等方面的特征，并運用重心法對特征量進行動態聚類；戴大洋和鄧光明（2018）[10]利用主成分分析法對前人提取的特征量進行二次綜合提取，不僅區分了樣本指標的重要性程度，也解決了潛在的信息重疊問題，提高了樣本聚類結果的準確性。以上方法為多指標面板數據聚類問題提供了切實可行的思路，但同時也存在一些局限性。在聚類原理方面，多采用歐氏距離測度面板數據的相似性，而歐氏距離在測度帶有時間序列的數據時由于不能沿時間軸轉動，因此難以真正捕捉樣本在時間維度上的變化。在降維角度方面，相關研究雖避免了第一類方法中歐氏距離的問題，但在降維時存在以下不足：在從面板數據指標維度降維時多采用主成分分析法，該方法在計算每年綜合得分時不在同一坐標系下進行，因此無法保證評價系統的一致性以及評價結果的可比性；在從面板數據時間維度降維時，采用均值法提取絕對值特征無法體現不同時間點的重要程度。

鑒于以上方法存在的問題，本文從面板數據的維度特征出發，分別對面板數據提取指標維度綜合評價值和時間維度綜合評價值，并對兩個維度綜合評價值進行系統聚類，最后用我國省域高等教育發展水平相關數據進行實證分析。在計算指標維度評價值時，利用“縱橫向”拉開檔次法確定指標權重，并依據“厚今薄古”的思想加入時間權重，以避免主成分分析法所得評價值缺乏統一性、可比性以及均值法無法體現時間點重要性的問題。在計算樣本時間維度綜合評價值時，運用具有速度特征的綜合評價模型對樣本增量速度進行動態綜合評價，所得評價值融合了樣本增量速度狀態和趨勢，能較好地體現樣本的波動大小和變化趨勢。

1 面板數據指標維度的動態綜合評價

計算面板數據指標維度綜合評價值的關鍵在于指標權重的確定，常用的確定指標權重的方法有主成分分析法、熵值法等，但此類方法只適用于靜態截面數據，若將其應用于面板數據中分別計算每年的指標權重，則會造成評價體系不統一、評價結果缺乏可比性等問題。因此，本文選擇“縱橫向”拉開檔次法[12]確定指標權重。基本思想和求解過程如下。

（1）設xij(tk)為第i（i=1，2，…，n）個樣本在tk（k=1，2，…，N）時刻第j（j=1，2，…，m）項指標的觀測值。對原始數據進行標準化處理：

（2）對時刻tk（k=1，2，…，N）取綜合評價函數：

（3）確定權重系數wj（j=1，2，…，m）。用yi(tk)的總離差平方和σ2表示各種被評價樣本之間整體的差異：

若限定wTw=1，則當取w為矩陣H的最大特征值λmax(H)所對應的標準特征向量時，σ2最大，且有Hw=λmax(H)。

（4）將歸一化后的w=(w1，w2，…，wm)T代入式（2），可得各個樣本水平的綜合評價序列矩陣Y：

為體現“厚今薄古”的思想，對樣本每個時期綜合評價值賦予時間權重，進而得到樣本i在總時期內的指標維度綜合評價值Yi：

其中，時間權重ωtk由反三角函數F(tk)=arctan(tk)（tk=1，2，…，N）確定[3]。

2 面板數據時間維度的動態綜合評價

為體現樣本的波動大小和變化趨勢，運用具有速度特征的動態綜合評價模型[13]計算面板數據時間維度綜合評價值。根據“縱橫向”拉開檔次法得到綜合評價時間序列矩陣式（6），記樣本在[tj，tj+1]時間段的增量速度為vij，得到樣本的增量速度時間序列矩陣為：

根據式（8）可對樣本的增量速度狀態和趨勢進行測度。

2.1 增量速度狀態

假設樣本在某一時間段內的增量速度狀態是均勻的，則樣本增量速度的運動軌跡如圖1所示。

圖1 樣本增量速度運動軌跡

圖1 中折線與橫軸圍成的面積就是樣本在[tj，tj+1]時間內增量速度狀態累計狀況，其動態綜合評價值可用積分表示為：

2.2 增量速度趨勢

由式（8）可求得樣本在時間[j，j+1]內的增量加速度為：

為使動態綜合評價值體現出樣本“上升”或“下降”的變化信息，構造如下單調遞增函數測度樣本的增量速度趨勢：

若aij→+∞，則λ(aij)趨近于ε；若aij→-∞，則λ(aij)趨近于0。利用λ(aij)的單調遞增性可對不同的增量速度狀態進行獎懲式修正。若aij=0，λ(aij)=1，ε=2，樣本增量速度不變，則不對增量速度狀態進行獎勵或懲罰；若，樣本增量速度加速上升，則增量速度狀態得到相應大小的獎勵因子；若aij＜0，λ(aij)=，樣本增量速度加速下降，則增量速度狀態得到相應大小的懲罰因子。

2.3 動態綜合評價值

結合增量速度狀態和增量速度趨勢，可得到第i個樣本在時間[tj，tj+1]內的增量速度的動態綜合評價值為：

樣本在時間[t1，tN]內的動態綜合評價值為：

3 基于特征提取的面板數據灰色可能度聚類步驟

基于動態綜合評價角度對面板數據進行聚類分析，具體步驟如下。

步驟1：利用“縱橫向”拉開檔次法對面板數據指標維度進行綜合評價，得到綜合評價序列矩陣式（6），并依據“厚今薄古”的思想，利用反三角函數F(t)=arctan(t)(t=1，2，…，N)計算時間權重，得到每個樣本指標維度的綜合評價值Yi（式（7））。

步驟2：根據式（6）的綜合評價時間序列矩陣計算得到式（8）的變化速度時間序列矩陣，進而計算樣本的增量速度狀態和趨勢，最后得到體現樣本波動大小和變化趨勢的時間維度評價值。

步驟3：將Yi和

4 實例分析

4.1 數據來源和指標選取

本文選取了2011—2018 年我國31 個省份（不含港澳臺）的相關數據分析省域高等教育發展水平。從教育規模、教育投入、教育產出3個方面選取了9個指標，分別為每十萬人口普通高等學校數、每萬人在校學生數，公共財政預算教育經費支出占一般公共預算財政支出的比重、生均教育經費支出、普通高校師生比、普通高校研究與發展（R&D）全時人員，普通高校專任教師平均R&D課題數、普通高校發表科技論文數、普通高校專利申請數。原始數據來源于《中國統計年鑒》《中國教育經費統計年鑒》《中國科技統計年鑒》，部分指標數據經計算得到。

4.2 計算指標維度綜合評價值

通過R軟件，依據“縱橫向”拉開檔次法的計算步驟，可以得到隱含時間因素的指標權重為w=(0.1203，0.1370，0.1049，0.1034，0.0401，0.1298，0.1282，0.1278，0.1086)T。根據所得權重，可計算得到樣本的綜合評價時間序列矩陣，具體見表1。

表1 高等教育發展水平綜合評價時間序列矩陣

為進一步得到樣本所有時期總的綜合評價值，利用反三角函數計算得到樣本的時間權重wt=(0.0776，0.1094，0.1234，0.1309，0.1357，0.1389，0.1412，0.1429) 。樣本在所有時期總的綜合評價值見表2。

表2 高等教育發展水平指標維度綜合評價值

從表2 可以看出，北京的指標維度綜合評價值最高，說明北京的高等教育發展水平最高；上海、江蘇、天津等省份次之，整體的高等教育發展水平也比較高；遼寧、浙江、湖北、陜西等省份得分也較為不錯，高等教育發展水平較高；而一些西部地區的省份，如云南、青海、西藏等得分比較低，說明這些省份的高等教育發展水平相對較低。

4.3 計算時間維度動態綜合評價值

由式（6）得到樣本的變化速度時間序列矩陣式（8），由式（9）得到樣本的高等教育發展水平增量速度狀態結果，結合式（10）、式（11）得到樣本高等教育發展水平的增量速度趨勢結果，由式（12）和式（13）得到樣本高等教育發展水平時間維度的動態綜合評價值（見表3）。

表3 高等教育發展水平時間維度綜合評價值

由表3 可知，廣東、福建等省份的時間維度綜合評價值較高，說明在2011—2018年，這兩個省份的高等教育發展較快。

4.4 聚類分析

圖2 聚類系數隨聚類數目變化散點圖

從圖2可以看出，當聚類數目達到7之后，聚類系數的散點曲線逐漸趨于平緩，所以將離差平方和系統聚類的結果分為七類（見表4），并根據聚類結果繪制綜合評價趨勢圖（見圖3）。

表4 動態綜合評價法聚類結果

圖3 動態綜合評價法綜合得分趨勢圖

結合表4和圖3可知，第一類為北京，高等教育發展水平最高，整體呈現下降的趨勢。第二類為上海、江蘇、天津，高等教育發展水平也很高且整體發展趨勢相對平穩。第三類為遼寧、陜西、浙江、湖北，高等教育發展水平較高，發展趨勢有一定波動起伏。第四類為廣東、福建，高等教育發展水平中等，整體呈現上升的趨勢，是近幾年發展較快的省份。第五類為黑龍江、吉林、山東、安徽、湖南、重慶、四川，高等教育發展水平較低，呈現上下浮動狀態。第六類為貴州、廣西、寧夏、山西、甘肅、江西、河北、河南，高等教育發展水平偏低，整體發展趨勢相對平緩。第七類為內蒙古、海南、青海、新疆、云南、西藏，高等教育發展水平最低，發展比較緩慢。需要說明的是，整體呈現下降的趨勢不意味著教育水平的下降。如北京，雖然呈現逐年下降趨勢，但教育水平的各項指標是沒有下降的，而綜合評價值逐年降低是因為對每年數據進行了標準化處理。標準化實際上是一個縮放的過程，盡管北京的各項指標數值在增加，但其他省份的指標數值增加得更多，因此，北京與其他省份的差距在變小，則標準化后的數值也會相對變小。這也說明了教育資源從中心地區不斷向周圍其他地區下放，各省份間的高等教育水平差距在不斷縮小。

4.5 聚類結果對比分析

為了進行對比分析，運用文獻[10]中的特征提取法進行聚類，聚類結果見表5和圖4。

圖4 特征提取法綜合得分趨勢圖

觀察表5 可知，兩種方法聚類結果較為相似，如北京均是自成一類，福建和廣東也都是聚為同一類，其他類別中也存在較多重疊的省份，但也有一些省份的歸類差別較大。如特征提取法將黑龍江、重慶、湖北、陜西、遼寧歸到了第四類，而動態綜合評價法是將浙江、湖北、陜西、遼寧聚為第三類。根據表3中的水平值可知，黑龍江和重慶的高等教育發展水平值在0 左右，而陜西、湖北、遼寧、浙江都在0.5左右，且在趨勢上也較為相近，所以就地區的整體水平來看，動態綜合評價法的聚類結果更為合理。又如特征提取法中第六類將寧夏、西藏、吉林、湖南等省份都聚到了一類，然而無論是教育的投入、規模還是產出，寧夏、西藏都與吉林、湖南等省份相去甚遠，將其聚為一類并不合適。

再觀察圖3 和圖4，可以看出圖3 的聚類結果中各省份的高等教育發展水平高低和變化趨勢都較為相似，而圖4中特征提取法的聚類結果在整體趨勢上是較為相似的，但樣本絕對水平的跨度比較大，使得聚類結果看起來參差不齊。

為使對比更客觀，通過Calinski-Harabasz 指標（CH）和Davies-Bouldin指標（DB）度量聚類效果。

（1）CH通過類間分散度與類內緊密度之比衡量聚類效果[14]。CH值越大表明聚類結果越好。

其中，n為數據個數，k為聚類數，trB(k)為類間離差陣的跡，trW(k)為類內離差陣的跡。

（2）DB通過類內與類間分散程度之比衡量類與類的相似度[15]。DB值越小，聚類結果越好。

其中，k為聚類數，Wi、Wj分別為第i類和第j類內數據到其質心的平均距離，Cij為第i、j類的類間距離。

根據上述指標定義，可計算得到兩種方法聚類的CH值和DB值，結果如表6所示。

表6 CH 值和DB 值

觀察表6可知，動態綜合評價法聚類結果的CH值更大，DB值更小，即兩種指標結果都顯示動態綜合評價法的聚類效果更優。

5 結束語

基于面板數據聚類的特殊性以及現有面板數據聚類方法所存在的一些問題，本文從動態綜合評價角度提取面板數據指標維度和時間維度信息。利用“縱橫向”拉開檔次法和具有速度特征的動態綜合評價模型分別提取樣本的指標維度綜合評價值和時間維度綜合評價值，并對兩個維度綜合評價值進行系統聚類。此方法避免了對面板數據使用歐氏距離所帶來的問題，同時也解決了主成分分析法所得評價值缺乏統一性、可比性以及均值法無法體現時間重要性的問題。最后對2011—2018年我國省域高等教育發展水平相關數據進行實證分析，結果表明所提方法聚類效果良好。