何 雙
(陽江職業技術學院數學系,廣東 陽江529500)
為了貫徹落實《統籌推進世界一流大學和一流學科建設總體方案》《國家職業教育改革實施方案》等文件精神,國家大力推動本科“雙一流”高校與學科、高職“雙高”院校與專業建設,2017年評出第一批“雙一流”院校[1],2019年評出第一批“雙高”院校[2].如何厘定院校評價體系中各因素指標對評價結果的影響程度,理清其內部的作用機制,目前是教育統計、教育評價學等領域,尤其是教育數據挖掘領域(Education Data Mining,EDM)的熱點研究問題,其研究價值對高校管理決策以及實現內涵式建設與發展具有指導意義.
就該領域研究對象來看,鄧龍等[3]基于單個學校的視角,從“創新強校工程”的目標設定、項目建設、管理保障等角度出發,研究其有效建設路徑.孫洪鳳[4]就創新體制機制、教師隊伍建設方式、人才培養模式等角度研究高職院校軟實力提升的途徑.邱光明[5]針對高校“創新強校工程”專項資金考核內容、考核評價體系進行了全面的研究與解讀.熊飛等[6]梳理了三年來廣東高職教育“創新強校工程”考核實踐,指出高職院校在高質量發展問題上,既要突出辦學特色,又要重視人才培養全過程質量把控,提出走“擴容、提質、賦能”之路.就該領域研究方法來看,趙國瑞等[7]通過建立廣義灰色關聯度模型,將指標間的不確定關系白化,順次構建TOPSIS評價模型,耦合了廣東省一流高職院校評價結果.
縱觀現有研究文獻,從研究對象上來說,院校評價項目內涵、評價體系、建設路徑等方面研究較多.從研究方法上來說,定性研究多,定量研究少,并且從前期文獻搜索來看,基于算法模型研究院校評價結果影響因素厘定方法的文獻更少.
Spearman秩相關算法作為研究變量間相關度的模型,被廣泛應用于環境信息學、醫學與經濟學等領域,其中較為典型的文獻有:閆玉波等[8]將Spearman pank相關系數模型引入鐵路集裝箱發送量相關影響因素度量研究;賈超等[9]提出一種基于Spearman秩相關系數的區間數型水質綜合評價模型,用于研究區域階段性水質評價中的模糊不確定性的問題;蘇立民等[10]在兩個IVIFS之間引入Spearman秩相關系數(SPCC)的概念,計算理想備選方案與各備選方案之間的SPCC.但將Spearman秩相關應用到教育領域,尤其是教育評價領域的文獻很少.
本文研究主要有以下三個方面:第一,以2021年度廣東省“創新強校工程”考核為研究個案,追本溯源,整理了27所B類高職院校考核表,結合已往考核結果,全面梳理了盡可能納入模型的客觀、可量化指標;第二,利用Spearman秩相關從已取得的89個相關數據指標中篩選出28個與院校排名相關的關鍵解釋變量,結合Topsis-模糊綜合評判算法模型驗證關鍵解釋變量評價結果與實際結果有極強相關性,進一步說明關鍵解釋變量的有效性與科學合理性;第三,通過Spearman秩相關數據指標篩選的方法,為厘定院校評價相關性因素提供參考.
Spearman秩相關系數是利用兩個變量X,Y的秩次大小作為線性相關分析的非參數指標,取值范圍從-1至+1,其中,0暗示著兩個參數之間沒有相關性.
假設兩隨機變量分別為X,Y,它們的元素個數均為N,取兩隨機變量第i個值分別用Xi,Yi表示,1≤i≤N.對X,Y進行排序(同時為升序或降序),得到Xi,Yi兩個元素排行集合xi,yi,其中,元素xi,yi分別為Xi在X中的排序和Yi在Y中的排序,則得到兩隨機變量的等級差數di.
di=xi-yi, 1≤i≤N.
(1)
Spearman秩相關系數為
(2)
其中,相關系數ρ的絕對值越大(相關系數越接近于1或-1),說明X,Y相關性越強;相關系數ρ越接近于0,X,Y相關度越弱.通常情況下,通過取值范圍判斷變量的相關強度,見表1.

表1 相關系數絕對值與相關強度
本研究數據來源于2021年度廣東省“創新強校工程”考核申報材料.共收集27所高職B類院校樣本,其中,廣州南洋理工職業學院、肇慶醫學高等專科學校、汕頭職業技術學院是27所樣本學校前三名,同時是廣東省考核公布B類院校的第二、四、五名[11].本文以資料中27所B類院校在2021年度廣東省公布的“創新強校工程”考核排名順序為固定變量X0,各考核評價指標為隨機變量Xi.另外,全面梳理“創新強校工程”考核評價指標,重新構建二級指標體系,其中,解釋變量包括4個一級指標(擴容、提質、強服務、綜合績效)、89個二級指標,具體見分級指標體系(表2).

表2 解釋變量分級指標體系

續表
根據廣東省2021年度高等職業教育“創新強校工程”考核結果,為了確定各考核指標與院校排名的相關性,取定B類27所高職院校實際排名為固定變量X0,89個二級指標為隨機變量Xi,i=1,2,…,89.對院校排名與每個二級指標分別進行同為降序排序,通過式(1)得到院校排名X0與二級指標Xi的27個等級差數dij,i=1,2,…,89;j=1,2,…,27.
確定Spearman秩相關系數ρi,ρi為指標Xi與院校考核排名X0的相關系數(i=1,2,…,89).
利用式(2),運用Matlab軟件,得到各二級指標Xi與院校排名X0的Spearman秩相關系數ρi,見表3.

表3 二級指標Xi與院校排名X0的Spearman秩相關系數ρi(i=1,2,…,89)
構建Topsis算法模型是以各指標最優值、最差值作為該指標的正、負理想值,進而建立指標理想樣本,構建各樣本與正、負理想樣本的距離.為了驗證上述Spearman秩相關系數模型的結果,建立Topsis綜合評價模型.
2.4.1 確定評價對象,選取評價指標
以上述27所高職院校作為評價對象,在89個評價指標中選取Spearman秩相關系數ρi≥0.4的28個指標為關鍵指標,得到關鍵解釋變量分級指標體系,見表4.

表4 關鍵解釋變量分級指標體系
2.4.2 向量規劃化處理
將各指標數據矩陣A=(aij)27×28進行向量規劃化處理,得規范決策矩陣B=(bij)27×28,對于第i個評價院校的第j項指標值為
(3)
2.4.3 權重系數和理想點確定
分析“創新強校”各考核指標,結合Spearman秩相關系數,確定權重系數為
(4)
則上述28個關鍵指標權重分別為
0.030 0.034 0.034 0.029 0.045 0.029 0.031 0.034 0.035 0.034 0.045
0.051 0.040 0.031 0.034 0.033 0.040 0.030 0.029 0.032 0.034 0.034
0.038 0.035 0.038 0.030 0.045 0.045
構造加權規范決策矩陣C=(cij)=wj·bij,i=1,2,…,27;j=1,2,…,28.同時取加權規范決策矩陣中每列指標的最大值為正理想值、最小值為負理想值.
正理想樣本為
0.027,0.032,0.026,0.020,0.029,0.017,0.020,0.013,0.016,0.017
0.014,0.015,0.027,0.025,0.038,0.012,0.037,0.045).
負理想樣本為

-0.008 553,0.000 468,0.002 303,0.000 067 0,0.000 140,0.000 003
0.001 000,0.000 025,0.000 000 007).
2.4.4 建立Topsis綜合評價函數
(5)
(6)
(7)



表5 綜合理想值排名與實際排名
由表5可知,前10名結果與已知評價結果相近,僅兩所實際排名前10名院校未能進理想值前10名;后6名結果差異不大.不排除某些院校在考核材料填寫過程中對某些指標有理解偏差的可能.
2.4.5 進一步驗證綜合理想值排名與實際排名的相關性
為了進一步驗證綜合理想值排名與實際排名的相關性,再次利用式(2),易求得Spearman秩相關系數ρ=0.880 9,這表明理想值排名與實際排名為極強相關性.
結合Topsis算法模型過程結果,模糊綜合評判算法模型同樣是以表4為指標體系,將各指標數據矩陣A=(aij)27×28進行相同向量規劃化處理,得到規范決策矩陣B=(bij)27×28,權重選取與Topsis算法權重W=(wij)1×28一致,則建立模糊綜合評判算法函數為
S=B·WT.
(8)
逐個計算各樣本學校的S值,S值越大,則相應的排名越靠前.
計算27所學校綜合評判結果排名,其中前10名理想值排序如下:肇慶醫學高等專科學校(0.262)、汕頭職業技術學院(0.232)、廣東南方職業學院(0.209)、廣州城市職業學院(0.197)、惠州城市職業學院(0.180)、廣州南洋理工職業學院(0.177)、汕尾職業技術學院(0.163)、廣東嶺南職業技術學院(0.162)、廣東碧桂園職業學院(0.152)、廣州華夏職業學院(0.134).對比27所學校綜合評判排名S與實際考核結果排名X0,見表6.

表6 綜合評判排名與實際排名
前10名結果與已知評價結果相近,僅1所實際排名前10院校未能進綜合評判排名前10名;后5名結果差異不大.不排除某些院校在考核材料填寫過程中對某些指標有理解偏差的可能.
為了進一步驗證綜合評判排名與實際排名的相關性,再次利用式(2),易得Spearman秩相關系數ρ=0.910 3,同時表明綜合評判排名與實際排名有極強相關性.
從兩種算法秩相關系數來看,模糊綜合評判算法略優于Topsis算法,并且模糊綜合評判算法計算過程相對簡單.從Topsis算法與模糊綜合評判算法耦合結果來看,兩算法結果排名與實際排名皆具有極強相關性,進一步印證了Spearman秩相關模型的有效性和合理性.
從表3的總體結果來看,ρi≥0.4,i=1,2,…,89,有28個解釋變量指標,其中擴容占6個指標,提質占15個指標,強服務占3個指標,綜合績效占4個指標.
|ρi|>0.6的指標有X20,X29,X30,X87,X88,說明中高職貫通培養三二分段、校企深度合作以及學校資金投入與支出等指標與院校考核排名強相關;而|ρi|≤0.05的指標有X5,X45,X57,X79,X84,X86,說明普通高職招生人數增長率X5、專任教師人均教學時數X45、專業課總課時X57、在職人員經費占總支出比例X79、教師繼續教育培訓支出X86以及占工資總額比例X84與院校考核排名相關性不大.
中高職貫通培養三二分段X20相關系數ρ20=0.63,說明中高職貫通人才培養是創新強校考核的重點關注指標,這與目前擴大中職生源指標政策有關.
企業提供的校內實踐教學設備價值X29相關系數ρ29=0.63,企業訂單學生數X30相關系數ρ30=0.72,說明校企深度合作始終是辦優高職院校關鍵因素和重要途徑.
學校財政下達資金X87相關系數ρ87=0.63,支出X88相關系數ρ88=0.64,說明加大對高職教育的投入和合理有效支出對院校考核排名影響較大.
普通高職招生人數增長率X5相關系數ρ5=0.05,說明普通高職招生人數增長不是院校排名重點關注,這可能與近幾年高職院校擴招較快有關.
教師繼續教育培訓支出X86相關系數ρ86=0.02,占工資總額比X84相關系數ρ84=-0.02,說明考核指標院校排名關聯低,原因可能是受疫情影響各院校參差不齊.
院校評價有主觀因素,同時又有客觀因素,通過評價結果分析各指標影響因素,查找學校發展過程中的優勢與不足,提出發展目標,為院校在教育考核決策中提供參考.
第一,本文基于Spearman秩相關理論,建立了評價結果與指標因素的數學模型,通過指標數量關系得到評價指標與考核結果的關聯度,驗證關鍵指標因素的合理性,解決了數據無統計意義等現實問題.
第二,通過Spearman秩相關的關鍵指標,構建Topsis-模糊綜合評判算法模型耦合考核評價結果排名與實際結果排名都具有極強相關性,對院校自我評價和決策有參考價值.
第三,對本文模型分析結果表明,中高職貫通培養、企業提供的校內實踐教學設備值、企業訂單學生數、學校財政資金到位、學校財政資金支出與院校排名強相關;普通高職招生人數增長率、專任教師人均教學時數、專業課總課時、在職人員經費占總支出比例、教師繼續教育培訓支出及占工資總額比等因素未產生實質性影響.