(浙江工業大學 計算機科學與技術學院,浙江 杭州 310023)
高校專業評價是指多個高校在某一專業上優劣比較結果,為全面、準確地表示評價結果,在高校專業評價的過程中需要以多個指標為準則[1-3],由于高校專業評價指標涉及面廣、數據間差異大,因此解決該問題的評價方法需要在考慮以上因素的同時兼顧傳統觀念因素。目前被廣泛應用到多指標評價分析的方法主要有主成分分析法[4-5]、模糊綜合評判法、TOPSIS評價法、灰色關聯度分析法和熵權法等。文獻[6-10]將層次分析法(AHP)運用到威脅評估、質量評價等問題上,雖然可以快速、簡便地得出評價結果,但是評價過程過于依賴專家知識體系,獲得的指標權重和評價結果缺乏客觀依據。文獻[11-12]通過對熵權法進行改進并應用于實際評價問題中,雖然一定程度上改善了指標權重精確度,但是仍然會因為數據極端多寡導致評價結果失真。文獻[13-19]將多種評價方法結合建立多指標評價決策模型,各模型都一定程度地降低了對人為因素的依賴、增加評價結果的穩定性,但在主、客觀權重融合及評價結果的精確度上還有待提升。
筆者提出一種多組合賦權評價模型,通過主成分分析法提取原始樣本主成分,實現對復雜樣本數據的降維處理,在層次分析法執行中引入多專家打分及熵值概念,并與熵權法獲取指標權重綜合加權求得綜合權重,既大幅度減輕了指標權重對專家經驗的依賴,又避免數據極端多寡導致的指標權重失調,最后采用二次加權的方式獲取更準確的評價結果,并將這種多指標評價模型應用到高校專業評價問題中。
以各高校在計算機專業中排名問題為例,為該多指標評價問題構建指標體系,基于指標選取的契合性、針對性、系統性和科學性原則,參照層次分析法的關系模型,根據該問題的支配關系形成指標體系層次結構,如表1所示。表1中:新生質量、就業競爭力、科研力量和學校實力為一級指標體系;二級指標體系由計算機專業在該校的錄取分數線、錄取最低名次、該校計算機專業學生總數、該校計算機專業學生的就業率、升學率、專業就業對口度、就業后的滿意度、雇主滿意度、平均薪酬、計算機專業教師學生發表論文單篇引用數、H指數、發表論文數、計算機專業老師數、教授的比例、高校批次及高校辦學地的城市等級16 個指標組成。在前期的研究中,發現科研力量及學校實力等多項指標均成線性相關,解釋的信息有重疊,因此基于對信息的高效性與簡潔可操作性原則,科研力量主要從論文產出來做解釋。

表1 高校專業排名指標體系Table 1 University professional ranking index system
在高校專業評價原始指標體系中二級指標變量較多,且多指標數據之間通常具有一定的相關性,得到的評價結果往往效果較差。用層次分析法(AHP)求多指標權重時,重要性判斷過于依賴專家的知識體系和經驗,評價結果很大程度受到主觀因素的影響。高校專業評價問題受多個指標的影響,精度要求較高,對于多指標的子層指標體系評價準則往往偏差較大;熵權法(IE)求指標權重的結果完全取決于客觀的樣本數據,因此原始數據的差異性決定了權重的大小,而實際應用中往往存在許多特殊數據導致獲取的權重與人們的常識相差過多。筆者通過改進、結合3 種多指標評價算法,來得到更加客觀、穩定的權重。利用PCA的降維思想結合樣本數據的差異性來選擇綜合排名指標,實現對不同量綱單位數據的歸一化處理,從而構造性質較好的樣本數據,更準確地映射評價結果。表1中高校專業評價指標體系一級指標屬于對高校專業評價領域相對抽象的主觀認知,二級指標為樣本數據的客觀映射,首先通過引入多專家打分機制和熵值概念改進層次分析法,分別獲得一級指標和對應的二級指標的權重,從而消除傳統層次分析法中1~9標度對多指標間重要差異性難區分的問題,同時很大程度上避免權重計算因過于依賴人的主觀意識致使評價結果有失客觀性及準確度的問題;然后采用熵權法對下層指標體系求權重,將層次分析和熵權法得到的指標體系權重進行一系列的綜合加權處理獲得綜合指標權重,最后對綜合指標權重采用二次加權的方法求評價結果,從而兼顧所有評價指標的影響,避免指標權重失調引起評價結果的失真。具體步驟如下。
假設高校排名實例樣本數據中有n個樣本,指標評價體系中有k個一級指標,m個二級指標項,則可構成由樣本和指標項數據組合的原始矩陣Y=(yij)n×m,其中yij表示第i個高校對象在第j個排名指標上的值。

(1)
2) 依據標準化矩陣均值為0,方差為1的規則,計算標準化矩陣C的相關系數矩陣R為
(2)

(3)
4) 通過選取在主成分中載荷量較大的r個指標來作為新指標體系的二級指標,代替原有的樣本指標項來表示所有的樣本信息,構成綜合指標體系。
對上述綜合指標體系中的一級指標及對應的二級指標求解權重,以k個一級指標求解為例,為指標重要性設置100 分制評分表,如表2所示。采用v個專家分別對各指標重要性打分,再結合1~9 標度法(表3)對指標重要性分值進行兩兩比較建立v個判斷矩陣,第q個判斷矩陣為
Pq=(pqij)k×k
式中pqij為第q個專家比較矩陣中第i個指標比第j個指標的重要度,則第q個專家判斷矩陣對應的權重集合記為wq,且wqi表示根據第q個專家指標評分得到的第i個指標權重,其計算式為
(4)
式中zi為中間變量,表示第q個專家指標評分中第i個指標的相對權重,通過對k各指標的相對權重進行歸一化處理,得到第q個專家指標評分得到的第i個指標權重wqi。對第q個專家判斷矩陣進行一致性檢驗,其計算式為
(5)

(6)
將一級指標權重向量記為B={β1,β2,…,βk},同理求出一級指標對應的二級指標權重向量記為Φ={φ1,φ2,…,φr}。

表2 指標重要度評分表Table 2 Index importance score

表3 1~9標度法規則表Table 3 Levels scale method

表4 平均隨機一致性指標Table 4 RI index
1) 根據主成分分析法確定的n個高校樣本及r個綜合排名二級指標項組成原始矩陣T為
T=(tij)n×r
對T進行標準化處理,包括對去除排名指標單位不同造成的影響而進行的無量綱化處理和為減少指標數據極端值對排名結構的影響而進行的歸一化處理,得到標準化矩陣為A=(aij)n×r,aij可表示為
(7)
式中:tmax,tmin分別為原始數據中最優值與最差值。
2) 根據數學上熵值的定義可得出第j個評價指標的熵值為
(8)
式中:sij為第j個指標在第i個樣本下的比重;熵值Ej取值為0~1。
3) 根據得到的熵值,定義熵權法權重向量為Ψ={ψ1,ψ2,…,ψr}。熵值與熵權呈現反比關系,熵權越大,熵值越小,說明該指標在評價體系中作用越重要,熵權為
(9)
1) 將改進層次分析法得到的二級權重Φ={φ1,φ2,…,φr},結合熵權法得到指標權重Ψ={ψ1,ψ2,…,ψr},計算二級指標綜合權重為T={t1,t2,…,tr},其計算式為
(10)
2) 按照主成分分析得到的k個一級指標與r個二級指標的對應關系,對綜合指標權重T重新定義為T={t11,t12,…,t1n1,…,tk1,tk2,…,tknk},其中tini即第i個一級指標對應的第ni個二級指標權重,ni表示第i個一級指標對應的二級指標數。分別對第i個一級指標對應的二級指標綜合指標進行歸一化處理,結果記為Ω={ω11,ω12,…,ω1n1,…,ωk1,ωk2,…,ωknk},其中ωij為
(11)
3) 將一級指標權重向量B與綜合二級指標權重向量Ω進行2 次加權,得出高校專業評價模型為
(12)
式中xikl為第l個高校專業在第i個一級指標對應的第k個二級指標項對應的樣本數據,這種2 次加權模型很好地將主、客觀權重組合到一起,保證了評價模型的科學性、穩定性及準確性。
實例選取116 個高校的計算機科學與技術專業的16 個評價指標在2016 年各項數據作為實驗樣本數據,即樣本n=116,指標項m=16。
1) 將上述116 個樣本,16 個排名指標項數據作為原始矩陣,對原始樣本矩陣進行同一量綱下的標準化處理,計算出關系矩陣R,利用SPSS工具計算相關矩陣R的累積貢獻率等,如表5所示。

表5 樣本總方差分解表Table 5 Total varlance explained
由表5可知:前4 個主成分的累積貢獻率為82.5%,超過80%,基本代表了原始樣本的所有信息量。根據載荷矩陣規則得出:第1個主成分主要由C7(就業滿意度),C8(雇主滿意度),C9(平均薪酬),C15(高校批次)決定;第2 個主成分主要由C10(單篇引用數決定),C11(H指數),C14(教授占比)決定;第3 個主成分主要由C1(錄取分數線),C2(錄取最低名次)決定;第4 個主成分主要由C16(辦學地城市等級)決定。上述10 個排名指標分別在4 個主成分中載荷較大,可代替原有的16 個指標,大大減少了需要分析的變量數。
2) 從上述116 個樣本中選取80 個樣本數據比較完整的高校結合主成分分析得出的10 個主成分排名指標組成的新矩陣進行相關性檢驗,考察指標間的聯系和區別及指標的交叉影響,實現對指標體系的優化。從檢驗結果(篇幅有限,此處不贅述)得出多項指標存在相關性關系,考慮同一量綱下對于樣本中缺失項數據的兩種處理方法為(1) 替代轉化:由樣本數據結論可知,雇主滿意度和就業滿意度存在可替代關系,利用線性回歸系數加以處理,可以較為合理地解決滿意度數據,因此可將這兩項整合為一個綜合指標;(2) 相關性均值填充:因為數據顯示,多項指標的數值浮動較大,故不適合用全體均值來填充缺項,但發現各項指標間的相關性存在顯著,如若A校缺少P指標,P指標與Q指標顯著線性相關,高校按照Q指標排名,取A校臨近4 個高校P指標均值進行填充。
依據以上規則,結合主成分分析法得到綜合指標體系的二級指標集合為S={錄取分數線,錄取最低名次,就業滿意度,平均薪酬,單篇引用數決定,H指數,教授占比,高校批次,辦學地城市等級},對116 個樣本中的缺失項數據進行補全后得到矩陣T,表示為
T=(tij)n×ri=1,…,n;j=1,…r;n=116;r=9
3) 高校專業評價綜合指標體系一級指標集合Z={新生質量,就業競爭力,科研力量,高校實力},利用改進層次分析法求綜合指標體系權重。參考3 位專家對綜合指標體系的評分意見,可構成一級指標打分矩陣A為

以一級指標求權重為例,根據每個專家的評分情況,結合1~9 標度法構成5 個判斷矩陣,對第i個矩陣通過式(4)求出第i個專家評分對應的指標權重向量Wi,并通過一致性檢驗獲取滿足一致性要求的指標權重向量。即W1={0.226,0.293,0.165,0.316},W2={0.257,0.231,0.103,0.409},W3={0.308,0.199,0.207,0.286},W4={0.297,0.145,0.239,0.319},W5={0.273,0.233,0.177,0.317}。將得到的3 個一級指標權重向量組合成權重矩陣W。
對權重矩陣W利用熵值概念,通過式(6)求出指標相對客觀權重向量B={0.293,0.203,0.113,0.391},同理利用改進的層次分析法分別求出一級指標對應的二級指標向量Φ={0.761,0.239,0.376,0.624,0.733,0.267,0.275,0.479,0.246},如表6所示。
表6 改進層次分析法求指標權重
Table 6 Improved analytic hierarchy process to obtain index weight

總體目標評價準則評價指標高校專業評價A新生質量(0.293)錄取分數線(0.761)錄取最低名次(0.239)就業競爭力(0.203)就業滿意度(0.376)平均薪酬(0.624)科研力量(0.113)論文單篇引用數(0.733)論文產出H-指數(0.267)高校實力(0.391)教授占比(0.275)高校批次(0.479)辦學地城市等級(0.246)
4) 熵權法求綜合指標體系二級指標權重,參照式(7)對主成分分析法得到的矩陣T進行標準化處理,得到矩陣A作為熵權法的標準化矩陣,指標項集合為S,得到的權重集合為φ={0.053,0.242,0.138,0.116,0.211,0.105,0.034,0.066,0.035}。然后,參照公式(10),將熵權法獲得的二級指標權重φ,結合改進層次分析法得到的二級權重Φ求得綜合二級指標權重集合T={0.089,0.127,0.114,0.159,0.34,0.062,0.02,0.07,0.019}。參照式(11)對綜合二級指標權重進行歸一化處理得當標準化綜合二級指標權重Ω={0.412,0.588,0.418,0.582,0.846,0.154,0.184,0.642,0.174}。
最后利用加權評價模型式(12)對改進層次分析法得到的一級權重B及綜合二級指標權重Ω進行二次加權求解,求得高校專業評價結果。表7為筆者評價模型及層次分析法得到的部分高校在計算機專業上排名結果,根據層次分析得到的結果中武漢大學排名明顯高過北京郵電大學,因為層次分析法專家經驗給出的錄取分數線權重較高,而武漢大學在錄取分數線高于北京郵電大學,而其他大部分指標數據較為劣勢的情況下得到較高的排名,這與傳統觀念相差甚遠。經驗證,筆者提出的評價模型獲得的評價結果具有較高的準確度和穩定性,該評價模型合理、可行且易操作。

表7 計算機專業高校排名Table 7 University rankings in computer science
筆者通過改良高校專業評價的指標設計體系,提出了基于PCA-AHP-IE的多指標評價模型,很好地避免了評價結果過于依賴主觀經驗或客觀數據,也避免了因數據極端多寡或專家知識庫結構不同而導致評價結果與人們的正常認知或實際情況不符的情景,既符合樣本數據的內在規律,又能滿足專家及大眾的普遍認知。該評價模型可以有效、合理地應用到高校專業評價這類多指標評價研究中,但是算法仍存在一些不足之處,指標體系仍受限于數據的不完善,希望在以后的研究中繼續改進。