王瑛 李菲
摘要:采用聚類分析法將多專家的動態綜合評價轉換為靜態綜合評價;引入橫向拉開檔次法對各指標客觀賦權,結合指標主觀權重,運用數學規劃法得到指標的集成權重;采用貝葉斯網絡模型對24項科技成果進行分類評價,對每一項成果獲得某一等級獎項的可能性給出測度,并對每一類內的項目排序。實證分析表明:我國科研成果大部分具有研究價值,且成果豐碩,但突破性、創造性的研究成果較少。
關鍵詞:貝葉斯網絡;集成權重;拉開檔次法;聚類分析法
中圖分類號:G311 文獻標識碼:A
與2013年、2012年相比,2014年度國家科學技術獎授獎項目明顯減少。對此,國家科技部獎勵辦表示,優化獎勵結構、減少獎勵數量,是為了突出鼓勵自主創新成果和重大的發明創造科技成果。科技成果的評價作為科技獎勵的前期工作,對科技獎勵的最終決策有著舉足輕重的作用,也是保證真正的重大創新項目獲得應有獎勵、鼓勵科研人員進一步有所突破的關鍵。
目前,學者們對科技獎勵綜合評價體系的研究做了大量工作,部分研究成果已經投入實際應用。張立軍等構建了基于路徑系數權重體系的科技獎勵評價模型。王瑛等提出了基于模糊多屬性投影法的科技獎勵模型和E-BP神經網絡的科技獎勵評價模型。黃衛春等提出了一種基于云模型的科技獎勵評審模型,利用云模型描述項目評分在各屬性下的分布情況,通過計算云模型參數來確定云模型數字特征圖或云滴分布情況,并以此確定評價等級。王瑛、蔣曉東等提出了改進CRITIC法和云模型的科技獎勵評價模型,既考慮評價過程中專家評分的模糊性和隨機性,又考慮了定性語言與定量語言之問的轉換。王瑛、王娜等提出了基于隨機森林賦權和改進的ELECTRE-Ⅲ方法的科技獎勵評價方法,既提高了權重估計的精確度和可信度,又解決了難以給定門檻值和不能完全排序的問題。朱紫巍等針對國內外科技評價方法,進行比較分析,提出了改革我國科技評價方法的建議。
針對科技獎勵評價涉及多專家、多項目、多指標的特點,此前,學界的研究主要集中在評價指標的客觀賦權法與主觀賦權法的單方面研究,沒有將這兩方面有機結合起來;在評價方法上主要集中在數理統計和人工智能等方面,但對于評價結果的可靠性沒有給出科學的測度。對此,本文提出一種集成權重的方法對科技獎勵的評價指標進行綜合賦權;應用概率論中的貝葉斯網絡模型進行科技獎勵綜合評價,該方法不僅可實現對科技成果的分類評價,而且可對每一項科技成果獲得某一等級獎項的可能性給出概率測度,并在分類評價的基礎上,對每一類內的項目進行排序。
1集成權重的理論
評價指標權重的確定可分為主觀賦權法和客觀賦權法,兩者各有千秋。本文采用一種主、客觀權重集成的方法,計算各評價指標的綜合權重,該方法既能滿足決策者的主觀偏好,又能實現決策的客觀性、真實性。
1.1基于聚類分析的專家權重理論
聚類分析方法是一種作為模式識別的分類方法,它常常被用來判斷樣品質量的好壞。把評審專家的個體排序向量看作是待識別的樣品,對其進行聚類分析并判別其客觀可信性,再根據聚類結果給專家賦權。
動態專家賦權堅持的是簡單多數的基本原則,即一個評審結果體現的是整個專家群體的綜合意見。因此,一個專家的個人評審意見和大多數專家的評審結果的吻合程度決定了該專家在整個綜合評價中所占的分量。如果他的評價結果與大多數專家的結論基本一致,就可以給這一類專家賦以較大的權重;反之,其意見就值得懷疑,可以給這一類專家賦以較小的權重。
通過聚類分析,可以將個體排序向量劃分成不同的類別,即將k個評審專家分成s類(s≤k),假設第l類(l≤s)內包含φl個個體排序向量,那么,第k位專家的權重ηk應該和他所在的類別中包含的專家人數φk成正比,其具體計算公式為:
(1)對ηk進行歸一化處理,即可得到基于聚類分析的動態專家權重:
(2)
1.2拉開檔次法的指標賦權理論
拉開檔次法就是在使得各被評價對象之問的整體差異盡量拉大的條件下確定評價指標權重的方法。
對于靜態綜合評價問題,一般解決辦法是取線性綜合評價函數:
(3)式中:ωi為評價指標權重。
(4)式中:
當指標權重矩陣W為對稱矩陣H的最大特征值對應的特征向量時,σ2取最大值。此時權重系數W最大可能地體現了各評價對象問的差異。
1.3基于數學規劃法的集成權重理論
本文應用數學規劃法在非線性約束條件下,求解線性目標函數的極值問題。該方法在科技獎勵綜合評價中的具體應用如下。
(5)
解得:
(6)
(7) (8)
(9)
(10)
由式(10)即可求得評價指標的集成權重。
2貝葉斯網絡模型的理論
(11)式中:P(A|Bi)為條件概率;P(Bi)為事件Bi的概率。
結合科技獎勵評價的特點,Bi為科技獎勵的等級集,元素yji表示第j個指標在第i等級時的標準值;A表示科技獎勵的指標集,元素xjk表示第k項科技成果的第j個指標的實際值;i為標準級別,i=1,2,…,s;j為指標,j=1,2,…,m;k為科技成果編號,k=1,2,…,n。據此式(11)可改寫為:
(12)
算法步驟如下:
1)計算P(yji)。在沒有任何信息的條件下,某項科技成果究竟屬于哪一等級,這在許多應用中難以確定。結合科技獎勵的特點,在沒有獲取科技成果相關信息的情況下,人們最能接受的是獲得某等級獎勵的概率相等,即取:P(yj1)P=(yj2)=…=P(yjs)=1/s。
2)計算P(xjk|yji)。現有研究成果表明,P(xjk|yji)的估計是貝葉斯網絡模型的核心。本文從抽樣誤差角度估計P(xjk|yji)。根據統計理論,當科技成果屬于i類時,由于抽樣緣故獲得的樣本指標值和總體指標值總是存在一定的抽樣誤差,其分布可用正態分布表示。基于以上考慮,將抽樣誤差正態分布原理用于估計P(xjk|yji)。以科技成果評價指標j各等級標準值作為正態分布的均值aj,基于aj和標準差σj獲得某一等級某一指標完整的正態分布。
(13)
(14)
(15)式中:aj,σj和Cj分別為指標j各等級的均值、標準差和變異系數。
由式(13)~(15)計算變異系數Cj,Cj表示指標j在各類之間相對變化情況。而某類指標j抽樣值的相對變化亦與之類似,因此采用Cji=Cj,即以各類等級變異系數估計某一類指標抽樣值的變異系數。
基于抽樣誤差正態分布原理估計P(xjk|yji)的計算步驟歸納如下:
①由式(13)~(15)估計Cji,并采用Cji=Cj;
②將第i類指標j的標準值yjk作為該類指標均值;
③計算第i類的標準差σji=Cjiyji;
④將抽樣值(檢測值)xjk標準化,
(16)
⑤以標準化正態分布計算
(17)
用標準正態分布函數求取,|tjk|為tjk坤的絕對值。
3)由式(12)計算P(yji|xjk)。
4)多指標下(ωj為指標權重)科技成果評價后驗概率Pi的計算。
(18)
5)以最大概率原則決策最終的級別Ph。
(19)
6)以分類結果為基礎,在每一類內根據概率大小進行排序。
3實證分析
以國家科學技術進步獎(技術開放項目)評選中25位專家對24項科技成果的評分數據(資料來源:科技部國家科技獎勵辦公室,原始數據略)為例,該獎項的5個評價指標是:技術創新程度、技術經濟指標的先進程度、技術創新對提高市場競爭能力的作用、已獲經濟效益、推動科技進步的作用。國家科技獎勵辦賦予5個評價指標的權重為:ω'=(0.2,0.2,0.2,0.25,0.15),將該權重作為評價指標的主觀權重。具體步驟如下。
步驟1基于聚類分析法的專家權重的計算。
運用SPSS19.0對原始數據進行聚類分析,將25位專家分為5類,即:
第一類包含10,16號2位專家;
第二類包含1,2,4,12,15號5位專家;
第三類包含3,6,8,9,14,25號6位專家;
第四類包含5,7,11,13,18,19,20,21,22,23,24號11位專家;
第五類:含17號1位專家。由式(1)(2)計算專家權重,結果見表1。
由表1求得的專家動態權重,采用簡單線性加權法,計算25位專家對每個項目的5個評價指標評分的加權平均值,計算結果見表2。
表2的數據組成的矩陣,即為式(4)中的矩陣X,應用Matlab7.0計算XTX的最大特征值及歸一化的特征向量(即權重系數)分別為:
步驟3科技成果評價標準體系的構建。
根據國家科技獎勵辦公布的國家科技進步獎(技術開發項目)評價指標體系和獎勵辦法,建立國家科技進步獎(技術開發項目)評價標準。按照“從嚴把關,嚴肅評審,寧缺毋濫”的原則,在分類上設置5個等級,在各等級標準設定中采取5分制原則,采用隨機生成數的辦法,得到5個指標各等級的評價標準,見表3。
步驟4
基于貝葉斯網絡模型的科技獎勵評價。
3)由式(12)可知,求P(yji|xjk)的過程就相當于P(xik|yji)的歸一化過程,計算結果略。
4)由式(18)計算該項目分屬各等級的概率。
同理,計算24個項目分屬各等級的概率,結果見表5。
5)由式(19)確定項目1所屬類別,屬于三等,抽樣誤差標準正態分布以0.366的概率保證其獲得三等獎。
6)同理,可以得到所有項目的所屬類別,并根據同一類內概率的大小,進行排序,結果見表6。
從分類評價結果看,大部分科技成果都屬于二等和三等,一等和四等的項目較少,五等的項目完全沒有;從評價結果的可靠性看,獲得一等獎的項目分別以0.408,0.426,0.469的概率給予保障,獲得二等、三等項目的可靠性測度維持在0.382,獲得四等獎的可靠性則以0.320的概率給予保障;每一個等級內的排序可以為決策部門在授獎指標一定的情況下提供參考。通過實證分析可以得出:高等級獲獎項目較少,大部分屬于二等和三等,低等級獲獎項目極少,這表明我國科研成果絕大部分具有研究價值且成果豐碩,但突破性、創造性的研究成果較少。
4結論
采用集成權重和貝葉斯模型相結合的方法進行科技成果綜合評價,方法的特點表現在:
1)聚類分析將多專家的動態評價轉化為靜態評價。從一般線性函數的評價結果出發,用拉開檔次法對評價指標客觀賦權,該賦權過程科學、客觀、透明,可操作性強。
2)數學規劃法將主、客觀權重相結合,構成評價指標的集成權重,使科技獎勵綜合評價結果同時反映了主、客觀因素,彌補了單純采用主觀賦權法或客觀賦權法的不足。
3)基于貝葉斯網絡模型的科技成果綜合評價,立足于概率,對每一項科技成果可能獲得某一個等級的獎項都給出一個可靠性的測度,既實現了對科技成果的分類評價,也具有預測作用。