余 彬, 朱永忠
(河海大學理學院,江蘇南京211100)
實際生活中,許多項目在實施前需要被客觀地評價,然而在整個評價過程中會出現很多不確定性因素。如果評估者在評價時,采用傳統的概率統計手段,給出的是一個估計值,用剛性的“點”去描述,往往不能很好地描述事物的真實性[1]。若能用一個模糊地區間去評價它,這樣在評價時就能降低評估者在賦值時的主觀性[2]。汪培莊教授首次提出了集值統計方法,在概率統計實驗中,每次得到的實驗結果是象空間的一個模糊子集,稱這種實驗為集值統計實驗[3]。評估過程中的各種不確定因素是集值統計法在評估時的有利因素,它的區間評價很好地滿足了評估者的模糊心理。
近年來,集值統計法有了很大發展。一方面集值統計法在教學評估、項目決策、氣象預測等不同的領域得到了較好的應用。邢云磊、張喜將集值統計法應用到了大型客運站的風險評估研究上[4],陳斯、陳崗將其應用到了項目融資上[5],羅曉芳將其應用到了教學評估上[6],廖文來、何金平將其應用到大壩安全的監測上[7]。另一方面,對集值統計法的改進也取得了較大進展。一是對評估者給予了不同的權重。孫九春、史家均利用評估者給出的評價區間的相似性與差異性給出專家權重的賦權方法[8]。二是對各項方案中指標權重的改進。鐘小偉、傅鴻源[9]和王煒[10]等人采用層次分析法來確定指標的權重[9],陳驥采用特爾菲法和層次分析法相結合來確定指標的權重[11]。也有人采用專家調查法、判斷矩陣法和區間打分法給出指標權重的計算方法。但是傳統的集值統計法在對評估結果進行檢驗時,往往也只是一個模糊的評斷標準。例如,當結果的可信度大于90%時,就相信評估結果是可信的??墒窃诤芏嗲闆r下,即使這些評估區間中出現一些異常的區間,得到的可信度仍大于90%,這時應該選擇哪一個方案呢?沒有出現異常區間的方案還是出現了異常區間的方案呢?很顯然,傳統的集值統計法中的檢驗方法已經行不通了。
文中在傳統的集值統計法基礎上,建立了在數據刪除模型下的可信性檢驗,通過對區間的檢驗,判定出給評估結果帶來不利影響的異常區間,根據帶來的影響程度的高低,對相應的評估值賦以不同的權重,得到最終的評估結果。結果顯示,通過改進后的集值統計法得到的評估結果可信度更高。
假設共有n位評估者,對i項方案進行評估,每位評估者對每項方案給出一個區間估計值,記為位評估者對方案j的評價值可得一個集值統計序到一個評估矩陣,見表 1所示。

表1 評估者給出的評估矩陣Tab.1 Evaluation matrix given by the evaluator
其中,ajk(1≤j≤i,1≤k≤n)表示第k位評估者對第 j個方案所作出的評價值,其
將這n個區間疊加在一起則形成覆蓋在評價值軸上的一種分布。這種分布可用下式描述:

其中,wk是n位評估者的權重,


由式(3),(4),(5)得


由式(1),(3),(6),(7)可推得

傳統的集值統計法在對評價結果進行可信性檢驗時,往往是根據評價函數得到的b值來判定,當b值大于0.9時,就相信評價結果是可信的。但是,當遇到幾項方案的平均成績相差無幾,而評價函數得到的b值又都大于0.9時,又該如何取舍呢?為了方便說明,舉出下面例子。
假設現在有4套方案,由5位評估者進行打分,所得到的評估矩陣如表2所示。
由表2可以看出,有一些方案中,并不是每一位評估者給出的評價區間都是相同的,由于評估者的專業性等原因而出現這種差距,是可以理解的。若按孫九春的文章中提到的由評價區間的相異性與差異性求評估者的權重,剛好每一位評估者出現一次異常的評估,為了方便起見,暫且認為每位評估者的權重是相同的。經過計算得到方案1,2明顯大于方案3,4,但是到底選擇方案1還是方案2,這兒遇到了問題:
方案1的平均估計值和可信度分別為

方案2的平均估計值和可信度分別為


表2 5位評估者對4套方案的評估Tab.2 Four schemes'evaluation given by the five evaluators
由結果知道,兩者的可信程度均在0.99以上,具有很好的可信度,兩者的平均值,也相差無幾。到底選擇哪一個方案,傳統的評估準則已經不能很肯定地給出一個令人信服的答案。從這里可以看出,異常區間的出現打亂了傳統的評估方法。文中嘗試找出一個好的辦法,對異常區間進行處理,使評價結果更符合實際情況。
數據刪除模型是統計診斷的基本模型,比較刪除模型與未刪除模型相應統計量之間的差異是統計診斷最基本的方法。下面結合集值統計法對評估區間進行檢驗。
給定一組評估區間集 Z={z1,z2,…,zn},檢驗第i個區間zi是否為異常區間。如果區間zi是異常區間,那么刪除該區間之后,所得結果的可信度bi值與未刪除該區間時的b值相比,將變大;同時得到的值將更趨近真實情況,如果區間的異常程度越高,得到的bi值會越大值越接近真實值。
基于數據刪除模型,知道當可信度的變大時,這個時候得到的平均值也更接近真實水平。通過刪除模型的檢驗,已經知道了區間中的異常區間,通過對異常區間Δbi的相對改變量對相應的賦予權重wi,最終的綜合評價值

實例分析:為了說明改進后模型的有效性,對上文的兩方案用該模型進行檢驗,得到的結果見表3和表4,b值表示未刪除區間時的平均估計值和可信度,bi值表示刪除第i個區間zi后的值)。
從表3和表4可以看出,由數據刪除模型從可信度的改變量看,方案1的可信度所有區間在刪除后都是減小的,而方案2有兩個區間在刪除后可信度是變大的,即所給區間中有兩組是異常區間,第一組和第五組。那么方案2最終結果會有變化,由公式(10)得到改進后的最終綜合評價值:


表3 方案1評估區間刪除前后的比較Tab.3 Difference of the result after the first scheme's evaluation interval delete

表4 方案2評估區間刪除前后的比較Tab.4 Difference of the result after the second scheme's evaluation interval delete
由此可以看出,反而出現了異常區間的方案2得到的最終評價值大于方案1。為了檢驗方案2最終評價值的可信度,已知在忽略評估者自身權重差異的情況下,即對每位評估者給出的區間賦予相同的權重,那么在刪除兩組異常區間后得到的綜合值是最接近真實值的,刪除兩組數據后得到的平均值:

在評估者對評價指標進行評估時,由于評估者本身和評價對象含有的各種不確定性因素,文中采用集值統計法對指標給出一個區間估計,并針對這些區間出現的異常區間,對這些區間進行處理,處理后發現評價結果的可信性更高,更能反映評估者的真實意圖,使評價結果更符合實際情況。通過舉例分析,發現當兩個方案在均值相同的情況下,并不一定是出現異常區間的方案更差。但值得注意的是,對異常區間的處理過程還比較繁瑣,找出一種更簡潔的方法將是筆者進一步的研究方向。
[1]宗金峰,趙淑芹.引入集值統計改進德爾菲法中數據處理過程[J].統計與決策,1997,13(3):10-11.ZONG Jin-feng,ZHAO Shu-qin.Introducing set-valued statistics modified delphi method in the process of data processing[J].Statistics and Decision,1997,13(3):10-11.(in Chinese)
[2]汪培莊.模糊集與模糊集落影[M].北京:北京師范大學出版社,1985.
[3]刑云磊,張喜.基于集值統計的大型客運站風險評價研究[J].鐵路計算機應用,2009,19(1):5-6.XING Yun-lei,ZHANG Xi.Study on risk assessment of large passenger station based on set-valued statistical method[J].Railay Computer Application,2009,19(1):5-6.(in Chinese)
[4]陳斯,陳崗.基于集值統計的項目融資技術方案評價[J].科技與市場,2009,9(16):64-66.CHEN Si,CHEN Gang.The evaluation of technical scheme of project financing based on set-valued statistics[J].Technology and Marked,2009,9(16):64-66.(in Chinese)
[5]羅曉芳.基于集值統計的模糊綜合評判及其應用[J].數學的實踐與認識,2005,35(9):42-44.LUO Xiao-fang.Fuzzy synthetic evaluation based on set-valued statistics and its application[J].Mathematic in Practice and Theory,2005,35(9):42-44.(in Chinese)
[6]廖文來,何金平.集值統計法在大壩安全巡查量化分析上的應用[J].人民長江,2005,36(4):68-71.LIAO Wen-lai,HE Jin-ping.Set-valued statistics in the quantitative analysis of dam safety patrol[J].Yangtze River,2005,36(4):68-71.(in Chinese)
[7]孫九春,史家均.加權集值統計理論和重心決策理論在橋梁評估中的應用[J].橋梁工程,2001(4):21-22.SUN Jiu-chun,SHI Jia-jun.Weighted set-valued statistics theory and center of gravity decision theory in the evaluation of bridge[J].Bridge Construction,2001(4):21-22.(in Chinese)
[8]鐘小偉,傅鴻源.基于集值統計的綜合評價模型及方法[J].統計理論與方法,2012,27(4):88-90.ZHONG Xiao-wei,FU Hong-yuan.Interval comprehensive evaluation and its application based on set-valued statistics[J].Staticstics Information Forum,2012,27(4):88-90.(in Chinese)
[9]陳驥.基于集值統計的科研項目立項評審方法及其應用[J].科技進步與對策,2011,28(19):29-31.WANG Wei.Research on the synthetic evaluation method grounded on mass statistics to define the profit sharing rate of patent assets[J].Science and Technology Management Research,2011,28(19):29-31.(in Chinese)
[10]王煒.基于集值統計的專利資產利潤分成率綜合評價法研究[J].科技管理研究,2011(11):34-36.CHEN Ji.The evaluation method of research project based on set statistics and its application[J].Science Technology Progress and Policy,2011(11):34-36.(in Chinese)
[11]陳驥.基于集值統計的科研項目立項評審方法及應用[J].科技進步與對策,2011,28(19):29-31.CHEN Ji.The evaluation method of research project based on set statistics and its application[J].Science Technology Progress and Policy,2011,28(19):29-31.(in Chinese)