王廣彥,王 薇,董繼國
(1.軍械工程學院六系,石家莊 050005;2,石家莊經(jīng)濟學院 數(shù)理學院,石家莊 050031;3.河北師范大學 數(shù)信學院,石家莊 050016)
基于貝葉斯網(wǎng)絡的高校教師績效評價方法
王廣彥1,王 薇2,董繼國3
(1.軍械工程學院六系,石家莊 050005;2,石家莊經(jīng)濟學院 數(shù)理學院,石家莊 050031;3.河北師范大學 數(shù)信學院,石家莊 050016)
提出了采用基于貝葉斯網(wǎng)絡推理技術(shù)的高校教師績效評價方法。該方法以現(xiàn)有的績效評價指標體系為基礎,結(jié)合貝葉斯網(wǎng)絡中多層隱類模型的構(gòu)建原理,將評價指標體系中的各項指標轉(zhuǎn)化為貝葉斯網(wǎng)絡中的結(jié)點,并根據(jù)各級評價指標之間的邏輯關(guān)系將其轉(zhuǎn)化為貝葉斯網(wǎng)絡中的聯(lián)接強度,可得到用于教師績效評價的貝葉斯網(wǎng)絡;將各項指標的評價分值作為證據(jù)輸入到貝葉斯網(wǎng)絡中,便能以概率形式評定參評教師的績效水平。最后分析了教師績效評價貝葉斯網(wǎng)絡的四種典型應用模式。
貝葉斯網(wǎng)絡;績效評價;指標體系;多層隱類模型
目前在高校教師績效評價工作中經(jīng)常采用加權(quán)平均法這一定量評價方法,盡管該方法具有操作簡便、評價結(jié)果客觀等優(yōu)點,但針對一位具體的參評教師,該方法只能給出一個最終評價分數(shù),根據(jù)該分數(shù)只能確定該教師在本單位所有參評教師中的大概排名,但卻無法評定該教師績效水平在相應領域中的整體層次。本文采用貝葉斯網(wǎng)絡推理技術(shù)用于高校教師績效評價,根據(jù)該方法可評定參評教師在相應領域中的整體水平層次,避免績效評價結(jié)果在相應整體領域中缺乏可比性的問題。
根據(jù)貝葉斯網(wǎng)絡推理的基本原理,可將教師績效評價問題映射為一個多因素的推理分析問題,即建立用于教師績效評價的貝葉斯網(wǎng)絡。首先將教師績效評價指標體系中的各級評價指標都轉(zhuǎn)化為貝葉斯網(wǎng)絡中的結(jié)點,然后建立起所有結(jié)點之間的因果關(guān)系(以條件概率P(Xi|ΠXi)形式進行描述),這樣教師績效評價問題就轉(zhuǎn)化為一個貝葉斯網(wǎng)絡信念更新問題,即求解Bel(x)=P(x|e),其中e對應葉結(jié)點,即最低級績效評價指標的實際得分;而x對應根結(jié)點,即參評教師的最終績效水平分數(shù),其通過貝葉斯網(wǎng)絡自動推理獲得。從貝葉斯網(wǎng)絡推理過程來看,它與目前加權(quán)平均績效評價法在思路上是一致的,都是根據(jù)最底層可觀測的評價指標來評價參評教師的最終績效水平,因此在加權(quán)平均績效評價法基礎上,可以方便地得到用于教師績效評價的貝葉斯網(wǎng)絡。
用于教師績效評價的貝葉斯網(wǎng)絡屬于貝葉斯網(wǎng)絡中的多層隱類模型(hierarchical latent class model),簡稱 HLC模型,其特點是:
(1)網(wǎng)絡結(jié)構(gòu)是一棵非平凡有根樹,其根結(jié)點至少有兩個子結(jié)點;
(2)所有葉結(jié)點代表的都是顯變量,即可以直接觀測的變量,如發(fā)表論文的數(shù)量;
(3)所有內(nèi)結(jié)點代表的都是隱變量,即不能夠被直接觀測,但可通過分析獲得的變量,如科研能力。
圖1給出了一個HLC模型示意圖。其中灰色結(jié)點代表隱變量,白色結(jié)點代表顯變量,在HLC模型中表現(xiàn)為葉結(jié)點。
這種HLC模型在形式上與教師績效評價指標體系是非常類似的,教師績效評價指標體系通常分為三級,如圖2所示,該績效評價指標體系重點評價教師在教學和科研方面的績效水平。這種逐層分解細化的績效評價指標體系在結(jié)構(gòu)上與HLC模型是一致的,結(jié)合該教師績效評價指標體系,可對圖2所示HLC模型做如下理解:其中“根結(jié)點X”對應“第零級指標:教師最終績效評價水平”,“子結(jié)點Xi”對應“第一級評價指標(教學評價與科研評價)”,“子結(jié)點Xi,j”對應“第二級評價指標(如教學效果、科研成果等指標)”,“葉結(jié)點Xi,j,k”對應“第三級指標(如語言表達、發(fā)表高水平論文等指標)”。實際上HLC模型是教師績效評價指標體系在拓撲結(jié)構(gòu)上的另一種描述形式。
針對圖2所示的高校教師績效評價指標體系,從HLC模型角度來看,其中第三級評價指標為顯變量,這些指標可根據(jù)參評教師提供的詳細資料直接獲得;第零級、第一級和第二級指標都為隱變量,這些指標都不能直接觀測獲得,需要在下一級指標支撐下分析獲得。


用于教師績效評價的貝葉斯網(wǎng)絡的構(gòu)建基礎是已有的績效評價指標體系,在此基礎上重點需要研究各級評價指標如何向貝葉斯網(wǎng)絡結(jié)點轉(zhuǎn)化,以及各級評價指標之間的聯(lián)接強度如何確定。
貝葉斯網(wǎng)絡中的結(jié)點由若干種狀態(tài)組成,因此對于相應的績效評價指標,也需要劃分為若干等級。在三級績效評價指標體系中,第三級評價指標一般都是可以量化的指標,而第零級、第一級、第二級指標一般都是定性的指標,這些定性指標在績效評價過程中一般不做評價,只是通過第三級可量化的指標來體現(xiàn)。
對于第零級、第一級、第二級等定性評價指標,可根據(jù)績效水平高低將其分為若干等級,如對于科研成果評價指標,可將其對應的結(jié)點劃分為五個等級:(1)國際領先水平;(2)國內(nèi)領先水平;(3)中等水平;(4)一般水平;(5)較差水平。至于每項績效評價指標劃分為幾種等級,可根據(jù)績效評價工作習慣確定,一般情況下,可將各指標劃分為優(yōu)秀、良好、中等、較差四個等級。
而對于第三級可以量化的指標在加權(quán)平均法中一般是不需要進行等級劃分的,但在用于績效評價的貝葉斯網(wǎng)絡中,需要將這些可量化的指標也劃分為若干等級,這些等級也是定性的,這是一個由定量指標向定性指標轉(zhuǎn)化的過程。如將發(fā)表高水平論文指標分為優(yōu)秀、良好、中等、較差四個等級,這些等級分別對應一定的高水平論文數(shù)量,如發(fā)表論文數(shù)量在10篇以上定為優(yōu)秀,8篇至10篇定為良好,4篇至8篇定為中等,4篇以下定為較差。
由于這些指標等級是根據(jù)教師績效評價中的一般評價習慣來確定的,通過評價可將某位教師在各級評價指標上的等級水平體現(xiàn)出來,便于教師充分認識本人在業(yè)內(nèi)的總體水平。


表1 科研成果與發(fā)表論文之間的條件概率表
如確定績效評價指標結(jié)點“科研成果”和下一級績效評價指標結(jié)點“發(fā)表高水平論文”之間的條件概率表,如表1所示,即確定 P(發(fā)表高水平論文=“等級 j”|科研成果=“等級 i”)。
對于條件概率表(表1)可這樣理解,科研成果績效評價等級越高,其發(fā)表論文為優(yōu)秀的可能性就越高,這種可能性高低體現(xiàn)在條件概率上,這與人們的推理邏輯是一致的。很顯然,某人若科研成果處于“(1)國際領先水平”,他發(fā)表論文為優(yōu)秀的可能性就越高,在表1中確定為0.7。這種條件概率既考慮到了一般情況,同時也沒有排除特殊情況,某人若科研成果處于“1.國際領先水平”,但無暇發(fā)表高水平論文,他發(fā)表論文的指標也有可能被評價為較差,在表1中確定為0.05這一較小的條件概率。
HLC模型中的根結(jié)點 (教師最終績效評價水平指標)是對其他下一級結(jié)點進行推理的起點,因此對于根結(jié)點不存在更高級別的原因事件。此時只需要確定根結(jié)點各等級的先驗概率分布,即隨機抽取一位教師,其處于優(yōu)秀、良好、中等、較差各等級的分布列。可采用抽樣調(diào)查的方式獲得該分布列,即調(diào)查某單位所有教師績效水平,統(tǒng)計處于各等級的教師數(shù)量,各等級教師數(shù)量的比例即為根結(jié)點初始概率分布。

各評價指標之間的條件概率表體現(xiàn)了它們之間的推理關(guān)系。當然條件概率表反映的是最基礎的推理關(guān)系,各個條件概率表組合在一起構(gòu)成網(wǎng)絡時,當觀測證據(jù)e(評價指標具體分數(shù))到來時,整個貝葉斯網(wǎng)絡的信念得到更新,可獲得隱變量處于各等級的概率,即Bel(x)=P(x|e),實現(xiàn)所有評價指標的自動綜合推理。
結(jié)合圖3所示的高校教師績效評價指標體系,將各級績效評價指標劃分為若干等級,然后轉(zhuǎn)化為貝葉斯網(wǎng)絡中的推理結(jié)點,再采用條件概率表方式建立各級評價指標之間的推理關(guān)系,便得到了一個可用于教師績效評價工作的貝葉斯網(wǎng)絡,基本結(jié)構(gòu)如圖1所示。本節(jié)重點研究利用該網(wǎng)絡開展教師績效評價工作的幾種模式,如圖3所示。
如圖3(a)所示,該模式針對某位參評教師,首先對其需要評價的所有第三級指標進行評價,根據(jù)參評教師實際業(yè)績確定各項第三級指標的評價等級;評價完畢后,這些第三級評價指標所確定的等級即成為觀測證據(jù)e,將其輸入到貝葉斯網(wǎng)絡中,便可得到該參評教師第零級、第一級、第二級評價指標上的績效水平,該績效水平是以概率形式給出的,即針對某指標,貝葉斯網(wǎng)絡將給出該教師處于各等級的概率,便于參評教師確定本人績效水平的總體層次。
這種績效評價模式是一種正向推理模式,即根據(jù)可測的評價指標,通過推理獲得其他不可直接測量的評價指標水平。這種評價模式是績效評價工作中的主體模式。
如圖3(b)所示,教師績效評價工作若只根據(jù)第三級指標進行評價,對少數(shù)教師有可能會造成一定程度的誤評。如某位有較高造詣的教師長期忙于探索一些艱深的課題,在短時間內(nèi)無暇撰寫論文,會導致其發(fā)表論文這一指標處于較差的等級,但其高水平的科研能力卻是公認的。在這種情況下可采用貝葉斯網(wǎng)絡中的d割斷這一特性,摒棄第三級評價指標,而從其上一級評價指標(如第二級評價指標)直接進行評價。
在這種模式下,第三級評價指標的具體評價等級,對最終的第零級評價指標將不再起作用。這種評價模式對于少數(shù)教師適用。
如圖3(c)所示,教師績效評價指標體系是針對多數(shù)教師建立的,可能對部分教師不適用,如某些年輕教師工作時間短,未曾獨立擔任過課題研究工作,若嚴格在該指標上評價其等級,很容易被評定為較差等級,這存在一定的不合理性。在這種情況下,不評價教師的該指標應是更合理的。
在貝葉斯網(wǎng)絡推理過程中,允許存在部分證據(jù)缺乏的情況,網(wǎng)絡在信息不完全的情況下依然可對教師的第零級評價指標進行計算。
如圖3(d)所示,針對參評教師的某一評價指標,一般采用確定性方法評定教師所處等級,即參評教師只能處于優(yōu)秀、良好、中等、較差四個等級中的某一個。但這樣做也可能存在一定的武斷性,如某位教師發(fā)表論文數(shù)量為8篇,根據(jù)評定原則應定為良好,若其再多發(fā)表1篇,則可評定為優(yōu)秀,這顯然也有失公允。為避免這種尷尬局面,可采用不確定性等級評定方式,如可將該教師評定為優(yōu)秀的概率確定為20%,評定為良好的概率確定為80%,這也可作為證據(jù)e輸入到貝葉斯網(wǎng)絡中進行推理,可在一定程度上解決績效評價中等級確定的模糊性問題。
本文將貝葉斯網(wǎng)絡技術(shù)用于高校教師績效評價工作,是對加權(quán)平均評價法的一種改進。該評價方法基于智能推理技術(shù),在績效評價指標體系基礎上,結(jié)合各級評價指標之間的內(nèi)在聯(lián)系,以概率形式評定出參評教師的績效水平,便于教師績效水平在整個高教領域中進行橫向比較。并且這種方法應用靈活,可在多種評價模式下處理績效評價過程中出現(xiàn)的一些特殊問題,具有較好的應用前景。
[1]譚躍進,陳英武,易進先.系統(tǒng)工程原理[M].長沙:國防科技大學出版社,1999.
[2]王姝,韋增欣.如何對教師進行有效的績效管理[J].高校改革,2006,(6).
[3]王廣彥,馬志軍,胡起偉.基于貝葉斯網(wǎng)絡的故障樹分析[J].系統(tǒng)工程理論與實踐,2004,(6).
[4]張連文,郭海鵬.貝葉斯網(wǎng)引論[M].北京:科學出版社,2006.
[5]任中普,蔡淑琴,劉飚.高職高專教師評價指標體系研究[J].科研管理,2006,(6).
(責任編輯/易永生)
G451.1
A
1002-6487(2010)18-0160-03
河北省教育科學研究“十一五”規(guī)劃課題(06020183)