付 鈺
教師是影響學生綜合發展的關鍵因素。一項覆蓋了800多項元分析的綜合報告對影響學生學業成就的相關因素進行了排序,結果發現,排名前20位的影響因素中,教師及與教師密切相關的課程教學因素共占據了15項。(李勉 等,2020)因此,如何提高教師因素的正面效應成為教育教學體系亟須研究探討并解決的難題。教學質量的提高需要教師自我約束、自我發展,但教師教育質量評價手段同樣是教育管理、教師教學質量監測與保障機制不可或缺的重要方面。目前,各個高校的教師評價體系未形成科學、統一的標準,評價指標及權重分配也不盡相同。現行的教師教育質量評價形式主要分為以下幾種:學生評教、督導評教、教師互評、教師自評;評價方法通常采用分項評分,即把教學質量量化成若干個子類別(教學態度、教學目標、教學方法等),并對每個子類別分別做出評價;評價內容包含教師的教學行為、教學過程、教學結果,從多維度收集與反饋信息,兼顧評價的多樣性和全面性。
教學評價的結果與教師經驗的總結、教學內容的更新、教學方案的改進、教學環節的完善反應直接相關,如果評價不科學、不合理,不僅不能對教學起到推進的作用,而且還可能偏離預先設定的目標。制定科學的評價標準和評價方式,有助于提高教學評價的可靠性和有效性,為各個高校推動教學大綱落實、促進教學改革等提供有效信息反饋。(許宏 等,2021)教學質量的評價標準及指標是動態的,考評的計算方法也應不斷改進,以防一成不變的評價體系制約教師的進一步發展。模糊綜合評價法是“在多級估量法上發展起來的一種綜合評分法”,“實現了用‘亦此亦彼’的模糊評價來確定各因素的隸屬規律,用[0, 1]中的連續值取代了二值邏輯或多值邏輯,使評分者能根據自己的印象選擇最合適的隸屬度,充分表達自己對評判對象的印象”(陳希鎮 等,1993)。本文著眼于現有教學質量評價體系的動態性、主觀性和模糊性特點,主張運用模糊綜合評價法對評價標準和評價指標進行量化處理,構建教師教學質量模糊評價的數學模型,提供科學評價、有效評價的新路徑。
全方位的考核方式優于自下而上(學生評定教師)或自上而下(上級評定教師)的傳統縱向方法,但在實際操作過程中仍包含了較強的主觀性和模糊性,難以保證評價的信度及效度。它存在以下幾方面的問題。
第一,等級描述語比較含混。在評價量表中,教學質量被分解為幾個不同的維度,每個維度下都有反映教師表現的不同考評因子,對應完成質量高低的不同等級水平,每個考評因子所屬的各個等級水平應有表現的描述語,施評者按照教師表現與描述語的匹配程度勾選評價或打分,最終取各維度評價的總值或均值作為最終結果。(許宏 等,2021)但在實際操作過程中發現,多層級描述語之間的界限較難區分。以浙江越秀外國語學院教學質量量化標準為例,各個教學環節的評價等級都分為A、B、C、D4檔,教學目標一項,知識目標和能力目標的A級標準均為“目標明確可測,體現課程教學的特點,并使學生清楚明了”,C級標準均為“目標較明確,能使學生有所了解”,實際上我們很難說清楚“目標明確可測”和“目標較明確”究竟如何界定;教學態度這項,A級標準為“熱愛教育事業,立德樹人,為人師表,尊重學生,從嚴治學,責任心強”,C級標準為“熱愛教育事業,為人師表,尊重學生,責任性較強”,從A到C跨越2個等級,但是我們卻很難明確指出二者的差別;況且B、D級標準均未做出具體描述,削弱了量化評分標準的指導作用和實用功能。標準模糊會加大評價誤差,影響教育教學評價的準確性。
第二,評價結果不易解釋與反饋。評價維度有限,可能會出現多個考評因子合并評判的情況。教師往往會得到一個對其教育評價的綜合評級,即使等級相同或得分相同也可能代表不同的意義,教師很難從評價結果上直觀判斷出自身在某一教學環節上的問題,不利于教師素養的進一步提升。例如越秀評價標準中的“教學準備”一項,包含教學大綱、教學計劃、教材、教案、備課、課件多個內容,教師無法從這一項的綜合評分上獲知究竟需要改進哪些方面,進而影響教育評價的反饋和教學效果。
第三,核算方法過于簡單。教師的教學質量終評是融合了學生、督導、教師、自身等的多元評價結論,學校往往采用簡單的加權算法將各個信息源的各個維度評價都匯總起來計算成一個結果,并劃分教師的評定等級,這是一項工作量較大的復雜任務,需要方便、科學的計算手段予以輔佐。
總之,現行教學質量評價機制缺乏客觀性,等級標準比較原則化,權重設置及核算方式偏向于使用傳統手段,有必要更新成更加科學、合理的評價方法,提高評價的總體信度,以推動教育教學的發展。
許宏、付鈺(2021)指出,模糊綜合評價法是一種常見的基于模糊數學的綜合評價方法,以“模糊集合”與“隸屬度函數”2個概念為核心。“模糊集合”將評價指標與評價等級轉化為“從0到1的不同程度的相對判定”(李金波,2010)。“隸屬度函數”用于描述模糊集合,根據隸屬度理論把定性評價在形式上轉化為定量評價,將不確定性轉化為確定性,“對受到多個因素制約的事物或對象做出一個總的評價”,“由于從多方面對事物進行評價難免帶有模糊性和主觀性,采用模糊數學的方法進行綜合評判將使結果盡量客觀從而取得更好的實際效果”(張鐵男 等,2002)。教師教育質量評價系統涉及的評價指標多,指標的層次結構多,符合應用模糊綜合評價法的條件,適宜創建模糊綜合評價模型。
本文以浙江越秀外國語學院的教學質量考評情況為例,分析現行的多能力評價構念,結合模糊綜合評價法的基本原理,通過組合、重置本校使用的教學環節觀測點,創建了以下性能優良、實踐性較強的評價模型。
“評價因素”指學生、督導、教師等評價主體對某一教師進行教學質量評價時需要考慮的因素。本文設立的評價因素集由2個層次的集合組成:一級指標因素集U={U1, U2, U3, U4, U5}={教學準備,教學內容,教學方法,教學表現,教學效果};二級指標因素集U1 ={U11, U12, U13}={教學態度,教學目標,授課材料},U2 ={U21, U22, U23,U24}={思想性,科學性,先進性,有效性},U3 ={U31, U32, U33, U34}={多樣性,因材施教,技術現代性,課堂組織},U4 ={U41, U42}={教態,語言},U5 ={U51, U52, U53, U54, U55}={課堂提問正確率,基本訓練落實,輔導答疑,批改作業,教學活動參與度}。
評教前,施評者應充分熟識各級指標的特征及能力要求。教學準備層面考察教師的責任心、對教育事業的熱心、立德樹人的態度,課前對學生知識目標和能力目標的確立,教材、教案、課件等授課材料的準備情況;教學內容層面主要考慮其是否對學生有一定的思想教育和素質培養,講授內容是否正確、科學,闡述是否準確,知識內容是否反映前沿水平,是否及時更新知識與技能,是否有效傳遞了知識和技能,使學生在此方面有所提高;教學方法層面旨在評判教學的方式和方法是否靈活多樣,能否根據不同學生的特點有針對性地施教,是否利用現代化的多媒體教育技術,課堂組織是否緊湊、生動,教學互動及課堂氛圍是否活躍;教學表現層面注重觀察教師的衣著是否得體、形象是否端正、儀態是否大方,語言表達是否清晰明了,富有邏輯性;教學效果層面關注學生在課堂上回答教師提問的正確率,教師對學生的基本訓練落實情況,課后輔導答疑及批改作業的認真、及時程度,教師在過程性考核和終結性考核上的設計是否合理,學生的作業任務提交是否及時有效,配合度如何。
“評價等級”指教師在每個指標下的質量評價高低。本文采用序化等級標準,將評價等級集確定為V={V1, V2, V3, V4}={優秀,良好,合格,不合格}。
權重集基于U建立,權重系數A=(0.25, 0.25, 0.2, 0.1, 0.2),子權重集同樣根據子評價因素集確定權重系數,分別為A1=(0.4, 0.3, 0.3),A2=(0.25, 0.25, 0.25, 0.25),A3=(0.2, 0.2, 0.2, 0.4),A4=(0.5, 0.5),A5=(0.25, 0.35, 0.15, 0.15, 0.1)。權重系數代表各個評價因素的受重視程度,系數越大,所分配的權重越大,評價結果對其的依賴性越高。

計算公式為B=A·R=A·(A1·R1,A2·R2,A3·R3,A4·R4,A5·R5)T=A·(B1,B2,B3,B4,B5)T,利用矩陣點乘方法將A轉換為教師的綜合表現在V上的模糊集合,B1、B2、B3、B4、B5分別表示“教學準備”“教學內容”“教學方法”“教學表現”“教學效果”評價因素的低級層次模糊評價,這5個結果組成模糊評價矩陣R,完成高級層次模糊評價B。符號“·”表示廣義的合成運算,模糊合成算子運用加權平均模型計算,并對結果做歸一化處理,根據最大隸屬度原則,B取集合內最大值,由此得出教師教育質量評價的級別,若進一步計算最終評分,則可按照百分制原則給“優秀”“良好”“合格”“不合格”4個評價等級賦值為VT=(90,75,60,45),并根據Y=B·VT完成最后的計算,獲得終評分數。(楊綸標 等,2011;張國立 等,2011;蔣澤軍,2015)
本文設定的教師教育質量模糊評價模型沿用學生、督導、教師、受評教師自身這4類主體共同評價一位教師的教評機制,學生、督導、教師主體的參與人數可為若干名。該評價模型既可容納每一位參評人員,采用全體樣本統計的辦法,又可隨機選取部分參評人員的數據,采用部分樣本統計的辦法。為便于計算,本模型采取隨機抽樣的方法,抽選學生5名、督導2名、教師2名及受評教師本人共10名,共同組成評價團體,對同一位教師的教育質量進行評估。每一位參與者針對每一項二級指標的評價等級結果都記1/10,即0.1,如針對一級指標“教學準備”中的二級指標“教學態度”一項,10位參評者內有5名做出“優秀”的判定,3名做出“良好”的判定,2名做出“合格”的判定,無人做出“不合格”的判定,那么此項指標的行向量為(5/10,3/10,2/10,0),即(0.5,0.3,0.2,0),其他指標同理可得。為了進一步說明模糊評價模型在教師教育質量評價系統中的應用過程,本文假設10位參評者對某一教師的教學質量做出以下判斷,見表1。

研究發現,教師教育質量評價系統運用模糊綜合評價法,構建模糊評價模型具有以下優點。第一,評價信度較高。已有評價系統多采用簡單的加權統計方法,評價誤差較大,模糊評價模型利用模糊合成的原理降低極端個評對總評的影響,從而減小隨機誤差。原則上,教師之間具有同行的導向與參照關系,且彼此工作內容相近,教研與科研狀況比較了解,教師互評結果應更具說服力,但同事間相互評價易因個人情感、利益沖突、競爭關系等因素出現評價兩極化等不實情況。模糊評價不可見最終得分,因而能在一定程度上避免教師自動調控給他人的評分,減輕人為因素的干擾,提高教學評價信度。第二,可操作性較強。評價原始數據以向量的形式出現,評價過程表現為模糊評價矩陣,施評者即便提供的是順序型數據,而非數值型數據,也還是能通過模糊合成運算獲得精確的總評分數,精準觀測教師之間的能力差距,且能夠將之進行單項比較,便于學校的相關教學管理。第三,評價主體較為靈活。模糊評價模型可根據要求及需求更改實際參評的人員與人數,也可隨時追加評價主體,便于加入領導評教、教研組評教等多個維度。第四,權重分配自由。模糊評價模型下的權重分配可多層次、多樣化。教師教育質量評價的觀察點及側重點不同,理應分配不同的權重加以評判。模糊評價方法不僅能給一級評價指標加權,還能給其內部的二級評價指標加權,使評教結果更具準確性。第五,模糊評價有助于減輕教學督導參評時的心理壓力。督導往往對學校的發展理念,以及教師各方面的優劣勢有總體認識,因而能夠較為客觀地分析教師的教學行為,督導在實施評教時給出“優秀、良好、合格、不合格”的序化等級,而無須糾結于具體的得分數字,減輕了施評壓力,方便對被考核教師做出全面、公正、客觀的評判,實行有效的教學效果調控與管理。
同時,該教學評價模型還存在明顯的弊端。學生、督導、教師、自身等評價主體都處于同等地位,即在教師的終評中所占的評價比例相同,對教師終評的影響力相同,無法同簡單加權算法一樣自由切換這幾個評價主體在總評價中所占的百分比;評價指標及其權重體系的確定包含了一定的主觀性,評價指標考慮得不全面、權重系數制定得不合理會影響評價的科學性;評價指標的權重系數在0到1之間,給評價等級集V賦值時,“優秀”和“不合格”的數值決定了兩極情況下(所有施評者給某一教師在所有指標上都評“優秀”或“不合格”)教師能得到的最高或最低評分,該閾值體現了教學質量評分被允許的范圍,因而模糊合成運算提供的分數在理論上排除了大于最高評分或小于最低評分的部分。
科學、合理的教師教學質量評價方法能推動教育教學的發展。本文基于現有教師教育質量評價體系中存在的問題,以浙江越秀外國語學院教學質量評價標準為例提出模糊評價新路徑,主張對評價標準進行量化處理,構建教學質量評價的模糊數學模型。科學的教學質量核算方法應堅持貫徹客觀性、動態性等特點。模糊評價模型將主觀評價客觀化、將不確定評價因素確定化,它具有評價信度高、可操作性強、評價主體靈活、權重分配自由、減輕施評者心理壓力的優勢,能有效地提高教學評價的可靠性和準確性,有助于改變當前教育教學評價構念,將重心從評價結果轉向評價過程及評價反饋上,應予以廣泛使用。