吳 星
(重慶理工大學 人事處,重慶 400054)
?
高校學生評教方法的固有限制、不當運用及其改進探析
吳星
(重慶理工大學 人事處,重慶400054)
摘要:學生評教是高校普遍采用的教學質量監控手段。研究認為,當前學生評教方法存在異質性與內生性偏誤問題,指標體系涵蓋范圍問題,指標體系的科學性問題,評教過程的不可控制性問題,認知黑箱、信息不對稱與逆向選擇問題;評價方法存在固有限制,但是更為根本的問題是對評測結果的不適當運用和解讀,包括教學質量排名、教學排名與獎懲簡單掛鉤、漠視教師在學生評教問題上的話語權等,帶來了分數膨脹與評教結果雙重膨脹、人才培養標準下降和師生關系異化、教師隊伍的劣幣驅逐良幣等諸多負面后果。可以從改進評測指標體系、優化評測過程、調整評測結果運用和解讀的導向等角度予以改進。
關鍵詞:學生評教;內生性問題;認知限制;信息不對稱;分數膨脹
培養高素質人才是高等教育的根本任務?!秶抑虚L期教育改革和發展規劃綱要(2010—2020年)》規定,提高質量是高等學校改革發展的核心任務。為提高教育質量,構建教學質量監評體系,目前全國高校大多已經建立了教學質量評估制度,其中,學生評教是運用最為廣泛的一種舉措。
高校學生評價教師的教學質量簡稱為學生評教,通常是由學校組織學生對任課教師的教學態度、教學方法和教學效果等進行打分評估,并在定量或定性分析學生評價數據和意見的基礎上,由學校相關部門向教師反饋評價結果,以督促教師不斷提高教學水平和教學效果,并以此作為教師聘任、考核、獎懲的基本依據。學生評教制度在實際運用中多有爭議,圍繞評教方法的科學性、有效性及評教結果運用的合理性等方面,學術界展開了諸多討論和研究。
本研究梳理了評教方法所固有的一些限制,以及高校對于評教結果中的若干不當運用和解讀,提出了改進建議。
一、評教方法自身存在的固有限制
從認識論和方法論的角度來說,學生評教與教學質量之間并無必然的對應關系,學生評教通常是依據一定的指標體系來描述教師的授課行為及其質量,然而教師的授課質量不等同于教學質量、更不等同于學生的評教分數。這是因為,量化、指標化的學生評教存在其固有的先天限制。
(一)評教對象和評教主體的異質性(變異性)與評教結果的內生性問題
作為一種量化的認知活動,內生性問題的考慮是數據解釋和運用的科學性的前提。然而,因為對社會生活和社會科學研究中的內生性問題認識不夠或處理不夠,使得學生評教結果必然地具有信度和效度不高的問題,當這些評教結果被運用于教師之間或課堂之間的比較、排序的時候,其誤差會被進一步放大。
內生性問題原本是計量經濟學中的一個重要概念,現已成為社會科學量化研究的重要核心議題,但是在經濟學之外的其他社會科學研究領域還沒有對其引起足夠的重視。內生性問題是指因為某些因素不能被控制或被忽略,使得不同的變量或事物不具有可比性的問題。通常來說,人們所比較的那些顯性變量之間的差異,其實部分上有可能是被忽略、未能被觀察到的影響這些顯性變量的潛在變量的差異,這種可能引起那些待比較變量的變量又被稱為混雜變量。因此,為使得不同的數據、變量、事物具有可比性,必須假定其他的變量(混雜因素)都相同或通過計量的方式能被控制。在計量經濟學中,通常采取增設控制變量或使用工具變量、傾向值匹配、變量差分等方法來消除混雜因素的影響。
就教學評價而言,通常來說,學生的年紀、性別,課程的類別、難度,課業負擔,上課時間安排,學生對專業的認同度、滿意度,班級規模大小,教師的年齡、性別、職稱、行政職務、個性特征,學生學習能力,學生自身的個性特征等因素具有較大的變異性(異質性),都會對評教結果產生影響,使得不同的課程評教結果失真以至于不具有可比性。在實際的評教指標體系中,要考慮或設置諸多可能會影響評教結果的控制變量是不可能的,因此,在對評教結果的解讀和運用中如果缺乏內生性問題的視角,則必然放大既有的測量誤差。事實上,因為缺乏受控條件下的邏輯思維,評教指標中難以設置或未曾意識到要設置諸多控制變量,必然產生忽略變量偏誤,進而導致內生性偏差,使得學生評教結果完全不具有可比性。密執安大學生物統計學教授約翰遜發現了評教活動中并不具有如學生選課決定不受他們可能遇到的評分標準的影響、大學里沒有約束的評分在不同班級、不同院系、不同學校有一致的和客觀的意義等實際情況[1]。
評教結果的內生性問題,從本質上看,有兩個來源。其一是高等學校對學生評教結果的排序運用,即以教師個人作為分析、評估教學質量的單位,用單一的學生評教數據來進行排序,進而在相對的比較意義上研判教師的教學質量。這種試圖用排序的方式來評估教師的教學質量,使得評教中的內生性問題被凸顯出來,而且難以解決。因為忽視這種內生性問題,使得本來不具有可比性的教學排名變成了教師教學質量的代名詞,而評教得分對評估教學質量所具有的參考意義完全被忽略。因此,從內生性的角度很容易發現,線性的評教方式最大的問題在于其識別性不高,一方面是它無法識別那些因混雜因素影響而被高估或低估的教學質量評價結果,另一方面是當同一位教師在不同的年級或專業甚至時段講授同一門課程所得到的分數懸殊以至于無法用于對教學質量的識別。
高校教師教學質量評估事實上是一個多因素的模糊非線性問題,因為對教學質量產生影響的眾多因素既難以被考量并被控制,又很難用恰當的數學模型來測量。著名統計學家、美國國家科學院院士謝宇認為變異性是人類社會的本質屬性,采用受控比較邏輯,通過社會分組和情景分組,擴大組間(如需要進行評測比較的教師、不同的課堂、課程等指標變量)的變異性,排除混雜因素以趨近于事物本質,使得不同的變量或事物(教師、課堂或課程)之間具有可比性,而這些分組變量即是評測教育教學質量中被控制住的混雜因素[2]。
(二)評教指標體系的涵蓋范圍與使用范圍問題
當前大多數高校的評教指標體系都是針對課堂教學環節設計的,其合理性在于課堂教學內容對于學生來說是一個顯性的場域,便于學生做出評判。但從教學作為一個系統工程來看,課堂教學環節的評教指標體系顯然不能指代、反饋全部的教學活動,使得教學評價內容過于狹窄,以至于對教學質量的評判難免以偏概全,結果失真。
當前高校評教指標體系是以教學過程中的顯性化環節為基礎設計的,先天地只能運用在課堂教學環節,無法對課堂教學之外的教學內容、教學環節與過程做出教學質量評價,比如課程教學內容體系的設計,教學內容的選用、編排與組織、難易度的選擇、知識范圍的選擇,試卷的命制與批改,成績的考核和評定,實訓與實習,學年論文與畢業論文,課外答疑,各種競賽與課外學習指導,育人指導等行為的多寡及其質量。雖然課堂教學在各教學環節中處于核心地位,但是教師教學是一個綜合系統的工程,對教師教學質量的評價應該是對其參與的所有教學工作內容的評價。各個教學環節完成的質量決定了教學活動的整體質量,這些未能被評教指標體系所反映的教學環節的質量同樣應該是教學質量的應有之義。因此,基于課堂教學環節得出的評教數據對于教師教學質量的評價只具有部分參考意義。
(三)認知限制與評教過程的不可控制性
評教指標、評教對象和評教主體是評教方法的主要組成部分。除了評教指標和評教對象的非確定性、不可控制性之外,評教過程與評教主體也存在諸多的認知限制和不可控因素,對評價結果的有效性、可信度帶來影響。
評價是一種社會心理認知活動,而人的認知活動大多是受特定情景的限制,情境性認知問題主要是心理學中的各種認知效應陷阱,包括暈輪效應、首因效應、近因效應、框架效應、戒備心理、應付心理、報復心理、刻板印象、從眾心理等等,這些認知陷阱不可避免地會對學生的教學評價帶來選擇性觀察、記憶的難題。學生帶著自己看待世界的方式、態度和情感有意識地過濾外部世界的信息,主觀的、能動地對評教指標體系進行自我解讀,不僅使得學生與外部世界——教師的教學活動之間的關系失真,也使得不同學生之間、學生在不同的課程之間的關系也處于失真的狀態,進而使得每個學生的每次評教活動都具有特別的獨立含義,評教數據具有隨機游走性質,彼此處于不可比較的狀態。由于認知限制和設計上的缺陷,學生在評教中的認知限制未能在評教中得到反饋,如未能通過改進評教問卷設計收集學生在評教時自身看待評教對象所依據的原則、認知活動、情感體驗、自我反思、自我控制與評估等等重要指標和數據信息,無法對學生打分時的心理活動、認知陷阱和隨意性進行評估和約束,以至于對教學質量的評價往往演化成為對教師個人形象、性格,對課程難易度、實用性,對課堂趣味性的評判。
事實上,從更為一般的意義上來說,評教指標體系是對教學質量這一抽象概念的操作化過程,是建立在實證主義哲學認識論的基礎上的,然而,對它的理解都源于以語言圖像論為代表的傳統社會科學。語用學轉向后的當代社會科學則推翻了語言圖像論,指出語詞的意義并不在于它所對應的客觀對象,而在于語詞自身的實踐用法及其相應的生活形式[3]。特別是當評教指標體系中運用的抽象概念越多的時候,這種由學生依據自己的態度、情感和經驗來進行主觀性、情境性的解讀情況就越嚴重。
從學生認知經驗的角度說,認知限制在教學質量的評價中帶來的主要問題是學生對評教活動的認知經驗與可比較框架的選擇運用。學生的評教活動不僅是在絕對意義上來對課堂教學進行評測,同時也是在相對的比較意義上來進行的。學生要經歷多門課程和多位老師,不確切的比較和參照問題無法避免。
教學質量的評價應該是在可比較的參考框架下來展開的,即基于這種框架性的可比較經驗的獲得之后,再用以比較其他需要評價的課堂,從而在相對的意義上獲得評價結果。問題在于,第一,學生所使用的可比較參考框架具有不確定性,不同的學生、不同的時期,對于不同的課堂或教師,所使用或其偏好的比較框架是多元的,使得同一位老師或課堂的教學評價結果實際上是由來源于多個不同的比較框架下的比較結果,呈現出一種不確定的模糊狀態?,F實中,放大比較范圍就可以發現不同年級、專業、課程的學生對同一位教師的評價呈現出多種不同的結果,評教數據具有隨機游走性質。第二,學生缺乏可使用的可比較參考框架和合理的可比較經驗,這一點對于大學新生來說問題尤其嚴重。實際上,教學作為育人活動而非標準化的工業生產工作,具有一定的技藝性質,課程之間差別很大,法無定法,加之不同的評教主體對“教學”“質量”和“教學質量”存在多元而變動的理解,要確定標準的可比較參考框架在事實上是無法實現的。
認知限制的另外一種表達是學生個體對“教學質量”在語義學上的多樣化判斷。雖然一般的教學質量評價指標體系羅列了諸多選項供學生研判,但是毫無疑問,不同的個體對教學質量的定義和認知各不相同,對各指標項的偏好(比如權重)和關注處于離散狀態,從測量的角度看,計量結果必然缺乏效度。
(四) 認知黑箱、信息不對稱與逆向選擇問題
評教活動和評教指標體系多是經驗性的,很少能夠直指教學及教學質量的本來面目。對于教學所應該達成的目標及其方式,學生在事實上是處于被限定的狀態,因為信息的不對稱,造成作為一種認知思維的評教活動處于理性、信息和認知不足的境地,用一位哲學家的話來說就是擰著自己的頭發無法離開地球。例如,學生對于教學內容的創新性,教學內容體系的科學性、有效性、深淺寬窄,教學內容的質量與價值,教學內容與專業培養目標、能力的關聯性,課程的中遠期效果等問題,超出了他們的既有經驗范疇,學生無法做出評判,這一點對于大學基礎課程和大學新生來講尤為突出。一方面,這種認知信息的黑箱其實與學生缺乏對教學質量可比較框架的掌握有關,另一方面,這些需要被科學評測的內容,其實是被教師自己控制構建起來的,教師可以有意識地弱化學生對這些核心問題的關注,而將學生對教學質量的評價的注意力轉移到關于教學質量評測的外圍指標上,如師生關系、課堂氛圍、教師的情緒狀態等,但是這些領域或評價指標只能反饋教學質量的外圍內容,與教學質量高低雖具有相關性但不具有唯一的因果對應關系,因而不能用于識別、體現教學質量本身的高低優劣。
學生對教師教學質量的評價在很大程度上是對教師自身設計好的教學內容、體系、方法的評估,因此得到高水平評價的低質量教學活動是存在的。例如,為了確保教學的順利開展與有效控制,或得到學生更高的評價,教師可能會有意識地降低教學難度或教學要求,降低考試難度,諸如此類的認知黑箱和信息不對稱問題,學生基本上處于無意識狀態,難以對教學質量有真正的理解和把控。結果必然就是,學生自認為得到了高質量的教學服務,而事實上并非如此。而相反的過程也是存在的,高質量的教學活動也會因為信息不對稱而被學生低估。
二、學生評教運用的若干缺陷及其后果
任何一種方法都有其固有的缺陷,但是缺陷本身不是問題,不能認識到方法的缺陷,不加限制地解讀和運用才是問題的根源。因此,真正需要關注的是高等學校的管理者對待學生評教所秉持的價值觀、對評教結果的解讀和運用是否科學合理等方面。目前國內高校在對待學生評教的價值導向和解讀運用上存在有不當之處。
(一)過度強化學生在教學評價中的主體作用和權力利益,缺少對學生責權利對等的教育,使得教師失去對教學的有效掌控
目前,多數高校并未能很好地在學生群體中開展評教教育工作,或是開展了但成效不明顯,學生并不能正確地認識自己在評教活動中的主體身份和與之相對應的權利和責任,造成評教權力的濫用或誤用。
當前,一些高校為追求短期利益,不詳細分析學生就讀偏好的特征,簡單地引入市場經濟中的營銷觀念,不適當地將教育定義為商品,將學生定義為消費者和上帝。以簡單地滿足作為顧客和消費者的學生的短期的消費體驗、偏好作為基本的辦學理念,盲目強調教師對課堂的教學質量和秩序的主體責任——實際上是被學生自己所定義的教育偏好、消費權利所左右,忽視對學生自身責任的教育工作和對高等教育所應該達成的目標、有效實現方式的宣教工作,使得教師失去了對教學的有效控制、部分學生濫用評教權力。
(二)濫用學生評教數據,直接用來識別教學質量和排名
評教數據的解讀、使用方式本身是評教方法的一部分,但是這一點很少被關注到,以至于數據被誤用、濫用,使得評教中存在的若干隱性問題被顯性化并被放大。
不難發現,很多高校開展評教活動并不是基于對教學質量的評估反饋以檢討和提升教學質量,而只是用作教學監控的工具,只是為教學管理服務。這是因為,多數情況下,對教學排名的強調使其成為教學質量的代名詞,使得教師往往忽視了評教結果對教學質量反饋的思考;另一方面,綜合得分的反饋形式使得教師難以發現自身教學能力、水平在微觀層面上的具體優劣表現,無法用于查漏補缺。
即便不考慮內生性偏誤,事實上由于測量誤差的必然存在也使得相鄰的分數之間不具有等級差異的意義。從嚴格的統計學意義上來說,評教量表中的各個指標都是定序層次的變量,定序層次的數據只能用于同一個指標層次(即需要評測的那些關于教學質量的指標概念,比如教學方法、課堂氛圍、教學效果等等)在不同的比較單位(比如課程、教師、課堂、專業等)之間進行排序比較,而不能用于加總,一旦加總(一次濫用)后用于排序(二次濫用)則基本失去了參考意義。
在測量誤差或評教主體、評教對象的異質性和評教分數的內生性偏差不能被有效地控制并測算的情況下,評教結果的原始數據完全不具有可比性。因此,在學生評教的誤差無法被精確控制或估算的情況下,直接以原始分數的高低來對教師的教學工作進行排名是不客觀的。很多情況下,即便兩個老師的評教分數只有1分之差,也可能在教學排名上有極大的差距,造成分屬兩個教學質量等級的結果。從統計學的角度來看,評教得分存在不可避免的系統性測量誤差,但對于評教結果的排名等級的確定,卻有著決定性的作用。很多情況下,教學排名的次序儼然成為了教學質量的代名詞,得了多少分并不重要,排在哪個位置才是最重要的。因此,評教數據的科學運用和解讀應該成為評教方法的重要組成部分被予以關注和考量。
(三)濫用學生評教結果進行排序排名,實行“末位淘汰” 或一票否決,嚴重損害了教師群體的權益,增加了教師群體的精神壓力,惡化了教師群體的人際關系
比評教原始數據用來識別教學質量引起更多爭議的是依據教學排名來實施末位淘汰制。根據筆者的文獻搜索和在重慶諸多高校了解到的情況來看,絕大多數高校都是根據學生評教得分排序劃分質量等級,間接地引導教師開展“評教得分”排序競賽。從而,“教學質量”變成了評教得分競賽,得分排序變成了教學質量的代名詞,直接關乎教師的地位、形象、尊嚴;教師群體為了爭奪教學排名陷入了或明或暗的爭斗、競爭之中,惡化了教師之間的正常工作關系,甚至一些教師為了確保排名等次,不惜降低教學標準。另一方面,因為教學評價結果具有不確定性的特點,教師背負著極大的精神壓力工作。有些高校簡單粗暴地將學生評教結果和崗位任職、職稱評審、評優評先、課程設置與調整直接掛鉤,甚至賦予其“一票否決”的效力[4]。
(四)缺少對評教結果有效性的評估機制,忽視學生評教的局限性,評教程序中缺少教師權利救濟制度
不少高校雖然在設置學生評教的指標和程序中有考慮教師的意見,但是這些意見和建議大多是被限定在管理者事先設置好的框架內,教師的建議難以得到重視。更嚴重的問題是,面對評教結果,大多數高校的教學評價管理部門由于缺乏專業的統計調查研究人員,難以對評教數據的穩健性、變動性和有效性做出評估,所以往往是先入為主地判定評教結果的有效性,并以此來否定教師質疑評教結果行為的合理性。
作為評教對象,教師對學生評教結果的認定有異議本屬教師的合理權利,但實際上一些高校管理部門卻片面強調學生評教結果的有效性,忽視了教師的話語權[4]。一些教學管理者在教師對學生評教結果提出質疑或異議時,往往不是分析或評估評教結果的有效性,而是先入為主地認為,如果學生對教師的教學很滿意,教師就不會得到不好的評教結果,如果評教結果不理想,只能說明教師的教學質量不過關,使得教師的評教救濟權利得不到保障。目前國內高校評教工作中基本上都沒有涉及教師權利救濟的程序。
(五)師生關系扭曲異化,人才培養標準下降,教師隊伍出現劣幣驅逐良幣效應
在大學擴招、全社會知識貶值、大學生就業難、高端就業崗位比例攤薄等情況日漸加劇的大環境下,專業知識的多寡和優劣對于多數大學生的前途的影響彈性在下降,使得大學生對于學習專業知識的重要性的認知漸趨淡漠,與之相對應的是對分數、對各類獎勵證書的需求日漸高漲。在這種心理作用下,大學生對課堂教學提出的要求主要表現在課堂生動、形象、有趣,輕松活潑,老師上課應該像“百家講壇”甚至娛樂節目主持人那樣風趣、幽默,講課的方式要活,案例要多,把所有的知識都轉化為喜聞樂見的方式呈現出來,完全無視知識所具有的抽象屬性,以及學習的抽象、內化等復雜思維過程,對需要思辨、內化的那些抽象的、復雜的、理論性強的知識,對那些屬于“知其所以然”的知識的學習變得越來越不能忍耐,大學課堂日漸呈現出逃離理論的狀況。越來越多的學生未能認識到知識與能力的關系,片面強調能力而忽視對知識的學習。而事實上,沒有高等級的質量標準,沒有嚴格的考核、艱深的思索、充足的訓練,學生是無法學到知識和鍛煉能力的,學生素質下滑和人才培養質量滑坡是必然的。
因此,在上述背景下,受學生偏好的影響,受制于學生評教的壓力,不少教師主動降低教育教學標準,主要表現在課堂教學流于感性化、娛樂化,授課難度降低,課業要求降低,作業負擔減輕,考試難度降低,或是考試前有意無意透露考試內容,課堂紀律下降等方面,教師不敢管、共同混課堂現象日漸嚴重。對學生要求寬松的教師在評教中獲益更多,至少短期利益得到保障并且及早占據有利條件,進而產生劣幣驅逐良幣的效應,真正優秀的教師往往難以脫穎而出,從而在整體上導致大學教學質量的下降、異化教師之間的正常工作關系。
(六)作為權益的消極博弈,教師與學生相互放縱,導致學生課程成績與學生評教結果雙重膨脹
在關于國內高校學生評教的研究中,有關成績膨脹與評教結果膨脹的問題少有人論及,目前,在中國知網上僅能查到3篇相關文獻,在百度上查詢也不超過10篇。由評教所帶來的雙重膨脹現象,特別是學生學業成績膨脹問題具有較強的隱蔽性,其所帶來的危害尚未被引起重視。
分數膨脹主要表現為學生成績向高分段集中、平均成績提升或是不及格率下降。在20世紀60年代美國推行學生評教制度以來,學生分數成績膨脹問題就開始凸顯,20世紀90年代之后問題日趨嚴重,以至于有學者認為美國高等教育寬進嚴出的傳統已經從事實上破產了。維倫·約翰遜和羅斯塔澤研究發現,美國高校學生成績嚴重向高分段集中,自從20世紀60年代開始,高校分數膨脹快速增長,從70年代中期到90年代中期分數膨脹的速度減緩,自2000年之后隨著全球通貨膨脹和經濟危機的蔓延,高校分數膨脹的速度又開始加快[5]。
美國學者劉易斯在其專著《失去靈魂的卓越》中,闡述了哈佛大學在追求卓越過程中迷失教育宗旨的種種現象:分數膨脹、課程改革流于形式、課堂教學質量下降等[6]。當前,美國高等院校中出現的“大學比高中好混”的情況已經比較普遍。在美國一流名校普林斯頓大學,本科生的成績基本上分布在A和B兩個等級,很少有C和D;在斯坦福大學,只有不到8%的學生的成績是C和D,無人得E;在哈佛大學,學生的平均成績是B+,而25年前是B[7]。
實際上,學生分數膨脹和評教分數膨脹是一個問題的兩個側面。黃桂在中山大學開展的一項調查顯示:接近50%的學生認為師生關系與評教關系緊密,教師太嚴格,不通融,不好說話,即使教學不錯,學生也會打低分;接近80%的學生認為教師會因為學生打分而迎合學生[7]。事實上,自學生評教引入之后,不少高校發現教學質量提高不明顯,但嚴格要求學生的老師卻日漸減少,學生要求放水和教師主被動放水的現象普遍存在,比如,減少和降低教學與作業訓練要求,降低考試難度、縮小復習備考范圍甚至有意無意透露考試題目等。李麗麗引用AAAS的報告指出:分數膨脹在不同的學科之間存在分布差異,人文社會科學各專業比自然科學各專業更為嚴重[5]。分數膨脹帶來的結果必然是評教結果的膨脹,差距逐漸縮小,使得評教分數完全失去對教學質量評估的參考意義。
分數膨脹帶來的負面作用是多方面的,其中之一是全社會對高等教育質量特別是大學生分數的信任度下降,學生在找工作的時候,用人單位對學業分數成績越來越不信任、不看重,更多地關注學生學業成績之外的所謂能力、關系、社會經驗等非學術因素,給社會公平和社會信任帶了巨大的挑戰。這些所謂的經驗、信息通過媒體和畢業生的反饋,對在校生產生了巨大的負面影響。
三、若干改進建議
雖然學生評教帶來了諸多爭議和問題,但是科學合理的學生評教在高校教學質量監控中依然具有不可替代的作用,具有積極意義。我們必須明確,哪些是評教方法測量方面的問題,哪些是數據運用和解讀的問題。事實上,評教方法自身的限制本身不是問題,真正的問題在于評教內容的科學設置、評教過程組織和評教結果的科學解讀與運用。
為提高教學質量,優化教學活動中師生的關系,教師也有必要傾聽學生對其教學工作的意見,并針對學生的意見反饋做好解釋溝通工作,聽取合理意見并加以改進,疏導不良或不適當的想法,做好學生學習的指導工作。
為提高學生評教的有效性,基于以人為本的理念,筆者提出如下改進意見。
(一)加強學習,提高認識
學校教育教學管理部門應充分學習教學評價在方法論上的特征,科學把握其本體論與認識論的限度,在操作層面充分認識和研討科學的組織程序,并充分認識社會環境因素、學生個體差異對教學活動帶來的影響,充分認識和評估教師與學生在教學活動中的責任分配及限度。
教育管理工作者和教師必須同時加強學習,深刻地認識到教學工作與教學質量的非線性特點和學生評教方法的固有限制,確立學生評教結果審慎有效的認知理念。學生評教方法的固有限制是社會科學認知活動中的固有缺陷在評教工作中的具體表現,學生評教結果對教學質量的識別具有一定的模糊性,因此只具有參考意義。
另外,教育管理工作者和教師必須通過學習研討,樹立系統的教育質量和人才培養質量觀念,將教育質量從課堂延伸至全部的教育培養環節,綜合考量評估各種可能影響人才培養質量的因素,杜絕唯學生評教分數的觀念。
(二)引入專業研究力量加強研究,改進評測方法
一方面,通過實地調查研究分析教學評價中存在的主要缺陷和有待解決的問題;另一方面,加強理論研究,破解學生評教工作在認識論、方法論上的局限性,設置更為科學合理的測量指標體系和計算模型。
評測方法的固有限制可以隨著人們對世界認識能力的提高,比如對評教活動的非線性特征的認識,而得到部分改進或克服。新近興起的綜合模糊評價法、德爾菲法、神經網絡方法(BP)、結構方程模型(SEM)、多元判別分析、控制內生性與異質性的計量分析方法(如偏相關與偏回歸分析方法、傾向值分析方法)等在學生評教中的運用就是很好的技術性嘗試。從計量誤差理論來說,必須考慮到指標體系的合理性,以及計算方法的科學性,控制可能會影響評教結果的各種混雜變量,比如專業、年級、課程等因素,力圖通過方法上的創新,增強學生評教數據的可信度和可識別能力。這就需要在評教指標設計上,將那些可能影響教學質量的因素考慮進來,包括學生自身的學習心態、學習基礎、評教時的自我評估、參考比較框架等指標。另外,還可以通過約束性指標(比如署名、誠信指標、自我認知指標等)的設置區分學生評價是否有效,結合學生的學習狀態數據(比如出勤情況)、學習成績情況評估其評教結果的有效性、合理性。
學生評教實際上要回答的問題是教育目標的設計和達成問題,要回答評什么、側重點是什么,以學生素質為中心形成一套科學評價體系。在指標設計方面,可以考慮給學生一定的自由度,適度增設開放式自由填答問題,例如,“教師的哪些地方或課程教學中什么能夠引起你的興趣”“聽了這門課后,你的哪方面能力得到提高”“學了這門課,你的思維方式、認知判斷能力、知識內容有了哪些改變”“這門課程最精彩和最有待改進地方是什么”等,這些開放式問題經驗性強、直觀可辨別,對教學效果或教學質量的反饋比簡單的分數或分數排名更為直接有效[9]。
改進優化學生評教方法的另一個重要方面在于完善教學質量評價體系,將學生評教結果與同行評價、專家評價和督導評價結合起來,對教師教學質量做出更為全面、客觀的評價;利用同行觀察、教學大綱、測試、教師課堂筆記、試題、作業、教學材料和課程成績等作為常用的評估證據[10]。
(三)教學管理部門改進對學生評教結果的解讀和運用方法,體現對教師的人文關懷
第一,明確組織開展評教工作乃是服務教學的根本理念,創造寬松的評教環境。一方面,對學生評教結果的運用要以教師發展為導向,發揮評教的正面引導作用,保護教師的教學熱情,體現對教師的人文關懷。另一方面,改變將學生評教結果視為識別教師教學質量的唯一依據或直接等同于教師教學質量,特別是改變將評教結果用于排序以識別教師教學質量高低的做法,廢除學生評教結果的“一票否決制”,將學生評教的結果作為教學質量的參考性而非決定性依據[4]。
其次,要根據學生評教的結果,綜合考量同行評價、教學督導評價意見,分析教師教學中的優點和不足,共同探討如何解決這些問題。例如,可以共同分析探討影響教學得分的因素,討論課堂教學中的困難,分析教學目標、教學內容、教學方法與教學對象之間的關系,制定改進策略,提供教學經驗,幫助教師站穩講臺,提高教學水平。
其次,改進評教結果使用,將評教結果更多地運用在同一位教師在不同年度之間的相同或相近的教學任務的比較上來,用以跟蹤教師個體的教學評價情況變化,增強評教結果的可比性和科學性;或是以課程、專業、年級等作為教學質量比較單位,以得出更為客觀有效的數據。
給予教師適當的救濟權利,比如,允許教師查看評教原始資料,允許教師對評教結果提出質疑、分析和說明,允許教師對評教方式方法展開討論、辯論等等,增進教師對評教工作的理解和支持。
(四)加強對學生評教工作的宣傳教育和溝通解釋,提高學生評教工作的可信度和有效性
有效地宣傳解釋工作是減少不可預見因素對評教結果產生負面影響的重要辦法,對評教的學生進行引導教育是提高評教效果必不可少的前提條件。
在評教前,通過宣傳教育解釋評教指標的內涵,幫助學生了解評教的意義、作用,幫助學生確立正確的評教態度,提高學生參與評測教學質量的責任感和有效度。
(五)認真研究可能存在的分數膨脹和評教結果膨脹問題,高度關注學生評教中可能存在的道德風險和逆向選擇問題
評估教師的教學目標要求和標準、課業負擔、考試難度、分數分布、課外輔導等數據信息與學生評教結果、學生學風之間的關系,評估可能存在的降低教學標準和分數膨脹問題,通過不斷完善評估指標體系,提升學生評教的科學性。
參考文獻:
[1]華倫·埃斯迪.分數膨脹:大學教育的危機[EB/OL].吳萬偉,譯.[2005-04-08].http://www.aisixiang.com/data/6367.html.
[2]謝宇.社會學方法與定量研究[M].2版.北京:社會科學文獻出版社,2012.
[3]吳肅然.論操作化:當代社會科學哲學的啟示[J].社會,2013(5):22-23.
[4]鄧紅梅.高校學生評教中存在的誤區與危害[J].中國成人教育,2006(10):31-33.
[5]李麗麗.美國高校分數膨脹現象述析[J].黑龍江高教研究,2007(4):34-37.
[6]哈瑞·劉易斯.失去靈魂的卓越:哈佛是如何忘記教育宗旨的[M].2版.侯定凱,等,譯.上海:華東師范大學出版社,2012.
[7]黃桂.分數膨脹與等級膨脹:評教系統雙重失效原因探析——基于某部屬重點高校大學生評教的視角[J].高教探索,2011(6):17-19.
[8]周繼良.高等學校學生評教行為偏差研究——基于南京仙林大學城若干大學的分析[J].大學教育科學,2012(2):22-24.
[9]譚瑩.高校學生評教制度有效性的調查分析[J].統計教育,2007(9):51-52.
[10]彭虹斌.高等學校學生評教存在問題與對策分析——以N大學為個案[J].當代教師教育,2009(2):47-49.
[11]羅玉萍,劉麗娜,潘慶先.基于過程管理的高校內部教師教學評價探索[J].高校教育管理,2015,9(6):99-104.
(責任編輯魏艷君)
On Inherent Limitation, Improper Use and Improvement of Students’ Evaluation of Teaching Methods in Universities
WU Xing
(Department of Personnel, Chongqing University of Technology, Chongqing 400054, China)
Abstract:The student evaluation of teaching is the teaching quality monitoring means widely used by colleges and universities. The research that the current students’ evaluation of teaching method has problems such as bias of heterogeneity and endogeneity, covering range issues of index system, the scientificity of index system, that the process of evaluation cannot be controlled, cognitive black box and asymmetric information and adverse selection problems. The evaluation methods have inherent limitations, but a more fundamental question is the inappropriate use and interpretation of the evaluation results, including teaching quality ranking and teaching ranking are related to reward simply, the repression and deprivation of teachers’ right to speak on students in teaching evaluation and so on, which brings double expansion of fraction expansion and the results of teaching evaluation, the decline of personnel training and dissimilation of the relationship between teachers and students, that teachers being driove by bad money out good money and other negative consequences. It can be improved from the perspectives of improving the evaluation index system, optimizing the evaluation process, adjusting the evaluation results application and interpretation guid and so on.
Key words:students’ assessment of teaching; endogenous problem; cognitive limit; information asymmetry; grade swell
中圖分類號:G647
文獻標識碼:A
文章編號:1674-8425(2016)03-0116-09
作者簡介:吳星(1982—),女,湖北赤壁人,講師,碩士,研究方向:高等教育管理。
基金項目:重慶理工大學高等教育教學改革研究項目“學生評教方法的內在限制、不良效應及其改進的探索性調查研究”(2015YB09)
收稿日期:2015-04-20
doi:10.3969/j.issn.1674-8425(s).2016.03.019
引用格式:吳星.高校學生評教方法的固有限制、不當運用及其改進探析[J].重慶理工大學學報(社會科學),2016(3):116-124.
Citation format:WU Xing.On Inherent Limitation, Improper Use and Improvement of Students’ Evaluation of Teaching Methods in Universities[J].Journal of Chongqing University of Technology(Social Science),2016(3):116-124.