張光進 卓成剛
摘 要:學生評教是監控和提高教學質量的重要機制,但學生對教學內容進行評價受到不少質疑。本文主要通過實地研究和準實驗研究回答疑慮是否屬實。結果表明,樣本學校的評教表具有內容效度,學生對教學內容的評教項目能夠跟對教學態度、教學效果、教學方法的評價項目一樣給出較一致的評分,學生評教結果和教師同行的評教結果具有等效的區分度,學生能夠對不同課件給出較一致的評價排序,基本可以替代教師同行對教學內容進行評價。文章最后根據研究結論提出了學生評教的建議。
關鍵詞:學生評教;教學內容評價;評教有效性
一、引言
教學質量是教育的生命線,但當前社會上偏重科研的評價導向使得不少教師忽視本科教學工作,本科教育質量令人擔憂。2016年5月《人民日報》刊文《沒有一流本科,很難成為一流大學》就是對改變目前狀況的強烈呼吁[1]。
為了保證和提高教學質量,許多高校開展了學生評教工作,并將學生評教結果跟教師的年終考核、績效工資、崗位競聘等掛鉤,試圖通過這種機制促使教師在教學上下功夫。筆者對所在城市的8所部委屬高校的調查表明,這些高校每學期都開展學生網上評教,并將本科評教結果不同程度運用于教師管理。
盡管學生評教被廣大高校所采用,但有關爭議卻始終存在,并且當這種評教結果和教師利益掛鉤時,來自教師的質疑就更加強烈[2-7]。其中有一個質疑經常被提及卻很少有實證分析,即由于教學內容安排是衡量教學質量的重要方面,幾乎所有高校的學生評教表都包含學生對教學內容的評價,但有研究者和教師對本科生是否有能力對教學內容進行評價表示疑慮[8-9]。對于這個問題的回答是有價值的。如果證明學生有能力評價教學內容,那么教師以此為借口質不接受學生評教結果就站不住腳,評教管理部門對這樣的評教表應該有信心,可以更充分地運用評教結果。如果證明這個疑慮屬實,那么評教管理部門應該調整完善評教表,避免因學生無能力評價教學內容導致評教結果失真,偏離學生評教的初衷。
目前學者們對本科生是否有能力對教學內容進行評價這個問題的回答大多是演繹推理或者定性分析[10-11],從某種程度上說,還需要尋找有說服力的實際證據。本文正是基于這個現狀,采用實證分析為主的方法嘗試獲取明確的答案,以期為學生評教實踐提供參考。
二、研究設計
本文主要通過對實地收集的學生評教數據和一個準實驗數據的分析,試圖回答本科生是否有能力評價教學內容。
本研究從三個方面進行分析:一是分析樣本學校學生評教表的評價項目是否反映了要評價的內容,即評教表的內容效度如何;二是分析學生在教學內容方面的評教數據是否和在其他方面(如教學態度、教學方法、教學效果)的評教數據一樣,具備良好的結構效度和信度;三是以同行教師對教學內容的評價結果為參照系,分析學生對同一教學內容的評價結果是否和教師一樣有效。
(1)學生評教表的內容效度分析構想。筆者邀請了5位專業人士,對樣本學校的評教表的每個評價項目是否反映了所屬的評教維度進行獨立判斷,通過統計持肯定觀點的比例來判斷評價項目是否具備內容效度。
(2)學生評教表結構效度和信度分析的思路。通常情況下,學生評教表包括4個方面,分別是教學態度、教學內容、教學方法和教學效果。一般而言,除了教學內容外,學生對其他三個方面的評價能力是沒有疑問的。因此,從理論上來說,如果學生對教學內容的評價能和對其他三個方面的評價一樣有效,那么評教數據將支持學生評教表的四維結構,評教表四個維度的內部一致性信度應該都可以達到可接受的水平,學生在四個維度上評教數據的標準差應該沒有顯著差異。
(3)教師同行和學生評教數據有無差異的分析設計。筆者進行了一項準實驗研究,在該實驗中,我們準備了外校教師的5份不同課程的公共管理類課件,邀請了10位公共管理學科教師和10位公共管理學科本科生,分別請他們對這5份課件的教學內容獨立做出評價,并對這5份課件從最好到最差排序。對于收集到的實驗數據,筆者做了三個方面的分析:一是按照教師同行的評價分數把5份課件分為3個不同的優劣級別[12],檢驗學生的評教分數在這3個不同級別的課件上是否也有明顯差異。二是對于每一份課件的教學內容,學生的評價結果和同行教師的評價結果是否沒有明顯的差異。三是學生是否能夠對這5份課件的優劣做出一致性排序。
為了完成上述分析,筆者向5位專業人士發放了教學評價項目是否適當的調查表收集專家的意見,通過實地研究向學生發放評教表收集評教數據。同時開展了一個準實驗研究,分發了5份課件和教學內容評價表收集數據。對于收集上來的數據通過比率統計、因子分析、內部一致性信度分析、均值比較、肯德爾和諧系數計算等,回答學生是否有能力評價教學內容。
5位專業人士對教學評價項目是否適當做了獨立的評判,并將調查表反饋給筆者,樣本學校評教表的評教項目見后文。
在實地研究中,隨機選擇了一些以講授為主的管理類課程的課堂教學,在任課教師允許的情況下,請上課學生按照評教表的項目表述從完全符合到完全不符合作出五級評價。評教數據僅限于研究使用,請學生無記名真實填答。共收到有效評教表213份,評教表的具體內容見后文。
準實驗研究中,每位教師同行和學生都發放一份教學內容評教表和5個不同的PPT課件(評價項目來自學生評教表教學內容評價指標,由于是PPT課件不涉及講授表現,故評教表中編號為“8”的評價項目予以舍棄),最終每個課件共收到教師和學生各10份教學內容評價數據。
三、數據分析結果
在按照研究設計收集到有關數據后,筆者遵循研究思路對相關數據進行了以下3個方面的統計分析。
1.學生評教表內容效度分析
本文首先統計了五位專業人士關于評教項目是否反映評教維度的看法,結果見評教表第三列的數據。從評教表第三列數據可以看出,20個評價項目中,有12個項目5位專業人士一致認為反映了所屬的評價內容,有6個項目4位專業人士認為符合所屬的評價內容,有2個項目認可度最低,但也超過了半數。由此可以認為該份學生評教表的評價項目較好地反映了要評價的內容。
2.學生對教學內容項目評價的一致性分析
上述結論是基于專業人士的主觀判斷,為了進一步觀察評教表內容是否如管理者理論上構思的那樣分為4個方面,我們對213份學生評教數據進行了因子分析,因子分析的條件檢驗及結果見表1和表2。
表1顯示,學生評教表的KMO值為0.950,超過了0.9,表明樣本非常充足。巴特立特球型檢驗的顯著水平小于0.001,表明變量之間具有共享因素的可能,適合做因子分析。
在原評教表中,編號1至4項為教學態度評價,5至10項為教學內容評價,11至15項為教學方法評價,16至20項為教學效果評價。從表2可以看出,20個項目自動負荷在4個因子上,根據因子載荷系數判斷題項的歸屬,F1因子包含的就是教學內容的題項,F2是教學態度的題項,F3是教學效果的項目,F4是教學方法的題項。由于普遍認為學生有能力評價教學態度、教學方法和教學效果,所以表2中F2、F3、F4因子包含的題項與原評教表一致是符合預期的。表2中的數據顯示F1因子僅僅包括了教學內容的題項,這說明學生對教學內容各題項評價結果的正相關度是很高的。否則,原表中的5至10題項不可能清晰地聚集在一個因子上。從這個角度來說,學生有能力對課堂教學內容評價項目做出一致性評價。
在對學生評教數據進行因子分析的基礎上,接著對評教表的內部一致性信度作了分析,結果見表3。
從表3可以看出,4個維度的克朗巴哈系數均超過0.8,其中信度相對較低的是教學方法而不是教學內容,但都達到可以接受的水平[13]。一個合理的推論是,如果學生在教學內容評價項目上不能給出較一致的評價結果,其克朗巴哈系數不會高達0.924,這說明學生能夠跟對其他三個方面的評價一樣,對教學內容方面做出較一致的評價。
本文進一步比較了學生評價數據在評教4個維度上標準差的差異,結果見表4。
一個合理的假設是,如果學生能夠對教學效果、教學態度和教學方法每個方面的項目做出一致性評價,而對教學內容的評價項目得分凌亂,那么教學內容方面評教數據的標準差將會是較大的,明顯大于其他三個方面。但從表4可以看出,4個評教維度數據的標準差沒有顯著差異,說明在教學內容維度的評價項目上,學生評教數據跟在其他三個方面一樣,具有一致性。
3.學生對不同課件評價的區分效應分析
按照常用的五級評分三分法,本文依據教師同行對課件內容的評價得分,將5份課件分為3個類別[12]。其中平均得分低于2.33的為Ⅰ類,有一份課件。超過2.33且小于3.67的為Ⅱ類,有兩份課件。等于或者高于3.67的為Ⅲ類,也有兩份課件。然后比較學生對這3類課件內容評價得分的均值,結果見表5。
從表5可以看出,對于教師同行認定的3類課件,學生評價數據也表明每兩類課件之間得分有明顯的差異。其中第Ⅰ類課件得分最低,第Ⅱ類居中,第Ⅲ類最高。學生對教學內容的評價和教師具備等同的區分效應。
為了更精細地分析學生對教學內容的評價是否跟教師同行一樣,沒有明顯的差異,筆者對5份課件的教師評分和學生評分進行了比較,結果見表6。
從表6可以看出,除了第一份課件之外,教師對其余課件的評分都比學生低一些,但從統計意義上而言并沒有顯著性差異。根據前述三分法的得分區間劃分,以教師評分所屬類別為依據,也可以看出學生對每份課件的評分沒有出現類別錯劃問題。換言之,對于同一份課
件,即使讓教師同行來評價,也不會跟學生評價結果有明顯差別。
教師同行的專業性使人們相信他們可以對教學內容做出準確的評價,表現在對評價對象的優劣排序上,他們對多個對象的評價排序一致。本文借鑒這一思路利用肯德爾系數分析了學生對5份課件的排序數據,結果見表7。
從表7可以看出,肯德爾系數為0.882,顯著性水平小于0.001,表明10位學生對5份課件的排序具有高度一致性。
四、結論及建議
我們的研究結論是:
(1)設計一份科學合理的學生評教表是可能的。參考一些高校的學生評教表,總體而言,從教學態度、教學內容、教學方法和教學效果4個方面衡量課堂教學質量是比較適宜的。而教學內容方面的評價,可以從課程的基本概念與理論是否準確清楚、重點難點是否突出、教學內容是否充實、內容講授是否嫻熟、教學內容是否理論聯系實際、是否聯系學術動態來考察。
(2)學生對教學內容評價項目能夠給出較一致的評分。評教數據的因子分析、內部一致性信度分析以及4個維度標準差的比較分析表明,跟對教學態度、教學效果以及教學方法的評價一樣,學生在教學內容各項目評價上沒有出現評分凌亂的情況,甚至對教學內容評價的一致性超過教學方法方面。
(3)學生能夠對課件的教學內容做出優劣評判。準實驗研究中教師同行認定的優劣不等的課件,學生評價數據在這些課件上同樣具有區分度,且等級判別與教師同行的結果一致。
(4)學生對教學內容的評價結果跟教師同行的評價結果沒有明顯差異。準實驗研究中,雖然教師同行對課程教學內容的評價較之學生略低,但差異并不顯著。從這個角度來說,學生基本可以代替教師同行對課程的教學內容進行評價。
(5)學生對課件內容的優劣排序具有較高的一致性。準實驗研究中,10位學生對5份課件的優劣排序數據表明,他們對課件內容相對優劣的判斷具有較高程度的共識,從統計學意義看,一致性達到很高的顯著水平。
我們對學生評教提出如下幾個建議:
(1)管理者要提供一份科學的學生評教表。只有評教表科學合理,才能夠準確評測教師的課堂教學質量。一般來說,課堂教學評價可以從教學態度、教學內容、教學方法和教學效果4個方面進行,本文所示的各個方面的評價項目僅是一種代表性觀測點,現實中各高校在設計和修訂評價表時可以參考借鑒。
(2)加強學生評教的溝通工作。一方面,要對以往的學生評教數據進行系統分析,拿出學生有能力進行評教的實際證據,讓老師們認識學生評教,認可評教結果。另一方面,要在學生中廣泛宣傳解釋學生評教制度,促使他們以認真負責的態度參與到此項工作中,這項工作尤為必要。以筆者的初步了解來看,不少學生認為他們的評教只是走過場,故不少都是應付性打分。在這樣的態度和行為方式下,評教表即使科學合理,評教結果也將失真。
(3)有步驟地運用評教結果。在教師對學生評教還沒有充分認識的情形下,學校可以先將評教結果運用于教師發展。比如將評教結果(絕對分數和相對排名)用書面形式反饋給教師并由教師填寫教學改進計劃后再提交給教務管理部門,促使教師關注學生的評教意見,避免選擇性忽視教學工作。經過一定時間的發展性學生評教后,在學生和教師都有較深入認識的情形下,可以將評教結果進一步運用到年終考核、績效工資和崗位評聘上。
(4)重視影響評教結果的其他因素。除了學生評教表的科學性、學生的評教態度之外,還可能有一些其他因素影響評教結果的可比性。比如老師承諾給學生高分以博取學生高評,不同的大類學科趣味性不同導致評教結果有明顯差異,老師因嚴格要求導致個別學生打低分報復等。這些可能的因素需要進一步研究驗證,并對教學管理和評教制度進行完善,例如規范教師課堂言行、在學生知曉自己的成績前安排評教以免教師遭報復、對不同大類學科評教結果分類排名等。
本文嘗試用實證數據回答學生能否評價教學內容的問題,并得到了比較明確的答案。這不同于以往理論分析的研究范式。但研究結論的應用仍需保持謹慎。本次實地研究中學生評教的課程是講授為主的社會科學類課程,不能簡單推論學生同樣能對理工類課程、藝術類課程的課堂教學內容做出較準確的評價。這需要進一步的研究。此外,在準實驗研究中,對教學內容的評價是以對PPT課件的評價代替教師現場教學內容,這與現實教學還是有一定的差異。在此情形下,本研究用師生評價文本課件的數據進行分析得出的結論,需要在以后的研究中,用現實課堂教學內容評教數據做進一步驗證。
參考文獻:
[1] 董洪亮. 沒有一流本科,很難成為一流大學[N]. 人民日報,2016-05-12.
[2] 倪超美,付東升.對學生評教實踐的反思[J].江蘇高教,2009(1):74-77.
[3] 付八軍, 馮曉玲.大學生評教客觀度的調查研究[J].大學教育科學,2011(1):35-40.
[4] 楊秀芹.學生評教制度締結的行動邏輯——學生的道德風險與教師的行為選擇[J].教育科學,2009(5):61-65.
[5] Pieter Spooren and Francis V. Loon,. Who participates (not)? A non-response analysis on studentsevaluations of teaching[J].Social and Behavioral Sciences,2012(69):990- 996.
[6] 吳莎,李沖.高校學生評教影響因素研究綜述[J].科教文匯,2012(9):32-33.
[7] Shu-Hui Liaw Kim-Leng Goh, Evidence and control of biases in student evaluations of teaching[J].International Journal of Educational Management, 2003(1):37-43.
[8] 雷敏.論提高高校學生評教質量的方法和策略[J].高教探索2005(1):50-52.
[9] 楊麗萍,張彥通.是什么影響了高校學生評教的信度和效度[J].中國大學教學,2009(3):72-74.
[10] 馬秀麟,衷克定,張 倩.學生評教偏差分析與控制模型研究[J].現代教育技術,2011(2):40-44.
[11] 張光進,張士菊,楊朝琦.高校學生評教存在的問題及對策探討[J].高等理科教育,2012(2):40-41.
[12] 張光進,廖建橋. R&D;人員績效特征及考評方法權變選擇研究[J].科學學研究,2014(9):1355-1357.
[13] T. R. Hinkin,. A brief tutorial on the development of measures in survey questionnaires [J]. Organizational Research Methods,1998(1):104-121.
[責任編輯:陳立民]