周天蕓+姜禹杉



摘要:課程教學是高校人才培養的主要方式,課程教學水平和質量將會影響到大學生的專業能力,由此大多數高校建立學生評教制度,以反映和跟蹤課程的教學質量,但很多高校在學生評教過程中出現一些異化現象。本文基于S大學的課程教學評價數據,應用統計方法檢驗影響高校課程評教的結果特征及其影響因素,深入分析學生評教異化現象的表象與原因,從而客觀準確地評價高校的學生評教制度及其效果。
關鍵詞:教學評價;學生評教; 影響因素隨著中國高等教育改革的不斷推進,高等教育的教學環境也發生重大變化,由這些方面引起的教育變革對高校的課程教學提出更高的要求。教學評估是根據一定的教學目標和標準,對教師的教學工作所進行的系統檢測,并評定其價值及優缺點,以求改進和提升教學質量的過程。教學評估既是教學過程的重要組成部分,也是有效教學與成功教學的基礎。
高校的學生評教是教學評估的固有部分,經歷了從非制度化到制度化的過程。與教師同行評價、專家評價、管理者評價等相比較,學生評教更能反映課堂教學質量,且操作方便,因此在高等學校普遍實施。但是,學生評教制度的不完善及其實施過程的不科學,都可能導致高校學生評教的目的錯位、內容失真、方法片面、結果主觀等等問題,從而使得高校的學生評教流于形式。
有關學生評教的作用和效果問題,高校管理者、學者和高校教師一直存在著不同的看法,這種觀點分歧不但限制學生評教的應用,也制約學生評教發揮改善課堂教學質量的作用。經過多年的實踐,對于高校學生評教的制度設計與實施能否促進高校的課程教學,高校需要進行認真的探討和更深入的研究,這對于發揮學生評教的作用具有重要理論意義和現實價值。
一、教學評價及其研究意義
教學評價是依據教學目標對教學過程及結果進行價值判斷,并為教學決策服務的活動,教學評價是研究教師的“教”和學生的“學”的價值的過程。教學評價一般包括對教學過程中教學內容、教學方法手段、教學環境、教學管理諸因素的評價,是對教師教學工作的評價。
學者對學生評教的效度歷來存在不同觀點。以馬夏( MarshH W.)[1]等為代表的觀點認為學生評教是有效的,指出學生評教無效或存在較大偏差的結論是由研究方法缺陷引起,這些研究方法或存在缺陷,或所依據的理論不健全,或對各種偏差概念缺乏好的操作性定義,如相關分析中暗含因果推論、使用不適當的分析單元,忽視學生評價和潛在偏差的多變量性質,不適當的實驗操作,不適當的操作定義等。研究變量的選擇可能影響學生評教的結果,但并不一定會削弱學生評教的效力;相反,某些變量可能支持學生評教的結構效度。這些學者選擇與學生評教的區分效度緊密相聯的一些關鍵變量,如教師對學生的成績寬大等是否影響學生評教等,發現學生評教無效和存在偏差是由實驗研究的不足所導致的。
反對的觀點則認為學生評教存在偏差,學生評教與有效教學的其它指標的相關性很小,學生評教只能解釋學習成就15%左右的變化,由于其它與學生學習無關因素的出現,導致學生評教存在較大的偏差。為保證學生評教的公正性,學生評教的結果需做統計上的調整。格林瓦爾德(Greenwald A.G.)[2]等人是這種觀點的代表人物,他們的研究揭示了學生評教所處的困境。根據統計分析相關的研究表明,1971年至1980年期間的研究多數認為學生評教無效和存在偏差;1981年至1985年的研究則多數認為學生評教有效;1986年至1995年的十年,認為學生評教有效與學生評教無效或存在偏差的研究各占一半。同時,研究發現教師給學生的評分是影響學生評教的重要因素,教師評分的松緊對學生評教有中等或中等以上的影響,學生學習成績與其對教學質量的評價之間存在相關,其它無關變量也會影響學生的評教結果。這表明學生評教的科學性、可行性和有效性并沒有得到確認,因此認為學生評教無效和存在偏差的觀點也相當普遍。
同樣,國內的學者、高校教師和高校管理部門同樣對學生評教的效度持不同觀點。現有文獻大多肯定學生評教的作用,理由包括:第一,大學生具有一定的認識能力和判斷是非的能力,絕大多數學生是公正客觀的,能夠對教師的課堂教學作負責任的評價;第二,學生評教參與的人數較多,從統計學意義上看,評價結果具有較高的可靠性;第三,許多高校開展課堂教學質量評估的實踐證明,學生評估結果是客觀可信的。實證研究表明,學生評教的信度值達0.82,說明學生評教結果具有一定的穩定性和可靠性。[3][4][5][6]
但也有學者對學生評教的價值和客觀公正性提出質疑。有些研究認為,學生評教的結果并不一定合理,其原因是:第一,教學內容具有學術性,學生難以客觀評判,因此評教結果不夠準確。第二,學生評教會給師生關系帶來負面影響,教師會降低對學生的要求,或任意更改教學大綱以遷就學生。有研究發現,人情因素嚴重影響學生評教的結果。多數學生以自己能否聽懂來衡量教師的教學水平,當教學內容有一定難度,導致學生理解費力時,就認為教師的授課水平差;相反,如果教師降低授課難度,不論講授的內容是否與課程有關,學生都可能認為教師的授課水平高。由此,學生的評教可能出現以偏概全的結論。[7][8][9][10][11][12]
雖然在教育研究的層面,對于高校學生的評教并未達成一致的觀點,但在實踐方面,中國大多數高校都有通過學生評教促進教學質量提升的制度設計和安排。學生評教的效果可能受到制度設計與制度實施中的一些因素影響,因此,本文結合S大學的學生評教數據,檢驗和討論高校學生評教數據中反映的問題,以探討高校學生評教的效果及其影響因素。
二、課程教學評價的指標設計
學生評教制度的設計依賴于評教指標及其體系,課堂教學質量評定指標應該具有客觀、全面以及便于理解等特點。首先,應該建立在課堂教學客觀規律基礎上,體現學科教學的特點,體現教學的統一,減小主觀因素對評價結果的影響;其次,結構上能夠體現課堂教學的整體性,并力求做到評價項目、內容具體明確。因此,評價教學質量的指標體系通常包括三個方面,即教學內容、教學方法和教學效果。[13][14]
S大學全校開設五大類課程,并由學校對每位授課教師進行評教。教學評估指標分為一級指標和二級指標。一級指標涵蓋課程質量評估各個方面的內容,其中涉及教學組織和實施內容的占50%,包括專業知識的講授,教學內容的前沿性等,涉及教師責任心的占20%,教學互動、教師活力等反映教師個人教學風格的占30%;二級指標在一級指標的基礎上規范和細化內容,使質量評估體系內容更加充實,條理性更強,具體評教指標見表1。
課程評教采取百分制,總分為100,對于各項指標,學生根據內容給予授課教師不同的評分。為了保證評分的準確性,在計算教學評分時會去掉最高的5%和最低的5%,通過計算中間的90%的學生評教分數,得出每位授課教師的評教得分。
S大學多年來堅持實施學生評教制度,經過多年的實踐,改進和完善了評教的指標體系和評教實施方法,在教務系統中增加了評教的項目,要求選讀課程的學生在系統中完成評教,具體實施方法是期末學生查詢課程成績時,學生必須完成評教,然后查詢成績。雖然這種制度安排使學生評教參評率得以保證,但由于和成績查詢綁定,部分學生比較反感,而且評分容易受到情緒、考試成績預期等因素的影響。
理論上,S大學的學生評教指標具有一定的科學性和合理性,但在具體實施過程中,學生評教的效果如何,本文將從實證的角度進行探討。
三、 S大學課程學生評教的數據分析
本文采用S大學2012年的本科授課課程的評教數據,探討高校學生評教的結果和作用。S大學的本科課程包括公共必修課216門、公共選修課336門、專業必修課739門、專業選修課671門和實驗課程204門,2012年參加學生評教的五類課程共計2166門。由于課程性質、參評人數等的不同,評教結果也有所不同,2166門參評課程的得分均值、中位數、眾數等指標存在明顯差異,具體見表2。
根據統計結果,S大學的公共必修類有216門課程參評,得分的均值為91.9分,平均與課學生數為227人,平均參評率為97.87%;公共必修類課程得分用方差衡量的波動性為5.17;其峰度為1.41,表明超額峰度為0;其偏度為-1.25,為左偏。總體上公共必修類課程得分趨進于正態分布。
公共選修類有336門課程參評,平均得分91.73分,平均與課學生數為130人,平均參評率為97.48%,用方差衡量的波動性為5.64;其峰度為5.99,表明超額峰度為3;其偏度為-1.78,為左偏,總體上公選類課程得分不服從正態分布。
專業必修類有739門課程參評,平均得分91.49分,平均與課學生數為88人,平均參評率為97.39%,方差衡量的波動性為8.99;其峰度為6.1401,表明超額峰度為3.14;其偏度為-1.85,為左偏,總體上專業必修類課程得分不服從正態分布。
專業選修類有671門課程參評,平均得分為90.9分,平均與課學生數為63人,平均參評率為98.26%,用方差衡量的波動性為10.50;其峰度為4.44,表明超額峰度為1.4;其偏度為-1.65,為左偏,總體上專選類課程得分不服從正態分布。
實驗類有204門課程參評,平均得分為91.5分,平均與課學生數為127人,平均參評率為98.60%,用方差衡量的波動性為7.8437;其峰度為6.4039,表明超額峰度為3.4;其偏度為-2.09,為左偏,總體上實驗類課程得分不服從正態分布。
根據課程評教結果的統計分析,可以發現,S大學的五類課程得分僅呈現細微差異,公共必修類課程和公共選修類課程的均分略高,專業選修課的均分最低。同時,公共必修類課程和公共選修類課程得分的波動性最小,實驗課次之,專業必修課和專業選修課得分的波動性較大,公共必修類和公共選修類的參評課程和參評學生都高于專業必修類課程、專業選修類課程。
通過評教分數的統計描述可以發現兩方面的問題。第一,評教分數過高,五類課程的平均分均在90以上,波動范圍在90.89-91.92之間,無法體現教學質量的差別;第二,五類課程的評教得分均呈左偏厚尾分布,均不服從正態分布,表明評教得分落在低分區域的比落在高分區域的多,這與大部分數據的正態分布特征存在有差異。
四、影響教學評價因素的實證檢驗
由于五類課程的得分差異很小,統計數據很難發現評教中存在的問題,因此本文對評教數據做進一步的處理,試圖發現影響高校教師教學評分的影響因素。由于五類課程的評教得分都呈現左偏厚尾,不服從正態分布,表明評教數據難以滿足OLS估計的基本假設,因此本文嘗試采用GLS回歸的估計方法。
由于S大學的評教指標主要評價教師的教學態度、教學方法、教學內容等,因此本文結合教師的個人特質、學生參與評教等方面設計多元回歸模型。根據相關研究文獻,本文設計以下實證模型:
Score=β0+β1title+β2sex+β2zb+β3zx+β4gb+β5gx+β6sy+β7people+β8scale
其中score表示評教得分;title代表教師的職稱,0代表助教、講師和高級講師,1表示副教授,2表示教授;sex代表教師性別,0表示女性教師,1表示男性教師; zb、zx、gb、gx、sy分別表示課程類型中的專必、專選、公必、公選和實驗課程,本文采取虛擬變量的計量方式; people代表課程學生人數;scale代表課程參評率。評教得分為實證模型中的因變量;自變量包括課程性質(5類課程性質,用虛擬變量),教師性別,教師職稱(是否高級職稱),課程學生人數,課程參評率等。
首先,對全部評教數據進行懷特檢驗,結果在1%置信水平下顯著,由懷特檢驗結果可知評教數據存在顯著異方差現象。因此,本文的實證模型采用加權最小二乘法(WLS)進行估計,并得到表3的結果。
表3總體數據的估計結果
Coef(系數).P值title(職稱)0.40370.000**sex(性別)-0.58790.000**zb(專必)-2.46110.000**zx(專選)0.02280.923gb(公必)0.75320.000**gx(公選)-0.33450.012*people(課程學生數)-0.00140.000**scale(課程參評率)-3.39930.000**cons95.62060.000**注:**表示在1%置信水平下顯著,*表示在5%置信水平下顯著。
根據估計的實證結果,本文發現:
(1)教師職稱對教師評教得分影響顯著,教師職稱越高,評教得分越高,教師職稱每高一級,評教得分則提高0.4分。這一結果一定程度反映教師職稱越高,其教學質量越得到學生的認可,評教得分與教師的科研能力及對課堂的控制能力正相關,反映中、低職稱的教師對大課堂的掌控能力相對較弱。
(2)課程類型中只有專業選修課不顯著影響評教得分,專業必修、公共必修、公共選修、實驗四類課程對評教得分的影響顯著。學生評教打分不僅是教師的教學質量,還包括學生對課程設置的意見和學生自己的學業期望是否與教師及課程沖突等綜合性的因素。從本文數據分析結果可以發現,專選課程得分最低,波動性最大,同時也最不顯著。這是由于其他類課程中教師和課程的選擇具有固定性和強制性,因此學生對課程設置的意見較小,對課程期望較弱,因此給分普遍較高,從而導致了評教得分過高且影響顯著的結果。而專選類課程多是學生根據自己的興趣愛好自主選擇的,具有較強的主觀期望和學習目的,當學生的課程設置和自己的學業期望相沖突時,會給較低的分數,且打分波動性變大,造成專選課程對教師評教得分影響不顯著。
(3)課程學生人數顯著影響評教得分。課程的學生人數越少,教師評分越高,學生人數減少一人,評教得分將提高0.0014分。這可能是由于學生人數多的班級授課,教師在多樣化課堂教學活動、批改作業和師生互動上存在較大困難,因而導致授課教師難以顧及每個學生的需求,課堂效果不好;而對于學生人數少的班級,教師可以根據每個學生的學習基礎、學習能力給予個別指導和調整教學的難易程度,課堂效果較好,從而評教得分較高。
(4)性別對教師評教得分影響顯著,女性教師比男性教師的評教得分多0.5879。這是由于男性教師和女性教師在表達方式和教學風格等方面存在差別。男性教師更注重信息量的輸入與授課的權威性,從而容易帶有說教性質;而女性教師的課堂互動性相對較強,比較注重交流和溝通,因此,學生偏好女性教師的授課方式,從而給女性教師更高的得分。
(5)課程參評率對評教得分影響顯著。課程參評率上升1%,教師評教得分下降3.3993%。這一結論說明此次評教數據可能存在偏差,由于個別學生放棄評教而對評教結果產生影響,因此評教指標體系仍需改進。
五、 結論與反思
基于S大學評教數據的統計分析,本文認為學生評教的客觀性總體上比較欠缺。首先,學生評教具有一定的局限性。學生社會閱歷較少,知識層面也較淺,對評教的看法和理解難免片面,導致評教結果容易失之客觀。其次,學生評教具有主觀性。由于評教通常采用匿名方式,學生在評教時容易受情緒影響,特別是評教時間安排不合理時,評教結果更容易失之偏頗。最后,學生評教具有偏差性。由于難以準確把握評教標準,學生評教分數高低差別很大,得分高低無法反映授課質量的差異,如90分的教師不一定比89分的教師的教學質量更高。微小的誤差從統計學的角度是合理的、允許存在的,但對于評教結果的排序和質量等級的確定,卻有著不同的意義。
在學生評教結果的使用方面,也可能存在一些消極影響。由于一些教師對學生的要求高或者評分嚴格,就可能使部分學生耿耿于懷,在測評時對教師的評價較差,評教得分較低,不可避免地會影響教師的教學熱情。
總之,要發揮高校學生評教的作用,需注重制度安排和制度實施過程,制定相應的措施,以確保其作用的發揮。
第一,確立學生評教的目的。實施學生評教制度是為改善教學,提高教學質量,因此學生評教不應根據教師的為人和表象進行評價,而應根據教師的教學水平進行評教。學生評教應有利于加強師生溝通,促進師生和學校的共同發展,并引導教師正確對待評教。
第二,建立科學、合理和規范的學生評教指標體系。構建評價體系時,要科學地設計調查問卷,充分聽取教師乃至學生的意見和建議,針對不同學科或不同專業的特點,提出客觀、科學、系統、有效的評教指標體系。
第三,加強對學生的評教指導,建立健全學生評教的制度規范。學生參與評教和認真評教是評教成功的關鍵,幫助學生提高認識,樹立客觀、公正的態度,引導學生正確認識教學活動規律,認識專業或學科特點,認識教師年齡、性別和性格等方面的差異,理解教師多樣化的教學風格,盡可能減少學生因個人主觀好惡來評價教師,減少評教的隨意性。
第四,科學地分析和使用評教結果。運用科學的方法統計并分析評教結果,避免簡單、粗糙地使用評教結果。要考慮學科、專業特點,注意教師個人特質,區分學生差異。教學管理部門不能簡單地排出教學優劣結果,以評教結果作為判斷教師教學水平的唯一依據,而是應該仔細分析評教結果,結合評教得分的排序和變化,幫助教師分析教學的不足,并提出改進辦法,以達到教學評價的目的。
綜上,高校學生評教作為一種制度安排,具有提高教學質量的作用,但在其實施過程中容易出現一些問題,可能導致高校的學生評教無法發揮其積極的作用。因此,建立和實施學生評教制度,必須綜合考慮和科學安排,并合理運用評教結果,才能切實發揮學生評教的作用,推進高校教育教學質量的提升。
參考文獻:
[1]Marsh H. W.,Roche L. Making studentsevaluations of teaching effectiveness effective[J].American Psychologist,1997,52(11):1187-1197.
[2]Greenwald A.G. Validity concerns and usefulness of student ratings of instruction[J].American Psychologist,1997,52(11):1182-1186.
[3]劉杭玲.高校學生評教的有效性及保障措施研究[J].教學研究,2011(6):95-127.
[4]胡鵬,何冬蘭.分工體系的深化及學生評教的轉型發展[J].江蘇高教,2011(5):88-90.
[5]付八軍,馮曉玲.大學生評教客觀度的調查研究[J].大學教育科學,2011(1):35-40.
[6]吳培群,陳小紅.大學生評教的統計分析及其改革途徑探討——基于北京一所高校學生評教分數的統計分析[J].高教探索,2010(3):78-91.
[7]毛洪濤,敬麗敏,曾雙寶.我國高校全員評教制度的困境與對策[J].中國大學教學,2010(3):64-67.
[8]黃桂.分數膨脹與等級膨脹評教系統雙重失效原因探析——基于某部屬重點高校大學生評教的視角[J].高教探索,2011(6):95-127.
[9]艾文國,王桂偉,關玉晶.高校學生評教系統改進研究[J].中國大學教學,2012(12):76-79.
[10]廖明,姜峰,郭燕鋒.大學生對教學質量的主觀偏好與學生評教體系的完善[J].中國高等教育,2012(18):49-50.
[11]周繼良,湯其成.高等學校學生評教行為偏差研究——基于南京仙林大學城若干大學的分析[J].大學教育科學,2012(2):30-34.
[12]董澤芳,申曉輝.高校“學生評教”的困境反思與價值重構[J].教育科學,2013(2):47-51.
[13]周婷婷.國外部分高校學生評教指標體系分析[J].中國大學教學,2012(2):89-94.
[14]朱軍,范慧慧.研究型大學學生評教指標體系建構中的若干關注點——基于復旦大學問卷調查的分析[J].中國大學教學,2012(8):69-72.