孫 鰲,孫由之
(1.南方醫科大學 經濟學系,廣東 廣州 510507;2.中國礦業大學(北京) 英語系,北京 100083)
大學生評教開始于20世紀30年代美國的個別高校,到70年代已成為西方大學的普遍實踐,在中國高校流行則是在90年代[1]。作為一種改進教的策略,學生評教的基本假設是,學生是教師提供的服務的直接消費者,他們不僅有充分的激勵而且有足夠的理性客觀公正地給教師打分,而教師可以從分析學生的評分中,反思其教,找到有效的改進策略。然而,與預期相反,學生評教從一開始就遭到教師普遍而持續的抵制[2]。主要原因是:絕大多數高校在實踐中,都把學生評教用作對教師進行總結性評價的工具,以加強對教師的人事管理和控制,而非形成性評價的工具,以幫助教師改善其教績。各大學在實行學生評教后,都程度不同地出現了持續的學生課程分數的膨脹和教師普遍的焦慮,卻沒有人找到學生評教改善教學績效的有力證據[3-4]。
學生評教所具有的廣泛而持續的爭議性和其在高等教育中的重要性,是大量相關研究文獻產生的重要原因。國外對學生評教的研究主要集中在如下兩方面:
第一, 影響學生評教行為的因素。研究發現,學生的特征(如個性、性別、心境、預期的課程分數、與教師的感情和關系、年級、學習的期望和抱負水平、心理取向、專業、人口特征、對教和評教的看法、完成評教問卷的學生在總學生人數中的百分比、對教師的感受或職業處境的關注、對其評價的代表性和影響力的信心等),教師的特征(如性別、職稱、學位、與學生的關系、教學經驗、氣質和形象等)和教師或學生不可控制的一些因素(如上課的具體時間、班級學生人數、課程計劃學時數、課程的性質、學生評價的匿名程度、師生間的權力關系等),都可能以特定的方式對學生的評教行為產生特定性質和程度的影響[5-18]。
第二, 學生評教導致課程分數膨脹的證據、原因和解決辦法。許多研究都證實了課程分數膨脹是內生于學生評教之中的[19]。主要原因是,教師為了使其獲得的評教分數達到某個“安全”水平,而通過各種他人難以察覺的方式降低學術標準,使學生形成高課程分數的預期。其實質是,教師用高課程分數向學生“購買”高評教分數[20]。因為,作為自利而理性的經濟人,學生一旦形成高班級平均課程分數的預期,就會傾向于給教師打高分[21]。其結果必然是評教分數與課程分數同時膨脹 。毫無疑問,這是學生評教失靈的集中反映,也是高等教育出現危機的信號。
怎么辦?有學者主張,根據預期分數、過去的分數、學生對課程的態度和教師的印象等,對課程分數進行事后調整[22]。另一些學者則建議,調整原始的評教分數,以消除教師可操縱的一些因素(如預期的課程分數和教師為提高評教分數所刻意創造的課堂娛樂性)和他們不能操控的一些因素(如課程的性質)的不利影響[23]。這些建議顯然不具有現實的可操作性。作為對課程分數膨脹的反應,康奈爾大學在1996年實行一種新的課程成績報告政策:一是在網上公布班級課程平均成績,二是在成績單上注明班級課程平均成績。其理由是,學生和成績單的使用者將因此獲得更加準確的課程成績的理念,從而鼓勵學生選擇平均成績相對低的課程[24]。事與愿違,整個大學的平均成績反而上升了。原因是,盡管高能力的學生較少被寬大評分的課程吸引,但他們在學生中的比例較低。結果,在哪些課程是寬大評分的課程成為所有學生都知曉的信息之后,注冊寬大評分的課程的學生人數反而上升了。學生的這種選課模式被教師觀察到的結果是,一些原來低評分的課程在第二期就變成了高評分的課程。與康奈爾大學不同,威爾斯利學院在2004年推出了一種課程成績限制政策,規定初級課程的平均成績不得超過3.33或B+。結果是,一些過去課程平均分高的系的平均課程分數和學生注冊量都明顯下降了。隨后,這些系的教師的學生評教分數也在4.0標準下降低了統計上顯著的0.11。然而,成績限制政策并沒有消除課程分數膨脹,卻引起了學生對就業的焦慮[25]。畢竟,用人單位會根據學生在校的平均成績判斷學生的工作潛能。
顯然,國外對學生評教的研究主要集中在學生的有限理性和機會主義行為傾向在評教中的表現和后果上。學生評教在實踐中所暴露出的很多問題,都與它假設學生有充分的激勵和理性去評教有莫大的關系。但是,已有的研究在很大程度上忽視了學生評教的博弈方面,至少缺乏深刻理解和解釋學生評教所要求的博弈模型。
中國學者對學生評教研究的主要貢獻是,用博弈模型解釋學生評教中的各種策略性互動。葉五一等用動態博弈模型分析學生評教中師生間的互動,但他們選擇的策略變量不夠合理[26]。孫鰲從教育的信號發送功能出發,揭示了學生評教中高校間博弈的囚徒困境性質,但沒有把這一思想模型化,也沒有對他主張的學生評教失靈的解決辦法——教的咨詢——展開說明[27]。遺憾的是,中國學者都忽視了學生評教中高校與其監管者間的博弈。
本文的基本結論是,學生評教失靈是由學生評教中的各種博弈所內生的,根本的解決辦法決不是努力去“完善”它,也不是要摒棄它,而是要改變它的用途,把它從對教師進行總結性評價和人事管理的工具,變成診斷、考核和發展教師績效的持續過程的環節和手段。其實質是,在高校中實現從評教到教的咨詢的變革。
在教師的各種利益與學生評教分數捆綁的政策下,教師追求的一個重要目標是,自己的學生評教分數達到學校規定的“優秀”等級。
因為,只有如此,他們的那些與學生評教捆綁的利益才是安全的。由于教師最終看到的學生評教分數是一個平均數,最可能導致這個分數低于優秀等級標準的是那些機會主義行動的學生。因此,教師在選擇自己的策略和行動時必須考慮這些學生對他的策略和行動的反應。師生間的這種博弈可用博弈樹展示如圖1所示。

圖1 師生間博弈模型
在圖1所示的博弈中,教師有討好學生和嚴格要求學生兩種策略,學生有給教師打高分和打低分兩種策略。行動的時序是,教師先行動;學生在觀察到教師的行動后采取行動。教師得益的排序是:T1>T2>T3>T4。其成立依賴于兩個假設:第一,教師嚴格要求學生要付出比討好學生更多的努力成本和心理成本,如擔心學生在評教時給自己打低分。第二,對教師而言,在努力成本一定的情況下,高學生評教分數總是好于低學生評教分數。學生得益的排序是:S1>S2>S3>S4。其成立也依賴于兩個假設:第一,學生給教師打低分是有心理成本的,如學生對教師的內疚感和對教師可能產生報復行為的擔心。第二,對學生而言,在心理成本一定的情況下,高課程分數總是好于低課程分數。用倒推法不難發現,教師的均衡策略是在博弈的第一階段討好學生,學生的均衡策略是在博弈的第二階段“如果感知到教師討好學生就給教師打高分,如果感知到教師嚴格要求學生就給教師打低分”。這里,均衡策略的含義是,它是每一方對對方策略的最佳反應,因而是博弈方不愿意單獨改變的策略。實際上,正是因為預料到存在一定比例的學生會采取上述均衡策略,教師才普遍地和被迫地以各種他人難以觀察和證實的方式降低學術標準,去討好學生,以期獲得一個“安全的”學生評教分數。其結果是,課程分數與學生評教分數同時膨脹。
機會主義行動的學生在總學生人數中的比例越高,上述結論就越可靠。這類學生最突出的心理特征是,對學習的期望偏低,往往滿足于獲得及格成績,對學習過程和學識的進步基本上沒啥興趣。因此,上述結論具有明顯的因學校類型而異的性質。
目前,高校教師降低學術標準以討好學生已經是學校、教師和學生等各方間的共同知識。那么,為什么大多數高校會容忍自己的教師討好學生呢?要回答這個問題,就必須理解學校間通過學生就業市場所進行的博弈。該博弈可用得益矩陣展示如圖2所示。

圖2 高校間博弈模型
在圖2所示的博弈中,每個博弈方都有禁止和容忍兩種策略,兩個博弈方同時選擇各自的策略和行動,每個博弈方的四種可能的得益的排序都是:T>R>P>S。得益R>P的主要原因是,當所有學校都容忍本校教師討好學生時,高課程分數就不再代表高學習能力和工作潛能。其直接后果是形成一種混同均衡,用人單位無法根據課程分數把高能力的學生與低能力的學生分開,優秀學生無法通過獲取高課程分數向相關單位發送其高能力的信號,他們會因此抱怨甚至憤恨學校的學生評教政策,其學習的激勵會受到削弱。所有這些后果通過各種途徑和機制,損害整個高校的社會聲譽。表現之一是,學生不認同本國高校,寧愿花費巨資也要到國外讀書。然而,當所有高校都禁止自己的教師討好學生時,前述過程和機制就會在相反的方向上起作用,最終改善高校的社會聲譽。得益T>S的主要原因是,用人單位因在嚴格限制的時間內獲取申請者能力信息的成本相對于其收益偏高,根據申請者平均課程分數判斷其能力的高低。在其它學校容忍其教師討好學生時,禁止教師討好學生的高校的畢業生會因其它學校的學生有更高的平均成績而在職位申請中吃虧。這必然會逐漸地削弱禁止教師討好學生的高校在招生中的吸引力。容忍教師討好學生是每個學校的均衡策略,也是其占優策略:沒有一個學校愿意單獨改變其策略,而且,無論其它學校采取什么策略,每個學校的最佳策略都是容忍其教師討好學生。這是高校教師討好學生能夠長期存在的一個重要原因。
與國外的學生評教不同,中國高校的學生評教最初并不是高校自愿采取的行動,而是在高校監管當局的行政命令下被動采取的行動,而且,一直處在監管當局的監督之下。中國高校與其監管者之間的博弈可展示如圖3所示。

圖3 高校與監管者間博弈模型
該博弈的時序是,高校監管者首先行動,選擇要求還是不要求高校實行學生評教。高校在觀察到監管者的選擇后行動,決定執行還是不執行監管者的要求。最后,監管者在觀察到高校的行動后,決定監督還是不監督高校的學生評教。隱含在模型中的得益數字里的重要假設有:第一,如果監管者要求高校實行學生評教而高校不執行,監管者會因其權力得不到尊重而受損,其報復將直接損害高校戰略決策者的利益。第二,監管者的監督收益包括行使權力所帶來的心理滿足和實實在在的政績等,大于其監督成本。第三,在沒有監督的情況下,高校有更大的自由裁量權,其收益大于有監督下的收益。用倒推法可知,監管者的均衡策略是,在博弈的第一階段要求高校實行學生評教,在博弈的第三階段監督高校執行學生評教,而高校的均衡策略是,在博弈的第二階段執行監管者的要求。這意味著,即使高校主觀上不愿意實行學生評教,由于監管當局的要求和監督,它們在現實中也會實行學生評教。
教師的聘用、任期、晉升、職稱評聘、評優評獎和年度考核等人事決策與學生評教分數掛鉤,還會使大多數教師只關心自己的學生評教分數是否處在“安全的”范圍內,而不關心學生評教分數對改進他們的教學績效的意義。結果,學生評教不僅不能改進教師的教,還會導致對教師的不公平評價,一些學術水平高而嚴格要求學生的教師被打低分,而一些學術水平低的討好者則被打高分[28]。這必然會引起教師對學生評教的抱怨,降低他們的士氣[29]。因此,要克服學生評教失靈,就必須改變學生評教的用途,使其從總結性評價的工具變成形成性評價的手段[30]。為此,必須在高校中實現一個根本的變革:從評教到教的咨詢。
教的咨詢是企業管理咨詢在高等教育中的對應物,其本質是由代表學校的咨詢專家向教師提供的旨在改進教師績效的咨詢服務,是高校績效管理的核心內容和環節。它絕不是一種單純的評價和反饋過程,而是確認、考核和發展教師的績效,并使它們與組織目標一致的持續過程。盡管咨詢專家與教師間存在著權力關系,教的咨詢是咨詢專家與教師間的基于信任和感情的持續的互動和合作過程[31]。在這個過程中,教師要把評教與教的咨詢看成自己成長的機會和其職業責任的延伸,積極參與教的咨詢的各個階段[32]。
教的咨詢主要有三個階段:診斷教師績效問題,制定和執行教師績效改進策略。在第一階段,咨詢專家的主要任務是:確認教師什么地方做得好因而要堅持甚至推廣;什么地方做得不好因而要改進。這里的“確認”不是簡單地根據學生評價或教學督導評教表進行判斷,而是要從教師的自我評價與學生評價的對比出發,傾聽教師對學生評教結果的解釋,與教師們一起討論他們對學生評教的看法和他們的教學理念,以共同確認他們的教的特征和模式,尤其是那些要改進的問題[33]。在第二階段,咨詢專家要與教師一起討論和確定教師要努力實現的和可行的變化或目標,并討論各種可能的策略,包括各種策略的執行所要求的資源,可能遇到的困難,可能引起的變化,尤其是各種改進策略所體現的特定的教學理念,以期在雙方達成共識的基礎上“多中選優”地確定教師績效改進策略。在第三階段,咨詢專家要與教師面對面地討論改進策略的執行情況,回答教師的問題,提供有效的反饋,以保證教師績效改進策略得到有效的和創造性的執行。
與單向的、沒有申述機制的現有教學督導評教和學生評教反饋不同,教的咨詢中的反饋是一種咨詢性反饋,它滲透在教的咨詢的各個階段,其基礎是咨詢專家與教師之間的互動、信任和感情。咨詢專家與教師之間的互動是多樣化的,有產品、處方、合作、親密和挑釁等五種基本模式[34]。教師對咨詢專家的信任是重要的,因為,如果沒有基本的信任,教師就可能把咨詢專家提供的反饋理解成吹毛求疵的和控制性的,咨詢的效果就會大打折扣[35]。咨詢專家與教師之間的感情意味著,雙方看重彼此關系本身的價值,能夠從彼此的互動中獲得積極的心理滿足。教師看重與咨詢專家之間的感情是重要的,因為,有效的咨詢要求教師與咨詢專家間持續的互動。教的咨詢中的咨詢性反饋是一種形成性反饋,是咨詢專家向教師提供的旨在改善教師教的理念、技能、行為和效果的信息。其基本特征是非評價性、支持性、及時性和明確的針對性,它也是一種基于學生評教的反饋[36-37]。這意味著,咨詢專家可以先確認學生評教分數低于平均分的教師,然后多途徑多渠道地搜集這些教師的績效信息,再與教師本人一起討論這些信息,以發現教師的績效問題,并共同制定教師績效改進策略。其關鍵是咨詢專家與教師一起討論教師對學生評教和分數的看法,以及他們的教學理念。研究發現,沒有教的咨詢的單純的學生評教反饋往往不能改善教師的教,而與教的咨詢耦合的學生評教反饋則能顯著地改善教師的教[38-39]。這是因為,教的咨詢中的咨詢性反饋在本質上是一種幫助教師從績效取向轉變到學習取向的認知支持機制,也是幫助教師獲取獨立工作能力的過程[40]。
在教的咨詢中,咨詢專家是教師績效的診斷者、促進者、發展者和合作者而非單純的評價者 ,他們的咨詢才能和努力在很大程度上決定著咨詢的效果。因此,必須挑選和吸引真正有教的咨詢才能的人組成咨詢團隊,并設計和構建有效的激勵機制使他們在追求自己的私利中最大化教師的績效。為此,首先要對咨詢專家實行效率工資,使他們的工資略高于教授的工資。只有這樣,才能吸引真正有教的咨詢才能的人參與教的咨詢實踐,鼓舞他們的士氣,使他們盡其所能地投身于教的咨詢中。畢竟,教的咨詢是一種創造性的復雜勞動,不僅要求咨詢者具備先進的教學理念、高超的溝通技巧和卓越的干中學能力,還要求他們投入大量的時間和心智資源,任何第三方都難以對他們的工作進行有效監督。目前,高校中的教學督導制度的主要問題是,教學督導往往滿足于通過一次性的十幾分鐘的聽課,就給教師一個評分,還不給教師任何解釋和辯護的機會。主要原因是,督導的“工資”偏低,現在的“行情”是每月2 000元,既不能吸引真正有能力的人當教學督導,又不足以使他們下功夫去做好督導工作。當然,根本原因是,目前,教學督導制度在本質上只是學校監督教師而非給教師提供咨詢的機制。
要把學生評教變成教的咨詢的一個環節,還必須為改進教而重新設計學生評教表。目前,高校使用的學生評教表存在的主要問題是:第一,更加關注教師的行為而非學生的行為和成就,體現的是以教師為中心而非以學生為中心的教學理念[41]。評價標準沒有抓住好的教的大多數元素,使用無效的和不恰當的標準去評價教。第二,假設學生有充分的愿望和能力按表中條款和標準公正地評價教師,忽視了學生的機會主義行為傾向和有限理性對其評價行為的不利影響。不僅設置了一些學生沒有能力正確判斷的問題,如教師的溝通技能、學識水平、教學組織和教學規劃等,還導致學生評教在一定程度上成了機會主義行動的學生借以制約教師的渠道和機制[42]。第三,假設有效的教的特征都可以用數字量化,學生評教90分的教師肯定比89分的教師優秀。其結果是對數字的過度依賴和迷信[43]。第四,它包含的教的信念也許與教師的不一致。來自于評價表的反饋無助于教師反思其教學實踐[44]。第五,匿名性降低了學生機會主義地評價教師的心理成本[45]。第六,關注教師的課堂行為,忽視教師的許多課堂外發生的職業行為,如教師在課堂外給予學生的學術和心理輔導等[46]。第七,忽視學科差異,把相同的評價標準強加于所有學科[47]。第八,一些學生評教表包含著教師不可控制的變量,如所使用的教材的適當性等。第九,要求學生進行過多的價值判斷而很少進行事實判斷。結果,學生用數字給出的許多判斷是第三方無法事后證實的,這無疑為學生機會主義地評教開了方便之門。
為教的咨詢設計的學生評教表,其目的是診斷教師的績效問題,其本質是實現學生評教與教的咨詢結合的咨詢性反饋的工具,其基本特征是:第一,傾向于以學生為中心的教學理念,更多地關注學生的學習行為和成就,以學生取得的實際成就評價教師。第二,不要求學生抽象地評價教師,而要求學生用文字說明教師在什么情形下采取的什么行為或措施為什么好或不好。第三,多維度,更多地關注學生的行為和成就的同時,也關注教師的行為。不僅關注他們的課堂內行為,還關注他們的課堂外行為。第四,其基本形式不是學生根據評教表上的條款給教師打分,而是學生回答評教表上的一些開放性問題。這有助于消除讓學生給教師打分必然產生的對學生和教師的不利的心理暗示。第五,其形成過程有教師的參與。讓教師參與學生評教表的設計有三大好處:(1)讓教師體會到學校幫助其改進績效的“善意”和“誠意”,有助于消除他們因工作被置于他人的批評和爭議之下所產生的對學生評教的心理抵制。(2)通過使學生評教表所體現的教學理念與教師心目中“好的”教學理念一致,有助于提高教師對學生評教的認可、參與和對學校的忠誠。(3)讓教師更加深刻地理解學校的期待和努力方向,有助于教師隨時參照學生評教表所體現的績效標準進行自我評價和調整。第六,其使用有教師的參與。在學生評教結束之后,教師要與咨詢專家和學生代表一起研究學生評教的結果,以確認教師的績效問題,共同制定績效改進策略,而不是被動地被告知學生評教的分數。
顯然,教的咨詢是教師、學生和咨詢專家三方共同參與的探索和學習過程,也是集體知識的創造過程。通過教學的咨詢,教師和學生可以學會如何有效地教和學。其實施的困難主要有:第一,學生評教已經是全球絕大多數大學的慣例化實踐,具有使用的方便性和產生評教分數的容易性,也具有組織政治上的合理性和優勢,高校和其監管者滿足于這種實踐而不愿意改變它。第二,大多數高校缺乏實施教的咨詢所需要的專門的人力資源、資金和組織能力。一句話,至少在當下,大多數高校既無意愿也無能力成功實施教的咨詢。但是,能夠率先成功實施教的咨詢的高校一定會獲得差異化優勢和各種先動者優勢。