朱成 武小鵬 熊佳



【作者簡介】朱成,碩士研究生,研究方向為數學教育、教育測量與評價;武小鵬(通訊作者),教授,研究方向為教育測量與評價、數學課程與教學、課堂教學評價;熊佳,碩士研究生,研究方向為數學教育。
【基金項目】2022年度江蘇省高校哲學社會科學研究一般項目“數學核心素養的測評研究”(2022SJYB0166)
【摘 要】教師評估是促進教師專業發展和提高學校教育質量的有效手段。美國田納西州教師教學成長的有效性和結果模型(TIGER)是在增值評價的基礎上,結合標準化評價而開發的,從學生成績、學生進步和課堂觀察等三個方面對教師進行評估。評估的目的是通過整合具有高可靠性和有效性的定量和質性評價方法來促進教師的成長。這種教師評估模式反映了美國教師評價的新趨勢,對我國新時代教師評價的目的、方法、主體和體系有重要的參考價值。
【關鍵詞】教師評價;TIGER;增值評價;質性評價
一、引言
2020年10月,中共中央、國務院印發《深化新時代教育評價改革總體方案》,明確提出要完善立德樹人體制機制,扭轉不科學的教育評價導向,堅決克服唯分數、唯升學、唯文憑、唯論文、唯帽子的頑瘴痼疾[1],為教師教學評價改革指明了方向。為構建符合新時代教育發展需求的教育評價體系,教師評價改革需要立足于國內實際,還要有國際視野,借鑒和學習國際上優秀的教師評價經驗。
美國田納西州在發展增值評價技術的過程中,也注意到了教師專業發展的問題,于2010年開發了教師教學成長有效性與結果模型(TIGER),將量化評價與質性評價進行有機結合。TIGER有完備的評價標準、專業的評估人員和多樣化的課堂觀察模式,關注評價過程,注重結果運用,克服唯分數論的弊端,有效地促進了教師的專業發展。TIGER發展至今已初具規模,是田納西州最成功的教師評估模型之一。
本文深入研究田納西州教師評估模型TIGER的評估內容、評估流程、評估者培訓,對其實施成效進行剖析,以期為我國建立質性與量化相結合、基于課堂觀察的教師評估體系提供參考和借鑒。
二、TIGER評估系統
TIGER既是形成性的又是終結性的,是一種教師評價的成長模式。教師的成長和決策都直接建立在這個過程中,評估過程不是為了評判教師的優劣,而是為了促進成長。[2]評估教師的目的是為所有學生提供優質的教學,并促進教師自己的專業成長。因此,TIGER有一套特定的評估標準用以指導教師和觀察(評估)者,以及記錄證據。評估標準規定了有效教學、有效教師規劃策略、課堂環境和教師專業水平的關鍵指標。TIGER是夏洛特·丹尼爾森(Charlotte Danielson)教學框架的變體[3],該框架自1996年首次推出以來就被廣泛使用和研究,是當前許多教師評估模型的基礎。評估者根據這一框架,就課堂上有待改進的地方或課堂上較為優秀的地方提供反饋。
(一)TIGER評估內容
評估者從教學設計與計劃、教學環境、教學過程、專業化水平等4個方面對教師進行評估。其中,前3項是課堂觀察的3個一級指標,教學設計與計劃包含3個二級指標,教學環境包含4個二級指標,教學過程包含12個二級指標(見表1)。
評估者基于課堂的觀察對教師的表現水平從1分到5分進行評定:1分為顯著低于預期,2分為低于預期,3分為滿足預期,4分為高于預期,5分為遠高于預期。
(二)評估流程
TIGER的評估理念反對“一刀切”,堅持以差異化的方式進行評估,因此它的評估過程是形成性的,也是總結性的,根據教師成長所處階段進行分層評估[4]。評估人員根據教師所處的階段(新手、熟練、專業)開展對應階段的評估。3個階段都有對應的評估目標:第一階段的評估目的是“輔導”,旨在幫助新手教師達到能提供高質量教學的程度,如圖1所示;第二和第三階段的評估目的是“成長”,如圖2所示,不同的是成長的對象,第二階段是幫助教師自我提升獲得專業成長,第三階段是教師能幫助其他教師。
教師所處的階段由田納西州教育部(TNDOE)進行評定,教師必須滿足并保持各個階段的目標才能進入下一個階段的評估,并最終成為一名被TNDOE承認的專業教師。評估中,50%的定量部分由35%的增值數據和15%的成績數據組成,分別由TNDOE批準的田納西州教育評估系統(TVAAS)和田納西州教育委員會規定的測試數據提供,50%的定性部分根據課堂觀察得來,在學年的年底進行綜合評定,做出針對教師個體的總結性決定(如留任、晉升、不續聘等)及針對教師整體的計算效能評定。
(三)評估者培訓
TIGER的評估執行者可以是達到第三階段的教師、教研員、教學主管,也可以是校長或助理校長。所有的評估人員必須參加兩天的面對面的評估人員可靠性培訓,且在培訓后需要進行認證。申請認證之前,必須提供有關如何實施TIGER的計劃設想,計劃應包括介紹TIGER評估系統,劃分學校中教師所屬評估階段,指定研究員協助評估過程等。正式的認證有兩種途徑:一是評估準確率與專家的評估結果相比達到90%,則可直接通過認證,成為正式評估者;二是評估準確率與專家的評估結果相比達到70%,則需通過國家卓越教學研究所(NIET)[5]的在線認證考試。兩種途徑獲得的認證有效期限均為一年。
三、TIGER質性與量化結合后的成效分析
(一)評價體系實施效果
1.學生獲得了更好的學業成長
學生成績的變化直觀反映了教學質量,田納西州規定使用學生學業成績的增值來評估教師教學的有效性,使用TVAAS將教師的影響與學生家庭背景等非教育因素的產出分離開,衡量學校或教師的“凈效應”[6]。田納西州在2012年的教育報告中指出,使用TIGER評估模型的教師取得高增值得分的比例更高,達到了59%[7]。研究人員調查了區域內230名使用TIGER評估模型的教師和2839名使用其他評估模型的教師,把各個模型評估得分與學業增值得分進行分析,發現TIGER模型的得分與學業增值得分之間的相關性高于其他模型得分與學業增值得分之間的相關性[8]。各方面數據表明,TIGER模型在提升教學質量和提高學生學業成績上更加出色。
2.評估受到教師的廣泛認可
早期的評估實踐者認為教師評估的價值是能夠解雇效率低下的教師,保留教學優秀的教師[9]。這種功利性的評估觀點扭曲了教師評估的真正目的,實施過程中給教師帶來了無形的壓力。田納西州教育部認為有效的教師評估系統應該為教師提供有關其教學實踐質量的有意義的信息,促進教師專業能力長期發展[10]。在一項面向TIGER使用群體的調查中,60%的教師認為在評估的過程中感受到的是幫助,得到的反饋意見集中于教學改進,評估教師優劣的情況較少。2015—2017年,教師對該評估系統的支持率從77%提高到81%,每年的支持率都高于州內其他評估系統。不同層次的教師對該評估系統的認可度也十分一致的高,調查表明TIGER的支持率隨著教師工齡增長而有所提升[11]。
3.區域合作與反饋效率提升
合作與反饋是教師專業發展、評估系統不斷完善的重要環節。校長等領導層在評估系統中扮演著評估者和管理者的角色,協調著區域內的評估開展工作。78%的教師認為學校領導層能夠持續、認真地解決教師專業發展中遇到的問題,對反饋信息具有較高的接收效率。教師之間的合作交流是一種良性的工作關系,能反應評估系統對教師的聯結程度以及教師對評估系統的認可度,有90%的教師表示自己會根據評估系統提出的問題[12],邀請同事對自己的課堂實踐進行觀察并反饋,并且對這種合作關系表達了積極的態度。
(二)成效原因分析
1.均衡量化與質性,教師與學生共同成長
學生學業的成長是教師優秀教學能力最好的證明。2015—2017年,TIGER進行了改革,調整了評估中量化數據與質性數據的占比,學生成績的量化數據占比由原先的50%降低為40%,教師的質性評價數據占比提升至60%。但過度重視課堂觀察的質性評價,使得部分教師在評估時更關注表演性,即有意地加入一些對學生無用但對評估有利的教學行為,以提高課堂觀察評分。該次改革導致了學生學業總體下降,因此,田納西州對TIGER做出調整,自2018年后,評估一直保持質性與量化各占一半[13]。教師評價的終極目的是促進師生共同成長,因此教師評價制度應以促進師生成長為導向,分清教師評價的直接主體和目標主體,質性評價部分使用科學的評估指標,為課堂教學、教師發展提供引導,量化部分基于增值評估技術將學生學業成長進行數據呈現,兩種取向的有機結合使得教師與學生共同成長[14]。
2.廣泛收集表現證據,保證結果公平性
證據的收集是辨別教師教學表現和進行有效評估的重要依據。評估人員通過巡查或短期課堂訪問來記錄課堂的日常活動,并為教師提供形成性評估數據。基于課堂實際情況,一節課難以將評估中的19項指標要求的課堂表現證據盡數展示,因此教師可以使用教學材料作為一些特定指標的表現證據,如課程計劃、樣本作業和評估、與家長和監護人溝通的例子、專業發展計劃等。在最終成績上,評估負責人或管理人員綜合考慮所有觀察數據、演練數據和教學材料,給予總結性得分。與單純的通過課堂觀察得出平均分數相比,對整體教學進行總結性的評估能讓評估者對教師做出更細致、準確的評分。教師不再需要為課堂觀察期間的一個失誤而擔憂,可以真正地投入到教學提升中去。
3.投資專業平臺,提升評估過程連貫性
田納西州采取了一系列措施,如建立專業學習社區,選定員工發展日,鼓勵同行觀察和輔導等,旨在構建教師專業合作平臺,形成規模性的評估合作。措施實施后,研究人員會開展相關調查來檢驗這些措施的有效性,例如在一項名為“教學伙伴”的計劃中,研究數據表明高技能教師與低技能教師進行匹配學習,可以有效提升低技能教師的工作能力,在數值上,學生的成績提高了0.12個標準差[15]。教師專業的發展與評估系統的改進,還必須采取針對性的措施,保障評估的連貫性,使反饋第一時間傳達至被評估者手中,提高被評估者對評估結果的反應能力[16]。學校的領導層在這一環節發揮了至關重要的作用,TIGER評估系統針對評估中的領導與管理人員制訂了嚴格的標準,不允許營利性組織、機構參與,保證信息反饋的專業性與公平性,避免因錯誤的評估信息解讀造成反饋失誤。此外,TIGER申請了可觀的財政資金,為領導層解決反饋問題提供了支持,能夠通過培養教師教學能力、提供明確的指導和創建有效教學的組織結構來提升教學團隊水平[17]。
四、TIGER對我國教師評估的啟示
TIGER是由美國具有較強學術背景的團隊開發的,開發過程科學嚴謹,評估理念先進,是一種科學公正的評估方法,能夠較為真實地反映和評估教師的教學水平,提高教師的教學能力,對我國教師評價具有借鑒價值。
1.明確階段性評估目的,以師生成長為導向
教師的專業發展是持續上升且分階段的過程,每個階段都需要量變的積累,即具備了所處時期特點的發展條件才可能產生新的質變。[18]當前我國教師專業發展評估存在“重結果、輕評估”的現象[19],過于強調教學中的“輸出”功能,傾向于對教師的教學表現進行判斷,缺乏對教師專業發展的反饋調節功能。TIGER是為教師專業成長而設計的,兼顧教育行政管理者、政策制定者的利益訴求,系統權衡教師主體與利益相關者的利益,重視評估對教師專業能力的導向、鑒定、診斷功能,關注教師課堂專業表現的證據,基于課堂專業表現的證據對師資進行改進、調控,而不僅僅是對表現做出判斷。TIGER劃分了教師專業發展的三個階段,錨定高質量教學目標,推動教師隊伍建設,為評估者提供精準的評估范圍,從而能夠更有針對性地協助教師制訂專業成長計劃,改善教學。此外,TIGER厘清了不同類型教師的階段性發展目標,明確了評估者的評估重點和教師的工作方向:輔導新手教師,保證教學質量;鞏固熟練教師,促進專業成長;發展專業教師,助力協同發展。TIGER還建立了良好的評估流程,讓優秀的被評估者有機會成為未來的評估者,讓評估和教學進入良性循環,不斷改善和提升。[20]
2.嚴格培訓機制,構建評價主體多邊互動
我國中小學實行的教師評價模式中,多以學生成績情況或教師能力水平考試為評估手段,多以資質較優的教師、管理者等為評估者,不統一評估手段,且未經專業培訓的評估者產生的評估結果很難被高效利用,不利于教師評估的可持續發展。[21]TIGER提供了完善的評估體系,采用科學的評價指標,多領域、多角度對教師的課堂教學進行觀察。在評估者的選取和培訓上,TIGER嚴格遵循篩選原則和培訓手冊的要求,審查評估者的專業背景并考慮評估者參與評估的意愿,這在一定程度上保證了評估者的專業性和能動性,避免了一些形式主義的發生。在評估準確性上,TIGER確保每個經過認證的評估人員都能理解、掌握評價指標的各維度,保證穩定的評估準確度,為參與評估的各方(校長、教師、工會等)提供可信服、可使用、可推廣的反饋,避免因評估的不專業造成評估資源的浪費。[22]專業的評估人員以科學的評價指標、評價標準、評價流程、評價理念等作為依托,評價結果便具備了可研究性、可傳達性,教育從業者可更高效、更積極地從反饋信息中獲得持續的反思。我國在對評估者的選拔和培訓上,可以適當增加投入,規范、統一教師評估體系,提供教師評估的專業平臺,構建良好的教師評估生態。有良好的培訓機制作為基礎,評估者可以更全面地把握評價目的、評價標準以及觀察重點等,這有利于評價人員與教師的互動、溝通、協商,建立良好的多邊互動機制,從而能將規范、準確的信息傳達給教育決策者,促進教師評估高效發展。
3.豐富評價方法,質性與量化相結合
教師評估要引導教師上好每一節課,關愛每一個學生,建立教學述評制度。我國的教師評估多數關注學生成績的衡量,或是關注教師的績效考核,這是一種片面的教育績效觀,唯分數論和量化主義傾向嚴重。
學生是教育的承受者,教師的教學成果、專業成長也體現在學生身上。從學生是教育的客體這一角度看,教師的評估需要量化的手段來測量教育質量的高低。但需要注意的是,學生同時也是學習的主體。教育過程中進行的精神生產,要促進學生在德、智、體、美、勞等方面的發展,教師在課堂上的教學則屬于精神生產的過程。教師在教學中調動學生的主觀能動性和培養學生的思維等行為,通過學業成績或者績效等量化手段無法體現,因此教師評估中的質性評價也十分重要。
TIGER擁有一套成熟的課堂觀察標準,評估者根據課堂觀察與教師提供的材料,從教學設計與計劃、教學環境、教學過程等方面對教師進行評估,保障了教師評估的質性部分。在量化部分,TIGER以事實數據為基礎,借助統計學方法,使用田納西州增值模型分析學生的成績數據,有效反映了教師效能。TIGER兼顧了教師課堂教學情況和學生學業成長,把握質性與量化的統一,準確、公平地對教師教學進行評價,同時也調動了教師和學生的積極性。
參考文獻:
[1]中共中央、國務院印發《深化新時代教育評價改革總體方案》的通知[EB/OL].(2020-10-13)[2023-12-25]. http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/202010/
t20201013_494381.html.
[2]武小鵬,武小霞,張怡. 教師教學評估系統的構架與機制[J]. 比較教育研究,2019(8):59-67.
[3]Charlotte Danielson enhances framework for teaching with new evaluation instrument[EB/OL].[2023-12-25]. http://www.danielsongroup.org/.
[4]TIGER:A formative model for teacher evaluation[EB/OL].(2015-10-12)[2023-12-25]. http://tigermodel.net/about/.
[5]BARNETT J H,RINTHAPOL N,HUDGENS T. TAP research summary:examining the evidence and impact of TAP:the system for teacher and student advancement[R]. [S.l.]:National Institute for Excellence in Teaching,2014.
[6]MCCAFFREY D F,LOCKWOOD J R,KORETZ D M,et al. Evaluating value-added models for teacher accountability[M].[S.l.]:RAND Corporation,2003.
[7]Tennessee Department of Education. Teacher evaluation in Tennessee:a report on year 1 implementation[EB/OL].(2015-11-15)[2023-12-25]. https://www2.ed.gov/programs/ racetothetop/communities/tle2-year-1-evaluation-report.pdf.
[8]MORRIS N R. The Tennessee educator acceleration model and the teacher instructional growth for effectiveness and results model on measures of teacher effectiveness:a comparative study[D]. Johnson City:East Tennessee State University,2017.
[9]PAPAY J. Refocusing the debate:assessing the purposes and tools of teacher evaluation[J]. Harvard Educational Review,2012(1):123-141.
[10]KRAFT M A,GILMOUR A F. Can principals promote teacher development as evaluators?A case study of principalsviews and experiences[J]. Educational Administration Quarterly,2016(5):1-43.
[11]GAVIN E I,MAGEE D. Evaluating for improvement:perceptions of Tennessees teacher instructional growth for effectiveness and results(TIGER)observation model[D]. Nashville City:Vanderbilt University,2019.
[12]Tennessee Comptroller of the Treasury. Charter schools:funding Tennessees authorizers and schools[EB/OL].(2014-11-01)[2024-03-22]. https://digitalcommons.memphis.edu/govpubs-tn-comptroller-office-research-education-accountability/97/.
[13]FINCH M A. Tennessee to the top:one states pursuit to win race to the top[J]. Educational Policy,2017(4):481-517.
[14]HILL H C,GROSSMAN P. Learning from teacher observations:challenges and opportunities posed by new teacher evaluation systems[J]. Harvard Educational Review,2013(2):371-384.
[15]PAPAY J P,TAYLOR E S,TYLER J H,et al. Learning job skills from colleagues at work:evidence from a field experiment using teacher performance data[J]. American Economic Journal:Economic Policy,2020(1):359-388.
[16]MURPHY J,TORRE D. Creating productive cultures in schools:for students,teachers,and parents[M].[S.l.]:Corwin Press,2014.
[17]MCPARTLAND J M. Organizing schools for improvement:lessons from Chicago[J]. Contemporary Sociology,2011(1):16-17.
[18]邵志豪,解慶福. 學術型教師:新時代教師發展的思考、定位與實踐:以東北師范大學附屬中學為例[J].東北師大學報(哲學社會科學版),2019(4):128-133.
[19]何閱雄,李茂森,高鸞. 教師發展視域下的教師評價機制的思考與實踐[J].高等工程教育研究,2016(1):107-112.
[20]趙嵐,邱陽驕. 教師分類評價的價值意蘊、行動邏輯與實踐進路[J].中國考試,2021(10):1-11.
[21]張輝蓉,劉燚,丁丁.中小學教師評價改革進展調查與未來路向[J]. 湖南師范大學教育科學學報,2023(2):82-92.
[22]吳軍其,趙夢琦,周思慧,等. 高校教師培訓有效性評價指標體系建構[J].現代教育管理,2020(11):66-72.
(責任編輯:潘安)