農艷萍 羅蓉 肖麗平
2010到2011年間,美國教師評價發生了顯著的變化。國家開始要求學校使用多層次等級評價體系,而不是把教育者列為是否“令人滿意的”這種“非此即彼”的判斷來評價教師;要求各區將學生學術發展和高質量的評價評估準則納入對教師和校長的評級中;強調教育者面臨評價后的潛在后果。
受聯邦政府政策和激勵措施的驅動,包括初等和中等教育法案豁免,學校改進贈款(SLGs)和“力爭上游”(RTTT)計劃獎勵等,越來越多的國家政策制定者們都在改變教師評價政策,包括更頻繁、更嚴謹的評估措施,如旨在測量教師對學生學業成績貢獻的學生學業評估。根據2012年國家教師質量委員會的資料,2009年僅有14個州要求每年對教師進行年度評估,但是到2012年這一數字上升到23個,僅2012年一年,就有43個州要求對所有新教師進行年度評估。美國不同形式的教師評價均關注以下幾個方面:其一,教師個人在課堂教學上的表現(教師鑒定,教師同行評價和學生等級評定);其二,學校環境(學校外部檢查和學校內部自我評估);其三,學生成果(國家或地區的學生評價);其四,增值評估(隨著時間的推移來衡量學習的收獲)。
增值評估(value-added assessments)是利用統計模型,對教師和學生在課堂內取得成就之間的關系作出判斷的評價方式。增值評估衡量的是學生學術成就隨著時間推移而發生的增長,而不是學生在某一時間點的考試成績。在評價教師時排除會對學生成績造成影響的如社會經濟地位、殘疾狀況、學生種族等因素的影響,而對教師效能做出評價,是一種更加客觀公平的評價教師效能的方法。精心設計的增值評估,可以提供關于學校和教師績效以及學校和全面系統改進目標區域的更準確的定量信息。增值評估目前只在英國和美國實施。
一、賓夕法尼亞州增值評估體系
一直以來,賓夕法尼亞州的教師評價體系完全依賴于學校管理人員或其他人員進行,主要是根據丹尼爾森的框架(Danielson Framework),通過衡量教師的計劃和準備、課堂環境、教學策略和專業責任來評價教師。
2012年,賓夕法尼亞州通過《82法案》,為教師評價系統設定了新的評價標準。該體系主要包括四個方面的內容:教師觀察和實踐(占50%);基礎數據/學校績效簡介(占15%);選擇性數據(占20%)以及教師具體數據(15%)。鑒于《82法案》的相關規定,賓夕法尼亞州在全州范圍內的學區進行了為期三年的試點項目,同時還為教師、行政管理人員和教育領導者討論評級的替代方式舉辦論壇。該試點項目的第一階段包括四個校級系統:一個主要的城市學區系統和一個中間層次的學校系統,一個全州增值數據分析系統,以及來自試點的課堂觀察結果關系的系統。第二階段擴展到全州大約100個地區,涉及5000多個教育工作者。
該州在2013—2014學年實施的教師評價公式(詳見表1)主要由《82法案》設定的教師評價體系演變而來的。
二、增值評估體系解析
從表1可得知,賓夕法尼亞州增值評估體系對教師的評價主要依據對教師課堂觀察以及教學實踐的具體數據。其內容占據整個評估體系的二分之一(50%),具體包括四個方面的考察內容:計劃和準備、課堂環境、教學和專業責任。下文即以教師觀察/實踐為例,詳細說明。
1. 計劃和準備
教師展開教學前的計劃和準備,主要從教學計劃、預期和活動以及材料三個方面進行考察。
教學計劃的主要考察點為:目標與國家課程標準保持一致;活動、材料以及評估:和國家標準保持一致;遵循從基本到復雜的順序;建立在學生已有知識上;為學生工作、課程的開始與總結提供時機;證據表明教學計劃非常適合大多數學習者的年齡、知識結構以及興趣;證據顯示教學計劃提供許多機會滿足個別學生的需要。
預期包含的考察點為:教師為每一個學生設立高標準以及嚴格的學術預期;教師鼓勵學生從錯誤中取得經驗;教師創造學習機會讓大多數學生可以體驗成功;學生根據教師的預期完成他們的工作。
活動以及材料的主要考察點為:第一,活動以及材料包括以下大部分內容:支持課程目標;具有挑戰性;保持學生注意力;引發各種思考;提供反思的時間;和學生生活相關;為學生之間的交流提供機會;引起學生的好奇心和懸念;給學生提供選擇;把多媒體與技術整合在一起,把校外課程資源整合在一起;第二,文本和任務具有適當的復雜性。
2. 課堂教學環境
課堂教學環境,包括學生分組、管理學生行為、課堂環境和尊重文化四部分。
學生分組是在課堂教學中,教師為了更加有效地教學而設計的。主要考察:教學分組安排大多是為了提高學生的理解以及學習效率;小組內的大部分學生知道他們的角色、責任以及小組工作的預期;小組內大部分參與人員對于小組工作以及個人任務負有責任心;教學分組的依據(性別、種族、能力以及年齡)大多時候是為了更好地完成課程目標。
管理學生行為部分的考察點主要分為:大多數學生的行為表現得十分良好并且在參與工作,但是也可能發生一些小的學習中斷事件;教師對于學習以及行為規范制定了清晰的準則;教師會使用一些技術,如集體公約、不定期的活動等維持學生行為;教師忽視一些無關緊要的行為,但是有時候會中斷課程進行處理;教師處理使得課堂中斷的個別學生,但是有時候也會波及全班學生。
課堂環境考察點主要有:歡迎大多數成員以及客人;是大多數學生一起組織的且可以理解的;物資、設備和資源都是可以得到的;展示學生的工作;所有安排都是為了促進學生個人以及群體的學習。
尊重文化方面的考察點有:師生互動總體而言是友好的,但偶爾存在不一致、偏袒或漠視學生文化的現象;學生表現出對教師的尊重,對他人也彬彬有禮;教師大多時候接受學生的興趣以及觀點。
3. 教學
教學涵蓋的內容較廣泛,主要包括顯示的教學內容、課程結構和進程、激勵學生、提問和反饋五部分。
教學內容的考察點大多時候包括:課程目標建立、課程組織的預覽以及課程內部的總結等內容的可視化;與新的概念和想法相關的例子、插圖、類比以及標注;在教師的指導下使用有效的思維過程模型來顯示預期的表現;簡潔的溝通;邏輯順序以及分段;所有必要的信息;沒有無關緊要的、混亂的或不必要的信息。
課程結構和進程的考察點是:課程進入時間迅速;課程結構清晰緊湊,開頭、中間、結束明朗化;課程節奏適當,并有時會為處于不同學習水平的學生提供機會;用于分發材料的時間是高效的;在教學內容的轉換過程中沒有浪費時間。
激勵學生方面的要點為:教師有時候進行內容的組織以便學習內容對于每一個學生都是相關的和有意義的;教師有時候對有疑問的、好奇的、具有探索價值的學習經驗進行開發;教師有時候強化以及獎勵努力行為。
教師的提問應是不同和高質量的,包含的考察點為:問題有時需要學生引用課程中所學習的知識;問題一般具有目的性和連貫性;提問的頻率適中;問題的提出有時服務于教學目標;問題有時需要積極的回應;有時提供一定的等待時間;教師基于學生能力以及性別之間的平衡來對志愿以及非自愿的學生進行提問;當涉及文本的時候,大多數的問題需要基于文本。
反饋方面的考察點主要包括:進行的口頭、書面反饋大多是關于學術的,比較頻繁,多數是高質量的;在指導實踐以及家庭作業的檢查時有時給予反饋;教師在教學活動中提供幫助,并指導學生的工作;有時使用來自學生的反饋指導、調整教學。
4. 專業責任
教師的專業責任,主要包括學科內容知識和學生的知識兩部分。
學科內容知識主要考察:教師在教學實踐中顯示出對大多數學生學習困難有深入理解;教師實踐有時候包括了學生的興趣以及文化遺產;教師有時候提供不同的指導方法以及內容,確保學生掌握所教授的知識內容。
教師關于學生知識的相關考察點為:教師在教學實踐中顯示出對大多數學生學習困難有深入理解;教師實踐有時候包括了學生的興趣以及文化遺產;教師有時候提供不同的指導方法以及內容,確保學生掌握所教授的知識內容。
對教師評價體系諸多元素的考察可能將會超過三年這一預計的中長期時間。部分原因是由于州使用了三年滾動平均值來計算教師對學生學習的影響。例如,在2013—2014學年,盡管各區可以選擇將選擇性數據作為影響因素,但是,教師評級將會從觀察分數和基礎數據分離出來。這三年滾動平均值的數據包括2013—2014學年、2014—2015學年以及2015—2016學年的數據。到那時,教師將會看到這三年的滾動平均值在教師最后的評級形式中體現出來。下一年,三年滾動平均值將會包括2014—2015學年,2015—2016學年和2016—2017學年的數據。
賓夕法尼亞州的新教師評價政策開啟了教學實踐的改變過程。跨越500個區有效地執行這一政策并將它與其他改革整合在一起,其中包括含有共同學術標準核心的國家新體系,這對州、區和基礎層面的教育領導者來說是一個重大的挑戰。
美國教師評價體系改革嘗試建立一套清晰的教師評價標準和能力指標,力求客觀公正地評價教師而不是只基于學生分數或是升學率來評判教師。其相關改革經驗表明,教師評價需要與更寬泛的評估框架相整合。教師績效和測量系統的標準和能力需要與學生學習的標準和能力相一致,評價體系應至少包括課堂教學環境、教學和專業責任三部分。對教師的評價應把改進為目的的形成性評價與終結性評價(職業發展)有機結合。旨在改進的教師評價系統應該支持教師職業晉升,并幫助教師獲得更多的專業知識和能力方面的進步,以便他們在以后的職業生涯中更好地指導初級教師,進而提高教師隊伍的素質。
本文系江西省教育科學“十二五”規劃課題 11YB149
(作者單位:1. 江西師范大學教育學院
2. 江西師范大學心理學院)
(責任編輯:任媛媛)