楊明全 趙瑤|北京師范大學國際與比較教育研究院
教學評價是學校教育不可或缺的一個重要環節。在我國新一輪義務教育課程修訂過程中,評價問題備受關注。最新頒布的《義務教育課程方案和課程標準(2022年版)》提出要全面推進基于核心素養的考試評價,強化考試評價與課程標準、教學的一致性,促進“教—學—評”有機銜接。那么,如何有效開展教學評價?美國在課堂教學評價方面積累了大量的實踐經驗和研究成果,研發了多種課堂教學評價工具和系統,對我國的課堂教學評價改革具有一定啟發價值。
20世紀60年代美國已經出現了關于課堂教學評價與測量的研究。例如,希勒等人使用計算機調查了有效課堂教學的語言特征,發現當教師語言更加流利清晰時,學生的考試分數更高;弗蘭德斯基于社會心理學理論開發出“師生言語互動分析系統”(FIAC),旨在評估社會情感氛圍對學生態度和學習的影響。
從20世紀80年代到21世紀初,美國積極推動基于標準的教育改革,相關教育政策也強化了對課堂教學評價的要求。1983年美國高質量教育委員會發布了《國家處于危機中:教育改革勢在必行》報告,提出英語、數學、科學等學科應該有嚴格的內容標準,學生成績和教師教學質量也應該有可測量的標準。2002年頒布的《不讓一個孩子掉隊法案》,強調應該開放教育的過程,對影響學生成績的因素進行檢查評估,明確教師的績效責任,提高學校教育質量。2009年實施的“‘力爭上游’計劃”和2015年頒布的《每個學生都成功法案》也強調了對教師的課堂教學進行評價,引導教師通過高水平的教學培養有競爭力的人才。
當然,隨著社會的發展,教育政策也需及時進行動態調整。以上這些政策大多強調以學生學業成就為核心開展教學質量評價,過于關注學生的學業成就和學習水平,很大程度上忽視了教師在其中發揮的作用,無法精準有效地診斷教師的教學問題并幫助其提升教學水平。因此近年來,教育界一直在探究如何克服傳統教學評價的弊端,并嘗試推進以課堂觀察為基礎的課堂教學評價系統的研發與應用,標志著美國課堂教學評價開始走向多元和開放。
一是“課堂評估評分系統”(CLASS)。該評價系統由美國弗吉尼亞大學開發研制,將課堂中的師生互動劃分為“情感支持”“課堂組織”“教學支持”三個領域,每個領域又劃分出具體的評價維度。以幼兒園至小學三年級的評價系統為例:“情感支持”領域包括積極氛圍、消極氛圍、教師敏感性和尊重學生觀點四個評價維度;“課堂組織”領域包括行為管理、教學質量和教學活動形式三個評價維度;“教學支持”領域包括認知發展、反饋質量和語言示范三個評價維度。此外,各維度下還進一步劃分了具體評價指標、確定評分標準,從而形成了一套完整的課堂師生互動觀察工具,評價者可以據此對課堂教學進行評估并打分。
二是“教學觀察方案”(UTOP)。該評價系統由美國得克薩斯州立大學開發研制,主要應用于數學、科學、工程和技術等科目。它將課堂教學評價劃分為“課堂環境”“課程結構”“執行效果”和“教學內容”四個維度,每個維度下又細分為若干觀察要點,例如“課程結構”細分為課程順序、重點突出、即時評價、課程探索、課程資源、課程反思等觀察要點。在此基礎上,采用李克特5點量表對觀察要點計分,1分最低,說明課堂表現與預期最為不符;5分最高,說明課堂表現呈現了最佳狀態。此外,評價者還會結合課后教師訪談等收集更多信息,為評價課堂教學提供參考。
三是“為深刻理解而教數學”(TRU)。該評價系統由美國加利福尼亞大學伯克利分校與密歇根大學共同開發研制,將課堂教學劃分為“數學課堂內容”“學生認知需求”“公平學習機會”“學生表現度”和“課堂反饋”五個維度,根據評估標準再把每個維度分為三種水平,并賦相應分值。以“課堂反饋”為例,評估標準的三種水平分別為:教師對學生表現的反饋十分有限,僅僅是糾正學生的錯誤(水平1);教師能夠考慮到學生的數學思維,并總結出學生的常見錯誤,但對個別學生的錯誤并未多做處理(水平2);教師能積極引導學生思考,對不同學生的反饋都體現出恰當的教學方法(水平3)。水平1對應1分,水平2對應2分,以此類推,評價者就可以對教師的課堂教學進行量化打分。
四是“教學質量評估系統”(IQA)。該系統由美國匹茲堡大學開發研制,針對數學和閱讀等科目的教學進行評價,劃分出“任務認知需求”“解釋性話語”和“教師期望”三個評價維度,每個維度下又細分了若干指標。以“解釋性話語”為例,包括參與、教師關聯、學生關聯、學生反饋等具體指標。在課堂觀察的基礎上,評價者結合師生訪談、作品分析等方法共同對課堂教學做出評價。其中,課堂觀察和作品分析采用李克特4點量表進行計分,1分為“非熟練的表現”,2分為“接近熟練的表現”,3分為“熟練的表現”,4分為“示范性的表現”。
一是貫徹基于循證教育的評價理念。循證即遵循證據,目的是保證事物或事件的真實性。循證理念最早起源于醫學領域,1996年有學者提出教育領域也應該嚴格遵循研究證據,由此拉開了循證教育的序幕。此后,美國的一些教育法案陸續強調循證手段在教育實踐活動中的重要性,例如:《不讓一個孩子掉隊法案》多次提到“基于科學的研究”,這種研究突出獲得有效知識的嚴格、系統和客觀的程序,其中包括使用實驗或準實驗設計進行評估;《每個學生都成功法案》進一步強調了教育研究的科學性。這種基于科學研究證據的理念,日漸成為美國基礎教育學校改革的指導原則。美國課堂教學評價系統正是循證教育理念在教育實踐中的具體體現。
為讓教學質量評估更加精準、公正,助推教師專業成長,評價者會以課堂教學評價系統為依據,收集課堂教學的信息和數據,對課堂教學展開評價。在教育實踐中收集到的數據即證據,這些證據反過來又能改進教育實踐。這樣的評價理念改變了傳統的基于經驗和主觀感受的評價范式,為課堂教學評價注入了新的生機和活力。而且,為了體現評價的客觀性和真實性,學校往往引入第三方評價機構來收集課堂教學的相關信息,并以此為證據做出評判,這在很大程度上避免了課堂教學評價的主觀性和隨意性。
二是運用多元化的評價方式。課堂教學評價的主體是人,天然具有較強的主觀性,不同的評價者對同一教學過程進行評價時可能會得出不同的結論,由此導致其信效度不高。為保證評價效果,促進課堂教學評價的規范化和專業化,研究者根據各自的研究領域,將課堂教學拆分為若干維度,并進一步設計了子維度和觀察要點,還編制了詳細的操作手冊,給出了具體的評分標準和案例,以便于評價者采用量化的方法對課堂教學質量進行打分。但是,現實中的課堂教學情境是復雜多變的,僅僅采用量化的評價方式也可能帶來評價的單一化和機械化,因此研究者也采用了訪談、作業分析等方式,形成了以量化為主、質性為輔的課堂觀察評價體系,以對課堂教學進行科學、準確、細致的評價。
三是以推動有效教學作為評價目的。促進學生發展、實現有效教學是學校教育的根本追求,也是美國學者研發諸多評價系統的基本目的。不少美國學者堅信,“無法測量的東西,就無法改進”。傳統的課堂評價更多基于評價者主觀的實踐經驗,無法將課堂教學外顯為可觀察、可測量的指標,導致被評價者“知其然而不知其所以然”,無法真正促進其專業發展。經過多年探索,目前涌現出的課堂教學評價系統多從課堂教學的本質出發,把整個教學過程拆分成若干維度和具體的觀測要點,有利于教師依托評價發現教學中的優勢和薄弱之處,實現精準指導,提高教學的有效性。在基礎教育階段,教師的專業發展進步很大程度上也會帶來學生的高品質成長和學業水平提升,從而實現發展學生核心素養、提升育人效果這一根本目的。