孟慶俠 劉淑杰
摘要:美國核心課程標準自實施以來,新的教師評價體系應(yīng)運而生。本文通過兩個案例介紹了路易斯安娜州教育局在構(gòu)建新的coMPAss評價體系中所遇到的困惑。由此得出比較教育學(xué)者在介紹外國經(jīng)驗時應(yīng)該抱有客觀的態(tài)度,不能盲目否認我國本土化的方法。中國本土的學(xué)科教師評價可能更適合實踐層面的評價需要。
關(guān)鍵詞:教師評價;核心課程;美國
doi:10.16083/j.cnki.1671-1580.2016.08.010
中圖分類號:H315
文獻標識碼:A
文章編號:1671-1580(2016)08-0030-04
2010年6月,美國NGA中心(the National Gov.emors Association Center)和CCSSO委員會(theCouncil ofChiefState School Officers)共同頒發(fā)了州共同核心課程標準(common Core State Stan.dards)。這一標準包括英語語言藝術(shù)和數(shù)學(xué)兩個學(xué)科。年級包括從學(xué)前班到12年級。核心課程標準由專家、教師、教育局及中小學(xué)的行政領(lǐng)導(dǎo)和家長共同制定完成。其宗旨是為美國各州提供一個較為一致而明確的國家課程要求。
自2012年起,美國絕大多數(shù)州應(yīng)用這一課程標-準來取代本州獨立的課程標準。核心課程標準具有如下特點:(1)核心課程標準的要求符合未來大學(xué)和工作的需要。(2)核心課程標準在表述上清楚,明白,和具有一致性。這樣能夠使教師和家長清楚學(xué)生到底應(yīng)該達到什么樣的學(xué)習(xí)目標。(3)各州要求的一致性,使學(xué)生不因為居住地不同而影響到他們的知識學(xué)習(xí)進程。(4)通過高級思維能力(high or-der skills)的培養(yǎng)來掌握內(nèi)容和應(yīng)用性知識。(5)以當前州課程標準為基礎(chǔ),并參考了其他的考試成績優(yōu)異的國家的課程標準。(6)在課堂教學(xué)中注重實效性。(7)核心課程標準向世界高水平的基礎(chǔ)教育國家看齊,以使所有的美國學(xué)生能夠在今后的國際經(jīng)濟競爭中取勝。(8)以證據(jù)和過去的教育研究理論為基礎(chǔ)。
由于核心課程標準設(shè)定了較高的教育目標,各州的教師教育評價標準也隨之改變。傳統(tǒng)的課堂教學(xué)評價是僅有校長每學(xué)期聽教師一節(jié)課,然后給出一個合格或不合格的評價。這種評價已經(jīng)不能滿足核心課程標準對學(xué)生所提出的高期望和對教師提出的高要求。目前美國各州正在探索新的評價方式和標準。下文所介紹的COMPASS評價是路易斯安娜州教育局制定的教師評價的一部分。從這一標準可以看出從2010到2015年的評估變化。在2010和2011年的評估中,其評價標準只有兩個標準:滿意(satisfactory)和不滿意(unsatisfactory)。路易斯安娜州有99%的教師被評為滿意。但從2012年以后的評估中,由于應(yīng)用了COMPASS評價標準,教師被評為四個等級:非常有效、有效、初見有效和低效。其中前兩個指標為好的評價。這一指標體系提升了教師的教學(xué)要求。例如,在2012-2013學(xué)年的評估中,教師被評為前兩項指標的比例為89%,2013-2014學(xué)年的評估則為93%,這兩年的評估中非常有效的教師分別占27%和34%。新的評價模式對教師的要求不但要其所教的學(xué)生應(yīng)該有實質(zhì)性提高,同時其課堂教學(xué)還要被觀察并和核心課程標準的要求相一致。下面給以簡要介紹。
COMPASS評價首要關(guān)注點是教師為學(xué)生設(shè)定的學(xué)習(xí)目標。這些學(xué)習(xí)目標必須滿足三個方面的要求。第一,應(yīng)該和核心課程標準的要求相一致。第二,這些目標必須高標準并且契合學(xué)生的實際學(xué)習(xí)情況。第三,這些目標必須經(jīng)得起地區(qū)或州統(tǒng)一考試的檢驗,而不是教師自己的測驗。最后的一條標準實際上和目前提倡的教師增值評價有密切的關(guān)系。由于統(tǒng)一考試的成績每學(xué)期都記錄在案,教師所教學(xué)生的相對成績提高便可以統(tǒng)計出來作為教師評價的一個重要方面。對于第一條和第二條的評價則主要通過校長和專家教師的課堂觀察來獲得;這方面的評價應(yīng)該說在美國是一種新的嘗試。在執(zhí)行過程中學(xué)校領(lǐng)導(dǎo)會遇到較大的挑戰(zhàn)。下面通過兩個例子來介紹一下校長的課堂評價過程及其問題所在。
案例1:校長Landry先生的教學(xué)支持
這所高中是路易斯安娜州的XXX HighSchool校長助理是Binkley女士。被觀察的教師是教英語Ⅲ的。在這所高中的每一學(xué)期,所有的數(shù)學(xué)和英語教師都要接受兩次課堂觀察(整節(jié)課的)和多次的隨時觀察(幾分鐘的)。這些觀察由Landry先生、Binkley女士和本校的有經(jīng)驗的評課老師來完成并提供具體的教學(xué)反饋以幫助教師如何在教學(xué)中將其教學(xué)內(nèi)容和核心課程緊密相連。Landry先生還要求教師在每學(xué)期都要制定一個計劃來反映自己學(xué)生的學(xué)習(xí)成績上的進步。在開學(xué)之初Landry先生制定了一個第一個月計劃來親自觀察20名教師(共有40名教師需要觀察)。
Landry先生觀察了一位11年級的英語教師。觀察結(jié)束后,Landry先生問這位教師這節(jié)課是如何和學(xué)生的期末進步評估(student learning target)相聯(lián)系。教師的回答是:“現(xiàn)在回答這個問題太早,但我相信他們會做得很好。”接下來Landry先生告訴教師他觀察到了幾位同學(xué)好像不明白講課的內(nèi)容。并說:“你的學(xué)生需要清楚本節(jié)課的目標。”事實上,校長的這個評價并沒有給教師以具體的指導(dǎo)。兩個星期后,Landry先生讓Binkley女士對這位教師進行一次隨機觀察。Binkley女士對這位教師提出的建議是應(yīng)該提高學(xué)生的課堂參與程度。她并沒有研究這位教師的課程內(nèi)容是否和核心課程的一致性問題。
Landry先生這學(xué)期對教學(xué)的評估還包括參加教師的教研活動。第一次教研活動是教師討論在寫日常教案時如何確定教學(xué)目標以便使其能夠和核心課程標準的要求相一致。第二次教研活動是參加代數(shù)Ⅰ和Ⅱ教師的單元備課活動。這次備課活動沒有真正對該單元的數(shù)學(xué)概念理解以及這些理解是如何體現(xiàn)在核心課程之中做出說明。Landry先生雖然參加這兩次活動但在整個活動過程中始終保持沉默。
上述案例中的校長評價教師從COMPASS評價目標來看顯然沒有實現(xiàn)。當?shù)貐^(qū)教研室的專家對這個案例做出以下三點分析。首先,校長沒有向教師索要這個班過去的成績表現(xiàn),對這個班的情況不是很了解。其次,校長給出的評價是模糊的,教師不知道從哪個角度或點進行提高。再次,校長沒有有效利用學(xué)校中有經(jīng)驗的教師幫助他完成課堂觀察。所以這是一個評價失敗的案例。
案例2:校長Williams女士的合作觀察
這是一所一般水平的小學(xué)。負責(zé)評價教師的是校長Williams女士和教師組長Bigsby先生。在這個區(qū)的所有小學(xué)均要求校長在開學(xué)之初要提交教師備課計劃表。在開學(xué)第三個月時,教研員突然來到這所學(xué)校檢查校長評估教師的情況。發(fā)現(xiàn)教師小組正在開會,但校長Williams女士不在討論現(xiàn)場。她正在隨機觀察課堂。教師們說校長上周參加了類似的會議并告訴教師查看核心數(shù)學(xué)課程標準中的關(guān)于對數(shù)數(shù)的要求。每月至少看一次。在這次會議上,一個教師把當前學(xué)生對數(shù)數(shù)的理解向其他教師做一個匯報,然后分析學(xué)生的當前水平距離數(shù)學(xué)核心課程標準的K.CC.A.1要求還差多遠。這個要求主要涉及從1數(shù)到100,一個一個數(shù)和10個10個數(shù)。教師們注意到,其學(xué)校的學(xué)生目前很多還對1到20的名字不熟悉,所以要形成游戲中心主要先把這些名字讓學(xué)生熟悉起來。這是當前教學(xué)的主要任務(wù)。
在教研員的其他幾次到學(xué)校檢查中,發(fā)現(xiàn)校長Williams女士經(jīng)常做隨機課堂觀察并和教師一起研究課程計劃。在研究過程中她是把自己作為教師的角色來參與的。并能夠根據(jù)每個教師的強項和弱項來進行點評和幫助教師們提高。Williams女士還特別強調(diào)應(yīng)用過去學(xué)生的成績來分析和決定教學(xué)進度。她對學(xué)生熟練掌握知識特別強調(diào)。她同時為教師提供機會觀摩本校或其他學(xué)校教師的好的課堂教學(xué)。
教研員本學(xué)期最后一次訪問學(xué)校時對Bigsby先生進行了訪談。其目的是了解這所學(xué)校所進行的教師合作的結(jié)構(gòu)是否有助于學(xué)生成績提高。主要了解到如下的情況。第一,學(xué)校每周都堅持這種教師合作備課會議并感覺效果很好。第二,教師們在會議中始終保持一個四周循環(huán)的規(guī)律。第一周要查閱并發(fā)現(xiàn)教學(xué)月計劃目標,并明確這些目標是如何和核心課程標準相一致的。在此基礎(chǔ)上發(fā)展一個一個月的評價學(xué)生計劃。第二周的會議要對上一周的學(xué)生表現(xiàn)進行評價并找出需要優(yōu)先考慮的教學(xué)重點。第三周主要是教師之間要互相觀察并分享教學(xué)經(jīng)驗及問題。第四周是對前三周的情況進行匯報總結(jié)并指出學(xué)生的進步情況。
教研員對校長Williams女士的整體評價是有效的。主要表現(xiàn)在:第一,校長經(jīng)常參與教師備課會議并能夠具體指出在哪一個具體的點上教師需要注意。第二,備課會議始終有一個側(cè)重點,即如何把當前的教學(xué)和核心課程標準的要求結(jié)合起來并以其為依據(jù)。第三,四周一循環(huán)的備課活動能夠為教師提供一個循序漸進的反思機會并能夠分享其他教師的經(jīng)驗為自己的教學(xué)服務(wù)。
兩個案例的反思
美國的教師評價隨著課程改革的推進在向著更高標準發(fā)展。如前所述,教師評價的維度已經(jīng)由兩個(滿意/不滿意)增加為四個。并有一種將增值性評價和課堂觀察相結(jié)合的應(yīng)用趨向。增值性評價是這些年熱議的一個評價話題。但增值性評價的應(yīng)用并非一番風(fēng)順。在路易斯安娜州,2012學(xué)年到2013學(xué)年大約對三分之一的教師采用了增值評價法。但在2013學(xué)年到2014學(xué)年隨著教師的強烈反對而被迫取消。2015年3月5日路易斯安那州中小學(xué)教育委員會(Board of Elementary and Secondary Educa.tion,BESE)董事會決定將備受爭議的增值模式再次擱置一年。此外,董事會認為校長在教師評價中將獲得更多的發(fā)言權(quán)。州教育總監(jiān)懷特(Superinten.dent John White)把這些進展稱作是一個機會,它可以讓真正的教育者而不是考試分數(shù)或巴吞魯日(路易斯安那州州府)的一臺電腦成為決策者。董事會商議的具體內(nèi)容包括:(1)延遲用學(xué)生成績評價教師和學(xué)校。學(xué)生增值測試數(shù)據(jù)將不會被用于教師和學(xué)校評價,直到2015學(xué)年到2016學(xué)年之后。(2)校長控制教師評價。如果教師所教學(xué)生的考試成績不好或他們的課堂觀察等級不好,教師將不再被自動視為無效。相反,校長會在教師評價中起決定作用。當有一天增值數(shù)據(jù)再次被用于教師評價時,校長可以對基于這些數(shù)據(jù)的教師評價結(jié)果作出一個調(diào)整。(3)校長將獲得更多的支持,包括如何通過合作和反饋來提高學(xué)生的學(xué)習(xí)成績、進行評價和構(gòu)建更好的課程。
但從上文提供的兩個案例來看,用校長評價教師同樣有很大的挑戰(zhàn)。如果路易斯安娜州期待用增值性評價和校長課堂觀察相結(jié)合的方式來評價教師的話。這兩個方式均不容易在實踐層面得以有效實施。客觀分析這兩個案例,我們會發(fā)現(xiàn)校長評價的弊端也很多。
首先,校長觀察課堂的時間保證問題。從這兩個案例來看,校長由于行政事務(wù)太多很難完成教育行政部門規(guī)定的每位老師每學(xué)期觀察兩次的目標。解決這個問題的一個理想方式是組成一個教學(xué)評估團隊來對所有教師進行評估。校長更多應(yīng)該進行行政督導(dǎo)。案例2中的校長這方面做得很好,所以其效果明顯好于第一個學(xué)校。
其次,從學(xué)科的復(fù)雜程度來看,高中(或初中)的校長在評價教師的教學(xué)時會由于自己對學(xué)科的不熟悉而產(chǎn)生很多模棱兩可的評價。而小學(xué)教師在這方面則不存在問題。案例1中的學(xué)校校長在聽完英語教師上課時之所以沒有給出具體的指導(dǎo)意見,很可能是對學(xué)科的不熟悉。但案例2中的校長顯然對小學(xué)的任何一個學(xué)科都很熟悉,因為美國的小學(xué)教師絕大多數(shù)教所有學(xué)科。從這一點上看,美國的這種評價方式對小學(xué)可能更合適。
兩個案例對中國教育的啟示
這兩個案例及上面的討論為我國教育工作者提供了如下的警示。
第一,應(yīng)該充分認識我國本土教育評價的合理性和不合理性
我國對教師所進行的分科課程評價較美國的這種評估方式更為科學(xué)。分科評價能夠由本學(xué)科專家對教師進行針對性的評價(例如教研員的評課)。分科評價能夠針對課程的重點難點關(guān)鍵的地方把握得較好,不至于給出模棱兩可的結(jié)論。特別應(yīng)該指出的是,我國的分科教研課堂教學(xué)經(jīng)常舉辦各類比賽使教師有機會討論和觀摩什么是好的教學(xué),從而提高其教學(xué)設(shè)計的合理性。從上面的兩個例子看,我國的課堂評估并不落后。我國落后的是整體評估方面,學(xué)者們總結(jié)了我國的教育評價的三點不足:其一是評價標準單一,一般教育行政部門用大型考試成績作為評價學(xué)生教師和學(xué)校的重要指標,忽略了其他能力素質(zhì)。其二是評價技術(shù)比較原始,僅應(yīng)用原始分數(shù),平均分數(shù),以及排名等。其三是對教師學(xué)校進行排名時,方法上存在著非科學(xué)性和不公平性。所以,我國教育評價方面的發(fā)展方向是教育行政部門應(yīng)該對整體評估進行改進,而教研部門的課堂教學(xué)評價和評比應(yīng)該繼續(xù)保持和加強。只有從這個角度來認識,才能使我國的教師評價和學(xué)生評價走向合理完善的軌道。
第二,增值評價法不能不加思考地稱作評價領(lǐng)域的“最新進展”或“評價發(fā)展趨勢”。它必須和校長評價及專家評價結(jié)合使用才可能產(chǎn)生效果。“評價發(fā)展趨勢”介紹和探討在我國過去的教育評價研究中屢見不鮮。在比較教育領(lǐng)域,國外教育的最新進展多有被夸大的介紹。比較教育學(xué)者試圖通過介紹國外的經(jīng)驗為我國所用。在我國過去十余年的課程改革中這類介紹并隨之而進行的應(yīng)用的案例不勝枚舉。例如,在2001年的新課程改革初期,美國課程改革的理念不加篩選地被挪來作為中國課程改革的新理念,結(jié)果造成了教師們極大的困惑和教學(xué)實踐上的障礙。這些理念全面地否定了中國傳統(tǒng)教學(xué)中的優(yōu)秀傳統(tǒng),認為只有提倡以學(xué)生為中心的教學(xué)才能夠跟上時代的發(fā)展。這種不假思索的借鑒的結(jié)果是出現(xiàn)了教師的“集體抵抗”——教師穿新鞋走老路的現(xiàn)象。即教師在表面上說其教學(xué)應(yīng)該應(yīng)用新課程改革的理念,但在實際的課堂教學(xué)中卻始終應(yīng)用的是過去傳統(tǒng)的教學(xué)方法。十年的課程改革反思告訴我們這些新理念并不新,在國外這類理念正如本文的兩個案例介紹的那樣在實踐層面也有很多爭議。所以,任何一種理論不管出自何處何國家,均需教育工作者理性地看待和深入理解,不可盲從。
第三,從教育評價的角度看,增值評價不宜用于高風(fēng)險教師評價。因為增值評價法雖然考慮到學(xué)生學(xué)業(yè)的進步,但它是用學(xué)生成績來評價教師,因此如果將增值法用于中小學(xué)教師高風(fēng)險評價,可能會產(chǎn)生不良后果。這種后果主要表現(xiàn)為教師很可能只關(guān)注學(xué)生的成績而設(shè)計課堂教學(xué)從而忽略了學(xué)生其他方面的發(fā)展。甚至為“應(yīng)試”教學(xué)而作弊。美國中學(xué)校長協(xié)會關(guān)于教師評價的實施建議增值評價法不應(yīng)該用于關(guān)于教師個體的重要的人事決策。美國統(tǒng)計協(xié)會于2014年4月8日發(fā)表的聲明也是在很多州和學(xué)區(qū)用于決定教師的排名、雇用或解聘、終身教師職位的授予等高風(fēng)險決策的背景下,為了使有關(guān)人員審慎地使用增值模型的測量結(jié)果而提出,增值性評價應(yīng)與其他評價方法相結(jié)合才能更好地發(fā)揮作用。