鄭方賢

“學習性評價”于1998年在國際教育界首次提出,隨后《黑箱內:通過課堂評價來提升標準》發表,國際教育界開始了“學習性評價”的推廣應用,掀起一場學校教育的革新。近十來年,“測評與學習”也受到中國教育界關注。但是,相對而言,中文里的測試、考試(或測評)、評價等詞的含義,更接近英語單詞test、assessment、evaluation。在中國的學校教育中還難以看到“形成性評價”“以學習為導向的評價”等模式的實踐,更多的還是各種傳統的學科測驗,以及被學生戲稱為“周周爽”“月月爽”的考試。新高考推行后,逐年形成的大數據,使得測評對教與學的提升成為可能。
競爭性測評
推動應試學習模式
雖說不斷進步的技術保證了大規模測評的科學性、客觀性,其標準化、集約化的高效率也很好地回應了社會與公眾的要求。但是眾所周知,這種由一次測試決定結果的終結性評估方式只能反映被測學生過去的積累,而并非全部能力,也無益于學生在學習上的自我完善與能力提升,反而會引起更大的考試焦慮,形成強烈的應試學習模式。
以最近四十多年的高考為例,過去極低的錄取率使升學競爭十分激烈。盡管高考是由多門科目的測試所組成,但較之單門科目分數的得失,人們往往更關心總分,對總分的關心也是集中于其在總體中的排名是否達到了大學的錄取分數線標準。
雖然命題專家圍繞課程標準、教學狀況和高校選拔要求對各科試卷進行了精心開發與設計,也對考試過程和評卷質量進行了精確控制,但結果僅僅是各門科目總分的反映,實在令人非常無奈。由此所形成的以模擬考試代替教學的高強度應試局面也是必然的結果。
新高考為測評發揮正向作用提供基礎。從1999年起,國家增加高等教育投入,不斷擴大大學的招生規模,使得高考的錄取率連年提高,各地區普遍在80%左右甚至有超過90%,但是業已形成的應試教育模式難有根本改觀,高中學生普遍是早晨7點踏進教室、晚上9點離開學校。
正是在這樣的背景下,國家堅決推出了高考綜合改革方案。從測評的視角看,新高考被分成了兩個部分:即所有學生參加的語文、數學、外語科目的統一考試,與思想政治、歷史、地理、物理、化學、生命科學科目的高中學業水平考試。
而高中學業水平考試又根據學習的深入程度分為統一參加的合格性考試和選擇其中三門參加的等級性考試。即把一部分科目的測評以常模參照呈現,作為個體學生與其他學生的比較,而另一部分科目的測評以標準參照呈現,以期降低測評整體的競爭性。因為學業水平考試的標準參照還是與得分率分布相聯系,依然呈現出高利害性。但是學業水平考試的定位與設計,評價維度與指標體系,使得評價標準的意義得到體現,為測評對教學和學習的正向反撥奠定制度基礎。
測評提升高中教育質量
就上海而言,2014年啟動新高考,由于政策、環境的穩定,特別是高考總分分布的穩定可期,促使大家越來越關注如何通過測評提升高中培養質量。目前,各考試科目依據不同的定位,兼顧知識學習與能力提升,輔之以系統的學業評價標準,從內容和能力兩個維度,通過相應的各分項指標形式得以呈現。因此當學生完成考試以后,他所獲得的反饋還包括根據評價維度所描述的各分項指標以及對應的得分情況,學生可以了解自己的學習情況以及在群體中的相對位置。對于各科目的高中學業水平考試,學生更可以通過合格性考試的成績報告,發現自己在科目學習上的長處與短處,以完善下一步的學習,并爭取在等級性考試中取得好成績。我們通過上述方法所形成的學校和區域的成績報告,對改善學校的教育教學起到了促進作用。
考試數據表明,上海師范大學附屬中學閔行分校在思想政治科目合格性考試上的表現非常突出,他們的學生在內容領域和能力目標評價維度各分項指標上的得分率每年都比前一年有進步。如果以2017年該科目平均成績的位次為基準,則2018年比2017年在全市提升了23名,2019年又比前一年提升了65名。閔行第三中學,在思想政治、地理、化學、生命科學四門學業水平等級性考試科目上的進步也很顯著,各科目的整體成績排位三年來實現了兩位數的增長。閔行區很好地運用了學校和區域的成績報告信息,區教育學院通過集體分析反饋和分學科到學校指導相結合的辦法,對學校的學科教學進行了有效干預,提升了學生的學習質量。
測評的目標指向是學習。在高考綜合改革之前,測評的功能是以科目總分的方式實現學生學業的評價與篩選;在新高考的推動下,測評還能夠依據所建立的學業評價體系給予多維度多指標的分析評價,實現對教與學的正向反撥;未來還可通過更多分析工具、更多分析視角探索測評與教和學的深度融合,即把測評貫穿于學習過程中或者教學過程中,更有效地促進學習、促進學習質量的提高。
從不同維度分析測評大數據
在前期的工作基礎上,我們嘗試不同的分析方法與工具,對考試數據進行分析和挖掘,并反饋所獲得的有用信息,以促進學校教學質量的提高。我們采用統計中的聚類方法進行評價維度的綜合聚類,結果發現,對于學校來說,不同學科從不同維度來分析,可以得出不同的評價結果,而且對于不同的學校都有不同的需要提升之處。
僅以2019年數學科目高考學生的成績來分析各高中的數學教學情況。數學科目按照內容領域和能力目標兩個維度進行評價設計的,150分的試卷試題中——分屬內容領域維度的四個分項指標:方程與代數(占40分)、函數與分析(占43分)、數運算數據整理和概率統計(占13分)、圖形與幾何(占54分);分屬能力目標維度的五個分項指標:數學基礎知識與基本技能(占61分)、邏輯推理能力(占19分)、運算能力(占19分)、空間想象能力(占19分)、數學應用與探究能力(占32分)。
為保證分析結果的統計意義,我們確定204所高中學校的39000多名學生為分析對象,他們參加了2019年本市的高考數學科目考試且得分都位列前95%,并且每所學校的實際考生人數都大于或等于50。
我們以學校為單位,分析各學校的每位學生在各評價維度相應分項指標上的得分率,尋求他們的共性,以呈現不同學校的類型和特點,希望能為學校的教學提供參考。
根據計算,204所高中學校從內容領域維度得分上被分為了五類。這五類所含學校數目不等,分別是26所,49所,59所,41所和29所。
僅以其中兩類為例,我們可以發現,包括上海中學等人們通常所說的“四校八校”在內的29所學校被歸為一類,這些學校都是近年來表現突出的優質高中學校。包括天山中學、復旦中學等在內的49所中學被歸為另一類,也都是公認的好學校。
從內容維度來分析,可以得出的結論是——學生在試卷上的得分可以反映出這些學校的教師在數學科目內容知識的教學是成功的。
但是,如果對能力目標維度也進行了綜合聚類分析,同樣將學校分為五類,卻發現上述29所學校中有10所學校形成了單獨的一類,無疑,單單根據這一年的數據來看,這10所學校是兩個維度下綜合聚類分析表明最好的一類學校。
上述29所學校中的其他19所學校與49所學校中的22所組成了能力目標維度綜合聚類分析結果中的單獨一類,這意味著這些學校的學生在高考答題時,在這一維度上有相似性。
雖然不同的分類方法會給出不同的結果,但是通過多元的觀察視角,結合具體維度的分項指標,就不難發現教與學改善的空間。