涂秋元 姚正鑫 向春艷 龐新軍


教育評價是辦學導向的指揮棒,評價改革事關教育發展方向如何激發各層次學校的辦學活力、引導樹立“育人為本、德育為先、能力為重、全面發展”的辦學理念,全面推動素質教育,實現區域教育可持續發展,回應人民對優質均衡教育的需求,是廣州市荔灣區基礎教育面臨的系列問題中最主要的問題之一。實施教育評價改革,探索基于區域質量監測大數據的初中學生學業水平增值評價,是學校全面實施課程改革、促進教師專業發展的有效途徑。本文以2021屆初中區域教育質量監測數據為基礎,以不同基礎模型進行簡單試算初一起點測至初三終點測增值分數, 闡明不同增值性評價模型可能帶來的差異。
一、基于相對位次的區域增值評價
基于相對位次的區域增值評價以學校或班級為整體,以區域質量監測學生的有效分數作為計算對象,根據其總平均分在區域排名的變化來對教育教學水平進行分析。學校的位次增值(Y)計算公式如下:
Y=W0-Wn
其中:W0、W1分別為起點監測以及第n次監測中學校的均分在區域全體學校中的位次。Y=0表示位次沒有變化;Y>0為正增值,表示位次進步;Y<0為負增值,表示位次退步。圖1顯示了29所學校總分均分的位次增值發展。
基于位次的增值數據可以說明學校整體均分的相對增值情況,但也存在一些問題。從圖1可知高水平組學校上升難度遠高于低水平組,位次前5的學校中僅有1所增值為1的微小變動,而組別二和組別三的學校增值數量和幅度都遠超組別一,因此不同水平的學校位次提升的難度是不同的。提升同樣位次,因其層次不同其表達的學業水平變化的意義及學校所付出的教育投入都有著極大的差異。而且,高組別學校存在天花板效應,而低組別學校則存在地板效應,因此基于均分位次的增值性評價是相對不準確的。
二、基于等級達成率的區域增值性評價
等級達成率是一種簡易的增值性評價方式,以出口測學校各等級人數除以基于入口測預測的學校各等級人數獲得。如圖2所示,為區域部分學校等級達成率發展分析。等級劃分標準參照學業水平標準進行換算后獲得,選取前三等級進行分析,以避免D、E等級學生因進行職業生涯規劃時較大概率可能出現的出口測數據缺失的影響。
如圖2示,組別一G校C達成率接近190%,但其A、B達成率卻無明顯異常,該情況主要是由于其參加測試人數變化造成,而其A達成率低于100%,說明其優秀學生培養工作有所欠缺。組別一尾段和組別二前段都存在A、B達成率較低,而C達成率偏高的主要原因,在于該區段學校多數學生為等級臨界生,其受參測人數變化導致等級邊界偏移的影響最大。組別三學校則普遍存在A達成率超高,而B、C達成率較低的情況。主要由于組別三學校入口測A等級人數多為個位數,一兩名學生的變動都會導致其數據異常偏高。與此同時,其B、C等級學生存在部分因職業生涯規劃選擇或隨遷子女返鄉等情況,導致區域監測數據下的等級達成率反映情況有所局限。整體而言,對于在各等級有一定基數的學校,等級達成率能較好反映學校的增值能力;對于部分數據異常的學校需要做個案分析進行評價調整;對于部分臨界學生較多的學校,等級達成率的評價模式存在較大的不確定性。
三、基于提高度的區域增值評價
提高度反映學生個體發展水平提高的幅度,同時反映學校的加工能力。其原理是通過對學校的區域監測數據進行回溯,根據學生的入學基礎、發展潛力、學校的發展趨勢綜合分析,對各學校前樣、中樣人數作出預測,按學校表現將所有學校分為相應組別,不同組別的提高度預測標準有所不同,作為分析測算基礎數據。提高度(P)的計算公式如下:
如圖3示,組別一學校提高度整體不高,隨著學校排位后移,提高度的增值幅度不斷提升。與圖1對比,X校的均分排位僅前進一名,與其提高度增值180%有著明顯落差。在均分排位中前進8名的V校,其提高度卻為負增值。在組別一中僅有的排位前進的E校,在提高度評價中為負增值。究其原因,提高度主要關注學校中前段學生的學業能力,而均分排位則主要關注學校整體學生的學業能力,其在關注群體有所不同;且均分評價維度較為單一,未考慮學校內部的差異性,且以排位方式進行評價,區域學校整體波動未加入考量。而提高度通過多維度預測的模式,將區域整體情況和學校自身情況綜合考慮,主要關注學校培優固本的能力,特別是前樣率,對學校的加工能力提出了較高的要求。因此,提高度評價作為增值性評價的一個方法,有其科學性。但提高度計算方法依然存在部分與達成率模式相同的問題。
四、基于學生成長百分位法增值評價
學生成長百分位法(SGP)增值評價,以學生前測成績對學生進行分組,比較同組學生的后測成績的百分位位次以判斷學生的增值情況。其強調學生后測成績僅與學生前測同組別的學生進行比較,可以部分緩解優秀學生上升空間不足的問題。 計算公式如下:
學生成長百分位法是一種相對科學的增值性評價方式,其學生僅與和自身初次測試水平相近的學生進行對比,以其自身在該批次學生中的二次測試百分比作為增量。雖然該模型較好的考慮了學生分層情況,但由于其模型局限性,在統計上仍屬于零和游戲。因而,后續研究將進一步優化模型分層應用,考慮更多荔灣區域特色因素加以優化調參。如圖4示,優秀學校在該體系下依舊面臨增值幅度不大的問題,中后段學校反而表現較好。造成該情況的可能原因是該評價以初一起點測為基準對學生進行分組,而初一起點測科目較少,難度較低,區分度相對不足,導致優秀學生和中段學生沒有拉開差距,使得計算中并未能完全將同等級學生進行區分。此外,通過對一線教育工作者的訪談,個別學生在初中階段可以通過自身努力,實現學業水平的跨層次飛躍;而高水平學生多數成績較為穩定,波動較小,僅有部分學生會因為各種原因大幅下滑。因此,后續研究中應加強對起點數據的分組統計工作,加入更多變量進行分組,同時探索采用循環前測模式,不以單次起點測試作為增值起點,而以前次區域調研測成績作為后次調研測增值評價起點,以改善分組集中的情況。
注:本文系廣東省2021年度中小學教師教育科研能力提升計劃項目“基于區域教育大數據的初中學生學業水平增值評價研究”(課題編號:2021YQJK045)階段性研究成果。
本欄責任編輯 黃博彥