

摘要:長期以來,教育評價存在功能異化、內容單一、主體一元等問題,新時代的教育評價應該回歸“育人”本位,突出教育評價對人的改進功能和發展功能,實現“以評促學”“以評促教”“以評促改”。基于學生可持續發展的視角,探討教育評價為何、以何、如何的問題,試圖以教育評價改革為牽引,統籌推進育人方式的變革。
關鍵詞:可持續發展;教育質量評價;人的全面發展
中圖分類號:G40-058.1 文獻標識碼:A 文章編號:1673-4289 (2024)06-0022-04
教育評價事關教育發展方向,科學、合理的教育評價機制對于學生成長和學校發展具有重要的導向、診斷和激勵作用。進入新時代,我國義務教育正由基本均衡走向優質均衡,深化教育評價改革,是促進學生可持續發展和學校適應教學改革的重要措施,是貫徹落實全國教育大會精神的關鍵環節。新時代的教育評價應凸顯“為了發展而評價”的價值理念,從發展的視角,關注人的成長起點、過程、變化和結果,促進人的進步。
一、可持續發展視角下的教育質量評價的動因
(一)評價功能功利化
長期以來,我國基礎教育主要以考試成績作為評價學生的主要依據,傳統的教育評價的功能有以下幾點:第一,旨在選拔和甄別;第二,為教育行政部門決策服務;第三,考察教師的教育質量;第四,考察學生的學業水平。這種形式的評價不能實現評價學生優勢、不足、是否進步等功能,不利于學生和學校的發展。
(二)評價內容單一性
評價內容的單一抑制了學生全面發展的可能性。傳統的教育質量評價大多是對學生學業成績的評價,評價內容窄化,不利于學生的全面發展。習近平總書記在全國教育大會上明確提出要堅持中國特色社會主義教育發展道路,培養德智體美勞全面發展的社會主義建設者和接班人。因此,學校應盡快走出重視智育、忽視其他“四育”的誤區。
(三)評價主體一元性
傳統的評價是以教師為主體的評價,造成了學生一味追求教師認可的窘境。教育是一個大的生態系統,包括學生、教師、學校、社區等要素,而傳統評價沒有將學生的自我評價、同伴互評、家長評價和社區評價納入評價體制中,評價主體的一元性制約了學生的個性發展。
此外,傳統的評價方式對于班級、學校或區域的評價主要通過在各層面求取學生學業成績的平均分。這種僅重結果的評價模式難以為相關機構(學校、教育管理部門等)和個人提供具有較大價值的信息,同時這種評價模式缺乏對個體、群體學業發展變化的追蹤,對深入理解學生的學習過程產生不利影響。意旨
二、可持續發展視角下的教育質量評價
我國教育評價改革發展至今,傳統的教育評價方式的弊端逐漸凸顯,國內學者對于學生的成長和學校的發展做了很多的探索,如基于原始成績和相對位次來評價學生成長的程度。但它所能提供的學生學業成長的信息是十分有限的,且評價結果的公平性易受到質疑。
發展視角下的教育質量評價是指全面了解學生的發展基礎,對原有的狀態與經過一段教學后的狀態進行比較,計算出發展效能,以反映學生的進步與成長、教師的教學效能等。它的內涵主要包括以下幾點:
(一)全面發展
發展視角下的教育質量評價是學生德智體美勞的全面發展,包括對學生德智體美勞五方面的評價,即學業成績和非學業成績的評價,不僅關注學生最后的產出,更加關注學生的學習過程。了解學生發展中的需求,幫助學生認識自我,讓其在享受評價的過程中不斷矯正自己的行為,促進學生全面發展、均衡發展。
(二)全體發展
關注全體學生,將不同起點的學生放在各自同類學生群體中進行比較,保證了評價的公平性,讓每一個孩子既“達標”又“成長”。在傳統的評價中,教師易忽略“后進生”,而發展視角下評價——發展性評價更加關注學生的成長與進步,“尖子生”的成長與進步存在天花板,也就是說“后進生”的進步空間更大,這就引導教師關注全體學生的發展。
(三)可持續發展
發展視角下的教育質量評價牽動各方力量旨在促進學生可持續發展,強調評價過程動態化,關注影響學生成長的各個因素,如教師效能、家長效能、自身效能、學校效能等。基于大數據統計分析影響學生成長的教師效能值、家長效能值、自身效能值、學校效能值,將學生的表現與學生的基礎、學生的家庭背景等相關聯,便于教育行政部門、學校、教師、家長、學生有針對性、合理地調整教育教學方式,將其滲透到教育教學的全過程中,系統地推進學生持續發展。
基于發展視角的教育質量評價的方式強調的是每個學生的進步幅度,以此評價教師、學校的教學水平,這與目前所倡導的促進全體學生的全面發展的理念相契合。
三、發展視角下的教育質量評價的實踐路徑
發展視角下的教育質量評價主要包括構建指標體系、開發監測工具、數據處理、結果應用幾個部分。
(一)構建指標體系
發展視角下的教育質量評價的指標體系是工具開發的基礎,是評價的基本框架,合理完善的指標體系對于提升教育教學質量起著重要的作用,指標體系應包含三個方面的內容:一是評價指標;二是指標權重;三是評價標準。在評價指標方面,要與符合時代特征的相關教育方針、政策與法規相契合,要符合各學科的學科標準,此外還應充分總結國內外的測評項目,通過文獻分析、專家論證研討提取出關鍵詞。在指標權重方面,要以促進學生德智體美勞全面發展為主要目的,根據當下教育改革與發展的瓶頸有所傾向,還應將學生、學校的進步納入評價指標中賦予權重,重點考察學校與學生經過一段時間的教學與學習產生的效能。
(二)開發評價工具
工具開發是教育質量評價的核心環節,主要包括目標的確定、工具的設計、內容的確定、題目的開發和工具的技術分析等環節。在目標的確定上主要強調能力導向,主要考察被測對象應具備的能力,全面考察學生綜合素質,著眼于學生的能力狀態及經過一段時間的學習所產生的效能。在工具的設計上要考慮被測對象的特點,明確評價的方式和工具的具體題型等。在內容的確定上要符合課程標準。在題目的開發上要充分體現題目的知識結構、能力結構、難度結構、題型結構和題量等。在工具的技術分析上,要在小范圍內進行試測,對每個題目的難度、區分度等進行分析,不斷進行修訂和完善。
(三)數據等值處理
1.模型分析
學者Betebenner提出了學生成長百分等級模型(SGP),該模型基于學生以往成績來估計其當前成績的條件分布,即在同類學生中,其學業成績所處的條件百分位數為其成長百分等級。這一模型為我們比較不同起點學生的學業進步提供了可能。
學生成長百分等級模型的評價結果可以在統一的框架中進行解釋,即不同起點學生均與各自的同類學生群體比較。實際上,在此框架下不同起點學生的成長空間均在1%-99%范圍內,從而保證了評價的公平性。根據以往的資料預測當前的表現,將預測的表現與實際的表現進行比較。不是比較縱向量表上兩次分數,而是比較期望值與實際值之間的差異,以往資料可以是測驗分數,也可以是一些其他變量,如民族、學歷、家庭經濟地位等條件狀態模型。這就為評價學生學業成績和非學業成績的狀態與成長值提供了可能性。
2.成績標準化
將學生的原始成績轉化為能力成績,再將能力成績轉化為標準成績。原始成績反映的是學生做答對題的個數,或作答正確的程度,不能直接反映出考生間差異狀況,不能刻畫出考生相互比較后所處的地位,將原始成績轉化為能力成績以實現對學生能力的把握。標準成績是一種相對地位量數,它是用來說明原始分在所屬的那批分數中的相對位置的,且標準分數可加、可比。即單個標準分能夠反映考生成績在全體考生成績中的位置,而單個原始分則不能。
例如,某考生某科的原始成績為85分,無法說明該成績究竟如何,因為這與試題的難度有關,與總體考生的分數有關。如果某考生某科的標準分為650,即Z分數為1.5,則通過查正態分布表,查得對應的百分比為0.93319,于是我們知道,該考生的成績超過了93.319%的考生的成績,這就是分數解釋的標準化。根據標準分數形成學術伙伴。
3.同質分組,統計學生SGP
基于第一次推導的標準成績,劃分學術伙伴。在SGP的計算過程中,將學生當年的成績與在前一年測試中獲得相同成績的群體進行比較。前一年測試成績相似的群體,被稱為“學術伙伴”。基于第二次測評的學業成績,學生的原始成績轉換成能力分數,再將能力分數轉化為標準分數。在學術伙伴中計算學生成長百分等級(SGP),根據當年成績計算得到的這名學生在“學術伙伴”中的百分等級(percentile rank),就是SGP分數,他表示的是在常模樣本中低于這個分數的人數百分比。比如,如果一名學生的SGP是82,那么意味著在這個以“初次測試”定義的“學術伙伴”中,有82%的學生成績等于或低于這名學生。
4.發展賦分
基于國際上百分等級測評方式與數據的積累、比對分析后,將SGP轉換為非專業人員更熟悉的分數報告系統。如表1所示,將SGP轉換成一個1~4等級的等級評定分數體系。
(四)結果應用
結果應用的主要目標是為教育決策提供參考,為教育教學診斷提供依據,引導社會樹立科學的教育質量觀。教育管理愈發精細化,基于經驗主義的傳統思維不能精準地一對一改進,基于量化的大數據思維能夠深入解讀分析結果,讓數據服務于教育管理決策。通過評價可以明確學生、班級、學校和區域的發展狀況以及他們在群體中所處的位置和自身成長進步的情況,更有益于教育教學的診斷與改進,明確提升策略和問題解決的路徑。通過關聯分析報告學生發展狀況與成長值的影響因素,引導學校、教師和家長形成科學的質量觀和教育觀,有導向性地推動學校轉變育人方式,促進學生實現全面、個性和可持續發展。
(作者單位:成都市錦江區教育科學研究院,成都610000)