





DOI:10.3969/j.issn.1673-8454.2023.12.001
作者簡介:張一春,南京師范大學教育科學學院教授、博士生導師(江蘇南京 210097);楊宇晴、王瑞喆,南京師范大學教育科學學院碩士研究生(江蘇南京 210097)
基金項目:2021年江蘇省未來網絡科研基金項目“智能時代江蘇教育信息化創(chuàng)新發(fā)展路徑與對策研究”(編號:FNSRFP-2021-YB-13)
摘" "要:教育評價是教育發(fā)展的指揮棒,是教育改革的“引擎”,與教育事業(yè)的發(fā)展方向與發(fā)展速度息息相關。隨著智能技術與教育融合不斷深入,教育評價迎來智慧轉型的重要契機。基于21世紀與教育評價相關的154項國家政策,利用ROSTCM6與SPSS26工具進行文本聚類分析,獲取不同時期教育評價政策聚焦點,深度剖析國家教育評價改革總方向、總目標與總要求。遵循“政策源由——實際問題與發(fā)展困難”“政策積累——政策主體擴大與專家意見”“政策動因——國家需要與民眾需求”“政策形成——意見聚合與政策契機”的政策議程思路,捕捉政策發(fā)展的內在機理與深層邏輯。教育評價轉型具有系統(tǒng)性與可操作性,由此從“厘清智能評價邊界,強調評價育人導向”“創(chuàng)新智能評價方法,形成立體評價范式”“重構評價標準體系,擊破‘五唯’頑瘴痼疾”“加速教育新基建進程,實現(xiàn)智能全息評價”“提升師生評價素養(yǎng),組建專業(yè)評價隊伍”“智能運用評價結果,發(fā)揮評價服務功能”六大方面提出教育評價發(fā)展策略,探討其變革轉型的有效路徑,驅動教育高質量發(fā)展。
關鍵詞:教育評價;政策演進;聚類分析;教育數(shù)字化轉型;發(fā)展路徑
中圖分類號:G434" " " " "文獻標志碼:A" " " " "文章編號:1673-8454(2023)12-0003-12
教育綜合改革已步入深水區(qū),教育評價的變革轉型成為教育改革的“關鍵一役”。2021年兩會期間,習近平總書記強調,“要以教育評價改革為牽引,統(tǒng)籌推進育人、辦學、管理、保障改革”。智能時代如何發(fā)展教育評價、實現(xiàn)“人機協(xié)同”、實現(xiàn)教育評價智慧轉型成為破解教育綜合發(fā)展窘境的關鍵問題。[1]
教育評價政策的演進研究是教育領域一項重要的課題,隨著社會經濟的發(fā)展和教育理念的變遷,教育評價政策不斷受到關注和調整。對教育評價政策的演進進行研究,有助于深入了解教育評價在不同歷史時期的定位、功能和影響,為當前和未來的教育評價政策制定提供借鑒和啟示。因此,本研究旨在深入探討教育評價政策的演進過程,梳理其發(fā)展脈絡,剖析各階段政策的背景、特點和效果,以期為當前和未來的教育評價政策制定提供理論和實踐參考,促進教育評價工作的科學性、公正性和有效性。
一、學術梳理和研究成果簡述
教育評價(educational evaluation)是“基于某種價值觀或教育目的,通過一定手段,廣泛收集評價信息,對評價對象進行價值判斷,進而改進教育決策的過程”。[2]因此,分析梳理我國教育評價政策的發(fā)展歷程,一方面,可以明晰我國教育評價的發(fā)展過程,另一方面,有助于挖掘我國教育評價的本質。
(一)學術關注度
教育評價由來已久,1929年泰勒(R.W.Tyler)提出,現(xiàn)代教育評價是一種可以發(fā)現(xiàn)學生的學習結果與價值的過程。進入21世紀,改革教育評價以適應國家發(fā)展成為教育領域的重要議題,新興技術成為教育評價的支撐力量,教育評價改革迎來契機。2020年中共中央、國務院印發(fā)《深化新時代教育評價改革總體方案》(以下簡稱“《總體方案》”),明確把黨委和政府教育工作及用人評價納入改革范疇,教育評價成為引領教育變革方向的“指揮棒”。[3]
本文基于中國知網,以“教育評價”為檢索詞,對2000年至2022年的相關文獻進行統(tǒng)計整理。21年間相關文獻共計36,669篇,發(fā)文趨勢整體上呈上升趨勢,如圖1所示,可見教育評價關注度逐年上升。
(二)學術研究特征
中國的教育評價政策經歷多個階段的歷史演變。從早期的重點關注學生學業(yè)水平的單一評價,到后來逐漸擴展為對教學質量、教師、學校等多方面的綜合評價。在此過程中,政策不斷調整和完善,以適應社會發(fā)展和教育改革的需求。隨著時間的推移,政府機關相繼出臺一系列文件和法規(guī),包括《中華人民共和國義務教育法》《中小學教育質量綜合評價指標框架(試行)》《普通高等學校本科教學工作合格評估實施辦法》等,這些政策文件對教育評價的目標、原則、程序、制度安排等方面進行規(guī)范和指導。
從研究選題、主題內容、重要觀點、研究方法等維度對教育評價政策研究進行梳理提煉,可以得到學術研究的如下特征:
①選題是研究的起點,需要緊密結合實際,具有一定的理論和實踐意義。在教育評價政策領域,研究選題主要有“教育評價政策的制定與實施”“教育評價政策的效果評估”“教育評價政策的改革與創(chuàng)新”等。②主題內容是研究的核心,需要深入探討,具有豐富性和深度。在教育評價政策領域,主題內容可以包括教育評價政策的理論基礎、教育評價政策的歷史演變、教育評價政策的現(xiàn)狀分析、教育評價政策的前景展望等。③重要觀點是研究的靈魂,需要獨立思考,具有創(chuàng)新性和獨特性。在教育評價政策領域,重要觀點可以包括教育評價政策應以提高教育質量為目標、教育評價政策應兼顧公平與效率、教育評價政策應注重學生的全面發(fā)展、教育評價政策應適應社會經濟發(fā)展的需求等。④研究方法是研究的工具,需要科學合理,具有可操作性和有效性。在教育評價政策領域,研究方法可以包括文獻分析法、比較研究法、實證研究法、案例研究法、深度訪談法等。
(三)研究成果簡述
學者對教育評價政策的實施效果進行大量研究,關注學生成績、教育公平、教學質量、教師教育水平等方面的影響。通過大量的統(tǒng)計數(shù)據(jù)和案例分析,研究者試圖揭示教育評價政策對教育發(fā)展的積極和消極影響。學者也關注教育評價政策與教育改革的內在聯(lián)系,探討評價政策對教育改革的促進作用,以及在實際操作中可能出現(xiàn)的挑戰(zhàn)和困境。這方面的研究嘗試從宏觀和微觀兩個層面來剖析教育評價政策與教育改革的互動關系。除了國內的研究,一些學者也進行跨國比較研究,探討中國教育評價政策與其他國家的異同,從中汲取經驗教訓,為我國教育評價政策的改進提供參考。
二、教育評價政策及發(fā)展階段
按照“政策檢索—政策篩選—政策分析”的基本步驟對政策文本進行研究。選擇國務院網站、教育部網站等平臺進行檢索,以“教育評價”作為檢索的關鍵詞,采集自2000年以來所有中央、部委頒布的法規(guī)和公開文件,經仔細閱讀、謹慎對比和篩選,排除不相關的會議通知等文件,下載162份作為最初分析樣本;同時,我們以“教育評價”“評價體系”“效果評價”“績效評價”為表征的關鍵詞進行手動檢索(此類關鍵詞為知網“教育評價”研究的主題分布統(tǒng)計前4名),并經過核驗,確定154份政策文件形成研究的最終樣本。
之后將政策文件導入Citespace軟件進行數(shù)據(jù)化處理,得到關鍵詞時區(qū)分布,由時區(qū)圖譜主題聚類可見政策發(fā)展的整體脈絡——逐漸注重學生綜合素質評價、教學質量評價的不斷完善以及改革措施的深化。
根據(jù)關鍵詞時區(qū)分布圖所呈現(xiàn)的2009年、2019年關鍵詞時域變化的明顯特征,將我國教育評價政策分為三個階段——機制建設期、體系完善期、創(chuàng)新發(fā)展期,并總結各階段具體特征與標志性事件,最終呈現(xiàn)結果如表1所示。
(一)機制建設階段(2000—2009年)
1999年中共中央、國務院發(fā)布《關于深化教育改革全面推進素質教育的決定》,素質教育成為教育改革的主題。教育評價的重點由“知識評價”轉變?yōu)椤八仞B(yǎng)評價”,如何科學評價素質教育的實施成效成為這一階段教育評價政策的重要方向。[4]利用ROSTCM6與SPSS26工具對本階段20項政策文本進行分詞處理與詞頻統(tǒng)計,并對其系統(tǒng)聚類后,形成“基礎教育改革”“優(yōu)化教師評價”“全面推進素質教育”三大類團,主題詞譜系如圖2所示。各類團可以揭示研究焦點,反映此階段教育評價政策的聚焦點。
這一時期我國教育評價相關政策的重心是發(fā)展素質教育,特別體現(xiàn)在以下三方面:
一是整體推動素質教育,促進學生全面發(fā)展。“素質教育”“素質評價”“全面發(fā)展”“綜合評價”等高頻主題詞,表現(xiàn)這一階段國家迫切發(fā)展素質教育的期望,從“單一評價”轉向“綜合評價”,學生全面發(fā)展成為主題。在以《全國教育事業(yè)第十個五年計劃》[5]為代表的文件中,提出制定建立符合素質教育的教育質量評價機制,綜合評價學生德智體美等各方面的能力與素質,有效評估素質教育工程的實施情況,教育評價改革迎來新轉機。
二是聚焦基礎教育改革,推行成績等級制度。“學生能力”“等級制”“中小學”“義務教育”“基礎教育”等高頻主題詞,反映此階段基礎教育評價改革成為焦點,首次提出實行成績等級制,通過等級反映學習者知識與技能水平,以培養(yǎng)學生自信心,尊重學生身心發(fā)展,避免成績或排名透明化,并提出將成績等級制作為考試評價改革的重點。
三是強調優(yōu)化教師評價,突出考查技術能力。“業(yè)務水平”“教師評價”“績效考核”“教師考核”“教學能力”等高頻關鍵詞,圍繞教師評價展開,注重考核教師的業(yè)務能力。《lt;教師資格條例gt;實施辦法》《中小學教師教育技術能力標準(試行)》等文件具體明確教師的能力和素質,在此基礎上,以《國家教育事業(yè)發(fā)展“十一五”規(guī)劃綱要》[6]為代表,提出健全教師考核評價機制,建立促進教師業(yè)務水平與能力不斷發(fā)展的評價體系和考核辦法,并提出建立激勵機制、積極運用考核結果,為教師評價打開政策之門。
這一時期,教育評價側重師生綜合素質提升、全面發(fā)展,素質教育工程機制初見成效,為穩(wěn)步推進教育改革奠定基礎。
(二)體系完善階段(2010—2019年)
2010年,我國出臺第一個中長期教育發(fā)展的綱領性文件,即《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》,它將教育質量評價改革作為人才培養(yǎng)體制改革的重要任務,明確信息技術對教育的革命性影響,教育評價政策迎來新契機,進入體系完善階段。此階段,教育評價目標具有多重性,實現(xiàn)全面評價,謀求評價對象、評價方式、評價標準的多樣性和專業(yè)性成為教育評價的重點。
對這一階段的54項教育評價政策文本進行高頻主題詞分詞、合并后,經過系統(tǒng)聚類后形成四大類團,分別是“專業(yè)評價隊伍”“評價結果運用”“科技評價改革”“分層分類評價”,如圖3所示。
隨著教育評價改革不斷推進,技術成為影響教育評價的關鍵要素之一。技術支持下教育評價的范圍和質量,成為教育評價改革新的關注點,特別體現(xiàn)在以下四方面:
一是健全分層分類評價,制定特色標準體系。此類團中“分層次”“分類考試”“指標體系”等高頻主題詞,反映擴大教育評價范圍,提高評價針對性、實現(xiàn)特色化的迫切性與必要性。如《國家教育事業(yè)發(fā)展第十二個五年規(guī)劃》[7]等文件,提出針對不同類型學校、教育層次、學科門類、教師崗位等,完善分層分類分學科的評價指標,建立可衡量的教育質量標準體系,推動學校、教師及學生基本數(shù)據(jù)信息庫建設,促進科學化、標準化。
二是深化科技評價改革,健全考試招考制度。此類團由兩大分支構成,一分支由“考試評價”“招生錄取”“考核評價”等高頻主題詞構成,強調改革考試招生制度,如《國家教育事業(yè)發(fā)展“十三五”規(guī)劃》[8]等,格外側重考核學生綜合素質,實施分類考試,強調推廣多元錄取機制;另一分支由“科技評價”“科技成果”“評價改革”等高頻主題詞構成,科技評價改革成為我國教育領域的重要內容,明確運用信息技術進行科技評價,實施研究分類評價,以科技貢獻為要素,推行科技成果評價,科學客觀、開放多元的科技評價機制初見雛形。
三是強化評價結果運用,建立評價反饋機制。“評價結果”是按照評價指標體系,依據(jù)評價指標要素,對評價對象的綜合價值做出的分析與判斷。強調從結果呈現(xiàn)、使用、反饋三個層面加強評價結果應用,并嘗試構建評價結果綜合運用機制,以評促建,實現(xiàn)信息平臺互聯(lián)互通,優(yōu)化教育教學質量。
四是組建專業(yè)評價隊伍,搭建評價資源平臺。“專業(yè)化”“評價隊伍”“評價平臺”等高頻主題詞顯示第三方評價正逐步向專業(yè)化方向發(fā)展。專業(yè)化評價隊伍具體體現(xiàn)在以下三方面:①隊伍構成多元化,在《國家教育事業(yè)發(fā)展第十二個五年規(guī)劃》中提出建立專業(yè)評價隊伍,以政府為主導,由社會組織和專業(yè)機構組成;②技術理念先進,強調學理結合,著眼于保持評價理念與評價技術的先進性;③評價工具專業(yè)化,開發(fā)評價資源平臺,利用專業(yè)化工具,為教育評價的開展與改進提供技術支撐。
總之,這一階段的教育評價進入體系完善階段,在技術的助力下,教育評價無論是在全面性,還是專業(yè)化方面均已得到長足發(fā)展。
(三)創(chuàng)新發(fā)展階段(2020年至今)
2020年,中共中央、國務院發(fā)布的《總體方案》是新時代教育評價改革的行動綱領,從根本上改變教育價值觀,提出階段性目標,即到2035年,基本形成具有時代特征、凸顯中國特色、體現(xiàn)世界水平的教育評價體系。習近平總書記還指出:“深化教育改革的系統(tǒng)性、整體性、協(xié)同性。”以評價撬動改革,實現(xiàn)教育評價系統(tǒng)化,逐步走向改革和創(chuàng)新的軌道,數(shù)字化、智能化成為教育評價改革的主方向,利用智能技術,同步學習與評價。自此,教育評價相關政策激增,兩年間國家相關政策數(shù)量已超40多項。
對這一階段47項相關教育評價政策的文本進行分析,可知數(shù)字評價已成為教育評價的新焦點。經過系統(tǒng)聚類,形成“評價聯(lián)動機制”“量化指標”“評價方法”三大類團,如圖4所示。
這一階段以推進數(shù)字評價為重心,特別體現(xiàn)在以下三方面:
一是注重創(chuàng)新評價方法,強化技術支撐作用。《總體方案》中提出創(chuàng)新評價工具,積極將新興技術引入教育領域,為探索多樣的教育評價提供強大的支撐力量。《義務教育質量評價指南》[9]等一系列文件,提出利用信息技術創(chuàng)新并改進評價方法,探索強化新技術與評價方法的深度融合,綜合結果評價、過程評價、增值評價、綜合評價等方法,確保評價結果科學客觀、真實有效,強化評價功能。
二是斟酌選用量化指標,扭轉評價功利傾向。《總體方案》提出“破五唯”,習近平總書記更用“頑瘴痼疾”痛批教育評價存在的問題,因此審慎選用量化指標,以扭轉教師評價和教育評價功利化傾向格外重要。[10]單一的量化指標難以衡量師生的綜合素質,立體化評價指標體系亟需建立,教育評價的需求尚待滿足。就此,提出代表性成果評價、貢獻評價等方法,尤其避免結果與資源配置直接掛鉤。評價指標體系正面臨全面調整。
三是建立評價聯(lián)動機制,統(tǒng)籌評價標準體系。在《總體方案》的指導下,教育評價不再止步于多元參與或多元評價,正在嘗試探索多方聯(lián)動的評價機制,例如,《教育部等六部門關于加強新時代高校教師隊伍建設改革的指導意見》中提出建立院校、教學、學科和教師評價政策聯(lián)動機制。由此,提出探索建立多元多維成效評價體系,為評價體系規(guī)范化、協(xié)同化奠定基礎。[11]
總之,自《總體方案》發(fā)布后,教育評價改革進入創(chuàng)新發(fā)展階段,評估改革正式走向系統(tǒng)化,技術與教育評價迎來創(chuàng)新融合。
三、演進機理分析
(一)政策源由分析:實際問題與發(fā)展困難
政策的出臺基于社會的各項矛盾與沖突,[12]因此,政策的形成源于政府內部尚未解決的問題。一旦問題能夠明確定義并獲得強烈的反饋,就會迅速激發(fā)政策的制定和實施。[13][14]在早期教育評價的發(fā)展中,主要出現(xiàn)以下問題:
1.教育評估系統(tǒng)不夠完善
21世紀初,教育評價工作缺乏具體的指導以及完整的評估系統(tǒng),相關標準和管理框架仍待完善。隨著教育質量評價改革的不斷深入,教育評價研究初顯成效,相關研究成果被廣泛應用到各個領域。但由于關注點分散、難以聚焦,存在較大盲目性。具體表現(xiàn)為:基礎理論的研究以“理論引進的累積”為主,浮于表面,缺乏本土化,致使概念混亂,沒有形成完整成熟的理論體系。這導致教育評價研究在基礎理論方面,本能偏重于實踐操作,形成“行動”先于“理論”的局面,缺乏科學理論指導的教育評價實踐出現(xiàn)較長時期的“重結果性評價”的問題。
2.不科學的綜合評價指標體系制約學生全面發(fā)展
早期,我國秉持“為評而教”的理念,致使權威的知識系統(tǒng)與閉塞的課程體系成為教育發(fā)展的枷鎖,遏制創(chuàng)新性與批判性的培養(yǎng)。[15]推行“唯分數(shù)論”,分數(shù)成為“篩選”和“裁汰”的首要依據(jù),階層分化加劇,造成社會貧富沖突激化、教育失衡。[16]由此,政策理念轉向“為教而評”“為學而評”,評價開始為教育教學服務,為學習者發(fā)展提供強大助力。但政策層次只是評價改革的第一步,政策的實施與執(zhí)行更是重中之重,[17]不僅需要政府、學校、教師等更新教育評價觀,學習者注重反思性學習評價,還需要加強第三方的專業(yè)評價。教育評價成為一種工具,服務于學生發(fā)展,對創(chuàng)新評價方法、激勵評價對象具有重要意義。
3.教育評價制度的法律地位重視不夠
20世紀90年代,我國教育評價文件相對短缺,教育的監(jiān)督和評估工作無法可依,健全適用于素質教育的評價法規(guī)體系迫在眉睫。因此,進入21世紀后發(fā)布一系列教育發(fā)展改革的行政法規(guī)和部門規(guī)章。例如,教育部出臺《全國教育事業(yè)第十個五年計劃》,明確政府具有“宏觀管理教育”的職能,具有“創(chuàng)設教育健康發(fā)展環(huán)境”的責任;[18]隨后在《國家教育事業(yè)發(fā)展“十一五”規(guī)劃綱要》中再次強調“政府督導評價體系”的重要性,強化法律對教育的保障功能。[6]強調教育評價制度的法律地位,實現(xiàn)依法治教。
(二)政策積累分析:政策主體擴大與專家意見
政策制定的過程中包含專家對問題解決的種種政策建議與主張,反映某一特定領域由政府內外部專家構成的政策共同體的意識。政策共同體中參與貢獻的專家,是能夠主動為現(xiàn)有問題提供最合適解決方案的人。
1.政府內部:政策制定主體的橫向范圍擴大與縱深發(fā)展
我國教育評價主體已由“單一領導”轉變?yōu)椤岸嘣獏⑴c”。早期,我國教育評價政策由“中央”主導,在已出臺的相關政策中卻極少牽扯其它部門。在某一時期,中央無疑成為催動我國教育評價體系變革的主要力量,一元化政策主體使制定的政策更具權威性,但同時導致政策決策權力集中、信息封閉和實施困難的問題。隨著教育評價迅速發(fā)展,逐漸涌現(xiàn)國家教育委員會、中央職稱改革工作領導小組等政策制定機構,教育評價政策主體范圍呈橫向擴大趨勢。在體系完善階段,政策主體逐步縱向深化,一方面突出中央政府的領導帶動作用,另一方面重視地方政府和各部門的參與積極性,[19]協(xié)同參與度較弱的問題仍待解決。發(fā)展到創(chuàng)新發(fā)展階段,教育評價面臨越來越復雜的問題,盡管政策主體多元化,聯(lián)合發(fā)文量呈上升趨勢,協(xié)同參與度逐漸提高,但整體上還沒有建立良好的交流協(xié)作關系。通過政策的制定激發(fā)各主體參與的積極性,成為發(fā)揮教育評價政策作用的有效途徑,如何加強政策主體間的協(xié)同性、全面優(yōu)化評價政策和制度的質量,是當前亟待解決的問題。
2.政府外部:專家建言獻策
在教育評價新政策出臺后,學者針對性地相繼展開深入解讀,并基于實際執(zhí)行效果因地制宜提出建議。中國法學會行政法學研究會會長馬懷德針對《總體方案》進行解讀,指出它已經吹響新時期教育綜合深化改革的號角,教育評價要破除“五唯”痼疾,矯正“單向度”偏差。教育信息化戰(zhàn)略研究基地主任黃榮懷,在《未來學習要構建智慧教育新生態(tài)》報告中指出,“數(shù)字中國”已成為國家的重要發(fā)展戰(zhàn)略,教育領域需要創(chuàng)新智能測評技術與環(huán)境建設,改善數(shù)字化教學質量,支撐教育評價數(shù)字化改革。外部參與者提出的政策建議和方案,成為制定政策的重要基礎。再經過調研、走訪、辯論與論證,具有較高可接受性與可行性較高的提案會成為政策的備選項。
(三)政策動因分析:國家需要與民眾需求
政策制定的動因是政策出臺的關鍵要素,一般包含國民情緒、公眾輿論、政府權力分配等因素。當一個政策逐漸形成時,需要多種因素形成助力,推動政策“落地”。
1.黨和國家對教育評價事業(yè)的高要求、高重視
智慧時代,教育處于政治新高度。習總書記強調,要扭轉不科學的教育評價導向,堅決破除“五唯”,從根本上解決留存問題。當下,不僅要從戰(zhàn)略高度上意識到其極端重要性,還需將標準化評價看成重要的政治任務。為落實評價政策,我國提出評價責任和信譽體系,將評價結果作為干部考核、獎懲、任免的重要依據(jù)。無論是2017年《國家教育事業(yè)發(fā)展“十三五”規(guī)劃》描繪的新時期教育評價發(fā)展藍圖,還是2018年的全國教育大會,都充分揭示黨和國家對教育評價事業(yè)的高要求、高重視。
2.民眾對教育質量與教育公平的關注、監(jiān)督
教育質量與教育公平問題是我國發(fā)展“不平衡、不充分”的重要映射,考試和招生制度具有人才選拔與培養(yǎng)的重要責任,成為化解這一難題的突破口。[20]具體來講,在民眾關心和社會輿論關注的招考制度上,教育評價政策改革在考試內容與方式、選拔錄取機制、招生管理三大層次上持續(xù)深入。2010年《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》明確提出“加強對全國教育質量監(jiān)督評估機構和資源的整合,健全監(jiān)測評估體系”“促進與世界一流評價機構合作,建立特色學校評價模式”等推進教育評價改革的具體要求。[21]這成為新時期教育評價的綱領性文件。
(四)政策形成分析:意見聚合與政策契機
政策的最終形成需要三個條件,包括具備現(xiàn)實問題契機、正面政策的承續(xù)以及專家意見交匯,他們共同支撐政策的制定。
1.專家意見交匯與社會推動
教育評價改革關涉黨和政府、學校、教師、學生、社會五類主體。因此,在其政策制定過程中,受到相關領域學者、教育從業(yè)者以及社會各類監(jiān)督媒體的關注,專家積極建言獻策,倡導教育評價系統(tǒng)性、規(guī)范化。同時,隨著社會公眾問責意識的覺醒,社會各界對我國教育評價政策提出各項批評建議。例如,2013年《中共中央關于全面深化改革若干重大問題的決定》中推行“綜合評價多元錄取機制”和“多元主體參與的運行機制”,便體現(xiàn)出教育評價多元主體的格局逐步確定,更加注重發(fā)展和強調創(chuàng)新發(fā)展,關注教育公平。
2.正面政策承續(xù)與現(xiàn)實契機
社會領域亟待解決的問題與先前政策穩(wěn)步推進積累的積極效果,為政策提質升級、進一步優(yōu)化提供驅動力。例如,《總體方案》對教育評價改革的總體要求、重點任務、組織實施作出全面部署。它的發(fā)布,離不開《中國教育現(xiàn)代化2035》等政策文件從教育現(xiàn)代化角度為教育評價指明方向,也離不開信息技術對教育領域發(fā)展提出的新要求。
四、教育數(shù)字化轉型下
教育評價政策發(fā)展路徑與策略
基于21世紀以來教育評價政策演進方向,立足于智能時代,從我國教育評價政策的階段特點出發(fā),展望教育評價發(fā)展方向,從評價邊界、評價方法、評價標準、評價手段、評價素養(yǎng)、評價結果六方面,提出以下教育評價政策發(fā)展的路徑與策略,如圖5所示。
(一)厘清智能評價邊界,強調評價育人導向
以大數(shù)據(jù)、人工智能為代表的新興技術克服傳統(tǒng)評價唯經驗論的弊端,保障教育評價的科學、客觀與精準,智能技術支持下的智能評價已成為教育評價的重要部分。教育評價作為一種價值判斷活動,應遵循長效發(fā)展的評價理念,避免評價主客體對技術的全方位依附,厘清技術運用的邊界,回歸評價的育人功能是其根本。
評價是人才培養(yǎng)的核心要素與關鍵活動。首先,智能評價要以“立德樹人”為根本目標,以落實育人功能為主旨,體現(xiàn)評價育人導向,實現(xiàn)由“因評價而育人”向“因育人而評價”的轉變。其次,確定數(shù)字評價邊界,依據(jù)不同類型的評價對象以及評價對象的特質建立分層分類的評價機制極為關鍵。技術在教育評價中運用的邊界主要指其運用范圍與運用程度。數(shù)字評價的運用范圍取決于評價對象的特性能否被量化,是合理使用智能評價工具的關鍵。如價值觀念、職業(yè)道德、情感體驗、學術品質等難以量化,無法依靠單一指標施以評價。最后,技術的運用應具有一定的適切性,把握技術在教育評價中運用的頻率與強度等要素是建立教育技術倫理秩序的關鍵。智能技術的運用一旦超過程度邊界,評價過程正當性與可信性將難以把控。
(二)創(chuàng)新智能評價方法,形成立體評價范式
新技術的快速發(fā)展為教育評價創(chuàng)造前所未有的條件,智能時代下教育評價方法正趨于多樣化,立體評價作為一種全面、客觀、科學的評價范式,對我國教育評價的改革和體系重構具有積極意義,教育評價正在從數(shù)字評價走向智能評價。
以人工智能為代表的智能技術與教育評價的深度融合,有利于彌補傳統(tǒng)教育評價缺陷,建立以智能化為特征的第五代評價范式,[22]使探索有效的智能評價方法,構建多維度、立體化的評價空間成為可能。智能評價方法要以智能技術為支撐,滿足師生各階段各方面的高素質發(fā)展需求,實現(xiàn)對師生行為相關數(shù)據(jù)的全面挖掘、智能分析、精準診斷、個性指導、有效預測與實時反饋。[23]教育評價政策需要逐步推動教育評價的精準診斷進程。這包括建立完善的數(shù)據(jù)采集、整合和分析體系,通過學生學業(yè)成績、教學質量評估、學校管理績效等多方面數(shù)據(jù),實現(xiàn)對教育系統(tǒng)全面、多維度的評價。教育評價政策還應注重過程性評價,借助數(shù)據(jù)分析技術,對教學過程和學生學習情況進行動態(tài)監(jiān)測和評估,及時發(fā)現(xiàn)問題、調整教學策略,實現(xiàn)教育過程的持續(xù)改進。
(三)重構評價標準體系,擊破“五唯”頑瘴痼疾
評價標準是評價的基礎和依據(jù),是克服“唯論文”“唯項目”“唯獎項”“唯職稱”“唯帽子”的重要基礎,而“五唯”備受詬病的最主要原因,即評論標準體系的單一、片面與抽象,實現(xiàn)評價立體化和智能化更要依托于評價標準體系。
智能時代的評價標準體系要具有全面性、綜合性、發(fā)展性、多樣性與多元化。全面性指評價指標體系要依托智能環(huán)境,建立覆蓋各個學段、各個專業(yè)的評價標準和評價服務標準體系;綜合性指評價指標體系要注重學生全面發(fā)展,尊重發(fā)展的復雜性,謹防綜合評價指標泛濫;發(fā)展性指評價指標應具有指導意義,做到“以多攻一”,權衡輕重,有的放矢,減輕指標落地時的壓力與負擔,實現(xiàn)各地評價指標體系特色化實施,否則事無巨細將會難以推進,面面俱到則會難以負擔;多樣性指評價指標應來源于多種途徑,綜合運用各項手段,充分利用各類智能技術,擊破“五唯”,謹防單純量化,引發(fā)新風險;多元化指要尊重評價主體、客體與情境的多元化,評價指標要由政府、企業(yè)、教師、社會各界等多方共同建立。
(四)加速教育新基建進程,實現(xiàn)智能全息評價
2021年教育部提出“到2025年,基本形成教育新型基礎設施體系”。教育新基建將成為我國教育評價數(shù)字化轉型與高質量發(fā)展的助推器和新抓手。
智能技術的發(fā)展進一步加速教育新基建進程,國家及地方要利用數(shù)據(jù)的采集、挖掘、呈現(xiàn)、反饋、儲存與保障的智能技術,開發(fā)智能評價工具與助手、智能平臺與資源,研發(fā)現(xiàn)代測評技術、信息與通信技術、風險防控技術等智能評價技術,建立全息數(shù)據(jù)中心、智能評價中心、服務運維中心,營造智能全息的評價環(huán)境,確保各類評價及服務建立在師生學習成長與發(fā)展的“全息”基礎上。在全息評價環(huán)境中,利用多樣的智能評價技術捕捉與評價對象相關的足夠多的關鍵信息,獲得師生學習過程與結果等行為的全息數(shù)據(jù),建立國家、省、市、縣、校五級貫通的全息數(shù)據(jù)庫,洞悉評價對象的結構和規(guī)律,進而做出全面、客觀、科學的價值判斷,以反映其全貌,逐一擊破我國教育評價領域的“痛點”和“瓶頸”,推進全息評價“人機共舞”,把握數(shù)智時代教育評價努力追求的方向。
(五)提升師生評價素養(yǎng),組建專業(yè)評價隊伍
《總體方案》強調“加強教師教育評價能力建設,支持有條件的高校設立教育評價、教育測量等相關學科專業(yè),培養(yǎng)教育評價專門人才”。新時代教育評價改革不斷深化,機遇與挑戰(zhàn)并存,然而,師生評價素養(yǎng)面臨關注度不足、與教學或學習實踐脫節(jié)的窘境,提升師生評價素養(yǎng)、實現(xiàn)教育評價專業(yè)化成為當務之急。
評價素養(yǎng)融合態(tài)度、知識與能力三大方面,評價素養(yǎng)直接影響教學質量和學習成效。師生只有實現(xiàn)由“對學習的評價”向“促進學習的評價”的轉變,發(fā)揮評價的促學作用,形成動態(tài)評價觀,才能切實提升評價素養(yǎng)。同時,遴選高評價素質的專家和業(yè)內權威人員組建一批高素質、復合型、專業(yè)化評價隊伍,并創(chuàng)新第三方評價,引入專業(yè)評價機構,使專業(yè)評價隊伍具有獨立性,促進決策公平,保障隊伍的評價質量和社會影響力,強化評價隊伍的監(jiān)督、檢查、考核、評價職能,提供教育評價及相關服務,提高評價隊伍的服務效益。[24]實現(xiàn)評價隊伍“專業(yè)化”、評價過程“立體化”、評價結果“精準化”,助推專業(yè)評價隊伍“普及化”。
(六)智能運用評價結果,發(fā)揮評價服務功能
評價結果是評價活動的核心要素與關鍵環(huán)節(jié),只有正確認識并運用評價結果,才能發(fā)揮其激勵與約束功能,深化教育改革。智能技術為運用評價結果提供強大助力,智能處理評價結果不僅強化教育評價的重要性,更有利于發(fā)揮評價的服務功能。[25]
新時代評價面向實踐的服務功能具體體現(xiàn)在五個方面:一是服務教育實踐,評價結果可以幫助師生了解教學效果與學習效果,從而選擇最有效的策略,展開針對性的學習;二是服務師生發(fā)展,將評價嵌入師生學習、發(fā)展或教學的全過程,智能利用評價結果規(guī)劃個人學習生涯,助力自身能力及素養(yǎng)的提升;三是服務教育改革,實現(xiàn)評價由經驗導向轉向數(shù)據(jù)分析,轉向“學習者為中心”,促使教、學、管發(fā)生根本性變革;四是評價服務于教育治理,利用智能技術改進教育治理策略,智能化、可視化、實時化呈現(xiàn)評價結果,實現(xiàn)全面監(jiān)控、動態(tài)反饋、實施防控、及時預警,并周期性生成數(shù)據(jù)分析報告,綜合運用評價結果;五是服務人才的培養(yǎng)與選用,將責任落實到具體的專家及團隊,根據(jù)評價對象,提高評價指標體系的適切性,有效合理培養(yǎng)和選任人才。
參考文獻:
[1]閆志明,朱友良,劉方媛.新一代信息技術支撐的教育評價:價值訴求、現(xiàn)實問題與建設進路[J].現(xiàn)代教育技術,2022,32(11):34-41.
[2]陶西平主編.教育評價辭典[M].北京:北京師范大學出版社,1998.
[3]朱軍文.分層、分類、協(xié)同推進新時代教育評價改革[J].教育發(fā)展研究,2021,41(7):前插1.
[4]朱濱,張新平.改革開放以來我國教育評價政策:演變、特征及展望[J].教育研究與實驗,2022,209(6):94-101.
[5]教育部.全國教育事業(yè)第十個五年計劃[EB/OL].(2001-07-01) [2008-04-25]. http://www.moe.gov.cn/srcsite/A03/s7050/200107/t20010701_77153.html.
[6]國家教育事業(yè)發(fā)展“十一五”規(guī)劃綱要[EB/OL].(2007-05-31)[2019-03-12]. http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/moe_1485/t1_22875.html.
[7]教育部.國家教育事業(yè)發(fā)展第十二個五年規(guī)劃[EB/OL].(2012-06-14)[2012-07-21]. http://www.moe.gov.cn/srcsite/A03/moe_1892/moe_630/201206/t20120614_139702.html.
[8]國務院.國家教育事業(yè)發(fā)展“十三五”規(guī)劃[EB/OL].(2017-01-10) [2017-02-20]. https://www.gov.cn/gongbao/content/2017/content_5168473.htm.
[9]教育部等六部門.義務教育質量評價指南[EB/OL].(2021-03-04)[2021-03-18]. http://www.moe.gov.cn/srcsite/A06/s3321/202103/t20210317_520238.html.
[10]楊聚鵬.新時代教育評價改革政策的價值意蘊、執(zhí)行阻力與改革路向[J].教育學報,2022,18(5):106-117.
[11]陽榮威,劉偉豪.新時代教育評價改革政策執(zhí)行的阻滯因素與紓解路徑[J].大學教育科學,2023,198(2):51-60.
[12]ROBERT F D, PAUL F D. Agendas, alternatives, and public policy: lessons from the U.S. foreign policy arena[J]. Journal of Public Policy, 1989(9):179-180.
[13]TAMARA VIOLA YOUNG, THOMAS V SHEPLEY, MENGLI SONG. Understanding agenda setting in state educational policy an application of Kingdon’s multiple streams model to the formation of state reading policy[J]. Education Policy Analysis Archives, 2010(18):3-4.
[14]蔡添.“雙減”背景下北京市教師輪崗政策迭代分析——多源流理論的視角[J].教育科學論壇,2022(22):29-32.
[15]孫綿濤.教育政策論——具有中國特色的社會主義教育政策研究[M].武漢:華中師范大學出版社,2002:318.
[16]李濤.邁向強國之路的中國教育評價改革[J].教育發(fā)展研究,2021,41(10):前插1.
[17]楊聚鵬.新時代教育評價改革政策的實踐困境與推進策略研究[J].武漢大學學報(哲學社會科學版),2022,75(6):181-190.
[18]周海濤.高等教育“管辦評分離”的緣由與路徑[J].國家教育行政學院學報,2014(3):3-8.
[19]劉遠杰,霍少波.邁向教育評價時代:潛在風險及其防控[J].教育發(fā)展研究,2022,42(19):58-68.
[20]余小波,陳怡然,張歡歡.新時代教育評價文化建設:意蘊、困境及完善路徑[J].大學教育科學,2022,196(6):62-70.
[21]國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)[EB/OL].(2010-07-29) [2021 -06-08]. http://www.moe.gov.cn/srcsite/A01/s7048/201007/t20100729171904.html.
[22]劉云生.運用現(xiàn)代信息技術開展學生立體評價的時代意蘊與探索思路[J].國家教育行政學院學報,2020(10):3-10,23.
[23]于發(fā)友,陳時見,王兆璟,等.筆談:新時代教育評價改革的邏輯向路與范式轉換[J].現(xiàn)代大學教育,2021,37(1):20-37,111.
[24]陸根書,李珍艷,牛夢虎,等.新時代中國特色高等教育評價體系建設探討[J].江蘇高教,2022,261(11):19-23.
[25]張宗益.推進“三位一體”教育評價改革與時俱進建設世界一流大學[J].中國高教研究,2022,349(9):7-10.
Research on the Evolution of China’s Educational Evaluation Policy under the Digital Transformation of Education: Analysis Based on 154 National Policy Texts of the 21st Century
Yichun ZHANG, Yuqing YANG, Ruizhe WANG
(School of Education Science, Nanjing Normal University, Nanjing 210097, Jiangsu)
Abstract: Educational evaluation is the guide of educational development and the “engine” of educational reform, which is closely related to the development direction and speed of educational cause. With the deepening integration of intelligent technology and education, educational evaluation has ushered in an important opportunity for intelligent transformation. Based on 154 national policies related to education evaluation in the 21st century, this study uses ROSTCM6 and SPSS26 tools to conduct text cluster analysis, obtain the focus of education evaluation policies in different periods, and analyze in depth the general direction, goals and requirements of national education evaluation reform, following the policy agenda ideas of “policy source-practical problems and development difficulties”, “Policy accumulation-expansion of policy subjects and expert opinions”, “Policy motivation - national need and public demand”, and “policy formation-opinion aggregation and policy opportunity” to capture the internal mechanism and deep logic of policy development. The transformation of educational evaluation is systematic and operable. From six aspects of “clarifying the boundary of intelligent evaluation, emphasizing the orientation of evaluation and educating people”, “innovating intelligent evaluation methods, forming a three-dimensional evaluation paradigm”, “reconstructing the evaluation standard system, breaking the five ‘stubborn problems’”, “accelerating the process of education infrastructure, realizing intelligent holographic evaluation”, “improving the evaluation quality of teachers and students, building a professional evaluation team” and “making intelligent use of evaluation results and giving full play to evaluation service function”, this paper puts forward the development strategy of education evaluation, and explores the effective path of its transformation and transformation, so as to drive the high-quality development of education.
Keywords: Educational evaluation; Policy evolution; Cluster analysis; Digital transformation of education; Development path
編輯:王天鵬" "校對:王曉明