999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學生評價的數字化整合:內涵特征與關鍵問題

2025-06-17 00:00:00楊麗萍辛濤李峰張生
中國遠程教育 2025年4期
關鍵詞:素養評價教育

一、背景

21世紀以來,我國在基礎教育課程改革中,始終堅持“全面貫徹黨的教育方針,落實立德樹人根本任務,培養德智體美勞全面發展的社會主義建設者和接班人”的教育總目標。2020年10月,中共中央、國務院發布《深化新時代教育評價改革總體方案》,明確指出要“改革學生評價,促進德智體美勞全面發展”(中共中央amp;國務院,2020),進一步明確了學生評價最終目標是促進學生的全面發展,以應對社會經濟、國際競爭與科技快速變化,實現個人需求與國家愿景的統一。

為確保全面發展育人總體目標得以實現,我國制定并推行了一系列配套政策與改革措施。在課程教學方面,核心素養融人課程標準為教學和考試改革帶來新變化。核心素養在政策文件《教育部關于全面深化課程改革落實立德樹人根本任務的意見》(教育部,2014a)中首次提出,到《中國學生發展核心素養》(核心素養研究課題組,2016)發布后,被正式納人《普通高中課程方案和語文等學科課程標準》(教育部,2017)和《義務教育課程方案和課程標準》(教育部,2022)。《國務院辦公廳關于新時代推進普通高中育人方式改革的指導意見》指出,命題要符合相應學業質量標準(國務院辦公廳,2019),強調素養導向的教學評一致性。在考試招生改革方面,綜合素質評價在考試招生中的地位逐步提高。《教育部關于普通高中新課程省份深化高校招生考試改革的指導意見》(教育部,2008)首次提出對學生的綜合素質進行全面且客觀的評價。隨后的國家文件強調“全面實施高中學業水平考試和綜合素質評價”(國家中長期教育改革和發展規劃綱要工作小組辦公室,2010),并“推行初高中學業水平考試和綜合素質評價”(中國共產黨第十八屆中央委員會第三次全體會議,2013)。《國務院關于深化考試招生制度改革的實施意見》(國務院,2014)確立了綜合素質評價的“德智體美勞”基本框架,《義務教育質量評價指南》(教育部等六部門,2021a)將學生發展要求具體化,以進一步推動學生全面發展評價工作的具體實施和落地。

當前,數字化為教育評價改革注入了新動力。全球范圍內,各國與組織均積極響應“數字革命”(UN Secretary-General,2023,p.3),高度重視并推進教育數字化轉型。國際大規模學生評價采用以促進學生學習為目標,增強學生學習能力的數字化多元評價方式(王爍等,2021)。在我國,從國家頂層政策規劃到地方實踐探索,已經形成強大的推動力,促進了教育評價體系的數字化轉型。《數字中國建設整體布局規劃》(中共中央amp;國務院,2023)和《教育部等六部門關于推進教育新型基礎設施建設構建高質量教育支撐體系的指導意見》(教育部等六部門,2021b),強調利用信息技術促進學習者個性化發展。在數字化教育環境中,真實教育教學數據的存儲、分析與回溯成為現實,新的評估方法和技術不斷涌現,評價結果的應用途徑和呈現方式也在經歷深刻變革(黃晶晶amp;劉宇佳,2022)。然而,與采用數字技術手段解決評價流程中技術難題的工程化思路相比,將學生評價政策與數字化評價實踐有效融合顯得更為重要。在此背景下,本研究提出的學生評價的數字化整合是指在遵循學生評價政策框架的前提下,將評價內容、數據、方法和技術等關鍵要素在數字環境中實現對接與融合。這不僅要求厘清學生評價的目的與內容,還要創新學生評價的基本理念和模式,確立數字化評價的標準與規范,從而更有效地推動學生評價反哺教育教學。

二、學生評價面臨多重困境與挑戰

從國家宏觀規劃與期望向具體實踐延伸的過程中,學生評價面臨評價體系之間的壁壘逐漸顯現、政策理想與現實執行之間存在巨大張力以及技術局限與結果使用相互制約等諸多挑戰。

(一)評價體系之間的沖突與壁壘

核心素養發展評價與綜合素質評價落實,分別在課程教學與考試招生改革這兩條獨立發展路線上推動著學生評價的革新,然而,核心素養與綜合素質在評價要求上存在的話語體系斷裂與差異不可回避。核心素養與綜合素質評價在本質上均致力于闡釋學生全面發展的要求,但各有其側重。核心素養關注少數通用且具備遷移性的關鍵素養的培育(褚宏啟,2016),將黨的教育方針中的抽象教育目標轉化為人的發展目標(辛濤等,2016)。通過融人課程標準,以學科核心素養貫穿教學目標、教學內容與教學建議,確保了黨的教育方針在課程和教學實踐各個環節和過程中得以落實。綜合素質評價則更強調各項能力的均衡協調發展,通過對學生成長過程進行持續觀察、記錄與分析,促進學生綜合素質的全面提升。為突破過度依賴知識傳授和分數考核的局限,綜合素質評價更加注重培養學生的社會責任感、創新精神和實踐能力。通過將學生的知識掌握程度、能力發展與個性特長相結合,達到學生評價的全面性和綜合性。然而,對于特定的能力與素養,這兩套評價體系往往有各自獨立的定義、標準與評價方式,二者之間的差異難免會增加一線工作者進行學生評價時的認知與操作負擔,并有可能引發潛在的沖突。由于目前國家層面尚未頒布關于這兩套評價體系融合統一的政策或文件,管理與實施層面仍需要面對較長一段時間內二者并行的現狀。

(二)政策與現實之間的張力難以化解

在核心素養評價與綜合素質評價推進實施的過程中,國家層面通過制定政策與標準,為教育教學和考試招生提供了明確的內容標準與質量要求。然而,政策導向與評價現實之間仍然存在巨大的矛盾與張力。

在核心素養融入教育教學的過程中,一方面,學科核心素養在課標中凸顯,通用素養在某種程度上被旁置。對與課程內容關聯緊密的學科核心素養執行得較為扎實,而通用素養、能力以及理想和信念等方面的培養與評估,在教學與考試中并未得到充分體現與貫徹。另一方面,核心素養如何與過程性評價相結合亦是一大挑戰。基于核心素養的評價體系應當具備跨學段的貫通性,為學生成長的全面、科學評估提供穩定、客觀的標準和依據。但是,由于資源與技術的可及性與復雜性,跨學段的核心素養評價標準劃分、基于學生成長過程的核心素養評價等在實踐中尚無成熟模式。在綜合素質評價的推進落實過程中,高考改革所倡導的“兩依據一參考”與中考的“一依據一結合”模式,都在引導學校教育教學由單純的知識、分數導向,轉向更加關注學生的個性和實踐能力。2014年出臺的《教育部關于加強和改進普通高中學生綜合素質評價的意見》,要求“堅持客觀性,如實記錄學生成長過程中的突出表現,真實反映學生的發展狀況,以事實為依據進行評價”(教育部,2014b)。然而,由于教育考試與評價的意義遠超教育系統,受到政治、社會、文化、經濟、技術等多重復雜因素的影響,出現了“重結果、輕過程,重一致、輕差異,重一面、輕全面”等現象(劉慶昌,2024)。在育人方面,盡管綜合素質評價對育人導向的重要性已獲得普遍認同,但要真正發揮以評促學的實效,還需經歷從學術研究、教學管理到教學應用的持續創新過程。

(三)技術局限與結果使用相制約

紙筆測驗在衡量學生的基礎知識和基本技能方面表現出較高的成熟度,但對于學生在日常學習生活中逐漸形成的動機、興趣、情感、態度、價值觀,以及自主學習能力、審辯性思維等重要素養難以精確測量。事實上,在全球范圍內,對學生的復雜思維、問題解決能力、創造力、分析和綜合能力等方面進行評價,都是一項極其復雜且難以實現的任務。這通常導致將有價值的評價目標簡化為那些能夠在標準化測試中有效測量的目標(Brown,2022)。在我國,情境化命題正成為當前解決這一問題的重要探索方向。但是紙筆考試大多通過文字描述來還原和創設任務情境,學生要對大段文字進行理解加工,大大增加了學生的認知負荷。紙筆考試固有呈現方式的局限性與現實世界的復雜性之間存在較大的差距,導致考試評價與當前所倡導的社會文化視角的學習觀之間明顯脫節。

相應地,綜合素質評價對學生“德”“體”“美”“勞”等方面的評價相對滯后。一方面,盡管全國各地正在努力探尋綜合素質評價的有效實踐路徑與方法,涵蓋評價手冊的制定、檔案袋記錄的完善以及其他表現性評價的引人等,然而,這些措施在實際操作中往往趨于形式化(賈瑜amp;辛濤,2023),導致綜合素質評價的真實性備受質疑。另一方面,各地在構建評價指標體系時,往往存在體系繁瑣且缺乏統一、評價標準模糊不清、“重校本輕普適”等現象(郭利明等,2024),導致評價結果難應用,缺乏可比性和推廣性。由于各地區和組織機構根據自身需求開發不同的指標體系及賦權算法,導致指標系統紛繁復雜且存在較大差異。這使得測量結果在不同地區和組織間不具備可比性,同一指標在不同時間點的測量和解釋缺乏穩定性,縱向測量結果難以比較,不利于一定周期內學生發展評價和教學質量評估。在中高考招生中,由于對考試內容的真實性和可比性存在擔憂,使得綜合素質評價的應用面臨較大局限,這也反過來制約了綜合素質評價技術本身的進一步發展和完善。

此外,評價人員的數據處理和分析加工能力存在空白和短板。尤其是在數字化環境下,即使采集了學生作業、課堂表現、學習數據等,但過程性數據的意義和價值不明確,不少地區與機構收集、管理、分析海量數據的能力欠缺,導致建立指導教育教學的常態化評價與反饋機制困難重重,在很大程度上制約了學生評價數據和評價結果的使用與發展。

三、學生評價數字化整合的內涵框架與主要特征

面對學生評價改革的時代動因和訴求,教育系統響應國家教育數字化戰略行動步伐,提升教育評價效能,積極推進學生評價的數字化轉型。隨著全國各地學生評價實踐探索的不斷深人,為打破評價體系間的隔閡,調和政策導向與實際操作間的張力,構建一套既對接與融合現行教育政策要求,又能充分發揮大數據與信息技術力量的學生數字化評價體系的必要性愈發緊迫。當前我國教育信息化的發展已經跨越了“起步”與“應用”兩個基礎階段,正在穩步邁入“融合”與“創新”的全新時期(楊宗凱等,2018)。但是,如何在這一新時期實現學生評價體系的融合創新,目前對此尚未形成廣泛共識。為此,在梳理學生評價相關政策背景與實踐中面臨的問題與挑戰的基礎上,有必要明確學生評價數字化整合的核心內涵、邏輯框架與主要特征。

(一)學生評價數字化整合的核心內涵與邏輯框架

若僅從技術層面考量,學生評價的數字化整合意味著運用大數據與現代信息技術,對學生評價流程的各個環節實施數字化升級和系統化整合,目標是實現評價內容、數據與技術的全面匯集及智能分析,從而建立一個客觀、量化且全面的學生數字化評價體系。而從更深層次看,考慮到教育評價在應對社會經濟變遷、技術創新以及教育哲學轉型中所扮演的角色,從系統化視角理解學生評價數字化整合的內涵,則是在學生評價政策的指引下,通過綜合運用心理測評、教育數據挖掘、學習分析等先進技術手段來彌合政策與現實之間的差距,推進學生評價體系的深刻變革與重塑。在數字化層面上促進評價內容、資源與技術的深度融合,不僅能減少學生評價的異化現象,還能提高學生評價的科學性、真實性、可比性和有效性,同時有助于構建學生評價的新生態,提升學生評價服務教育教學、教育管理與教育決策的效能與水平。

學生評價數字化整合的過程既注重評價內容的多元化與全面性,也強調評價方法的數字化與智能化。從評價內容上看,無論是聚焦于學生核心素養的精心培育,還是致力于綜合素質評價的全面深化,其根本目的都是促進學生全面發展,二者的共同指向為學生評價的數字化整合奠定了理論基礎。從評價方法來看,數字化環境中海量數據的充分挖掘與利用是學生評價轉型的核心驅動力。《教育部關于加強新時代教育管理信息化工作的通知》明確要求,推動教育決策由經驗驅動向數據驅動轉變(教育部,2021)。學生評價數字化整合的關鍵在于由理論驅動的評價向數據驅動的評價轉變,將大數據資源、數字化技術融合以覆蓋學生全面發展評價的全方面與全過程。為了構建對學生既客觀又科學的評價體系,將基于理論的自上而下的評價模式與基于數據的自下而上的大數據挖掘技術相結合,形成雙向驅動的評價力量。這不僅能夠彌補傳統從理論出發的評價模式的局限性,還能更加全面、客觀地描繪學生的學習狀況、能力發展和個性品質。由此可見,學生評價數字化整合的定位在于“在數字化層面服務于學生全面發展評價落地”。學生評價數字化整合并不能替代核心素養評價與綜合素質評價在教育政策、課程改革、學生評價和考試招生中的地位,其本身也不直接回應國家與社會需求。如果把核心素養評價與綜合素質評價比作政策層面針對如何評價學生全面發展所提出的“藥方”,學生評價數字化整合則是煉制解藥的“藥爐”。利用智能技術推進學生評價是一個涉及多要素、多層級、多領域的復雜系統工程,應在正確把握時代背景、面臨問題和核心內涵的基礎上,從整體生態視角系統構建多層次的學生評價數字化整合體系。

以大數據和智能技術作為技術支撐,在學生評價的指標體系、多渠道多模態的評價數據層面系統性推進學生評價的數字化轉型,形成數字技術賦能學生評價的邏輯框架。該框架包括數據層(提供豐富的數據基礎)、指標層(確立科學評價標尺)以及應用層(實現評價結果的有效轉化與應用)(如圖1所示)。

圖1學生評價數字化整合的邏輯框架

首先,數據層是基礎。在現行學生評價理論分析的基礎上,融合“數據驅動”的核心理念,利用大數據技術廣泛收集并深入分析學生在學習與成長過程中的各類數據,包括但不限于學業成績、課堂互動、課外活動參與等多渠道、多模態信息,為科學評價學生發展提供事實證據。其次,指標層是核心。指標層采用自上而下與自下而上相結合的方式,既基于核心素養與綜合素質的既定指標進行解構,同時深人挖掘大數據中潛在的學生評價新指標,形成涵蓋學生全面發展的豐富且多層次的數據指標體系①。在數字化層面整合學生評價指標的方式主要包括三種途徑:一是整合學業質量評價標準中關于學生核心素養發展的指標及其發展水平的界定,并進行綜合素質評價的理論分析、歸納與拓展(柴喚友等,2022);二是從大量可收集的數據中解析出指標,即通過匯集數字化環境下產生的數據,經過處理和驗證,提煉出具有操作性并能真實反映學生表現的指標;三是結合前兩種途徑的混合模式,即在充分考慮指標的解釋力、可操作性、預測性和使用情境等因素的基礎上,通過融匯學生全面發展的理論認識和現實條件,采用分解與提煉相結合的方法,形成指標的蓄水池。最后,應用層聚焦于評價結果的轉化。將數據層和指標層的分析結果有效地應用于核心素養發展評價與綜合素質評價實踐中,無論是核心素養評價還是綜合素質評價,抑或其他評價場景,都能在整合的數字基座中找到技術實現的最優路徑,從而構建出以學生全面發展為導向、持續優化完善的學生評價數字化閉環。

(二)學生評價數字化整合的主要特征

學生評價的數字化整合實質上是構建一個全面反映學生發展的數字基座,并且緊密對接我國人才培養目標,促使核心素養評價與綜合素質評價在數字技術空間上實現深度交融。其具有以下三方面特征。

一是不同導向下學生評價政策在評價內容上是統合的。從學生發展角度來說,就是核心素養導向的評價和綜合素質評價的統整化。學生評價的系統性和整合性體現了數字時代對學生全面發展含義及表現的深人思考。學生評價數字化整合意味著評價要在當前時代審視、理解與整合學生全面發展所涵蓋的能力、價值觀、動機、情感、意志等個體特征,形成整合的學生評價指標。在對現有評價內容進行整合的基礎上,體現出鮮明的數字時代特色。具體來說,一方面,學生評價數字化整合需涵蓋數字時代學生適應多元環境所需的能力與素養,并重新定義數字化環境中的能力或素養(Leeetal.,2021)。例如,學習能力不再限定于傳統意義上的課堂行為與成就,也表現為基于計算機進行科學探究實踐等(Piacentiniamp;吳泓霖,2024)。另一方面,對體現人類主體性與社會文化性的元認知、自主學習、網絡時代的人格特質等方面的關注顯得更加重要。尤其是在人與生成式人工智能體的協作中,學生不能被視為與計算機交互的另一臺“計算機”,交互過程也不是信息交換與迭代的冷冰冰的過程,應強調人的主體性與主觀能動性(吳剛amp;袁蕾,2023)。

二是在測量框架下的學生評價數字化整合具有通用性。基于數字化環境下多模態數據資源和分析技術的優勢,以整合后的評價指標為核心脈絡,能夠有效實現學生全面發展的數據與技術的深度融合。一方面,數字化整合過程匯聚了來自多個渠道的多模態數據。單一指標或孤立數據難以對學生全面發展進行推斷,需要整合來自不同時間、來源和形式的多重數據進行推斷和相互印證,以持續驗證、優化和完善指標與數據構成的證據體系。豐富的多渠道、多模態數據是學生在物理世界與數字世界中實際行動的映射與記錄,涵蓋學生的心智、生理和行為表現。通過整合學生在學校、家庭、社區等重要場景中自然產生的、具有代表性的數據,以及包含多元評價主體評價信息的數據,可從多角度直觀展示學生的思維過程和行為模式。另一方面,數據分析與處理技術在測量框架下得以整合。單純依賴觀測表現作為評價依據,易陷入行為主義評價范式的窠白,進而限制評價結果的應用范圍和深度。合理且高效地利用多模態數據資源,關鍵在于從紛繁復雜的數據中剔除冗余與噪聲,精準提煉出具有實質性價值的有效數據,并基于這些數據的內在邏輯與意義進行精準對齊與有機整合。這一過程中,構念(Construct)作為數據整合的核心概念,凸顯了對學生能力與素養及其發展水平進行一般性、概括性描述的重要性。具體而言,數字化整合通過將測量構念(常以指標形式體現)作為整合高自由度多模態數據的主線,運用學習分析、教育大數據挖掘等先進技術手段,構建起一套緊密圍繞目標測量構念的數據分析體系。此體系不僅能夠生成針對特定構念的深人分析結果,還能增強評價反饋的動態調整能力與時效性(Huang etal.,2007),從而提升學生評價的精準度與有效性。

三是學生評價數字化整合是具體化和常態化的。在學習與評價不斷融合的趨勢下,現實世界包括物理世界與數字世界的復雜場景,個體在解決問題過程中心智思維、工具、方法與資源的調動,以及在復雜情境下互動過程中的認知與行為全過程表現均有機會被關注與真實記錄。例如,在課堂教學中,通過高精度傳感器可以精確捕捉學生的眼動、心跳、身體動作等細微信息;又如,在線練習或考試時,學生的鼠標點擊、滑動及鍵盤操作日志等數據會被系統詳細記錄。這些數據的收集,使得學生的言語、行為、動作和生理數據在非高卷入度的學習環境中得以捕捉,從而確保了數據的真實性。面對每一個獨特的學生個體,或者某個學生群體,其整個發展的常態過程能夠在數字化基座中得到全面、系統的規則化和規律化分析。

概要之,在教育數字化轉型背景下,學生評價數字化整合是實現學生全面發展評價的一個基礎性的技術環節,為學生評價的數字化轉型提供了切實可行的數字基座。在這個基座中,各種指標的測量是學生評價的起點而不是目標。整合評價數據采集、匯聚與分析結果,系統性優化與迭代評價方法,為核心素養評價和綜合素質評價的落地實施提供豐富、可溯源的數據與技術資源。為確保這一體系順暢運行,將學生評價數字化整合與促進學生全面發展評價理念有機結合,需要在政策制定、管理實踐、科研探索以及一線教育教學等各個層面建立系統的有機聯動機制,以此有效應對學生評價在現實中面臨的困難和挑戰。

四、推進學生評價數字化整合的關鍵要素

在推動學生評價數字化整合的過程中,要在關鍵環節上撬動學生評價的變革與創新,需要轉變傳統的評價觀念與思維模式,打破長期沿用的分解式評價邏輯,全面激活并充分利用教育教學過程中的評價資源,建立并完善相應的數字化整合的評價標準與規范體系。

(一)系統化推進學生評價的數字化整合

從教育評價數字化轉型的國際趨勢來看,教育評價正逐步從嚴格約束和單一化的評價方式,轉向一種更為綜合和動態的評價方式。在國際大規模學生考試評價中,現已呈現出學生評價理論范式轉變、核心素養測評涌現、信息技術推動測試方法革新,以及教育評價結果支持教師與學生發展等多方面變化(張民選,2023)。我國學生評價數字化轉型過程同樣展現出類似的演進軌跡,但也面臨著一些獨特的問題。以本研究依托的國家重點研發項目“大規模學生跨學段成長跟蹤研究”為例,指標體系的建構要從理論和實際雙向對接,并且融合地方或校本綜合素質評價指標,集成數據算法與測評工具,形成了既有統一標準,也能對接地方特色的學生評價體系。在這一過程中,心理學家、教育考試專家、學科專家、計算機專家以及管理者的緊密合作確保了評價的順利實施和有效應用。

概要之,學生評價的數字化整合需要系統性推進。在充分結合評價理論、政策與社會現實的基礎上,從單純關注知識、技能,向評估學生的核心素養轉變;從選拔與排序的功能向促進學生全面發展的功能轉變;從開發專門的測評工具,向實現常態化數據采集的方向邁進;從逐級細分的指標體系向自下而上形成評價指標蓄水池的模式演變;從傳統的統計分析方法向基于大數據的描述與判斷方法過渡;從對教學產生強干預的評價向對教學產生弱干預的評價轉變。為適應這一系列評價變革,學生評價的數字化整合作為學生評價的數字基座,為各種情境下的學生評價,乃至各級各類教育評價提供了兼具客觀性、推廣性和統一性的指標概念體系、客觀數據與分析技術、結果使用參考框架以及豐富的證據系統,從各個維度全方位推動學生評價的數字化轉型。

(二)打破分解式的評價邏輯

傳統測量范式下,對特定能力的測定始于對所測構念的理論分析,采用分析式的方法自上而下將構念逐層分解為多層級指標體系,在此基礎上開發測評工具來測量學生能力。該范式通常從理論出發,通過分析式視角逐級分解形成指標體系(楊向東amp;朱虹,2013),然后將其轉化為測評工具的評價維度,并最終對應到可觀察和獲取數據的觀測點。然而,這種自上而下的傳統評價范式使指標分解過度細化,指標的科學性與可比性無法保證。在評估學生全面發展狀況時,無論是核心素養的考察,還是綜合素質評價指標的分解,其工作量遠遠超出了教育管理者或教育評價者所能承受的物力和人力范疇。即便開發出逐級分解的指標,其科學性仍難以得到驗證,而指標數量的成倍增加,也極大地增加了基層教育工作者的學習成本和評價負擔。

在學生評價的數字化整合中,評價指標細分和學習表現數據的關聯至關重要,這一步驟需要結合自上而下的理論分析與自下而上的數據技術共同發力解決。一方面,基于自上而下的理論分析將評價指標細化到一定大小的顆粒度,但很難拆解到海量的觀測點層面;另一方面,基于自下而上形成的日常教學與學生學習過程數據往往攜帶大量噪聲。因此,在數據驅動的測量范式中,更重要的是挖掘學生在現實世界中留存信息的測量意義,并在此基礎上建立數據與測量指標之間多對多映射關系的形式化表達。目前已有研究基于學生行為軌跡、文本等多模態數據預測學生心理特質(駱方等,2021),或與特定素養建立關聯。在這個過程中,通過數據的分析凝練、加權合成等技術消除評價指標與終端觀測數據之間的灰色地帶,減輕逐層細化指標帶來的繁重工作負擔,從而避免削弱一線工作者參與和利用數字化評價的積極性。

(三)強化基于教育教學過程的評價

過程性評價不應成為教育教學活動的額外負擔。首先,要逐步減少那些過度標準化和結構化的評估,這是因為這類評估常常中斷正常的教學進程。只有轉變為在教育和教學的各個階段常規性地收集評價資料,對學生在課堂內外及各類學習活動中的實際行為表現進行深人分析,過程性評價才能真正融入日常教學活動,形成一種持續有效的評價機制。以理科實驗教學為例,學生的實驗指導單和實施過程不僅是課程要求的體現,更是學生實踐能力與綜合素質的直接反映,這類教學過程材料完全能夠作為核心證據納入綜合素質評價檔案。其次,探索在日常教學的適當環節嵌入測評,為評價在教學過程中預設空間與路徑。在教學過程中,采用“埋點式”的評價方式能夠防止評價活動脫離課程主體,避免產生不必要的工作負擔,也能減少對學生學習過程的直接干預,緩解學生對評價的焦慮和心理壓力。同時,也有助于及時提供學生評價的反饋,以便改進教學策略,確保教學目標與評價內容的同步性,提高評價的時效性。最后,不斷優化和升級各地初步建立的形成性評價體系,如同伴評估、自我評估及成長記錄檔案袋等。通過將這些評價方式得出的結果與其他評價結果進行對比分析,從而綜合判斷學生的發展狀況,為實施個性化教育教學提供科學依據。

需要注意的是,在引入教學過程性數據時必須警惕數據誤用的風險。學生在學習過程中展現的探究、反思、質疑以及互動行為,使得評價更加貼合“與真實世界互動”的實際情境。為了充分利用這些數據,必須明確學生行為表現數據背后的深層含義。只有通過系統地收集、分析并合理評估那些對學生和教學具有指導意義的過程性數據、典型事件和關鍵行為,才能超越描述性統計分析的局限,深人挖掘并精確解讀學生學習過程數據的心理測量學意義。簡言之,只有將過程數據與學生具體素養及其發展水平的實質層面相聯系(El-Alfyamp;Abdel-Aal,2008),才能為教育教學的改進提供有力的證據支持。

(四)建立數字化評價的標準與規范

EducationalMeasurement(第4版)作為國際上教育測量的權威著作,闡述了教育測量與評價的原則、流程與標準(Borsboom,2009)。在數字化時代,需要從評價數據獲取、分析與應用的全鏈條上,對信度與效度標準進行重新界定與拓展,以保證數字化評價的科學性。同時,學生評價數字化整合中的指標、數據、工具與技術并非僵化不變,要根據實際應用場景和評價目標,建立數字化整合評價體系持續更新與迭代的標準與規范。

一是建立教育評價大數據的質量標準。數字化評價依賴大量數據的整合發力,為避免數據誤用或偏見導致評價失真,需制定統一的數據質量標準與檢驗標準,提高數據共享的規范性。將各地、各機構掌握的片面化、零散化的數據通過統一的存儲與使用標準進行規范化管理,以避免數據重復采集與分析,提高數據使用效率。對于數據采集、存儲、傳輸和使用過程中的潛在風險(Zhaietal.,2020),如信息泄露、個人隱私侵犯、算法偏見等,可制定數據安全政策和倫理規范,確保數據的合法、安全、可靠和可追溯性,符合相關法律法規和倫理要求。

二是重視測量與評價的可解釋性。數據應用于學生評價的方式分為兩類,一類是將數據作為預測變量,提高對所測量構念的預測準確度;另一類是用于評估學生的非認知能力。從測量視角出發,關注學生在所測量構念上的特征與水平,才是評價的核心目標。因此,要關注學生在當前測評任務與未來目標任務中解決問題過程的認知、元認知的一致性。依據當前數據估計其背后的構念水平,再基于構念水平推斷未來可能的表現,而非直接從當前表現預測未來表現,能夠提高評價的解釋力與透明度,確保評價的有效性和教育價值。

三是制定技術方法選擇與應用的操作規范。當前,數字化評價尚處于探索初期,不同學科專業領域的研究者與實踐者紛紛涉足這個領域,研究視角不一,評價方法與數據的選擇易出現隨意性傾向。當把新技術與新方法加人學生數字化評價中時,應明確它們能夠在哪些環節發揮作用,說明其使用的邊界與潛在風險,并對新技術與新方法的適用性和有效性進行嚴格評估,形成技術方法清單與操作規范。

五、未來展望

任何教育評價改革都應緊密圍繞國家整體教育目標展開。展望未來,融合新技術的學生評價數字化整合將作為關鍵驅動力,彌合政策規劃與教育實踐之間的空白,促進全面發展育人和教育公平的實現。

隨著認知智能大模型、虛擬現實等技術的迅猛發展,新技術在學生評價領域的應用潛力正蓄勢待發,預示著一場革命性的變革。跨學科融合已成為不可阻擋的趨勢,計算機科學的前沿探索、大數據技術的深度挖掘、認知科學的最新發現等多領域的成果為教育評價注人了前所未有的活力與可能性(Montene-gro-Ruedaetal.,2021)。然而,將這些先進技術有效融入評價體系,絕非一蹴而就,而是一個需要經歷反復驗證與調整的長遠過程。事實上,在未來相當長的一段時間內,數字化評價尚不能完全取代傳統評價方式,與“科學客觀地評估核心素養與綜合素質”的目標仍有很長距離。未來,隨著學生評價數字化整合理念的普及,各相關利益群體和評價參與者在數字化評價上的認知差異將逐步縮小,價值取向趨于統一,進而避免因盲目追求大數據與技術而舍棄既有的有效測評方式。在實事求是的基礎上,充分發揮數字化評價的效能,合理布局、科學施策,數字化整合評價將會在促進學生全面發展、推動教育質量提升方面發揮更加積極的作用。

學生評價數字化整合的最終目標將導向育人變革。在現行政策執行過程中,需要一個全面且成熟的框架來有效融合核心素養評價與綜合素質評價,但在國家層面出臺政策的條件尚未成熟。如果不從技術層面進行突破與創新,僅寄希望于集成一套包括核心素養評價與綜合素質評價的指標體系,遠不足以推動學生評價的系統性轉型升級。學生評價本身具有鮮明的時代性與動態性,以核心素養為例,作為一個不斷完善和發展的概念,其指標框架的內涵與外延也在不斷發展變化。相應地,學生評價數字化整合的內容與方式也要與時俱進,并在全面發展的教育目標下實現殊途同歸。教育管理是一個涉及多方利益相關者的復雜系統,是教育管理者、專家以及實踐者長期交互與相互影響的過程。學生評價的數字化整合將政策層面對學生的要求滲透到教育教學的各個層面,精準干預,構建“評價一反饋一優化”的常態化運行機制,形成可持續的學生評價,構建數字化育人新體系。

從教育公平的宏觀層面審視,學生評價數字化轉型無疑是一股強勁的推動力,能夠促進教育投人和資源配置的合理性。針對信息化采集可能加劇城鄉等社會階層間教育鴻溝的擔憂,應當看到,學生評價數字化整合非但不是鴻溝的制造者,反而是一種積極力量引導教育資源與管理策略向更加全面、均衡的方向傾斜。為實現對學生全面發展的精準評估,就要確保一套通用的教育數據采集與分析系統的正常運作,教育系統就要被激勵和深化其在數字化軟實力方面的投入,包括評價數據分析能力的提升、新技術方法的使用以及師生數字素養的培育等,而不僅僅是局限于硬件設施的更新換代。因此,學生評價的數字化整合是推動教育數字化轉型從“硬件堆砌”邁向“智慧學評”的關鍵步驟,是極大釋放教育數據生產力的過程。通過推進學生評價的數字化整合,使學生能享有均衡的評價環境生態與參與機會,從而進一步推動教育公平。

參考文獻

Piacentini,M.,amp;吳泓霖.(2024).PISA數字化學習技能測評.中國考試(2),18-24.

柴喚友,陳麗,鄭勤華,amp;王辭曉.(2022).學生綜合評價研究新趨向:從綜合素質、核心素養到綜合素養.中國電化教育(3),36-43.

褚宏啟.(2016).核心素養的國際視野與中國立場——21世紀中國的國民素質提升與教育目標轉型教育研究(11),8-18.

國家中長期教育改革和發展規劃綱要工作小組辦公室.(2010-7-29).國家中長期教育改革和發展規劃綱要(2010—2020年).中華人民共和國教育部網站.htp://www.moe.gov.cn/srcsite/A01/s7048/201007/t20100729_171904.html

郭利明,李魯越,amp;鄭勤華.(2024).構建兼顧校本特色與普適性的新型學生綜合素質評價體系.中國考試(10),61-69.

國務院.(2014-9-3).國務院關于深化考試招生制度改革的實施意見.中華人民共和國中央人民政府網站.http://www.gov.cn/zhengce/content/2014-09/04/content_9065.htm

國務院辦公廳.(2019-6-11).國務院辦公廳關于新時代推進普通高中育人方式改革的指導意見.中華人民共和國教育部網站.htp://www.moe.gov.cn/jyb_xwfb/s6052/moe_838/201906/t20190619_386543.ht-ml

核心素養研究課題組.(2016).中國學生發展核心素養.中國教育學刊(10),1-3.

黃晶晶,amp;劉宇佳.(2022).試析教育評價數字化轉型的原則、場域與方向.中國考試(6),16-23.

賈瑜,amp;辛濤.(2023).關注過程:落實綜合素質評價育人目標的關鍵.中國教育學刊(2),75-80.

教育部.(2008).教育部關于普通高中新課程省份深化高校招生考試改革的指導意見.中華人民共和國教育部公報(4),47-48.

教育部.(2014a-4-8).教育部關于全面深化課程改革 落實立德樹人根本任務的意見(教基二[2014]4號).中華人民共和國教育部網站.http://www.moe.gov.cn/srcsite/A26/jcj_kcjcgh/201404/t20140408_167226.html

教育部.(2014b-12-16).教育部關于加強和改進普通高中學生綜合素質評價的意見.中華人民共和國教育部網站.http://www.moe.gov.cn/srcsite/A06/s3732/201808/t20180807_344612.html

教育部.(2017-12-29).教育部關于印發《普通高中課程方案和語文等學科課程標準(2017年版)》的通知.中華人民共和國教育部網站.http://www.moe.gov.cn/srcsite/A26/s8001/201801/t20180115_324647.html

教育部.(2021-3-15).教育部關于加強新時代教育管理信息化工作的通知.中華人民共和國教育部網站.http://www.moe.gov.cn/srcsite/A16/s3342/202103/t20210322_521669.html

教育部.(2022-4-21).教育部關于印發義務教育課程方案和課程標準(2022年版)的通知.中華人民共和國教育部網站. http://www.moe.gov.cn/srcsite/A26/s8001/202204/t20220420_619921.html

教育部等六部門.(2021a-3-1).教育部等六部門關于印發《義務教育質量評價指南》的通知.中華人民共和國教育部網站.http://www.gov.cn/srcsite/A06/53321/202103/t20210317_520238.html

教育部等六部門.(2021b-7-8).教育部等六部門關于推進教育新型基礎設施建設構建高質量教育支撐體系的指導意見.中華人民共和國教育部網站.htp://www.moe.gov.cn/srcsite/A16/s3342/202107/t20210720_545783.html

劉慶昌.(2024).教育評價很影響教育質量嗎?太原學院學報(社會科學版)(5),125-126.

駱方,田雪濤,屠焯然,amp;姜力銘.(2021).教育評價新趨向:智能化測評研究綜述.現代遠程教育研究(5),42-52.

王爍,李昂揚,amp;蘇君陽.(2021).近十年國際教育評價研究熱點與趨勢的可視化分析.黑龍江高教研究(1),14-22.

吳剛,amp;袁蕾.(2023).教育的邏輯及人工智能的教育誘惑.北京大學教育評論(1),2-26,187.

辛濤,姜宇,林崇德,師保國,amp;劉霞.(2016).論學生發展核心素養的內涵特征及框架定位.中國教育學刊(6),3-7,28.

楊向東,amp;朱虹.(2013).教育指標系統構建的理論問題.清華大學教育研究(3),16-28.

楊宗凱,吳砥,amp;鄭旭東.(2018).教育信息化2.0:新時代信息技術變革教育的關鍵歷史躍遷.教育研究(4),16-22.

張民選.(2023).基于國際評價改革趨勢探討基礎教育高質量發展方向.中國基礎教育(3),15-21.

中共中央,amp;國務院.(2020-10-13).深化新時代教育評價改革總體方案.中華人民共和國中央人民政府網站.http://www.gov.cn/zhengce/2020-10/13/content_5551032.htm

中共中央,amp;國務院.(2023-2-27).數字中國建設整體布局規劃.中華人民共和國中央人民政府網站.http://www.gov.cn/zhengce/2023-02/27/content_5743484.htm

中國共產黨第十八屆中央委員會第三次全體會議.(2013-11-15).中共中央關于全面深化改革若干重大問題的決定.中華人民共和國中央人民政府網站.htp://www.gov.cn/zhengce/2013-11/15/content_5407874.htm

Borsboom,D. (2Oo9).Structural equation modeling: A multidisciplinary journal. InR.L. Brennan (Ed.),Edu-cational measurement (4th ed.) (pp.702-711). Tayloramp; Francis.

Brown,G. T.L. (2O22).The past, present and future of educational assessment: A transdisciplinary perspec-tive.Frontiers in Education,7,1060633.https://doi.org/10.3389/feduc.2022.1060633

El-Alfy,E.S.M.,amp; Abdel-Aal,R.E.(2O08). Construction andanalysis of educationaltests using abductivemachine learning. Computers amp; Education, 5I(1) ,1-16.

Huang,C.J.,Chu,S.S.,amp; Guan, C.T.(2OO7).Implementationand performance evaluation of parameter im-provement mechanisms for inteligent e-learning systems. Computers amp; Education,49(3),597-614.

Lee,J.,Kim,T.,amp; Su,M.(2O21).Reassessing school effectiveness: Multi-objectivevalue-added measures(MOVAM) ofacademicandsocioemotional learning.Studies inEducational Evaluation,68,00972.

Montenegro-Rueda,M.,Rosa,L.D.L.,Sánchez-Serrano,J.L.S.,amp;Fernández-Cerero,J.(2O21).Assess-mentin higher education during the COVID-19 pandemic:A systematicreview.Sustainability,13(19),1-13.

UN Secretary-General. (2023,September 19). Report onthe 2022 transforming education summit. United Na-tions web.www.un.org/sites/un2.un.org/files/report_on_the_2O22_transforming_education_summit.pdf

Zhai,X.,Yin,Y.,Pellegrino,J.W.,Haudek,K.C.,amp;Shi,L.(2O2O).Applying machinelearning inscience as-sessment:A systematic review.Studies in Science Education, 56(1),111-151.

Digital Integration of Student Evaluation: Connotative Characteristics and Key Issues

Yang Liping,Xin Tao, Li Feng and Zhang Sheng

Abstract: With the advancement of student evaluation reform, the deep integration of core competencies and curriculum teaching,as well as the comprehensive implementation of comprehensive quality evaluation, have pushed the evaluation that promotes students’ all-round development into a new stage. At the same time, it is also faced with multiple difficulties and challenges,such as barriers between different student evaluation systems,difficulties in resolving the tension between policies and practices, and mutual constraints between technological limitations and the use of results. Under the trend of educational digital transformation, there is an urgent need to integrate the content, data,and technology of student evaluation from different policy perspectives to construct a comprehensive, specific,and normalized digital integration framework for student evaluation.The key to realizing the digital integration of student evaluation lies in fundamentally changing evaluation concepts,breaking down traditional fragmented evaluation logic, strengthening evaluation’models based oneducational and teaching processes,and establishing standards and norms for digital evaluation. Looking ahead, the continuous promotion and improvement of digital integration evaluation is expected to bridge the gap between policy formulation and practical operations,enabling student evaluation to return to its essence of fostering talent,and driving the achievement of educational equity through digital evaluation.

Keywords: student evaluation; digital integration; all-round development; core competencies;comprehensive quality evaluation

Authors: Yang Liping,assistant researcher of the Institution for Supervision and Evaluation in Higher Education,Beijing Institute of Educational Supervision and Evaluation (Beijing 10oo34);Xin Tao,director and professor of Collaborative Innovation Center of Assessment for Basic Education Quality, Beijing Normal University (Beijing 100875); Li Feng,associate professor of the Institute of Advanced Studies in Humanities and Social Sciences,Collaborative Innovation Center of Assessment for Basic Education Quality, Beijing Normal University (Corresponding Author: lifeng@bnu.edu.cn Zhuhai 519o87); Zhang Sheng,professor of Collaborative Innovation Center of Assessment for Basic Education Quality,Beijing Normal University (Beijing 100875)

責任編輯 劉莉

猜你喜歡
素養評價教育
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
必修上素養測評 第四測
必修上素養測評 第三測
必修上素養測評 第八測
必修上素養測評 第七測
教育有道——關于閩派教育的一點思考
辦好人民滿意的首都教育
基于Moodle的學習評價
主站蜘蛛池模板: 久久久四虎成人永久免费网站| 欧美国产中文| 在线观看无码a∨| 国产精品高清国产三级囯产AV | 久久精品中文字幕免费| 喷潮白浆直流在线播放| 永久成人无码激情视频免费| 色国产视频| 色婷婷色丁香| 亚洲精品国产自在现线最新| 国产麻豆精品久久一二三| 国产性精品| 国产成人高清精品免费软件| 狠狠色狠狠综合久久| 日本三区视频| 免费看的一级毛片| www.91在线播放| 亚洲婷婷丁香| 国产极品美女在线观看| 国产一级视频在线观看网站| 婷五月综合| 国产成人精品高清不卡在线| 69av免费视频| 国产精品9| 日韩国产精品无码一区二区三区| 国产资源免费观看| 麻豆AV网站免费进入| 高清免费毛片| 色香蕉网站| 欧美激情网址| 国产精品九九视频| 日本高清免费一本在线观看| 18禁高潮出水呻吟娇喘蜜芽| 亚洲人成网站18禁动漫无码| 国产成人综合日韩精品无码首页| 中文字幕伦视频| 精品视频一区二区观看| 婷婷丁香在线观看| 国产精品亚洲一区二区三区z | 8090成人午夜精品| 亚洲另类国产欧美一区二区| 国产一级在线播放| 成年人久久黄色网站| 精品少妇人妻av无码久久| 91无码国产视频| 黄色福利在线| 欧美va亚洲va香蕉在线| 亚洲福利视频一区二区| 国产视频a| 四虎在线观看视频高清无码| 波多野结衣在线一区二区| 亚洲精品动漫在线观看| 在线国产毛片手机小视频| 666精品国产精品亚洲| 午夜少妇精品视频小电影| 丁香婷婷激情网| 国产综合亚洲欧洲区精品无码| 亚洲成人77777| 少妇人妻无码首页| 国产精品开放后亚洲| 国产微拍一区二区三区四区| 91视频精品| 人妻丰满熟妇αv无码| 国产无遮挡裸体免费视频| 成人午夜天| 直接黄91麻豆网站| 无码人中文字幕| 91国内视频在线观看| 色综合久久无码网| 国产一区二区三区精品欧美日韩| 亚洲欧美成人在线视频| a免费毛片在线播放| 在线观看欧美精品二区| AV老司机AV天堂| 黄色网页在线观看| 国产午夜无码专区喷水| 亚欧乱色视频网站大全| 青青青视频91在线 | 久久青草免费91观看| 激情五月婷婷综合网| 久久国产精品娇妻素人| 亚洲A∨无码精品午夜在线观看|