


摘要:隨著數字技術與教育的深度融合,數字化測評已成為現代教育測評發展的重要方向。文章著眼于學科核心素養評價這一現實需求,深入分析指向學科核心素養的傳統測評方法之困,洞察了新時期學科核心素養數字化測評的價值意蘊。在此基礎上,分析了學科核心素養的形成過程,并結合ECD理論構建了學科核心素養數字化測評的概念模型。最后從構建學科核心素養導向的測評指標體系、設計指向學科核心素養的數字化測評工具、研制學科核心素養水平量化計算方法三方面討論了新課標視域下學科核心素養數字化測評的實現機理,以期為學科核心素養導向下開展精準、全面的學習評價提供指導,有效推進數字化測評方法在教育評價中的應用。
關鍵詞:學科核心素養;學科核心素養測評;數字化測評;ECD理論
【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009—8097(2025)02—0055—08【DOI】10.3969/j.issn.1009-8097.2025.02.006
引言
2022年我國發布的新版義務教育課程方案及各學科標準,明確將培養目標從“三維目標”升華為“學科核心素養”,并圍繞學科核心素養的落實,優化教學內容與活動,提出了更具針對性的考試評價建議[1],為新時期學習測評的設計與落實提供了新的科學指導方案:一是明確學習測評的目標導向,強調知識的理解和運用、問題解決能力的發展以及正確價值觀的形成。二是基于核心素養發展要求,以核心概念為骨架,遴選主題內容和基礎知識,統籌優化課程結構。三是根據提出學業質量標準,準確把握學科核心素養導向下學生通過課程學習預期達到的學習結果。四是從學科核心素養出發,針對“內容要求”提出“學業要求”和“教學提示”,強化考試評價同課程標準與教學的一致性,促進“教-學-評”有機銜接。
新課標的頒布意味著學科核心素養導向的課堂改革已全面鋪開,學生的學習測評由知識掌握與應用水平,擴展為知識、能力以及學科思維等核心素養培養情況的全面評價。將測評目標聚焦于學生的學科核心素養,是教育主體在價值選擇和創新中的重要過程[2]。長期以來,紙筆測驗都是教學實踐中常見、主流的評價方式[3],盡管這種方式可以通過作答結果進一步分析出學生的能力水平,但是素養的真正意義在于能夠將所學知識和技能應用到實際生活和工作中。傳統的紙筆測驗無法模擬真實情境,難以了解學生的內在思維變化過程,對于實踐技能的評估存在一定的困難,特別是對于需要通過實驗、理論推導和數學建模來探索現實世界中各種現象和規律的物理、化學等學科而言,難以動態獲取學生答題活動過程中反映思維情況的行為信息[4],導致其在動態評價學生的高階能力、學科核心素養形成水平方面存在局限。
新一輪科技革命和產業變革以信息化和數字化高效發展為基本特征,PAD、數字紙筆等智能學習終端、虛擬仿真實驗室等學科工具在考試測驗中的廣泛應用,促使基于數字技術的測試過程性數據收集變得更加可行,很大程度上克服了由于可用數據單一、零散、有延時等情況所導致的學習評價準確性不足的問題,為測評學生思維等素養水平提供了有效的手段和途徑,這成為教育技術研究領域的熱點和富有挑戰性的問題。因此,在數字化條件下,研究指向學科核心素養的測評方法具有重要的理論價值與實踐意義。
一指向學科核心素養的傳統測評方法困境分析
學科核心素養是個體在現實情境中對特定領域知識、方法和觀念進行整合或重組,持續性和創新性解決問題的能力。鑒于其在具體內涵和表現機制上的綜合性與復雜性,實踐視域下落實學科核心素養的常態化測評面臨著諸多瓶頸問題,亟需正確審視和分析傳統測評方法之困,探尋更為適切的測評手段。
1 紙筆測試缺乏問題解決過程與高階思維的推論證據
紙筆測試是一種靜態的評估工具,對于測評淺層知識和基本技能有著較高的效率,在提高日常教學評價效率和可操作性方面具備優勢[5]。但是紙筆測試所提供的通常是在特定時間點的測量結果,易受時間和呈現方式的限制,對于設計和執行調查等科學實踐無法在靜態的紙筆測試工具中展現。由于難以觀測到學生答題活動過程中反映其思維情況的行為信息,無法收集學生開展問題解決探究活動和進行高階思維的推論證據,教師往往只能依靠作答結果評判出學生解決問題的思維能力水平狀況[6]。這使得全面反映個體在不同情境中經過復雜交互而產生的高階能力及其發展過程不易實現,難以適應當前指向學生學科核心素養的動態量化評價需求。
2 表現性評價方法在規模化測評項目中的可操作性低
近年來,表現性評價作為一種在真實情境或模擬情境中,運用評分規則對學生完成復雜任務的過程表現與結果做出判斷的評價方法[7],在學生的問題解決、交流合作和批判性思考等多種復雜能力評價方面,逐漸成為紙筆測試的替代性方案得到廣泛使用。然而,表現性評價方式通常在具體操作層面存在問題[8]:首先,施測程序復雜,特別是對個體表現進行深入和全面的評估需要更多的時間與資源,評分成本耗費較大[9]。其次,存在評價主觀性和一致性方面的問題,容易受到評價者主觀觀點和個人偏好的影響,在多人評估的情境中,難以確保評分的一致性[10]。最后,缺乏可操作的評分細則,表現性評價往往強調對綜合素養和技能的整體評估,對于一些復雜技能或能力,難以設計具體、可量化的評分細則,影響評估的準確性。
3 自我報告評價方法存在認知差異影響評估的準確性
自我報告評價是一種通過自主報告的方式來評估個體主觀體驗與感受或能力水平的方法,依賴于被評估者對自己的主觀認知,通常有問卷調查、日志記錄等方式。例如,加拿大“泛加拿大評估項目”(Pan-Canadian Assessment Program,PCAP)將嵌入式紙筆試題與測評量表相結合來評估學生的科學態度[11];澳大利亞科學素養測評NAP-SL2015項目中,以問卷的形式調查學生對科學的態度、觀點及科學學習經歷[12]。然而,個體在自我評價中對自己真實素養水平的認知會不可避免地存在偏差,往往傾向于呈現積極的形象或按照符合社會期望的方式進行回答,進而導致評估結果不夠客觀,無法全面反映真實的素養水平。
二新課標視域下學科核心素養數字化測評的價值意蘊
數字化測評是讓學生在移動終端上完成基于傳統多媒體技術和現代虛擬仿真技術等的數字化任務,通過采集學生任務完成的過程性數據,對其學習情況進行智能診斷與分析。這種方法有利于克服傳統測評中存在的瓶頸性問題,助力教師緊密圍繞新課改所要求的育人目標開展教學活動和學習評價。
1 創設學科核心素養評價所需的多樣化復雜情境,挖掘真實素養表現
情境是學生理解和應用概念原理的載體,通過嵌入知識的情境化設計,能夠促進學生的積極投入與主動建構,使學生圍繞問題情境辨析復雜信息,揭示學生真實的理解水平[13]。在數字化測評中,基于虛擬仿真、人工智能等技術,能夠模擬更加真實、符合現實世界本源特征的多樣化情境,通過模擬真實業務挑戰、法律案例、科學實驗等方式,讓學生分析并提出解決方案,賦予其更大的自主探索和合作探究空間,使觀測學生運用學科知識和技能來理解和解決真實、復雜問題的表現成為可能[14]。例如,在PISA2021創造性思維測評中,依托常規性和高度簡化的現實情境,為學生創建圖形化的虛擬環境和沉浸式的體驗,讓學生在與計算機代理的交互中,進行原創性設計與改進[15]。
2 記錄學生問題解決活動中反映思維的行為信息,獲取多源評價證據
指向學科核心素養的測評,其本質是以被試的外在反應推論其潛在素養特質。基于計算機的視頻技術、日志記錄技術等收集學生測試過程中的行為流、表情動作、作品成果等數據,便可記錄學生問題解決活動中反映思維的行為信息,具體包括:學生的鼠標和鍵盤操作,可以反映學生在解決問題時的交互方式和操作技能;學生在數字界面上的點擊路徑,可以了解他們在解決問題過程中的導航和信息獲取策略;學生在問題解決中的錯誤操作或答案記錄,可以被用來分析學生思維過程中可能存在的誤區或困難等。這些數據的獲取為綜合采用多源表現性證據進行高階思維的推論提供了科學基礎,克服了紙筆測試只能依靠單一作答結果評判出學生解決問題的思維能力水平狀況的瓶頸[16]。
3 客觀動態計算出學科核心素養的量化評價結果,促進學習改進優化
隨著機器學習技術的發展,已經衍生出許多能夠實現知識掌握狀況和能力形成狀況評價的計算模型,能夠挖掘多模態數據中蘊含的復雜認知規律,有助于克服傳統學科核心素養表現性評價中存在的可操作性低、難以具體量化的問題。例如,基于Q矩陣和作答數據,借助認知診斷模型可以實現對學生素養水平的診斷[17];基于歷史作答記錄,利用知識追蹤模型能夠判斷學生“過去”“現在”與“將來”核心素養形成的變化狀況[18]。將傳統的多維項目反應理論模型和貝葉斯網絡結合構建的混合模型,能夠科學分析虛擬表現中的結果數據和過程數據,準確估計科學探究能力[19]。在此基礎上,將評價結果及時、準確地反饋給學生,幫助學生理解自我的“認知過程”,學會監控和及時調整,進而促進有效學習過程的發生。
三新課標視域下學科核心素養數字化測評的概念模型
教學是一個“智育”的過程,學科知識是學科核心素養發展的本源與載體[20],有效的學習實踐往往發生在由真實問題、情境及評價感悟構成的問題解決境脈之中。只有掌握了基本知識、概念和規律,才能夠通過系統的實踐探究來應用這些概念,更好地認識客觀世界,利用所學積極地改造世界。思維是人腦進行智力活動的操作過程與方式,在各種問題解決中扮演著策略與方法的角色[21]。倘若教學過于重視知識點本身以及學生掌握知識點的數量,忽視外在問題解決實踐與內在思維活動的統一,將會出現惰性知識現象,阻礙學生在龐雜的學科系統中建構知識并獲得關鍵能力。只有讓學生經歷從“具體問題”到“抽象原理”再到“具體問題”的高階思維活動,才能促進學生的深度理解,實現從知識習得到學科核心素養的轉化。
概括來講,學科核心素養的形成是基于事實、概念等學科知識的習得,認識與理解學習情境,掌握與感悟學習內容所蘊含的方法性知識,在解決實際問題的過程中,逐漸形成應對各種場景、任務或問題的心智靈活性,發展與問題解決相關的學科能力和學科思維,以及對學科的價值追求,并嘗試獨立探索新的知識領域,從而不斷地認識新問題,實現學習的高通路遷移[22],形成過程如圖1所示。
學科核心素養的形成過程表明,運用學科的核心知識和活動經驗順利完成相應問題解決實踐的過程體現了學生一定的心智模型和認知范式,以及在不同情境下能力的具體表現過程。可概括為三個方面,一是知識和經驗的輸入——學習理解,二是知識和經驗的輸出——應用實踐,三是知識和經驗的高級輸出——遷移創新[23]。當學生能夠將所學的知識與自身的經驗、體驗和感悟對接、貫通起來,在問題探究中調用并建構自己觀察事物、思考問題的認知框架,完成從具體知識到認識方式的外部定向、獨立操作和自覺內化的不同思維活動時,外在的知識才能逐漸轉化為自身的素養。因此,學科核心素養的考察應蘊含在學生運用知識點解決各種不同能力水平問題的過程中,需要我們從一些解決復雜技能測量問題的理論中尋求啟發。
1999年,Mislevy等提出證據中心的設計(Evidence-Centered Design,ECD)理論,通過技術手段誘發復雜技能的證據,并利用統計模型從復雜的數據中進行推論,覆蓋了從評價指標的設定、證據的獲取到能力水平的推斷這一系列完整鏈條,展示了評價操作的藍圖和評價元素的相互關系。其概念性評價框架包括以下幾個關鍵組成部分:學生模型需要定義擬測量的知識、技能、能力等相關變量,明確測量要素和目標。證據模型由證據規則和測量模型兩部分構成,證據規則基于學生表現的關鍵特征,描述特定情境中不同表現的實質性差異,以形成推論潛在能力的證據;測量模型通過數理統計的方法,執行從證據到潛在能力的推理過程,對學生表現進行評分。任務模型旨在研發能夠獲得各種證據的測驗任務。組合模型則將測評作為一個整體,描述模型之間的協同。呈現模型描述如何在數字化環境中呈現任務[24]。
ECD理論系統地闡明了復雜測驗設計的基本結構,為學科核心素養數字化測評提供了原則性框架和學理依據。一是指向學科核心素養的測評首先需要明確測什么,形成可觀察的指標和具體的操作性定義框架;二是指向學科核心素養的測評要明確用什么測,從試題設計轉向任務情景設計,用情境化問題刺激學生的行為反應和表現,反映潛在心理特質,因此,需要在一般意義的情境化問題基礎上,將基于計算機的復雜交互任務作為重要的測評工具進行設計;三是指向學科核心素養的測評要突破傳統的“試題-答案”的測驗設計范式,形成以證據為中心的測評方法框架。基于此,梳理數字化環境的支撐條件、指向學科核心素養的復雜測評設計中各組成部分與功能以及其交互關系,達成高階能力的測評目標與測評結果之間在價值取向、證據收集與分析上的邏輯一致性,構建了與傳統測試方法截然不同的概念模型,如圖2所示。
該概念模型的核心是基于證據做出科學推理,主要包括學生模型、任務模型、證據模型三大核心環節。①學生模型以規劃測評內容與行為表現為核心任務,是基于測評目的與實際情境對所評素養進行操作性定義和精準畫像的過程,具體表現為明晰目標、洞察影響因素、確定測評結構以及細化測評條目等方面。關注所測內容的可量化性以及易操作性,將學科素養測評內容與學生行為表現建立關聯關系,為后續任務模型的設計與構建提供標準指南。②任務模型的核心任務是以循證測評為理念,設計能夠誘發學生學科核心素養表現的測評工具。既要有多樣化的任務來評估測評內容的各個維度,滿足測評需求,以實現全面評估;又能夠提供真實問題解決情境下良好的測評體驗,隱性地誘發學生調用學科核心素養,促進測評證據的生成,以實現精準評估。③證據模型的關鍵是基于理論框架獲取任務作答的行為模式或關鍵特征,并基于數理統計模型或融合人工智能領域的數據挖掘及自然語言處理等方法進行數據整合與分析,建立證據與學科核心素養的推理鏈條,進而實現學科核心素養的量化計算,形成數據驅動的測評范式。
四新課標視域下學科核心素養數字化測評的實現機理
基于以上分析,本研究認為學科核心素養數字化測評的實現邏輯可以概括為以下步驟:規劃測評內容與行為表現,建立測評內容的評價指標體系;以此為依據,基于真實的任務情境,設計指向學科核心素養的數字化測評工具;采集學生利用數字化測評工具解決問題過程中出現的數據,形成評價證據,通過基于數據證據的計算方法,精準量化學生的學科核心素養水平。實現機理如圖3所示。
1 構建基于學習進階的學科核心素養測評指標體系
推動核心素養導向下的測試評價,需要構建科學合理的測評指標體系,為整個數字化測評設計與實施提供重要依據。測評指標體系的構建首先需要明晰測什么,確定測評體系構建的核心骨架。不同學科具有不同的素養要求,應基于新版課程標準,既參照課標規定的教學內容,又依據學生核心素養規定的領域和要求,在學業質量標準的指導下,遵循學生認知發展規律,明晰不同學段學生應該實現何種能力水平、學到什么程度,深刻認識和分析每個所要測量的學科核心素養的內涵以及不同水平的實質特征,全面細致地明晰學科核心素養究竟需要測評哪些內容,設定精準的測評變量,為后續測評提供標準依據。
要明確怎樣去測,確定指標體系的具體構成結構與要素,將抽象的學科素養點與學生具體的行為表現相關聯,提高測評指標體系的可操作性。可基于學習進階理論深刻理解所要評價的素養從簡單到復雜的發展過程,厘清由學科核心素養點(新課標規定的各學科素養點)、課程內容(以新課標規定的課程主題為大概念)、能力水平(學習理解水平、應用實踐水平、遷移創新水平),以及行為表現描述組成的學科核心素養測評指標體系多層次結構。然后,根據學科核心素養的具體內涵與情境的復雜程度,從知識運用不同能力水平的多個維度,轉變為可外顯的學習表現,確定被試能力水平與被試在問題解決中調用的認識方式和行為或結果表現之間的關系,進一步明晰學生在各個學科素養點上預期應該有什么樣的行為表現,應以什么標準來看待素養水平和任務表現之間的關聯等,構建一個能夠全面反映學生學科核心素養形成情況與整體狀況的多維測評指標體系,為測評工具開發和量化計算提供標準依據。
2 設計引發學科核心素養表現的數字化測評工具
傳統認知測驗利用試題刺激學生的認知反應,而指向學科核心素養的測評需要依托具體情境從測評“知道什么”轉向測評“運用知識能做什么”,要求學生運用習得的知識和技能、思維方法、情感態度等,來解決現實問題,而不是單純對抽象的知識與概念和去情境化的原理與規則進行考察。因此,學科核心素養的考察需要在ECD理論的指導下,將其蘊含在學生掌握與運用知識,系統性和創造性解決情境性問題的過程中,利用數字化的探究任務激發學生的行為反應和表現。
數字化探究任務的設計需要以核心素養為軸,基于操作性的多維測評指標體系,針對不同素養點的要求及不同能力水平的指標描述,充分發揮大概念整合化的功能價值,圍繞特定主題,按照學習理解、應用實踐、遷移創新三類水平展開。在提供真實而復雜的任務背景方面,創設遞進式問題情境、支架式探究情境以及延展性應用情境,通過具體問題之間承上啟下的關系幫助學生獲得完整的問題解決體驗[25]。此外,以目標與過程并重為價值取向,嵌入虛擬仿真實驗室和學科工具等,誘發學生參與問題解決的過程,引起學生行為活動的狀態變化。最后還需通過專家咨詢、Rash模型檢驗等編制并完善具體測試試題,確保數字化測評工具的目標指向性和效度,為實現學科核心素養的有效測量提供測試工具支撐。
在技術實現方面,可采用學科工具智能嵌入,教與學行為數據匯聚與管理、建模與分析,個性化學習追蹤與服務推薦等功能集成的教育測評軟件平臺,建立多源異構教育數據的匯聚方法與共享機制,打通從基礎層到用戶層的完整閉環,實現機器智能與自主學習、課堂教學、雙師課堂等多場景學科核心素養測評的深度嵌入。在數據處理方法上,可構建人機互動中多模態測評行為數據和音、視頻等教學情境數據的智能感知模型與表征框架,實現對海量無監督行為數據的高精準感知,挖掘數據隱含的多行為線索;構建多通道行為數據一致性融合模型,對學生的行為反應進行深度挖掘和關鍵特征提取,實現測評行為可計算。
3 研制融合測評過程數據的學科核心素養水平量化計算方法
數據驅動的學科核心素養水平量化評價包含學習反應數據采集、智能計算模型設計、智能計算結果可視化三個方面。在學習反應數據采集方面,除了采集任務得分等結果數據外,還應兼顧人機交互的過程性數據,如學生操作鼠標的反應頻率,花費在每個題目或任務上的總時間等。以事件對任務情境中的活動進行統一規范,利用“活動流”的概念來跟蹤記錄學習經歷,并參考xAPI標準對測評活動流進行采集。
在智能計算模型設計方面,應充分發揮人工智能的優勢,將更豐富的學習過程數據利用起來,深入研究知識追蹤建模與數據融合問題,可采用不同類別的神經網絡對活動流數據進行行為特征提取、對學習者的認知情況進行動態演變建模,以及使用注意力機制給不同知識點分配不同的權重,靈活地關注學生學科核心素養形成中不同知識點的重要性,提高模型的建模效果。還應結合生成式人工智能大模型處理自然語言和視頻數據等的能力,對學生的開放性文本數據、視頻行為數據,鍵鼠操作數據和腦電生理數據等進行分析和理解,為計算建模提供精準的特征表示,探索多模態數據與核心素養更高階的關系映射,形成跨時空的多模態預測模型,使學科核心素養水平計算更準確,更加符合學生的個體特征。
在智能計算結果可視化方面,精心設計的多媒體環境可以幫助學生減少額外的認知負荷并增強學習。考慮到學科核心素養是在學科具體知識掌握和運用過程中形成的,在短時序周期測評中,將認知狀態,即知識掌握和應用情況用科學、合理的方式呈現給學生,對學習的促進作用會更大。因此,需要對學科核心素養點形成情況、學科知識點掌握與應用情況兩類結果界面進行有效的信息設計,發揮媒體的整合優化作用,準確、生動地傳達學生學科知識的掌握與運用水平,以及學科核心素養點的形成水平,幫助師生有目的地改善教學和學習活動,從而提升學習的意義、效率和深度指向。
五結語
學科核心素養是學生的一種綜合品質,需要通過客觀測驗以外的行動、作品、展示、操作等更真實的表現做出判斷。本研究對數字化環境中指向學科核心素養的測試和評價展開探討,提出了新課標視域下學科核心素養數字化測評的概念模型和實現機制,明確了學科核心素養測評的關鍵要素和邏輯框架,是貫徹落實教育評價改革和減負增效宏觀政策的一次有益嘗試,有助于引導教師在教學過程中更加注重學生學科核心素養的發展,并為每個學生提供個性化評價和輔導。未來,應深入研究全樣本、全過程、全景式的多模態教育大數據采集方法,在不增加師生負擔的前提下提高數據獲取的便利性,同時與不同學段、不同學科的教學場景結合,促進數字化測評在課堂實踐的落地實施,構建基于多模態數據的智能教育服務模式。
———————
參考文獻
[1]彭前程,馬賢榮.聚焦學科核心素養促進學習方式變革——《義務教育物理課程標準(2022年版)》變化要點分析[J].課程·教材·教法,2022,(9):35-40、86.
[2]楊向東.關于核心素養若干概念和命題的辨析[J].華東師范大學學報(教育科學版),2020,(10):48-59.
[3]陳凱,丁小婷.新西蘭課程中的核心素養解析[J].全球教育展望,2017,(2):42-57、66.
[4]龍海濤.人工智能時代教育評價改革:契機?挑戰與路徑選擇[J].中國考試,2021,(11):10-18、34.
[5]李鋒.學生問題解決能力的評價:在線伴隨的視角[J].中國遠程教育,2019,(8):79-84.
[6][16]田偉,駱方.科學探究過程的計算機模擬測試:趨勢進展與實踐啟示[J].中國遠程教育,2023,(2):28-36.
[7]周文葉.中小學表現性評價的理論與技術[M].上海:華東師范大學出版社,2014:53.
[8]Stecher B M, Klein S P, Solano F G, et al. The effects of content, format, and inquiry level on science performance assessment scores[J]. Applied Measurement in Education, 2000,(2):139-160.
[9]宋歌.國外科學教育中的表現性評價述評[J].外國中小學教育,2017,(6):17-25.
[10]Teig N, Scherer R, Kj?rnsli M. Identifying patterns of students’ performance on simulated inquiry tasks using PISA 2015 log‐file data[J]. Journal of Research in Science Teaching, 2020,(9):1400-1429.
[11]王俊民,盧星辰,唐穎捷.國際大規模科學學業評估的試題情境比較研究——基于情境類型學的量化分析[J].中國考試,2019,(2):32-40.
[12]王俊民.澳大利亞科學素養測評框架探析及啟示[J].外國中小學教育,2019,(3):47-56、46.
[13]National Research Council. How people learn: Brain, mind, experience, and school (expanded edition)[M].Washington, DC: The National Academies Press, 2000:31-51.
[14]Midura C J, Dede C, Norton J. Next generation assessments for measuring complex learning in science[R]. New York:Rennie Center Education Research amp; Policy, 2011:27-40.
[15]袁婷,林靜.證據中心設計理論在PISA2021創造性思維測評中的應用及其啟示[J].中國考試,2021,(3):56-62、73.
[17]萬海鵬,陳思睿,余勝泉.基于認知診斷的學科核心素養測量路徑構建[J].電化教育研究,2022,(11):92-99.
[18]李振,周東岱.人工智能支持下基于特征融合的深度知識追蹤模型研究[J].電化教育研究,2022,(4):47-54.
[19]Scalise K, Clarke-Midura J. The many faces of scientific inquiry: Effectively measuring what students do and not only what they say[J]. Journal of Research in Science Teaching, 2018,(10):1469-1496.
[20]范佳榮,鐘紹春.學科知識圖譜研究:由知識學習走向思維發展[J].電化教育研究,2022,(1):32-38.
[21]邢紅軍.物理學科核心素養:透視、商榷與重構[J].教育科學研究,2018,(11):5-14.
[22]李潤洲.學科核心素養的培育:知識結構的視域[J].教育發展研究,2018,(Z2):43-49.
[23]王磊.學科能力構成及其表現研究——基于學習理解、應用實踐與遷移創新導向的多維整合模型[J].教育研究,2016,(9):83-92、125.
[24]袁建林,劉紅云.核心素養測量:理論依據與實踐指向[J].教育研究,2017,(7):21-28、36.
[25]范佳榮,趙雪妍,鐘紹春.指向學科核心素養的數字化測評工具設計——以初中物理科學探究素養為例[J].中國考試,2024,(11):55-66.
Digital Assessment of Discipline Core Competencies from the Perspective of New Curriculum
Standards: Value Implications, Conceptual Model and Implementation Mechanism
FAN Jia-Rong1""" ZHANGShu-Qi2""nbsp; LUO Guang-Yao1,2""" ZHONG Shao-Chun3[Corresponding Author]
(1. School of Journalism and Communication, Jilin Normal University, Changchun, Jilin, China 130123; 2. School of Information Science and Technology, Northeast Normal University, Changchun, Jilin, China 130117; 3. Ministry of Education Digital Learning Support Technology Engineering Research Center, Changchun,Jilin, China 130117)
Abstract:With the deep integration of digital technology and education, digital assessment has become an important direction of the development of modern educational evaluation. Aimed at the realistic demand of the assessment of disciplinary core competencies, this paper deeply analyzed the limitations of traditional assessment methods pointed to discipline core competencies, and gave insight into the value implications of digital evaluation of discipline core competencies in the new era. Based on this, the formation process of disciplinary core competencies was analyzed, and a conceptual model for the digital assessment of discipline core competencies was constructed combined with the Evidence-Centered Design (ECD) theory. Furthermore, the implementation mechanism of digital assessment of disciplinary core competencies under the perspective of the new curriculum standards were discussed from three aspects of builting an evaluation index system oriented toward disciplinary core competencies, designing digital assessment tools pointed to disciplinary core competencies, and formulating quantitative calculation methods for disciplinary core competencies’ levels, expecting to provide guidance for conducting precise and comprehensive learning evaluations by the discipline core competencies orientation, thereby effectively advancing the application of digital assessment methods in educational evaluation.
Keywords: disciplinary core literacy; assessment of disciplinary core literacy; digital assessment; ECD theory