999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向準確與效率的數學學科能力自適應測評研究

2025-03-31 00:00:00郭炯榮乾
中國電化教育 2025年3期
關鍵詞:能力結構

摘要:在新時代教育教學改革的背景下,學科能力的培養是保障核心素養得以有效落實的關鍵途徑。鑒于學科能力的多維度性和復雜性,如何準確、高效地評估學生的學科能力是學科能力培養亟待解決的問題。傳統紙筆測試和現有的自適應測評研究主要聚焦于知識評估,對學生學科能力的測量仍顯不足。基于此,該研究首先梳理了學科能力的內涵,明確了測評的邏輯起點。其次,從知識空間理論視角出發,構建了包含內容、評價和結構三類要素的數學學科能力映射模型,實現了從知識評估轉向能力評估。此外,還提出了基于拉普拉斯平滑的能力狀態更新規則和基于信息熵的停止規則以優化測評過程。實證研究結果表明,該方法在數學學科能力評估方面展現出較高的準確性和效率,為實現面向能力的學生個性化輔導提供了支持,為數學學科能力的精準測量和評估提供新的思路和方法。

關鍵詞:學科能力;知識空間理論;自適應測評;能力結構;能力狀態

中圖分類號:G434 文獻標識碼:A

* 本文系2024年全國教育科學規劃國家重點課題“國家智慧教育公共服務平臺應用示范標準研究”(課題編號:ACA240027)研究成果。

一、引言

教育部發出的《基礎教育課程教學改革深化行動方案》提出,“發展核心素養立意的教學評價,發揮評價的導向、診斷、反饋作用,豐富創新評價手段”[1]。新時代教育教學改革的迫切性對評價方法的創新提出了更高要求。學科核心素養的概念成為推動教學范式轉型的關鍵要素。然而,核心素養的概念本質上具有高度抽象性和概括性,使得其在實際教學中的落實面臨諸多困難。為了彌合理論與實踐之間的鴻溝,學科能力的培養成為保障核心素養培養落地的關鍵中介[2]。傳統的紙筆測試雖然在考查知識掌握方面有其優勢,但在評估學生的能力水平方面仍顯不足。利用數字技術開發新型的測評方法可以為該問題提供解決路徑[3]。然而,在數學學科領域,現有的自適應測評研究和相關教育產品主要聚焦于數學知識的評估,對學生數學學科能力的測量仍顯不足,與新時代教育教學改革的要求仍存在差距。新技術的應用并不能簡單地解決該問題,應結合教育測量理論與技術在測評模型的構建上進行創新突破。

數學心理學研究領域的知識空間理論具有適用于自適應測評的優勢,能夠精確刻畫能力結構和學習路徑,通過構建“項目—技能”映射模型,運用自適應算法精準推斷學生能力狀態,為學科能力測評創新提供支撐和參考,其理論框架與數學學科能力的層次性、系統性特征高度契合,因此,引入知識空間理論構建形式化的數學學科能力映射模型,將有助于提高建模的準確性和測評的效率,為數學學科能力測評方法的創新提供重要的意義和價值。

二、數學學科能力測評的邏輯起點

受行為主義影響,數學學科能力被視為可觀察的客觀指標。認知主義興起后,教育研究者將學科能力定義為個體在特定情境下綜合運用知識、技能和態度的表現[4],強調了能力應用的重要性。近年來,數學教育領域對數學學科能力的定義發生了范式轉移,更強調數學活動的本質特性及其在能力形成中的關鍵作用。丹麥數學家尼斯(Niss)將數學學科能力定義為“個體洞察和應對特定情境中數學挑戰的準備程度與能力”[5],強調了理解、判斷和應用數學的重要性,尼斯對數學學科能力成分的劃分,成為了PISA、NAEP、TIMSS等國際數學評估工具的主要理論基礎。

在國內,林崇德團隊自1978年開始的兒童青少年思維、智力、認知能力發展研究,奠定了我國數學學科能力研究的基礎[6]。近年來,北師大王磊教授及其團隊對于學科能力開展了較為系統的研究。王磊團隊基于能力類化經驗理論,將學科能力定義為完成特定任務的心理調節過程,認為學科核心素養的實質是學科能力,學科能力發展及表現水平主要受問題情境、學科認識方式、學科能力活動、學科核心知識和活動經驗等變量的影響[7]。在學科能力的構成方面,王磊團隊強調學科認識方式是知識轉化為能力素養的核心,提出了涵蓋學習理解、應用實踐和遷移創新的二階學科能力要素模型,實現了跨學科能力素養的橫向比較。對于數學學科,該團隊還提出了數學學科能力3×3要素(如表1所示)。

數學學科能力3×3要素在數學學科能力研究中得到了較為廣泛的應用,如郭衎等基于學科能力要素模型開發了數學學科能力評價的二維框架(內容維度及能力維度),并對學生進行了測試與評分[8];綦春霞等人通過“智慧學伴”平臺使用該模型為學生數學學科能力進行診斷,發現通過使用該平臺,學生實現了數學學科能力的層級進階[9]。

縱觀學科能力測評研究中對教育測量理論的選用情況可以發現,國際能力評估項目PISA、NAEP、TIMSS和國內研究中多采用基于項目反應理論(IRT)和Rasch模型作為基礎測量理論。IRT和Rasch模型相較于經典測量理論,具有參數估算的樣本獨立性和能力評估的測試獨立性優勢。然而,這些方法忽視了知識、技能的結構性特征,未建立試題與知識點、技能的映射關系,也未深入分析受測者的潛在特征,在一定程度上導致了對學生認知能力的片面評估。

知識空間理論的研究者杜瓦尼翁(Doignon)等提出要將認知水平納入知識空間理論中[10],對知識空間理論進行擴展,從而形成基于能力的知識空間理論(Competence Based-Knowledge Space Theory,CbKST)。CbKST分為兩個平行但又相互依賴的層次:表現層(Performance Levels)和能力層(Competence Levels),這兩個層次之間由兩個函數進行相互映射,分別是“技能映射”“問題函數”,該映射認為潛在的能力決定了表現,如圖1所示。

具體來說,個體的知識領域Q和知識狀態K Q位于表現層,也對應學生能解決的項目的集合,即知識狀態。而在能力層上,設解決問題q所需的一組技能S,并且個人知識由一個稱為能力狀態的子集C表示,也對應學生掌握的技能的集合,即能力狀態。表現層通過技能映射函數μ:Q→2S映射到能力層;能力層通過問題函數映射p:C→2Q到表現層[11]。技能映射是實現知識狀態與能力狀態的鏈接,并在學科能力映射模型中發揮至關重要的作用,使測評可以根據學生的表現狀態(如學生在特定任務或測試中的表現)來推斷學生當前的能力狀態。

本研究以學科核心素養為導向,基于知識空間理論的框架,將學生的數學問題解決活動概念化為數學學科能力的外顯表征。將數學問題解決過程抽象化為一系列具體的評估指標(即測評項目),用以觀測學習者在應用數學技能解決問題時所掌握的具體技能集合,并借助可觀測的行為表現來推斷學習者潛在的數學學科能力狀態。在此理論構架下,數學學科核心素養、數學學科能力、技能、問題解決活動以及測評項目等核心要素之間的內在關聯如圖2所示,多維度的關聯為設計數學學科能力自適應測評方法奠定了基礎。

三、基于知識空間理論的學科能力映射模型構建

帕克特(Paquette)等指出能力建模是教育學習環境創新的核心[12],能力模型可明確學生能力水平,是自適應測評、資源推送、智能導學系統的關鍵模塊。在模型構建中,本研究將進一步對核心要素分析,探討如何將數學學科能力的內涵和測評要求有效地整合到知識空間理論的測評模型中。

(一)學科能力映射要素分析

基于測評本身的特點和評估的多維需求,本研究將學科能力映射模型構成要素劃分為內容、評價和結構三類要素。內容要素為評價要素提供基礎,評價要素指向評價的方向,結構要素通過多維映射關系將兩者有機聯系,形成完整的學科能力評估體系。

1.內容要素

內容要素主要涉及測評中的項目集合,是對學科內容的具體化和操作化表征。在知識空間理論中,項目作為問題的抽象類型,具有多重對應性,允許一個項目可對應多個具體試題,增加了測評的靈活性和適應性。項目設計基于特定的測評目標,反映了對學生在特定學科領域表現的預期。通過分析學生對項目的反應模式,可以推斷其潛在能力,獲取學生的知識狀態和技能水平信息,進而為測評的持續改進提供依據。

基于知識空間理論視角,在學科能力映射模型中引入項目,記為q;一個學科主題領域內所有知識可被分解成一系列項目的集合,記為Q,而Q的子集被稱作知識狀態,記為K。主題領域中的問題應具備合適的粒度和代表性,而學生的知識狀態由其能夠正確回答的問題集合來定義。

2.評價要素

評價要素即評價的指向,包括能力狀態和能力狀態層級劃分。在知識空間理論中,能力與技能緊密相關。知識空間理論進而將個體掌握的技能集合稱為能力狀態,記為C。由于學科能力狀態是內隱的、不可直接觀測的能力水平,需要通過可觀測的技能掌握情況來識別和評估這些能力狀態。能力狀態層級的劃分不僅需要考慮實際問題解決活動的特點,還應關注知識與能力表現之間的實質性聯系。能力表現的結構性和層級性是由知識的內在結構特點所決定的。本研究引入了王磊等人提出的數學學科能力表現的三個維度及九個層級[13],層級劃分記作B。在設計測評題目時,針對每個層級設置相應的問題,確保測評內容覆蓋了從基礎到高階的各種能力表現。在獲取測評結果的時候,通過分析學生在不同層級上的表現,可以更深入地理解學生的認知發展過程,識別其優勢和不足。進而通過觀察學生在不同層級間的遷移和發展,揭示數學學科能力形成的內在機制。

3.結構要素

學科能力結構要素是學科能力映射模型的關鍵,結合內容要素、評價要素進行映射設計,在各個要素之間建立多維度的映射,以實現要素之間的相互鏈接,形成層級化、形式化的結構表達。

(1)映射設計

基于結構要素的設計,可以進行完整的結構構建。基于前文對學科能力映射模型的要素分析,可知在構成學科能力映射模型的各個要素存在五個方面的關系,具體包括:(1)學科內容、評估項目集與技能集之間存在內容約束關系;(2)評估項目集與技能集之間存在技能映射關系;(3)學科能力狀態與學科核心素養集之間存在素養映射關系;(4)評估項目集與學科核心素養集之間存在素養映射關系;(5)學科能力狀態與學科能力表現層級之間存在能力層級劃分關系。由此,可以定義六個基本集合,學科內容集、評估項目集、技能集、學科核心素養集、能力狀態集、能力層級集,集合之間存在相應的關系及關系屬性。

(2)模型表征

在此基礎上,本研究構建了完整的映射模型結構。模型的整體結構通過連接各個映射關系,實現了從具體項目表現到抽象能力評估的全過程,模型表征如圖3所示。

(二)模型參數估計方法

學科能力映射模型的參數估計是自適應測評的必要條件,而參數估計的精確性則對測評結果具有決定性影響。知識空間理論通常采用基于頻率主義(Frequentist)的參數估計方法,該類方法在估計準確性方面存在一定局限。貝葉斯(Bayesian)參數估計以貝葉斯理論為基礎,在機器學習、生物統計學和工程學中都有廣泛的應用。為此,本研究提出利用貝葉斯理論下的馬爾科夫鏈蒙特卡羅(Markov Chain Monte Carlo,MCMC)方法結合Gibbs抽樣來優化參數估計。

參數定義需要依據知識空間理論的BLIM模型[14]進行設計,設BLIM模型參數向量θ=(β,η,π),其中,β代表粗心錯誤(Careless Error)的概率、η代表幸運猜測(Lucky Guess)的概率,π代表知識狀態的概率分布.。

對于每個項目q的粗心錯誤參數βq 和幸運猜測參數ηq的先驗分布設置Beta分布,具體如式(1)、(2)所示:

四、自適應測評算法設計

要實現自適應測評,還需借助自適應測評算法,對學生解決項目的情況進行觀察,收集其表現數據用以判斷其能力狀態。法爾馬涅(Falmagne)等將基于知識空間理論的自適應測評過程視為一個馬爾科夫過程,也稱為馬爾科夫隨機評估過程(Markov Stochastic Assessment Procedure)[15]。測評過程中,每步代表一個狀態。狀態間的轉移概率只依賴當前狀態,不受歷史影響。馬爾科夫隨機評估過程包括三個關鍵步驟:(1)基于選題規則選擇問題;(2)基于更新規則來更新知識狀態或能力狀態的似然分布Ln;(3)基于停止規則來判斷何時停止測評[16],如下頁圖4所示。其中,更新和停止規則對測評結果的準確性和效率至關重要。本研究將通過引入拉普拉斯平滑優化更新規則,并利用信息熵優化停止規則,以提高數學學科能力測評的準確性和效率。

(一)基于拉普拉斯平滑的能力狀態更新規則

1.設計思路

在自適應測評中,更新規則本質是對能力的概率估計。項目反應理論和認知診斷理論主要采用極大似然法、貝葉斯期望后驗估計和加權似然估計等方法[17]。知識空間理論的自適應測評則基于似然函數構建更新規則,是一個條件概率問題,常見的更新規則包括基于貝葉斯的更新規則,以及具有參數的乘法更新規則(Multiplicative With Parameters,MWP)。而在乘法更新規則中,更新權重參數ζ對似然值更新至關重要。然而,在極端情況下,可能導致似然值更新不準確或出現零概率問題。為解決這些問題,可以引入拉普拉斯平滑技術,通過為每個類別添加平滑參數,避免零概率事件[18]。本研究在似然函數中為每個能力狀態C添加根據學生回答的一致性來調整的動態參數α,提出基于拉普拉斯平滑的乘法更新規則(L-MWP),以減少對個別回答的依賴。

2.數學模型

(二)基于信息熵的停止規則

1.設計思路

停止規則在統計學中指導何時停止數據收集并進行推斷[19]。在自適應測評中,停止規則決定測試的終止時機。根據測試長度,停止規則可分為固定長度和可變長度兩類[20]。固定長度規則在達到預設題量時終止測試,操作簡便但測量精度因人而異。可變長度規則基于能力估計標準決定終止時機,更能體現自適應測評的優勢[21]。在自適應測評中,知識空間理論對停止規則的研究較少。現有研究主要基于似然概率計算,采用概率質量分裂(Probability Mass Split,PMS)和模態后驗(Modal A-Posterior,MAP)兩種方法判斷似然概率分布[22][23]。PMS方法依賴于學生狀態的直接判斷,可及時終止測評;MAP方法操作簡便直觀,能在測評達到一定確定度時快速結束。然而,這兩種方法存在局限性:PMS可能導致測評過早或過晚停止,MAP易忽視整體不確定性。為提高測評效率和準確性,引入新的概率計算方法衡量系統不確定性具有重要意義。1948年,克勞德·香農提出的信息熵概念為量化信息提供了數學框架,可用于衡量隨機事件或系統的不確定性[24]。鑒于信息熵能夠很好地衡量不確定性,本研究將引入信息熵構建基于信息熵的不確定性度量模型,設計停止規則,以提高測評準確性和效率。

2.數學模型

在基于知識空間理論的自適應測評中,設計停止規則的目標是在收集到足夠的信息以做出準確診斷時終止測評。如前所述,信息熵可以衡量系統不確定性,用來確定何時已經獲得了足夠的信息來停止測試,則似然函數Ln的熵H(Ln)基于信息熵(Information Entropy,IE)的停止規則計算公式為:

五、面向學科能力的自適應測評準確與效率驗證

測評效果驗證旨在驗證該自適應測評工具在數學學科能力測評中的準確與效率,為數學學科能力評估提供科學可靠的證據支持。在開展實驗驗證之前,本研究選取了七年級“相交線與平行線”單元和八年級“實數”單元兩個單元依據構建的學科能力映射模型邀請數學學科專家進行測評設計,包括項目集、技能集、技能映射的設計等,這些學科專家還對學庫寶平臺(https:// xuekubao.com/)提供的初中數學題庫進行了篩選與標注,將題庫中的試題與項目進行對應。在此基礎上,開發了數學學科能力自適應測評系統作為測評工具。研究團隊于正式測評前在S學校和X學校開展了預測試(共有476名學生參加),采用前文設計的基于貝葉斯的MCMC方法對試題項目參數進行估計,將后驗參數的均值作為項目參數估計結果,用于后續自適應測評算法的計算。

(一)測評準確性驗證

紙筆測評作為傳統評估方式,因其施測成本低、評分簡單且具有良好的適用性和信效度等特點,在教育評價中仍占重要地位,尤其在高利害、甄別性評價中[25][26]。鑒于其可靠性,本研究采用紙筆測評結果作為外部效標,通過與自適應測評結果的一致性檢驗來考察測評的效標關聯效度,以驗證測評準確性。在本研究中,紙筆測評由學科專家編制,試題設計嚴格對照課程標準和能力結構,確保符合學科能力測評需求,且與自適應測評所采用的學庫寶題庫不重復。紙筆測評每道題有不同分值,滿分為100分。

研究選取了實驗學校S學校(七年級185人,八年級169人)和T學校(七年級187人,八年級159人)開展了自適應測評與紙筆測評。

由于紙筆測試的結果是量化數據,而自適應測評結果是技能的集合,這兩種數據無法直接計算一致性,因此,本研究引入了Jaccard相似系數并結合皮爾遜相關系數進行計算。Jaccard相似度系數的取值范圍在0到1之間,0代表這兩個集合完全不相似,1代表這兩個集合完全相似[27]。通過Jaccard相似度系數的計算,可以將自適應測評的結果轉換為0—1之間的小數,便于利用紙筆測評的結果計算皮爾遜相關系數。然而,鑒于此方法在將自適應測評結果轉換為定量數據時可能導致學生技能掌握細節信息的損失,進一步引入了基于平均屬性匹配率(Average Attribute Match Rate,AAMR)的技能一致性分析作為補充[28]。在AAMR分析中,首先,由領域專家對紙筆測評中學生的技能掌握情況進行判定,其次,將這些判定結果與自適應測評的結果進行AAMR分析,以評估兩種測評方法在識別學生具體技能掌握程度上的一致性。其一致性檢驗結果如表3所示。

檢驗結果發現,就Jaccard相似系數而言,S學校七年級和八年級學生的系數分別為0.712和0.791,而T學校相應年級的系數則為0.882和0.803。表明兩所學校的測評結果均呈現出較高的相似度。就AAMR而言,S學校七年級和八年級的指標分別為0.799和0.831,T學校則達到了0.892和0.853。兩種檢驗方法的結合進一步證實了測評方法間的高度一致性。總體而言,所有測量結果均超過0.7的閾值,根據通常的統計標準,表明兩種測評方法之間存在顯著的正相關關系和良好的內部一致性,反映了自適應測評在捕捉學生能力水平方面的準確性。

(二)測評效率驗證

測評效率是本研究關注的重點內容,高效的自適應測評更加適合在課堂教學過程中開展,由于減少了測評的耗費的時間,更有助于為學生帶來即時反饋。為了更好地了解本研究提出的自適應測評方法的效率表現,研究抽取實驗學校X學校(七年級176人,八年級177人)和T學校(七年級187人,八年級159人)參加了兩種自適應測評方法的測評,包括本研究提出的自適應測評方法和德·丘索萊(de Chiusole)等2020年在Stat-Knowlab測評平臺中設計的自適應概率過程方法(Adaptive Probabilistic Procedure)[29]。本研究設計的面向準確與效率的自適應測評方法和自適應概率過程方法的區別如圖5所示。

具體來說,自適應概率過程方法的選題規則為半分法,更新規則按照基于貝葉斯(Bayesian Based,BB)的方法進行更新,停止規則為MAP。本研究中的自適應測評方法的選題規則和自適應概率過程方法相同,但更新規則為本研究設計的L-MWP,停止規則為IE停止規則。除此之外,本研究對這兩個不同方法在題庫、測評系統的設計等方面保持一致。以自適應概率過程方法作為基線,對比本研究提出的自適應測評方法,來分析自適應測評的效率。評價標準為平均測評長度計算方法。兩種方法的測評效率的檢驗結果如表4所示。

分析數據可知,無論是七年級還是八年級,本研究提出的自適應測評方法在測評長度和測評長度的變異性上都優于自適應概率過程方法,較低的測評長度和測評的穩定性證實了新方法在測評效率方面的提升。

六、結語

知識空間理論將技能與知識的映射關系納入測評體系,使測評從單純的知識檢驗轉向對學科能力的評估,為學科能力測評提供了新的理論框架。本研究在知識空間理論的基礎上,構建了學科能力映射模型,并創新了自適應測評方法。并通過實證研究驗證了其準確性和效率。本研究提出的學科能力測評方法,不僅為學科能力的精準測量提供了新的思路和方法,還有助于實現更個性化的面向能力的輔導,從而更好地支持學科能力的培養。由于知識空間理論在學科能力測評中的應用研究是一個具有前瞻性和現實性的研究領域,對于理論模型與學科特性的融合未來還需進一步探索。

參考文獻:

[1] 教材廳函[2023]3號,教育部辦公廳關于印發《基礎教育課程教學改革深化行動方案》的通知[Z].

[2] 郭炯,潘霞.面向學科能力培養的單元教學設計模型研究[J].電化教育研究,2022,43(7):81-88.

[3] 聶小林,張金霞等.智能技術賦能教育數字化治理:內涵、框架及路徑[J].中國教育信息化,2024,30(4):21-31.

[4] 鄭毓信,梁貫成.認知科學建構主義與數學教育:數學學習心理學的現代研究[M].上海:上海教育出版社,1998.

[5] Niss M,H jgaard T.Mathematical competencies revisited [J].Educational studies in mathematics,2019,102(1):9-28.

[6] 林崇德.學習與發展:中小學生心理能力發展與培養[M].北京:北京師范大學出版社,2003.

[7][13] 王磊.學科能力構成及其表現研究——基于學習理解、應用實踐與遷移創新導向的多維整合模型[J].教育研究,2016,37(9):83-92+125.

[8] 郭衎,曹鵬等.基于課程標準的數學學科能力評價研究——以某學區七年級測試工具開發及實施為例[J].數學教育學報,2015,24(2):17-21.

[9] 綦春霞,何聲清.基于“智慧學伴”的數學學科能力診斷及提升研究[J].中國電化教育,2019,(1):41-47.

[10] Doignon J P.Knowledge spaces and skill assignments [A].Fischer G H,Laming D.Contributions to mathematical psychology,psychometrics, and methodology [M].New York:Springer,1994.111-121.

[11] DüntscH I,Gediga G.Skills and knowledge structures [J].British journal of mathematical and statistical psychology,1995,48(1):9-27.

[12] Paquette G,Marino O,et al.A new competency ontology for learning environments personalization [J].Smart learning environments,2021,8(1):16.

[14] Stefanutti L,Spoto A.BLIM’s identifiability and parameter invariance under backward and forward transformations [J].Journal of mathematical psychology,2020,95:102314.

[15] Falmagne J C,Doignon J P.A class of stochastic procedures for the assessment of knowledge [J].British journal of mathematical and statistical psychology,1988,41(1):1-23.

[16] Stefanutti L,de Chiusole D,et al.Markov solution processes:Modeling human problem solving with procedural knowledge space theory [J].Journal of mathematical psychology,2021,103:102552.

[17] 韓曉玲.基于標準的計算機自適應測驗的設計及其有效性檢驗——以師范生教育技術能力測評為例[D].濟南:山東師范大學,2022.

[18] Xi N,Sun Y J,et al.Designing parallel adaptive laplacian smoothing for improving tetrahedral mesh quality on the GPU [J].Applied sciences,2021,11(12):5543.

[19] Douven I.Bayesian stopping [J].Journal of mathematical psychology,2023,116:102794.

[20] 李俊杰,鄭慧婧等.變長非參數認知診斷自適應測驗終止規則[J].江西師范大學學報(自然科學版),2022,46(6):617-625.

[21] 郭磊,鄭蟬金等.變長CD-CAT中的曝光控制與終止規則[J].心理學報,2015,47(1):129-140.

[22] Spoto A,Serra F,et al.New perspectives in the adaptive assessment of depression:the ATS-PD version of the QuEDS [J].Frontiers in psychology,2018,9:1101.

[23][29] de Chiusole D,Stefanutti L,et al.Stat-knowlab.Assessment and learning of statistics with competence-based knowledge space theory [J].International journal of artificial intelligence in education,2020,30(4):668-700.

[24] Liu C,Zhu M.The study and implementation of discretization algorithm based on information entropy [J].Software engineering and applications,2019,8(6):358-363.

[25] Gobert J D,Sao Pedro M,et al.From log files to assessment metrics:measuring students’ science inquiry skills using educational data mining [J].Journal of the learning sciences,2013,22(4):521-563.

[26] 駱方,田雪濤等.教育評價新趨向:智能化測評研究綜述[J].現代遠程教育研究,2021,33(5):42-52.

[27] Yan Z Q,Wu Q,et al.Locally private jaccard similarity estimation [J]. Concurrency and computation:practice and experience,2019,31(24):e4889.

[28] 羅慧,熊建華等.基于加權距離的一種認知診斷方法[J].江西師范大學學報(自然科學版),2018,42(1):74-81+88.

作者簡介:

郭炯:教授,博士,研究方向為信息技術與教育、數字化學習研究。

榮乾:在讀博士,研究方向為數字化學習。

Research on Adaptive Assessment of Mathematical Disciplinary Competence Oriented Towards Accuracy and Efficiency

—A Perspective Based on Knowledge Space Theory

Guo Jiong, Rong Qian

School of Educational Technology, Northwest Normal University, Lanzhou 730070, Gansu

Abstract: In the context of educational and teaching reforms in the new era, the cultivation of disciplinary competence is a crucial pathway to effectively implementing core literacy. Given the multidimensionality and complexity of disciplinary competence, accurately and efficiently assessing students’ disciplinary competence remains a pressing issue. Traditional paper-and-pencil tests and existing adaptive assessment research primarily focus on knowledge evaluation, which is insufficient for measuring students’ disciplinary competence. Based on this, the study first clarifies the connotation of disciplinary competence and identifies the logical starting point for assessment. Secondly, from the perspective of Knowledge Space Theory, a mapping model of mathematical disciplinary competence, encompassing content, evaluation, and structure elements, is constructed to shift from knowledge assessment to competence assessment. Additionally, the study proposes a competence state updating rule based on Laplace smoothing and a stopping rule based on information entropy to optimize the assessment process. Empirical research results indicate that this method demonstrates high accuracy and efficiency in assessing mathematical disciplinary competence, providing support for personalized student tutoring oriented towards competence and offering new ideas and methods for precise measurement and assessment of mathematical disciplinary competence.

Keywords: disciplinary competence; knowledge space theory; adaptive assessment; competence structure; competence state

收稿日期:2024年10月9日

責任編輯:宋靈青

猜你喜歡
能力結構
基于兒童的教學內容的設計與把握
社會資本視角下行業協會商會能力模型構建研究
學會(2016年12期)2017-01-13 20:36:51
管理學課程教學改革探索
大學教育(2016年12期)2017-01-03 20:31:31
管理學課程教學改革探索
大學教育(2016年12期)2017-01-03 20:31:03
構建高校創新創業人才評價體系研究
成才之路(2016年23期)2016-09-22 16:15:26
當前高中學生的能力結構現狀及提升的策略
能力結構下的音樂學專業應用型人才培養
戲劇之家(2016年5期)2016-04-05 13:34:46
基于能力結構的應用型國際經濟與貿易專業課程體系構建
科技視界(2016年4期)2016-02-22 12:19:10
基于就業能力結構的高校畢業生就業力研究
新課程標準下高中數學能力提升的理論與實踐
主站蜘蛛池模板: 国模视频一区二区| 精品久久综合1区2区3区激情| 久久免费视频6| 亚洲欧美另类久久久精品播放的| 国产成人精品一区二区三在线观看| 一区二区影院| 91原创视频在线| 国产精品毛片一区视频播| 九色国产在线| 国产97视频在线观看| 欧美高清视频一区二区三区| 国产精品无码作爱| 精品国产一区91在线| 午夜人性色福利无码视频在线观看| 欧美日韩在线第一页| 久久久四虎成人永久免费网站| 97国产精品视频人人做人人爱| 国产综合精品一区二区| 亚洲高清无码精品| a毛片基地免费大全| 日本人妻丰满熟妇区| 日韩黄色大片免费看| 日本在线亚洲| 亚洲中文在线看视频一区| 日本人妻丰满熟妇区| 国产乱人激情H在线观看| 亚洲av无码专区久久蜜芽| 无码乱人伦一区二区亚洲一| 97在线国产视频| 欧美国产菊爆免费观看| 亚洲av无码牛牛影视在线二区| 欧美国产菊爆免费观看 | 成人无码一区二区三区视频在线观看 | 五月激情综合网| 久久精品亚洲专区| www欧美在线观看| 精品久久国产综合精麻豆| 日韩资源站| 日本少妇又色又爽又高潮| 久热99这里只有精品视频6| 国产又粗又猛又爽视频| 婷婷亚洲综合五月天在线| 久久五月视频| 免费在线国产一区二区三区精品| 欧美高清日韩| 久久中文电影| 欧美成人免费一区在线播放| 国产成人一区免费观看| 午夜一区二区三区| 男女精品视频| 欧美一道本| 精品少妇人妻一区二区| 中国毛片网| 国产精品久久久免费视频| 亚洲欧美在线综合一区二区三区| 国产精品微拍| 婷婷六月综合网| av在线人妻熟妇| 乱色熟女综合一区二区| 国产黑丝视频在线观看| 污网站在线观看视频| 成人年鲁鲁在线观看视频| 午夜精品一区二区蜜桃| 欧美三级自拍| 亚洲欧美精品一中文字幕| 伊人久久综在合线亚洲2019| 91视频99| 午夜在线不卡| 亚洲精品爱草草视频在线| 亚洲欧州色色免费AV| 久996视频精品免费观看| 五月婷婷导航| 国产91色在线| www.日韩三级| 特级精品毛片免费观看| 亚洲国产成人久久精品软件| 国产视频资源在线观看| 亚洲精品麻豆| 国产亚洲日韩av在线| 免费观看国产小粉嫩喷水| 欧美日韩中文国产va另类| 欧美精品成人一区二区视频一|