康春花 任 平 曾平飛
(浙江師范大學教師教育學院,金華 321004)
自認知診斷評估(Cognitive Diagnostic Assessment,CDA)問世以來,研究者進行了多方面多角度的探索,其中發展最迅猛的是診斷分類模型(Diagnostic Classification Model,DCM)。在DCM方面,研究者根據不同的實踐需求從不同的前提和假設提出了各類模型,如按測評的評分方式,有 0-1評分的模型(如 RSM、AHM、DINA、NIDA、FM、GDM等)、多級評分或連續評分的模型(Bolt &Fu,2004;祝玉芳,丁樹良,2009;涂冬波,蔡艷,戴海琦,丁樹良,2010;張淑梅,包鈺,郭文海,2013;李娟,丁樹良,羅芬,2012;田偉,辛濤,2012;Sun,Xin,Zhang,&de la Torre,2013;羅歡,丁樹良,汪文義,喻曉鋒,曹慧媛,2010)。然而,這些多為參數模型,參數模型除了參數估計過程比較復雜外,往往需要大樣本數據,且屬性個數又不能太多 (Chiu &Douglas,2013;涂冬波等,2010)。為此,研究者開始探索更為簡潔的非參數方法,如Vapnik (2000)依據風險最小化原則提出了基于統計學習理論的機器學習方法——支持向量機(Support Vector Machines,SVM),SVM不僅結構簡單,還可運用小樣本數據,既省時又高效(何學文,趙海鳴,2005;鄺錚,2010)。Chiu等人(Chiu,Douglas,&Li,2009)在屬性合分思路(Henson,Templin,&Douglas,2007)的基礎上提出0-1評分的聚類分析方法。為吻合測評實踐需要,研究者(康春花,任平,曾平飛,2015)將 0-1評分的聚類分析法拓展到多級評分(Grade Response Cluster Diagnostic Method,GRCDM),并探討了樣本容量、失誤率及屬性層級對其判準率的影響,所得結果表明:GRCDM在模擬和實踐情境中均有很高的判準率,且對樣本容量及屬性層級緊密度依賴較小,可適用于小型測評等特征,這在一定程度上體現出非參數方法的優勢。然而,目前關于非參數方法的研究還尚粗淺,能否借助參數方法的已有成果,探索GRCDM的影響因素,深入考察GRCDM的優勢和性能,豐富非參數方法研究,是值得進一步關注的問題。……