目的:為更好發揮考試的診斷作用,促進學生全面發展,本研究編制了八年級數學診斷性測驗。結果:分測驗的難度分布在0.640~0.994之間;鑒別度平均指數在0.47~0.62之間。克龍巴赫ɑ系數在0.614 ~0.744之間;內容效度,嚴格按照教學大綱及新課程標準編寫。結構效度通過因素分析來驗證,分測驗解釋測驗的總變異都達到了50%以上。結論:本測驗具有適宜的難度和良好的區分度,鑒別度優良;信度檢驗結果表明,內部一致性高,測量標準誤較小;從內容效度、結構效度來看較理想,各測量指標表明測驗達到了測量學要求。
數學診斷性測驗難度信度效度1引言
在基礎教育課程改革逐步完善的過程中,傳統測驗的局限性在新課程改革中猶為凸顯。單一的分數不能反映學生使用的認知成分或技能,也不能診斷出學生答錯題目的原因,更不能挖掘考試信息的深度。《基礎教育課程改革綱要(試行)》明確指出:“建立促進學生全面發展的評價體系。評價不僅要關注學生的學業成績,而且要發現和發展學生多方面的潛能,了解學生發展中的需求,幫助學生認識自我,建立自信。發揮評價的教育功能,促進學生在原有水平上的發展。”而診斷性測驗(diagnostic test)是診斷性評價使用的工具,是運用測量手段,考查學生在學習上的困難而編制的一種測驗。一般在學期末或學期前,即實施新的教學計劃之前進行,目的是了解、評價、分析學生所具有的基礎知識基本技能掌握情況,以鑒別學生接受教學的能力并為補救教學提供參考。國內外學者的研究為診斷測驗的編制與開發提供了許多理論與方法,從不同角度為診斷測驗編制做出了努力,值得參考借鑒。但這些研究提出的理論比較局限,不夠精準,實踐性欠佳,因此未能被廣泛推廣應用。
八年級數學是初中數學學習的關鍵,也是轉折點。這一階段學生知識掌握與否,直接影響他能否順利進入高中階段學習。本研究以義務教育新課程標準為依據,編制八年級數學診斷性測驗,目的在于了解學生知識水平掌握情況,以鑒別學生能否順利進入九年級學習提供參考。同時,教師通過數學診斷性測驗,全面了解學生數學知識、能力等方面的基礎和發展狀況,以把握學生的學習起點,恰當地確定教學目標,選擇教學策略,并通過診斷報告獲得有關學生數學學習情況的評價信息,掌握學生數學學習目標的達成情況和他們在數學學習中出現的問題和困難,以便有針對性地提出適應整體和個別需要的教學策略和措施,達到因材施教的目的,改進數學教學,提高學生的學習效果,并為其它研究人員進行更廣泛的診斷性教育研究提供測量工具和方法。
2研究方法
2.1測驗的編制
2.1.1測驗內容的確定
本研究的內容為八年級數學診斷性測驗,用團體施測的紙筆測驗形式。參考國內外診斷性測驗的樣本,本測驗題型分為四選一的選擇題、填空題、計算題三大部分。以義務教育新課標準為依據,并參照多位從事中學數學教學的一線教師經驗選擇初步編制題本,一級目標10個,二級子目標63個,題目總數204。學生知識能力掌握情況分為三種水平。尚未掌握:是指不具備或不完全具備學習新知識的條件;基本掌握:是指已基本具備了學習新知識的條件;完全掌握:是指完全具備了學習新知識的條件。每個子目標的題目設置一般為三個,少部分5個。標準定為:題目設置為3個,3個全對則為完全掌握;2個全對,基本掌握;對1個或0個,則為尚未掌握。題目設置為5個,5個全對則為完全掌握;4個或3個全對,基本掌握;對2個或1個或0個,則為尚未掌握。選擇、填空題答對則滿分,否則0分,計算題按參考答案酌情給分,完全答對計滿分。
2.2測驗的實施
2.2.1預測
在贛州市信豐四中隨機選取了八年級一個班(60人)樣本,進行當堂施測,每次90分鐘,分10個時間段完成全部測驗。回收有效問卷60份。將難度系數 0.30以下和 0.95以上、區分度 0.19以下的試題刪除,并結合專家意見進行修改、增刪。測試題的二級子目標減少至53個,題目總數減至176個。
2.2.2正式施測
選取贛州市信豐四中剛升入九年級的三個班學生。1班60人,2班58人,3班60人。剔除無效問卷176份,回收有效問卷總計1574份。16、17章施測各為45分鐘,其它每章施測為90分鐘。
2.2.3統計方法
對數據采用SPSS20.0進行統計處理。
3結果
3.1難度分析
主觀題的難度用平均分除以滿分來表示。選擇題計算矯正難度系數CP。本研究把項目的難度分為五個等級,分別是小于0.20、0.20~0.39、0.40~0.59、0.60~0.79、大于0.80,對應的依次是最難、較難、中等、較易、最易。測驗難度以百分比或通過率表示,是等級量表,因此轉化成等距量表,查出Z分數,Z分數就視為該題的標準難度。各分測驗的難度等級分布為:最難項目測驗13有2個,測驗11、14、15、16、18、19各有1個。最易項目測驗11、15、17各有2個,測驗13、16、18、19、20各有1個,測驗12有3個,測驗14有5個。1個分測驗試題難度分布在0.2~0.39之間,7個分測驗試題難度分布在0.4~0.59之間,分測驗12,14試題難度分布在0.6~0.79之間。各分測驗樣本難度分布在0.640~0.994之間。
3.2測驗項目區分度分析
鑒別度指數分為四個等級,小于0.20認為區分度很差,區分度尚可:0.20~0.29,區分度較好:0.30~0.39,區分度很好:大于0.40。各分測驗鑒別度指數分布0.47~0.62,即各分測驗項目區分度很好。
采用相關法對項目的區分度進行分析,分測驗以及總分的相關區分度見表1。
表1表明,十個分測驗與總分的相關在0.350~0.799之間,且均在0.01上顯著。與鑒別指數法所分析的各分測驗的區分度結果一致。
3.3信效度分析
采用克龍巴赫ɑ系數方法來估計測驗的內部一致性系數。各分測驗的α系數在0.614~0.744之間,各分測驗間較同質(表2)。
用測量標準誤對信度分析得到各分測驗的測量標準誤在1.496~2.145分測驗的測量標準誤均在三個標準差內,說明測驗信度較好。
本測驗編制按照八年級數學教學大綱,以義務教育新課程標準為依據,從大量試題集中精選有代表性的題目編制成測驗試題,初步編制成題本后,還進行了一次小樣本施測,將難度系數0.30以下和0.95以上、區分度0.19以下的試題刪除。并請從事中學數學教學且有豐富教學經驗的一線教師和數學教研員,結合相關教材、測驗目標、教學大綱,參考各教學單元時數的基礎就題本呈現的內容、形式進行調整。最后,測驗的二級目標減少至53個,題目總數減至176。因此,整個過程保證了此測驗具有良好的內容效度。
并用探索性因素分析對測驗結構進行了分析(表3)。
經KMO統計量檢驗,各測驗的KMO在0.607~0.860,Bartlett' s球形檢驗結果在0.001水平顯著性。說明各分測驗適合用探索性因素分析。
以主成分法進行初始分析,采用方差最大化正交旋轉法,進行因素分析。測驗十一能得到兩個大于1的特征根,能解釋總變異的75.918%;測驗十二能得到兩個大于1的特征根,能解釋總變異的76.007%;測驗十三能得到兩個大于1的特征根,能解釋總變異的68.626%;測驗十四能得到兩個大于1的特征根,能解釋總變異的80.174%;測驗十五能得到兩個大于1的特征根,能解釋總變異的81.758%;測驗十六能得到一個大于1的特征根,能解釋總方差的67.006%;測驗十七能得到一個大于1的特征根,能解釋總方差的63.540%;測驗十八能得到兩個大于1的特征根能解釋總變異的73.181%;測驗十九能得到兩個大于1的特征根,能解釋總變異的67.206%。;測驗二十能得到兩個大于1的特征根能解釋總變異的64.008%。結果表明本測驗符合構想。
4討論
4.1測驗的內容
診斷性測驗旨在運用測量手段,考查學生基礎知識掌握情況,所以測驗的編制必須配合學校的課程。本測驗編制以全日制義務教育數學課程標準為依據,參照中學數學實驗教科書內容編寫。對新舊版本教材進行比較研究。它們之間的內容基本是相同的,主要是代數知識、幾何知識,只是內容呈現的先后順序稍有不一致,這也為編制測驗時提供參考的依據。老版本的教材八年級才設置幾何知識教學;新版本的幾何知識在七年級就以生活中常見的圖形向學生加以介紹,這樣不僅易于學習,還能和實踐相結合。除此之外,新教材把統計和概率的初步知識以及推理知識也納入到課本中來。
本研究編制測驗的目的是診斷學生的基本技能、知識掌握情況。編制的數學診斷性測驗包括十個分測驗。分式、反比例函數由于在數學課程標準中規定掌握的知識點很少,在測驗中題量相對較少。實測時,因條件限制,只在一所中學選取研究對象。就代表性來看,范圍應該更廣泛些。從測驗結果分析,總測驗包含10個分測驗,每個分測驗題目在總測驗當中的量不能太大,測驗時間又有限制,題目代表性的問題在后續研究中尚需完善。
4.2測驗的項目分析
測驗的項目分析從主要是對項目難度、區分度等進行分析。理論上來說,項目難度值在0.5左右較好,但診斷性測驗旨在測查學生基礎知識掌握情況,試題難度小,則說明學生掌握良好,大則說明大部分學生沒掌握,因此對難度系數要求不高。從各分測驗結果來看,除了第20章平均難度系數為0.365,其它各章平均難度系數分布在0.509~0.804之間;從總測驗題量分析,最難的題目占總題量的4.5%,較少。大部分題目難度系數落在0.4~0.79之間,總測驗的難度系數為0.628。可見測驗題目屬于中等偏易,試題難度分布符合測驗要求。
項目區分度用鑒別指數法和相關法進行了分析。各分測驗的平均鑒別指數(D)在0.47~0.62之間,各分測驗中項目鑒別指數大于0.4的項目均占最大比重。區分度小于0.2的項目占總題量的10.2%。采用相關法對項目的區分度進行分析,區分度越高,越能將不同水平的被試區分開來。用相關法計算分測驗以及總分的相關區分度,十個分測驗的區分度都達到了非常顯著水平,區分度較好。從測驗區分度結果來看,試題總體達標。
4.3測驗的信效度分析
內部一致性信度我們采用克龍巴赫ɑ系數。各分測驗的α系數在0.614~0.744之間,可見所測內容較為一致。各分測驗的測量標準誤在1.496~2.145之間,總測驗的測量標準誤為1.267,都在3個標準差以內,說明測驗分數與真實分數之間的誤差比較小。從這兩種信度估計的結果來看,本測驗的信度系數比較高,測量標準誤比較小,符合測量學的計量標準。
在結構效度考察上,采用探索性因素分析,根據所得各分測驗的因素負荷矩陣,來評量問卷的結構是否符合。經KMO統計量檢驗,各測驗的KMO在0.607~0.860,Bartlett's球形檢驗結果在0.001水平達到統計顯著性,說明適合做探索性因素分析。其中8個測驗都得到兩個大于1的特征根,2個測驗得到一個大于1的特征根,且解釋測驗的總變異都達到了50%以上。說明本測驗符合構想。
參考文獻:
[1]劉經蘭,戴海琦.小學四年級數學診斷性測驗的編制與研究[J].心理學探新,2003,(3).
[2]孟瑛如,蘇肖好,簡吟文.澳門地區小學學生數學診斷測驗之建置與發展[J].特教論壇,1997,6(4):56-68.
[3]楊曉輝,張蘭英.診斷性測驗在生物學概念教學中的應用[J].生物學通報,1992,(4).
[4]張瑜,胡慧海.關于中學數學研究性學習的反思[J].考試周刊,2011,(53).
[5]蔡艷,涂冬波,丁樹良.認知診斷編制的理論及方法[J].考試研究,2010,(7):6-3.