曹 佳,孫 艷,陳麗麗,高曉華
(哈爾濱醫科大學公共衛生學院,黑龍江 哈爾濱 150081)
預防醫學考試試題質量評價
曹 佳,孫 艷,陳麗麗,高曉華
(哈爾濱醫科大學公共衛生學院,黑龍江 哈爾濱 150081)
目的 評價預防醫學考試試題質量,以便科學地命題,理想地檢驗學生成績,使成績考核能真實地反映教學質量。方法 運用統計學方法對試題難度、覆蓋度、區分度、可信度進行分析。結果 試題難度適當,覆蓋度欠佳,區分度尚好,可信度良好。結論 在出題時,要注意試題難度和難度分配,增加試題類型和數量,提高覆蓋度和區分度。
預防醫學;考試試題;質量評價
如何科學地命題,理想地檢驗學生成績,是值得教師認真思考的問題。為檢驗并提高試題質量,同時也檢驗教學上存在的問題,我們對近年來公共事業管理本科學生預防醫學試卷質量進行評價,為以后教學命題提供借鑒。教學質量涉及到教學的整個過程,而檢驗教學質量的重要手段就是成績考核,而成績考核能否真實地反映教學質量,命題顯得特別重要。試題過難、過偏,會出現學生成績偏低;命題過易,勢必降低了教學大綱所規定的目標,使得學生成績偏高,無法區分開學生成績的優劣。
2001級、2002級公共事業管理本科學生103人的預防醫學試卷103份。
試題類型共分6種,分別是概念題(10分)、判斷題(15分)、單選題(15分)、多選題(25分)、簡答題(15分)、論述題(20分)。經統計學方法處理,根據考試成績對各試題得分進行分析。
假設試卷題目類型個數為n,P為得分(百分制評分),n個類型題目的滿分值分別為
設抽查全體學生數為N,樣本值用x1,x2,…,xn表示。這就是所抽查到的N個學生的考試成績。用xij表示第i個學生第j題的實際得分分別表示第j題的均值和方差。
為了統一檢驗量綱和提高各題間的可比性,把各題的得分標準化,令,則 sij為第 i個學生第 j題的標準分。這個過程實際上就是把符合正態分布的學生成績轉化為標準正態分布的過程。令aj、bj分別表示第j題滿分和0分的標準分。
采用4項指標即難度、覆蓋度、區分度和可信度[1]作為評價試題質量的主要指標。
覆蓋度:用各題之間相關矩陣表示,即r=(rij)n×n,其中
這種描述的基本思想是試題覆蓋面越廣,則各題之間的交叉相關性越小,反之則越大。相關系數的實質就是反映試題覆蓋面大小。通常以 rij<0.2 為覆蓋面大(i,j=1,2,…,n)。
區分度:第i題的區分度Gj為
其中,Hj,Lj分別表示樣本中高分組、低分組第j題的平均分。高分組和低分組各占樣本容量的25%、30%為宜。試卷總區分度Gj為各題區分度的加權平均,即
區分度是標志試題能否將學生成績拉開距離,真正從分數上將好、中、差的學生區分開來。區分度G>0.4為可,G<0.2為差。
可信度描述了試卷總分差在排除了各題隨機誤差之后,余下部分占總方差的百分比。各題隨機誤差小,則試卷可信度就高,反之則可信度低。一般情況下,試卷可信度可達0.5。
(1)103份試卷成績統計情況(見表1)。卷面分為56.2~95.5分,平均分為(76.44±4.4)分趨于正態分布。總難度D值為0.21,試卷難度適當;總方差為129,則可信度B=0.63,試卷可信度良好。

表1 103名學生成績統計(分)
(2)試卷各題相關系數矩陣。

從矩陣上看,概念題與判斷題、單選題的相關系數基本滿足<0.2的要求,判斷題、單選題與論述題的相關系數基本滿足<0.2的要求,其他各題間的相關系數均>0.2,試卷覆蓋度不夠好。
(3)對學生考試成績原始數據按從高分到低分排列,取前25名和后25名學生成績作為高分組和低分組(見表2)。試題總區分度為D=0.76。試卷區分度總體上較好。

表2 高分組與低分組間各題區分度
考試是教學中不可缺少的環節,是檢查和評價教學質量的必要手段。通過對考試成績和試卷的分析,及時發現教學中存在的問題,不斷完善命題工作,使考試在教學中發揮應有的作用。
從難度D值上看,多選題和論述題較難,難度均>0.2。這2個題型的確是教學重點和難點,難度設置較為理想。其余各題型難度均<0.2,特別是概念題和單選題,屬于基本概念題和容易判斷的選擇題,提示今后在同類班次的教學中,應增加這2個題型的難度。從覆蓋度上看,判斷題和多選題間以及多選題和簡答題間相關系數較高,說明試卷覆蓋度不夠好,今后在出題時,應注意授課的覆蓋面,避免在教學的重點地方反復出題。另外,作為結束考試,只出了6個類型題,覆蓋面也難達到高的要求,以后應增加試題類型,提高試題覆蓋度。試卷總區分度較好,但概念題和單選題區分度為0.09(<0.2),區分度較差,幾乎不可取用,應提高概念題和單選題區分度,可增加其難度。
綜上所述,試題難度較為理想,個別試題難度偏低;覆蓋度較差;總區分度良好,個別試題區分度較差;可信度良好。這只是從學生試題成績數據進行分析和評價,實際上影響學生成績的因素很多,如命題難易程度、命題合理性、學生掌握程度、考場紀律、授課人與命題人的關系等。要提高試題質量,應注意以下幾點:(1)注意試題難度和難度分配。在出題時,應將試題平均難度控制在0.5(0.4~0.7)左右。另外,應把難度分配做到相對平均又有所側重。(2)增加試題類型和數量。通過提高信度反過來提高難度和區分度。(3)加強試題質量評價。
[1]羅伯特·L·艾伯爾著,漆書清譯.教育測量綱要[M].南昌:江西師范大學高等教育研究室,1979.
G40-03
B
1671-1246(2010)24-0041-02