梁雅麗,袁 慧,石 瑋,丁書姝,宋建根,陳 燕,賀連平,朱 玉
(皖南醫(yī)學(xué)院公共衛(wèi)生學(xué)院,安徽蕪湖 241002)
衛(wèi)生統(tǒng)計學(xué)是預(yù)防醫(yī)學(xué)專業(yè)的必修課,是衛(wèi)生工作者進行科學(xué)研究和臨床實踐活動不可或缺的工具學(xué)科,但由于其具有邏輯推理性強、學(xué)習(xí)難度大、不易理解、學(xué)生綜合應(yīng)用能力差的特點[1]。因此如何準(zhǔn)確的反映預(yù)防醫(yī)學(xué)生對該科目知識的學(xué)習(xí)和掌握程度,一直是統(tǒng)計教學(xué)研究探索的重要問題[2]。當(dāng)前評價學(xué)生對所學(xué)知識的理解和掌握程度主要是通過筆試成績的考核,因此試卷質(zhì)量對能否準(zhǔn)確反映學(xué)生學(xué)習(xí)的效果是至關(guān)重要的[3]。如何科學(xué)的進行考試命題,準(zhǔn)確的反映學(xué)生的學(xué)習(xí)情況,客觀的評價教師的教學(xué)效果,是制定試卷時需要認真思考的問題。因此對現(xiàn)有試卷質(zhì)量進行評價,為日后提高試卷質(zhì)量及促進教學(xué)效果提供參考依據(jù)。
1.1 研究對象 選取2011級皖南醫(yī)學(xué)院全部預(yù)防醫(yī)學(xué)系本科衛(wèi)生統(tǒng)計學(xué)期末閉卷考試試卷,共計230份。該專業(yè)所選用的教材為人民衛(wèi)生出版社、方積乾主編的第7版《衛(wèi)生統(tǒng)計學(xué)》。試卷按教學(xué)大綱規(guī)定,根據(jù)規(guī)范化試卷要求,試卷滿分100分,考試的總題數(shù)41題,分為客觀題(單選題、多選題、填空題)和主觀題(名詞解釋、簡答題、計算題)兩部分。試題由本教研室高級職稱授課教師命題。按照考前制定的標(biāo)準(zhǔn)答案和評分標(biāo)準(zhǔn),進行流水作業(yè)式閱卷。
1.2 研究方法
1.2.1 可信度 試卷可信度是衡量考試穩(wěn)定性與考試可靠性的指標(biāo),試卷信度越高,表明考分對學(xué)生的學(xué)業(yè)水平的代表性越好。計算公式為[4],其中s2,一般情況,試卷的可信度應(yīng)達到0.5 以上[5]。
1.2.2 效度 試卷效度是反映整套試卷考察的知識點在教學(xué)實際知識點中的覆蓋程度,用各題間列聯(lián)相關(guān)矩陣表示(即相關(guān)系數(shù)),相關(guān)系數(shù)越小,表明各題考查內(nèi)容之間的交叉性越小,試題的覆蓋面越廣。計算公式為[6]rij=,其中n為試卷大題目的個數(shù),si、sj是相關(guān)大題的標(biāo)準(zhǔn)差,為相關(guān)大題的平均分?jǐn)?shù)。一般情況,試卷的效度系數(shù)應(yīng)低于0.2[7],表明覆蓋面較大。
1.2.3 難度指數(shù)[8]難度指數(shù)(P)是反映試題難易程度的重要指標(biāo),P的范圍為0~1,P值越大試題越容易。客觀性試題的難度指數(shù)計算公式為R/N,R為答對該試題的人數(shù),N為總答題人數(shù);主觀性試題的難度指數(shù)計算公式為:P=∑G/N×A,∑G為該試題所有考生的得分總和,A為該試題的滿分值,N為總答題人數(shù)。大樣本試卷的平均難度計算公式:P=(PH+PL)/2,PH、PL分別表示高分組和低分組對某題的通過率(將考試總分從高到低排列,然后將總分最高的27%和最低的27%考生分別定義為高分組和低分組);難度的程度劃分標(biāo)準(zhǔn)[9]:P <0.6為難題;0.6≤P <0.7 為較難題;0.7≤P <0.8 為中等題;0.8≤P <0.9 為較易題;P≥0.9為易題。
1.2.4 區(qū)分度 試卷區(qū)分度是反映試卷效用高低的參數(shù),用來判斷試卷能否將好、中、差不同程度的學(xué)生通過考試成績真正區(qū)分出來的能力。客觀性試題的區(qū)分度計算公式為[8]:D=PH-PL,PH、PL分別表示高分組和低分組對某題的通過率(將考試總分從高到低排列,然后將總分最高的27%和最低的27%考生分別定義為高分組和低分組);主觀性試題的區(qū)分度計算公式為[8]:D分別表示高分組和低分組得分的總和,N為總答題人數(shù),H、L分別表示該題的最高得分和最低得分。整份試卷的區(qū)分度[10]:D= ∑Difi/∑fi,其中 Di表示各題的區(qū)分度值,fi表示各題的滿分。試題區(qū)分度標(biāo)準(zhǔn)為[11]:D≥0.4,試題區(qū)分度很好;0.30≤D≤0.39 試題良好,修改更佳;0.20≤D≤0.29 試題尚可,仍需修改;D≤0.19試題差,必須淘汰。
2.1 試卷基本信息 參加本次衛(wèi)生統(tǒng)計學(xué)考試的總?cè)藬?shù)為230人,227及格,及格率為98.70%。試卷滿分100分,最高分為99分,最低分為51分,中位數(shù)為89分,四分位間距為9。考試成績呈負偏態(tài)分布,偏度系數(shù)為-1.45。結(jié)果見表1、圖1 和表2。

表1 2011級預(yù)防醫(yī)學(xué)專業(yè)本科生衛(wèi)生統(tǒng)計學(xué)成績分布情況

表2 2011級預(yù)防醫(yī)學(xué)專業(yè)衛(wèi)生統(tǒng)計試卷的基本信息
2.2 衛(wèi)生統(tǒng)計試卷的信度及效度分析結(jié)果 本次試卷信度為 Cronbach'sα =0.76,滿足一般試卷信度 >0.5 的要求,信度較高。除多選題與簡答題的效度系數(shù)為0.185,以及簡答題與計算分析題的效度系數(shù)為0.199,符合效度系數(shù)小于0.2的要求;其余均大于0.2,說明除多選題與簡答題以及多選題與計算題之間的相關(guān)性較小外,其它題型相關(guān)性較大,考察內(nèi)容之間交叉較大,覆蓋程度較低。具體情況見表3。
2.3 試卷質(zhì)量分析結(jié)果 試卷總體難度為0.88,難度系數(shù)最大的題型為填空題(P=0.95),多選題的難度系數(shù)最小(P=0.54)。試卷的總體區(qū)分度為0.3,區(qū)分度最好的題型為多選題(D=1.00),區(qū)分度最差的題型單選題和填空題,區(qū)分度分別為(D=0.18,D=0.19)。本次試卷的綜合判定結(jié)果為C級(容易,但仍有區(qū)別性),質(zhì)量綜合判定標(biāo)準(zhǔn)[8]見表4,試卷各題的難度和區(qū)分度及綜合判定見表5。

表4 試卷質(zhì)量綜合評價標(biāo)準(zhǔn)
本次研究結(jié)果顯示,試題基本符合教學(xué)大綱要求。學(xué)生成績呈負偏態(tài)分布,最高分為99分,最低分為51分,中位數(shù)為89分,四分位間距為9分,考試合格率為98.70%,滿足合格性考試能夠使大多數(shù)學(xué)生合格的目的,但學(xué)生分?jǐn)?shù)總體偏高,說明試卷整體難度較低。按照教學(xué)測量學(xué)理論,對于高校課程的合格性考試,一般要求考試試卷的信度達到0.5以上,本試卷的信度為0.76,信度較好,能夠達到標(biāo)準(zhǔn)化考試的要求,提示考試結(jié)果可真實反映學(xué)生的學(xué)業(yè)水平,受其它隨機因素的影響較小,可用于對學(xué)生個體知識水平的評價。
采用內(nèi)容效度指標(biāo)反映試卷的覆蓋面,用相關(guān)系數(shù)進行衡量。相關(guān)系數(shù)越小,表明各題之間的交叉性越小,試題對知識點的覆蓋面越廣,反之,覆蓋度不好,存在知識點的關(guān)聯(lián),一般效度系數(shù)小于0.2表示覆蓋面大,本次研究結(jié)果顯示除簡答題和計算題之間的相關(guān)系數(shù)以及多選題和簡答題的相關(guān)系數(shù)小于0.2,其余均高于0.2,其中簡答題和填空題的相關(guān)系數(shù)達0.548,表明該試卷的覆蓋度較低,今后應(yīng)增加出題的覆蓋面,避免相同知識點的重復(fù)出題,其次還可通過增加題目類型,以增加試卷對授課知識點的覆蓋程度。
按試卷難度分布要求,各類型試題所占比例為[11]:難題和易題各占5%~10%,較難題與較易題各占20% ~30%,中等題占25% ~40%。難度系數(shù)(P),P值與試題的難度呈反向相關(guān),即P越大試題難度越小,P值介于0.6~0.8表示整體難度較適當(dāng)。從該次分析結(jié)果顯示,本試卷平均難度為0.88,試題整體屬于較易題型,其中填空題、簡答題和計算題的難度值均大于0.9屬于易題,占總分值的比例為65%,單選題和名詞解釋題的難度值介于0.8到0.9之間,屬于較易題,占總分值的比例為30%,只有多選題的難度值小于0.6,為難題,難題分值占總分值的5%。難題和較易題所占比例合適,無較難題和中等難度題目,易題所占比例偏大,導(dǎo)致本次試卷平均難度較低。
本次試卷平均區(qū)分度良好,其中多選題的區(qū)分度很好,簡答題良好,名詞解釋和計算題尚可,單選題和填空題為差。最后,此次衛(wèi)生統(tǒng)計學(xué)試卷結(jié)合難度與區(qū)分度,綜合判定顯示試卷“容易,但仍有區(qū)別性”,其中多選題為較理想試題,名詞解釋、簡答題和計算分析題綜合判定為“容易,但仍有區(qū)別性試題”;單選題和填空題綜合判定為“有問題,需要修改的試題”。單選題和填空題的綜合判定結(jié)果較差,主要是由于對應(yīng)試題的難度低且區(qū)分度差而導(dǎo)致,可能是由于這兩類型題目主要是對單個記憶性知識點的考察,有研究顯示,學(xué)生對記憶性知識點掌握程度的區(qū)別不大[12]。在今后對單選題和填空題的命題中可相應(yīng)增加知識應(yīng)用類的題目,從而提高這兩類試題的質(zhì)量。
綜上所述,通過此次對衛(wèi)生統(tǒng)計學(xué)試卷的分析顯示,本次考試成績分布合理,考試結(jié)果能準(zhǔn)確反映學(xué)生的學(xué)業(yè)水平,區(qū)分度良好,但難度總體較易,試卷的覆蓋度較差。因此,在日后的試卷的命題中應(yīng)增加較難題和中等難度題目的數(shù)量,降低易題比例,增加綜合應(yīng)用類題目,減少記憶類題目,增強試題對教學(xué)內(nèi)容的覆蓋度,避免相同考點的反復(fù)出題。同時在試卷分析時發(fā)現(xiàn)學(xué)生在學(xué)習(xí)中存在對綜合性知識掌握不夠全面,相近知識點易混淆的問題,對知識融會貫通、綜合應(yīng)用能力不足,在以后教學(xué)中應(yīng)加強對綜合性知識的講解,使用多種教學(xué)手段提高學(xué)生對統(tǒng)計方法的綜合應(yīng)用能力。
[1]李鴻,馮 虹,田 智,等.四川大學(xué)本科階段《衛(wèi)生統(tǒng)計學(xué)》理論教學(xué)效果調(diào)查[J].現(xiàn)代預(yù)防醫(yī)學(xué),2011,38(15):2928-2932.
[2]朱 焱,朱俊民,胡 瑾,等.醫(yī)學(xué)統(tǒng)計學(xué)課程教學(xué)效果與需求的調(diào)查[J].貴陽醫(yī)學(xué)院學(xué)報,2013,38(3):329 -331.
[3]李 靜,朱繼民,武 松,等.某高校護理專業(yè)學(xué)生預(yù)防醫(yī)學(xué)試卷分析[J].中華疾病控制雜志,2014,18(3):265 -267.
[4]陳淑敏,林彩環(huán).高職助產(chǎn)專業(yè)病理學(xué)試卷分析與評價[J].四川生理科學(xué)雜志,2014,36(4):204 -206.
[5]蔡毅媛,宋沈超,劉海燕,等.臨床醫(yī)學(xué)專業(yè)《預(yù)防醫(yī)學(xué)》課程試卷及考試成績分析[J].貴陽醫(yī)學(xué)院學(xué)報,2013,38(1):104-106.
[6]洪 冉.用數(shù)理統(tǒng)計方法分析試卷質(zhì)量[D].武漢:華中師范大學(xué),2012.
[7]曹 佳,孫 艷,陳麗麗,等.預(yù)防醫(yī)學(xué)考試試題質(zhì)量評價[J].衛(wèi)生職業(yè)教育,2010,28(24):41 -42.
[8]袁作雄.試題定量分析指標(biāo)及其在SAS軟件中的實現(xiàn)方法[J].數(shù)理醫(yī)藥學(xué)雜志,2010,23(5):576 -578.
[9]龐 慧,李水仙.長治醫(yī)學(xué)院2007~2009級五年制醫(yī)學(xué)免疫學(xué)試卷分析[J].河北聯(lián)合大學(xué)學(xué)報(醫(yī)學(xué)版),2012,14(7):594-596.
[10]韓春紅.對南京醫(yī)科大學(xué)臨床醫(yī)學(xué)生部分課程考核試卷、試題質(zhì)量的分析[D].南京:南京醫(yī)科大學(xué),2010.
[11]劉曉蕙,徐學(xué)琴,牛 樂,等.衛(wèi)生學(xué)考試試卷分析[J].衛(wèi)生職業(yè)教育,2012,30(4):114 -116.
[12]趙 柯.試卷質(zhì)量指標(biāo)分析[J].新疆教育學(xué)院學(xué)報,2001,17(4):134-136.