姜超++李國春



摘要目的本研究對南京中醫藥大學選修《醫學統計學》課程的2013級本科生的188份期末考試試卷進行評價分析,為評定教學效果和教學質量提供依據。方法運用教育測量學理論和教育統計學方法對試卷進行評價,采用難度、區分度、信度(Cronbachα系數)對188份《醫學統計學》期末考試試卷進行質量分析。結果該試卷的筆試平均成績為74.63±12.20,最低分為43分,最高分為96分,平均難度為0.74,區分度為0.31,信度系數為0.73。結論該考卷平均難度適中,具有較好的區分度、信度,適合進行本科生醫學統計學的期末測評。制卷時側重于應用的考察將會獲得更好的效果。
中圖分類號:G71 文獻標識碼:A 文章編號:1672-3791(2016)10(c)-0000-00
醫學統計學是運用概率論與數理統計的原理和方法研究醫學科研中的有關數據的收集、整理、分析和推斷應用性學科[1],也是提高醫學高等院校學生水平的必修課程。為了了解本校此門課程的教與學的效果,給教學和制卷工作提供重要的反饋信息。本文通過對2013級選修此門課程學生的期末考試試卷進行分析,希望借此評價試卷質量,了解各專業學生知識的掌握程度,為進一步提高教學質量和制卷水平提供參考。
1. 材料和方法
1.1 材料
我校2013級本科生選修《醫學統計學》的學生期末考試試卷,采用整群抽樣的方法,從中選取了3個專業5個班級,共188分試卷。試卷嚴格遵守教學大綱和教材,注重對學生基本知識、基本理論、基本技能的考核,并注重對學生簡單應用能力的考核。
1.2方法
試卷分析采用目前國內較為常用的指標,包括試卷信度、難度、區分度等指標[2-4]。
信度是指考試的可靠性或可信程度,它指的是采取同樣的方法對同一對象重復進行測量時,其所得結果相一致的程度。從另一方面來說,信度就是指測量數據的可靠程度。信度高的試題很少受到外部因素的影響,對不同學生的多次測試都會產生相對穩定和一致的測試結果。
常用的信度指標為Cronbachα系數,計算公式為。k為測試的題目個數, 為所有被試者在第i道題上的分數變異, 為測試總分的變異。
難度是指試題的難易程度,它作為衡量試題質量的主要指標之一,是衡量試題質量的一個重要指標參數,與區分度共同影響并決定試卷的鑒別性。難度的計算一般采用某試題的通過率或平均得分率。較好的測驗大部分的難度P值應介于0.2~0.8之間。
難度的計算方法為:
客觀題 (k為答對該題的人數,N為參加考試的總人數)
主觀題 (x為試題的平均得分,M為該題的滿分)
為進一步計算區分度采用極端分組法計算難度,其具體步驟為:1、將考生的總分由高到低排列;2、從高分開始向下取全部試卷的27%(即188*27%=50份)作為高分組;3、從最低開始向上取全部試卷的27%(即188*27%=50份)作為低分組;4、分別計算出高分組的難度PH及低分組的難度PL;5、最后計算出PH和PL的平均值
區分度是指一道題能多大程度上把不同水平的人區分開來,也即題目的鑒別力。區分度越高,越能把不同水平的受測者區分開來,該題目被采用的價值也就越大。區分度D的取值范圍-1~1。一般要求試題的區分度在0.2以上。當D>0.4時,說明該題目能起到很好地區分作用;當D<0.2時,說明該題目的區分作用很差。
1.3統計分析
利用SPSS 18.0統計軟件和Excel對成績的分布特征及試卷的信度、難度、區分度等指標進行統計分析。
2.結果
2.1 試卷內容與結構
本張試卷內容涵蓋了醫學統計學的基本概念、t檢驗、方差分析、卡方檢驗、秩和檢驗、相關和回歸分析等。由選擇題、名詞解釋、簡答題、案例分析等部分組成,題量與分值設置見表1
2.2考試成績的基本分布特征
用SPSS18.0統計軟件對總分進行統計描述。結果顯示考試成績呈負偏態呈分布,參加考試188名學生中,最高分96分。最低分43份,平均分74.63分。各分數段人數見表2
2.3各專業成績比較
本次調查共選出3個專業共5個班級,各專業考試成績見表3
由表可見三個專業的學生考試成績差別有統計學意義(F=25.87,P=0.000)。兩兩比較發現營養專業與護理專業分數有統計學意義(P=0.000)與中醫班分數也有統計學意義(P=0.000)。
2.4試卷質量分析
2.4.1 信度分析利用Excel作信度分析,得到本卷的Cronbachα系數為0.73。普通試卷要求α>0.5,標準試卷要求α>0.7,說明整體考試結果可以信賴,該試卷能夠反映學生的真實能力。
2.4.2 難度與區分度分析 分別計算各種題型的難度系數和區分度,結果見表4。四種題型的難度均介于0.2~0.8之間,試卷整體難度為0.74,難度適中。其中案例分析題難度最大,名詞解釋難度最小。試卷總體區分度為0.31,其中簡答題區分度為0.15<0.2,較差;單選題、名詞解釋區分度分別為0.32、0.20介于0.20~0.29之間,一般;案例分析區分度為0.5>0.4,優秀,整體試卷質量較好。
2.4.3試卷質量分析運用教育測量學理論,計算所有試題的難度系數和區分度對試題質量進行綜合分析,結果見表5。本試卷良好試題占比為66.6%,可以認為試卷質量比較令人滿意。
3.討論
由試卷質量的分析可見本套試卷信度指標Cronbachα系數為0.74,可信度較高,試卷較真實地反應了學生的真實情況;難度系數0.74、區分度0.31。試卷難度設計適當、覆蓋面廣,試卷質量較高。但是在制卷過程中還有需要注意的地方。名詞解釋的題型對于學生考核的區分度不高,學生也較易得分。這由于部分學生在應試的過程中主要是通過死記硬背的方法,因此并不能很好的反應學生真實掌握的情況。需要在以后的制卷工作中加以調整。
此次考試學生發熱平均成績為74.63±12.20,成績曲線成負偏態分布,從學生成績看有接近40%的同學在80分以上,取得了較理想的分數,從中反映出這些同學對于基本知識、概念掌握較好并且能靈活應用解決實際問題。但也有部分同學成績較差,主要原因是案例分析題失分較多,這反映出這部分同學雖然對基本概念和知識掌握較好,但是對統計分析方法的運用以及解決實際問題的能力還有待提高。通過不同專業學生成績的比較,我們發現營養專業的學生獲得了更加理想的成績。這部分得益于我們新的教學嘗試,對于營養專業的學生我們在講授理論課的同時適時的增加了SPSS軟件操作步驟和結果解讀的講解。更豐富也更接近實踐的鍛煉有效的提高了他們靈活運用統計知識解決實際問題的能力。
對于提高解決實際問題的能力,我們認為將理論課與SPSS實踐相結合,教學過程中甄選案例,適時的補充SPSS軟件的操作步驟和對結果的解讀將會取得不錯的教學效果。這樣的方法可以幫助學生從繁雜的公式記憶和計算工作中解脫出來,從而使其注意力轉移到對統計學方法的應用條件的理解和對統計結果的判斷上,角色從計算的執行者轉變成為對結果的決策者。讓同學們充分體會到統計學解決問題后所帶來的快樂和成就感,有助于提高學生對醫學統計學的學習興趣及動手能力、實際解決問題能力的提高。
參考文獻
[1]孫振球.醫學統計學[M].北京:人民衛生出版社,2010:1.
[2]許志強,周華東,李靜等.試卷分析系統在神經病學教學中的應用[J].重慶醫學,2010(10):1311-1312.
[3]熊石龍,王前,鄭磊等.臨床醫學八年制實驗診斷學試卷分析與思考[J].中國實驗診斷學,2011(3):563-565.
[4]蔡琳,許能峰,何保昌等《流行病學》試題庫的應用與分析[J].福建醫科大學學報(社會科學版).2010(3):30-32.