上海中醫藥大學(201203)
董 英△ 黃品賢 宋花玲 戎 芬
醫學統計學是一門重要的工具學科,同時也被醫學生認為是“難學”的課程。本課程教師除了要傳授知識、經驗和技能外,更應教會學生獨立思考,提高學生分析問題、解決問題的能力,幫助學生有效學習。近年來,醫學統計學教學工作者從不同角度,開展了不同形式的教學改革探索與實踐,并取得了一定成效[1-4],但提高學生的學習成效,任重而道遠。在教學改革評價過程中,尋找有效的評價工具是一項重要工作。rubric評估表格是一種結構化的、明示評分標準與教師期望的評分機制,以促進學習為目的[5]。本研究針對《醫學統計學》課程中“文獻統計學錯誤辨析”教學環節,設計了量化的rubric評估表格,并進行信度、效度評價,根據評價結果對表格進行修改,應用rubric在學生自我學習前進行指導,在學生學習后對其學習效果進行評價,旨在促進學生有效學習。
教學對象為我校2015級2個學期在讀醫學統計學課程的部分全日制研究生,學生數分別為54人和70人。該班級教學中增加“文獻統計學錯誤辨析”環節,將學生分別分為10個和12個小組,以小組為單位開展學習。
在講授完醫學統計學大綱規定的知識后,要求學生結合自己的專業背景,以小組為單位課后查閱學術期刊文獻,對文獻中涉及的統計學方法進行評價,找出存在的統計錯誤,并進行適當的修改。組織學生在課堂進行匯報,作為聽眾的任課教師和其他組學生都可以提出疑問或補充,每個小組的評分由其他小組和任課教師評價,最后由教師進行點評。
rubric評估表格,先由筆者結合rubric的基本要求和以往“統計學錯誤辨析”的評分經驗,設計初稿,再與教學小組一起討論、修改。其中,教學小組由4名本課程其他主講教師、2名其他課程主講教師、2名教學經驗豐富的教授及1名課程助教(在讀高年級研究生)構成。

經自擬、討論修改,確定對“文獻統計學錯誤辨析”環節學習成效評價的rubric內容,主要分為5大目標評價。為盡量客觀化,在傳統rubric基本要求的基礎上,直接對各大目標的具體4個要求進行評分,每符合1項滿分得5分,具體見表1。
每個小組的評分由其他所有小組評分和1名任課教師的評分組成,先對學生的所有評分取平均值,分析學生評分與教師評分結果的一致性,得ICC值為0.754,P=0.001,兩者具有較好的一致性。為更加客觀體現各組的得分,最終取學生和教師評分的均值進行分析。全量規及各維度Cronbach’α系數計算結果見表2所示。

表1 “文獻統計學錯誤辨析”學習成效評價的量化rubric

表2 全量規及各維度Cronbach’α系數
除“資料支持”維度外,其他各維度和總量規Cronbach’α均大于0.8,具有較好的內部一致性信度。“資料支持”維度為-0.203,進一步對各條目進行分析,表3為該維度中分別刪除各條目以后“資料支持”維度的Cronbach’α,結果提示刪除條目“包括1篇以上英文文獻”后“資料支持”維度的Cronbach’α為0.821,具有較好的內部一致性信度。因此,量規中將“包括1篇以上英文文獻”條目刪除,重新計算全量規的Cronbach’α為0.960,本文中以下所有分析均基于刪除該條目后的量規。
對各維度總分與量規總分的相關性進行分析,結果見表4所示。各維度總分與量規總分的相關系數為0.842~0.960,各維度之間的相關系數為0.728~0.917,對相關系數的假設檢驗均有統計學意義。

表3 “資料支持”維度中各條目對α的影響

表4 各維度與總量規的相關分析
*:P<0.05。
對總量規及各維度進行描述性統計分析,并對兩個學期的得分水平進行比較,具體結果見表5。經兩獨立樣本t檢驗,總量規及各維度評分在兩個學期間差異有統計學意義,且2015-2016學年第一學期評分均高于2014-2015學年第二學期。

表5 學生表現評價
讓學生學會應用是醫學統計學的重要教學目標,教學改革應圍繞促進這一學習目標的實現而開展。本研究借助于“文獻統計學錯誤辨析”教學環節,增加學生“學以致用”的機會,既有利于鞏固學生的統計學知識、加深對知識的理解,又可以增強學生發現問題、分析問題的能力,在這一過程中還可以培養學生邏輯思維、批判思維和團隊合作能力等,幫助學生建立批判地對待文獻報道結果的態度。研究者通過設計rubric評價量規,實現對該過程的形成性評價。
rubric量規是由評價指標與評分等級交織而成的評分表格,與傳統評價工具相比最大的不同在于明示評分標準與教師期望,事先讓學生了解評分標準,可以幫助學生進行準備并提升表現,體現形成性評價的FED特征,即反饋(feedback)、鼓勵(encouragement)、指導(direction),幫助教師和學生找出教與學中的薄弱環節[6],更好地促進教與學協同發展,因此也被認為是以促進學習為目的的學習效果評價工具。本研究設計了針對“文獻統計學錯誤辨析”教學環節的rubric量規,體現了對學習投入、學習過程、學習效果等方面的考核,并對量規進行了信度、效度評價。修改后的全量規Cronbach’α系數為0.960,總體態度、團隊合作、知識應用、語言表達、資料支持五個維度的Cronbach’α系數分別在0.821~0.897之間,量規具有較好的內部一致性;應用相關分析進行效度評價,各維度總分與量規總分的相關系數為0.842~0.960,說明該量規結構較合理,具有較好的效度。
應用rubric量規進行評價時,每組的評分由教師和其他各組對該組的評分取平均值,可以減少誤差。對總量規及各維度評分進行統計分析,結果顯示總體態度維度評分較高,而知識應用維度評分較低,進一步分析發現在知識應用維度中“論述內容包括2個以上高級統計分析方法”條目評分最低。這一結果反映了研究生學習態度較好,但是在量規考慮的幾個維度中,知識應用能力提升的空間還較大,特別是高級統計分析方法的應用還需繼續加強。結合教學實踐發現,本校研究生雖然學習態度較好,但往往學習不夠深入,遇到困難便止步不前,如何進一步激發學生的學習興趣,提高他們對高級統計分析方法的應用能力,是今后教學中需重點思考的問題。假設檢驗結果顯示,對于總量規和各維度而言,2015-2016學年第一學期評分均高于2014-2015學年第二學期的評分,由于兩個學期的學生背景不同,目前尚未收集相關影響因素資料,還不能判斷學生學習成效差異的真正原因,本研究將在今后的教學中進一步深入,找出影響學習成效的關鍵因素,以促進學生更好地學習。