章芳芳,黃麗華
(浙江大學醫(yī)學院附屬第一醫(yī)院,浙江杭州 310003)
隨著實證科學概念的不斷推進,在醫(yī)學教育領域已有使用客觀證據取代個人主觀經驗的趨勢。評價教學是否確有效益,必須講求證據。因此,具有高信效度、客觀全面的評價方法在醫(yī)學教育研究中就顯得尤為重要。目前護理臨床教學領域對于教學效果的評價大多只局限于理論和操作考核,方法單一,也尚未形成完整連貫的評價系統(tǒng)。本文就國內外文獻報道的醫(yī)學教育主要評價方法進行綜述,為建立護理臨床教學評價體系提供依據。
1.1 評價的定義 評價是指通過觀察、表現(xiàn)與專題評定或紙筆測驗從而獲得學生的學習信息,并對學生的學習進展予以價值判斷。評價具有導向與激勵、反饋與交流、檢查與監(jiān)控、鑒定與選拔的作用[1]。
1.2 評價的類型
1.2.1 按評價功能分類 按評價的功能[1]可分為形成性評價(formative evaluation)和總結性評價(summative evaluation)。形成性評價是評價學生在教學前和教學過程中知道了什么、能做什么,持續(xù)性的形成性評價能幫助確定學生當前擁有的關于某個主題的知識和信念。總結性評價是在教學之后實施,用來確定學生是否掌握了某一課程的內容,應該給學生怎樣的最終成績,哪些學生可以進入下一階段的學習。
1.2.2 按評價形式分類 按評價的形式[2]可分為紙筆測驗和表現(xiàn)性評價(performance evaluation)。紙筆測驗是指書面形式的測驗,主要側重于評定學生科學知識方面學習成就高低或在認知能力方面發(fā)展強弱的一種評價方式。表現(xiàn)性評價是請具有相當評價專業(yè)素養(yǎng)的教師,編擬與學習情境頗類似的模擬測驗,然后讓學生表現(xiàn)所知所能的學習結果。
1.3 評價方法的選擇 好的評價方法應該具備RSVP特性,即信度(reliability)、標準化(standardization)、效度(validity)和實用性(practicality)[1]。每種評價方法都有其長處與短處,應依據評估內容做針對性的選擇[3],并將不同方法加以排列組合來評估不同的能力指標,同時考慮其信度、效度、對于未來學習與工作的幫助、參與者的接受程度以及成本等因素[4]。
2.1 紙筆測驗 多重選擇題(multiple choice questions,MCQs)是最常見的紙筆測驗形式,其最大的優(yōu)點是客觀公平,可使用計算機批改,基于這一特點也常被用于總結性評價,例如資格、執(zhí)照考試等。其他形式的紙筆測驗,包括簡答題(short answer)或結構式申論題(structured essays)等,不僅可測試內容知識,同時可測試知識的整合以及問題解決技巧等,但這些題目的可信度低、成本高、給分主觀、無法公平,故不適用于大型的資格考試,但可用于形成性評價[5]。雖然紙筆測驗能測量認知領域的學習結果,但在技能、態(tài)度領域則有其先天限制[2]。
2.2 表現(xiàn)性評價 表現(xiàn)性評價具有強調實際生活的表現(xiàn)、著重較高層次思考與解決問題技巧、允許評價時間彈性化、促進學生自我決定與負責、兼顧評價的結果與過程等特質[2],彌補了傳統(tǒng)紙筆測驗存在的局限與不足。其形式多元,在醫(yī)學教育評價中常用的有迷你臨床演練(mini-clinical evaluation exercise,Mini-CEX)、操作技能直接觀察(direct observation of procedural skills,DOPS)、個案為基礎的討論(case based discussion,CbD)、多源反饋評價(multi-source feedback,MSF)、客觀結構化臨床考試(objective structured clinical examination,OSCE)等。
2.2.1 基于工作場所的評估模式(workplace based assessment,WPBA) WPBA是一種以工作場所為基礎,評價住院醫(yī)師實際執(zhí)業(yè)能力的評估模式[6],由多種評價方法組成。
2.2.1.1 Mini-CEX Mini-CEX由美國內科醫(yī)學會(American Board of Internal Medicine,ABIM)Norcini等人設計[7],主要用于對住院醫(yī)師的臨床技巧評估。評估時間由住院醫(yī)師和臨床教師兩人預先約定,評估時在門診、急診或住院病房指定1例患者,教師觀察住院醫(yī)師對患者的診療工作,評估醫(yī)療面談、人文關懷、咨詢技巧、理學檢查、臨床判斷、組織技巧與效能,根據評定量表進行打分,并對其表現(xiàn)及時做出反饋和指導[8]。這種評估法的特點是能有效評估臨床技能并能立即給予反饋[9,10]。
2.2.1.2 DOPS DOPS由英國皇家內科醫(yī)師協(xié)會(Royal College of Physicians,RCP)設計,主要用于評估住院醫(yī)師的臨床操作技能。DOPS由住院醫(yī)師自己選擇評估時間、內容及考官。評估時,臨床教師直接觀察住院醫(yī)師在患者身上執(zhí)行1~2種臨床技術操作,在評定量表上打分并給予即時反饋[7]。
2.2.1.3 CbD CbD由英國國家醫(yī)療保健系統(tǒng)下屬的醫(yī)療評估和培訓所設計,主要評估住院醫(yī)師的臨床推理與決策能力。個案為住院醫(yī)師照顧過的實際病例,考官由有經驗并受過專門訓練的臨床教師擔任。每次評估由住院醫(yī)師自己挑選病例個案,并事先將病例資料送交考官,使考官熟悉個案情況。評估時,考官首先結合病例與住院醫(yī)師作結構式的討論,內容涉及診斷、治療、醫(yī)學倫理及法律等領域,然后考官根據討論結果在評定量表上打分,并立即給予反饋[8]。
2.2.1.4 MSF MSF又稱360°反饋評價(360-degree feedback assessment),主要是讓和住院醫(yī)師常常接觸但背景不同的人從多角度評估其表現(xiàn),內容涵蓋臨床照顧、醫(yī)療專業(yè)、教學與訓練、醫(yī)患關系、團隊協(xié)作等被英國總醫(yī)學會(general medical council,GMC)認定為優(yōu)秀醫(yī)療實踐(good medical practice)[11]的各個領域。評估者由住院醫(yī)師自己提名,包括臨床教師、護理及其他醫(yī)療相關人員等,同時也要求住院醫(yī)師依據表格進行自我評估。MSF評估是比較綜合的,可以獲得住院醫(yī)師更豐富而深入的信息,除了知識與技能外,還可了解其工作習性、團隊精神、人際關系等[12]。MSF的缺點主要體現(xiàn)在同行評估的保密性和自我評估的偏差性[13]。
2.2.2 基于模擬操作的評估模式 模擬操作在醫(yī)學上的應用導因于醫(yī)學生面對患者理學檢查或溝通技巧方面的不足可能導致的醫(yī)療質量問題。一個好的模擬操作通常包括以下特質:培養(yǎng)操作中關鍵步驟的能力,高度擬實境性,對于可能情境的涵蓋性,以及在操作中提供適當的回饋[14]。在醫(yī)學模擬教育評估中常用的方法有以下幾種。
2.2.2.1 OSCE OSCE是由英國Dundee大學的Ross等[15]于1975年提出的,是一種集測試、評估和反饋于一體的臨床培訓方法,也是一種客觀、有序、有組織的考核框架。不同醫(yī)學院或考試機構可以根據自己的教學大綱和測試需求培訓健康人作為標準化患者(SP)[16],并設計模擬臨床場景,讓考生通過一系列事先設計的考站來考察詢問病史、體格檢查、與患者交流、信息收集、假設建立、數據解釋及職業(yè)態(tài)度等。由觀察者或SP對考生進行評價,并即時對考生作出反饋,達到通過考試提高的目的[17]。OSCE因使用評定量表和多站評估使評分的客觀性大大增強,適合用于課程后的總結性評價。效度上OSCE高于筆紙測驗,但與WPBA相比又略遜一籌,信度上低于紙筆測驗但高于WPBA(因為患者與模具計算機為標準化情境)[18];缺點是成本很高且耗時,實施一次正規(guī) OSCE 所耗費的人力及財力相當可觀,并非是可以經常采用的方法[19]。
2.2.2.2 基于標準化患者的練習和考查(standardized patient experiences/exam,SPE/Xs) SPE/Xs既可用于醫(yī)學生平時的練習、評估及反饋,也可用于醫(yī)學生臨床技能的考查,解決醫(yī)師缺乏、患者缺乏及無法系統(tǒng)評估及反饋的問題[20]。SPE/Xs的缺點在于SP畢竟不是真實患者,不具有明確的陽性體征,在對醫(yī)學生臨床診療能力的考查上存在一定的局限。
2.2.2.3 基于仿真器的練習和考查 目前仿真器最普及的應用是模擬假人,如歐美醫(yī)學院或教學中心廣泛使用的SIMMAN,可訓練學生作循環(huán)呼吸的理學評估基本臨床技巧(氣管插管,中心或周圍靜脈導管置入),以及訓練醫(yī)療人員(急診,加護病房或手術室)面對緊急狀況的團隊合作等[21,22]。在成本效益評估方面,過去文獻研究顯示[23],仿真假人在訓練團隊合作方面具有很高的效益,但對于臨床理學檢查及技巧訓練而言則投資報酬率低。因此,這種模擬假人目前僅應用于OSCE及畢業(yè)后專科醫(yī)師培養(yǎng)或繼續(xù)教育訓練(CME)等方面[24,25]。
未來的醫(yī)學教育評價應導向多時段、多工具、多教師的多元化評價,評價本身的概念包含了不同的時機(課前、課中與課后)、不同的目的(形成性評價和總結性評價)、不同的形式(紙筆測驗和表現(xiàn)性評價)[5]。可靠的評價應該同教學緊密相連,既反映教學目標也指導教學策略,近來醫(yī)學教育的目標已有微妙的轉變,由過去“我們想要產生什么樣的醫(yī)師”轉變?yōu)椤拔覀兘o予患者什么樣的服務”,這就是一種以顧客為中心的客制化概念。所以在教學中,如果牽涉實際患者、SP,甚至是一些小組或病房學習過程中的同行,都應注意他們的評估意見(同行是屬于組織理論中的“內部顧客”概念)。因此未來的教學評價不能只從師長或單方知識的觀點來看學生表現(xiàn),還需注意病患關切的照護質量,以及同行的評價,即360°全方位評價。
參考文獻:
[1] 珍妮·埃利斯·奧姆羅德.教育心理學[M].龔少英,譯.6版.北京:中國人民大學出版社,2011:6-30.
[2] 李坤崇.教學評估多種評價工具的設計及應用[M].上海:華東師范大學出版社,2011:125.
[3] Epstein RM.Assessment in medical education[J].N Engl J Med,2007,356:387-396.
[4] Wass V,Van der Vleuten C,Shatzer J,et al.Assessment of clinical competence[J].Lancet,2004,357:945-949.
[5] 陸希平.醫(yī)學教育未來發(fā)展重要趨勢-2007亞太國際醫(yī)學教育之重要信息(下)[J].西北醫(yī)學教育,2008,16(4):617-620.
[6] Norcini JJ. Work based assessment[J].BMJ,2003,326:753-755.
[7] Norcini JJ,Blank LL,Arnold GK,et al.The Mini-CEX(clinicalevaluation exercise):a preliminary investigation[J].Ann Intern Med,1995,123(10):795-799.
[8] 曹偉.WPBA在英國畢業(yè)后醫(yī)學教育中的應用[J].復旦教育論壇,2010,8(4):92-96.
[9] Lawrence JW,Fauerbach JA,Heinberg LJ,et al.The reliability and validity of the Perceived Stigmatization Questionnaire(PSQ) and the Social Comfort Questionnaire(SCQ) among an adult burn survivor sample[J].Psychol Assess,2006,18(1):106-110.
[10] Corrigan G,Bowden FJ,Owen C.Mini-clinEx versus mini-CEX[J].Med Educ,2006,40(6):599-600.
[11] Howley LD,Wilson WG.Direct observation of students during clerkship rotations:a multiyear descriptive study[J].Acad Med,2004,79:276-280.
[12] Ramsey PG,Wenrich MD,Carline JD,et a1.Use of peer ratings to evaluate physician performance[J].JAMA,1993,269:1655-1660.
[13] Norcini JJ.Peer assessment of competence[J].Med Educ,2003,37:539-543.
[14] Carter FJ,Schijven MP,Aggarwal R,et al.Work group for evaluation and implementation of simulators and skills training programmes:consensus guidelines for validation of virtual reality surgical simulators[J].Surg Endosc,2005,19(12):1523-1532.
[15] Ross M,Carroll G,Knight J,et al.Using the OSCE tomeasure clinical skills performance in nursing[J].J Adv Nurs,1988,13(1):45-56.
[16] Barrows H.An overview of the uses of standardized patients for teaching and evaluating clinical skills[J].Academic Medicine,1993,68(6):443-453.
[17] 張新晨,吳德全,張麗穎,等.基于表現(xiàn)的教學與評估在醫(yī)學教育中的應用[J].中國高等醫(yī)學教育,2010,(5):45-46.
[18] Pulito AR,Donnelly MB,Plymate M,et al.What do faculty observe omedical students’clinical performance[J].Teach Learn Med,2006,18:99-104.
[19] Wragg A,Wade W,Fuller G,et al.Assessing the performance of specialist registrars[J].Clin Med,2003,3:131-134.
[20] Battles JB,Wilkinson SL,Lee SJ.Using standardized patients in an objective structured clinical examination as a patient safety tool[J].Qual Saf Health Care,2004,13(8):i46-i50.
[21] Le CQ,Lightner DJ,VanderLei L,et al.The current role of medical simulation in American urological residency training programs:an assessment by program directors[J].J Urol,2007,177(1):288-291.
[22] Dawson DL,Meyer J,Lee ES,et al.Training with simulation improves residents’ endovascular procedure skills[J].J Vasc Surg,2007,45(1):149-154.
[23] MacDowall J.The assessment and treatment of the acutely ill patient-the role of the patient simulator as a teaching tool in the undergraduate programme[J].Med Teach,2006,28(4):326-329.
[24] Triola M,Feldman H,Kalet AL,et al.A randomized trial of teaching clinical skills using virtual and live standardized patients[J].J Gen Intern Med,2006,21(5):424-429.
[25] Issenberg SB,Gordon MS,Greber AA.Bedside cardiology skills training for the osteopathic internist using simulation technology[J].J Am Osteopath Assoc,2003,103(12):603-607.