胡珊珊 范懷玉
(濟寧醫學院醫學信息工程學院 日照 276826)
隨著我國醫療信息化的深入發展,醫療衛生領域進入大數據時代[1]。借助于大數據分析和挖掘技術,發現其隱藏的規律,將促進基礎研究、藥物研發、健康服務以及臨床診療等領域的重大變革[2]。數據素養正是一種通過數據分析和挖掘發現數據價值的重要素養[2],醫學生應具備基本的數據素養來應對大數據時代的醫療環境。目前醫學生數據分析和挖掘能力比較弱,數據素養難以達到理想水平。因此應采取有效措施來提升醫學生數據素養水平[3]。數據素養教育是培養學生數據素養的重要途徑,高校在其中發揮著重要作用[4]。數據素養涉及數據意識、數據能力和數據倫理等多方面內容,其核心是對數據進行分析、挖掘的能力,數據挖掘課程是高校培養學生數據素養的重要課程[5]。本文在分析數據素養概念和構成要素的基礎上,以數據挖掘課程為載體,探討醫學生數據素養培養模式。
數據素養是指人們正當、有效地發現、評估和使用數據信息的意識和能力,主要包括數據意識、數據能力和數據倫理3方面內容。其中數據意識是指對數據敏感,具備判斷力和辯證思維,能夠充分感知數據價值;數據能力是指利用工具對數據進行分析和挖掘的技能;數據倫理是指在獲取、使用與發布數據的過程中遵守法律法規和道德規范[3,6]。數據能力是數據素養的核心組成部分,按照數據挖掘和分析流程可分為數據獲取、整理、分析、呈現、應用能力[7]。數據挖掘是一門綜合型交叉學科,其內容涉及計算機科學、統計學、機器學習、人工智能、模式識別、數據庫技術等多個領域,是數據分析和挖掘的技術支撐,是學生數據素養培養的優質載體課程[5,8]。
3.1.1 問題分析 數據挖掘通常以概率論與數理統計、計算機算法等為前導課程,包含大量公式推導和算法分析,理論性較強[9]。醫學生由于其專業背景,在計算機和統計學等方面知識儲備比較薄弱,學習難度大,難以理解數據挖掘算法,更難以將數據挖掘技術應用到醫療大數據中。醫學生數據分析和挖掘能力與職業需求之間存在巨大差距。
3.1.2 教學目標 醫學生是數據挖掘技術的應用人員,課程教學目標應側重于數據挖掘技術應用,讓學生借助所學知識和方法,運用數據挖掘技術對現實生活中的數據進行挖掘分析,獲取隱藏的有價值信息,從而指導決策。同時在教學過程中注重學生數據素養培養,包括培養數據意識、提高數據能力和樹立數據倫理。結合醫學生專業特點與培養目標,數據挖掘課程教學應重思想,輕細節,弱化公式和原理推導,注重挖掘算法實際應用。教師在講授數據挖掘算法基本思想基礎上,重點講授如何實施一個完整的數據挖掘項目,使學生掌握數據挖掘技術在現實生活中的應用。同時學生在執行項目過程中學習數據挖掘方法和步驟,在利用挖掘結果輔助決策時感受數據價值,在潛移默化中提升自身數據素養。需要注意的是實現數據挖掘流程中各個模塊對于醫學生較為困難。因此數據挖掘課程教學應借助某一種數據挖掘工具,通過調用已開發好的包和函數來實現各個模塊,使學生能夠從抽象的原理、算法以及復雜的算法實現中脫離出來,將關注點更多地集中在數據挖掘技術應用層面上。
3.1.3 數據挖掘工具選擇 目前常用的數據挖掘工具一般有 WEKA、RapidMiner、KNIME、Orange以及R等[10]。其中R作為一款開源免費軟件,在統計和制圖方面有顯著優勢,同時提供大量第3方數據挖掘功能包[11],可以被數據挖掘流程各個模塊無縫調用,學生只需調用函數并指定參數即可。R是數據挖掘的理想工具,本文以R語言為基礎開展數據挖掘課程教學。
3.2.1 概述 數據挖掘課程內容比較抽象,醫學生不容易理解,學習興趣不高,因此在課堂教學過程中引入案例教學。教師依據教學內容和目標設計案例,將相關知識點融入到案例中。案例選擇既要有針對性,又要考慮醫學生專業特點,選取生活中真實發生的事件作為案例,如垃圾郵件分類、藥品推薦等,讓學生感受到數據挖掘的現實意義,激發對理論知識探究的積極性。教學形式上,案例教學過程采用現場編寫代碼的方式。教師利用R語言對數據挖掘過程進行現場編碼和調試,將每階段的處理結果以最直觀的形式展示給學生,讓學生體驗數據挖掘中數據變換的流程。這種現場編碼的教學形式能夠充分激發學生學習興趣,提高其分析解決問題能力,提升數據素養。
3.2.2 案例討論 以對案例的數據挖掘過程為主線組織教學。數據挖掘流程可分為數據收集、預處理、挖掘、挖掘結果評價和分析決策等階段[12]。教師要對教學內容進行整合與重構,將知識點嵌入到數據挖掘流程各個模塊中。案例討論過程以數據挖掘流程貫穿其中,重點講述怎樣調用R語言中的函數進行案例數據收集、預處理、挖掘以及利用挖掘結果進行分析決策,將各模塊前后銜接成一個完整的數據處理過程,讓學生在數據處理過程中提升自身數據素養。例如以藥品推薦為案例,講授數據挖掘中經典的關聯規則Apriori算法,見表1。

表1 “藥品推薦”案例教學過程
3.2.3 案例分析 案例教學將數據素養培養融入到案例分析的整個過程,圍繞數據獲取、整理、分析、呈現、應用5種能力展開,這恰好與數據素養的5個能力維度相對應。教師在分析案例的過程中幫助學生樹立數據意識和數據倫理。例如對用藥數據進行挖掘,可以獲得治療某種疾病的高頻用藥以及藥品間的關聯規則,在分析決策階段,教師引導學生對挖掘結果進行分析和評價,發現醫生用藥特點和規律,從而指導臨床用藥決策。此外醫療數據中可能含有涉及患者隱私的信息,如姓名、聯系方式、家族病史等,在數據預處理階段要對這些信息進行屏蔽,保護患者隱私,讓學生懂得在法律和道德允許的范圍內正確使用數據。
3.3.1 理論教學 由于數據挖掘課程課時有限且涉及的知識點較多,僅利用課堂時間難以有效開展案例教學,因此在課程教學中引入翻轉課堂。課前,教師根據教學內容布置任務,學生利用線上教學資源學習相關課程內容。例如在講解關聯規則Apriori算法時,學生可提前學習頻繁項集、關聯規則、支持度、置信度、興趣度等概念以及R語言中的相關函數等。課中,以案例分析為基礎開展課堂教學,師生圍繞案例問題展開討論交流和合作探究,共同完成數據挖掘的完整流程,使學生在分析和解決問題的過程中理解和掌握數據挖掘算法在實際中的應用,從而提高數據處理能力以及數據素養。課后,學生結合個人課堂學習情況,自主地對所學知識進行復習鞏固和拓展延伸,例如利用教師發布的測試題進行在線知識測評,或通過教學平臺學習更多的數據挖掘案例,進一步拓展思維、提升能力。這種翻轉課堂的教學模式使學生在課下進行知識學習,課堂上在教師引導下針對案例問題展開討論,在分析和解決問題的過程中完成知識的內化,不僅提高課堂效率,更激發學生學習主動性和積極性,促使教學主體由教師逐步向學生過渡,真正實現學生為主體、教師為主導的教學理念。
3.3.2 實驗教學 數據挖掘是一門實踐性較強的課程,實驗教學必不可少。通過實驗教學使學生利用課堂所學理論知識解決實際問題,使學生在掌握數據挖掘理論和方法的基礎上提高利用、分析數據的能力。實驗教學采用項目教學法,學生圍繞具體項目展開實驗學習。在實驗教學過程中,教師以理論教學內容為依據,在充分考慮醫學生專業發展的基礎上設計實驗項目,如疾病風險預測、臨床輔助診斷等,以真實案例激發學生實驗探究的主動性。確定項目后,學生自由分組,每組3~4人,通過分工合作完成項目挖掘,要求學生實施數據挖掘的整個流程并完成實驗報告。學生在項目實施過程中掌握數據挖掘各種算法以及這些算法在實際中的應用。通過實驗教學不僅提高學生利用所學知識對實際問題進行分析和挖掘的技能,提升數據素養,也鍛煉團隊協作、溝通交流能力。
3.3.3 考核方式 課程考核是教學過程中的重要環節,是評價學生學習效果的有效手段。傳統考核方式通常以期末考試為主,側重于考查學生對理論知識的掌握情況,忽視對學生實踐能力的評價,更難以反映醫學生真實的數據素養和數據能力水平。因此采用多元化的考核方式,開展過程性評價,將期末考試、實驗、平時成績綜合起來作為學生最終課程成績。期末考試主要考查學生對數據挖掘原理和算法的掌握情況;實驗成績主要評價小組完成項目質量、團隊協作和成員參與及表現等情況,反映學生解決實際問題時的數據分析處理能力;平時成績以學生課堂討論問題的參與度為主要依據,同時結合考勤和作業等多個方面的表現。多元化的過程考核方式不僅對學生理論知識、動手能力和數據技能進行考核,也對學生在學習過程中展現的學習態度、方法和主動性等進行綜合評價,能夠有效促進學生發展以及數據素養提升。
大數據時代的到來對醫學生數據素養提出更高要求,掌握必備的數據技能可使學生更好地適應當前大數據醫療環境。對醫學院校而言,不僅要培養學生醫學專業素養,還應培養數據素養,使其成為綜合型醫學人才。目前我國醫學生數據素養難以達到理想水平,必須構建科學合理的課程體系,積極探索數據素養培養新模式,不斷提升醫學生數據素養。在培養過程中,重點培養醫學生在數據獲取、整理、分析、呈現和應用等方面的能力,同時使醫學生樹立數據意識和數據倫理,能夠認識到數據價值并在法律和道德規范的約束下正確使用數據。醫學生數據素養培養是一項系統工程,需要醫科院校、教師和醫學生多方共同參與合作。在這個過程中,學校和教師要互相配合,開發、整合多種教學資源,為學生提供豐富多樣的學習資源和完善的學習環境;醫學生要充分發揮主動性,探索適合自身的學習方式,在學校和教師引導下不斷提升數據素養。