靳瑞霞 陳繼超 徐 強
(新鄉醫學院三全學院智能醫學工程學院,河南 新鄉 453003)
“數據素養”是大數據時代“信息素養”概念的延伸,在大數據時代,“數據素養”幫助人們有效地獲取、解釋、評估、管理、分析并合理地利用數據。基于大數據的分析、決策及人工智能支持作用,各行各業依托大數據的人工智能應用,正在成為推動企業、科研工作等數字化、智能化轉型的利器。因此,“數據素養”被認為是21世紀個人發展的必備技能。2016年6月國務院印發《關于促進和規范健康醫療大數據應用發展的指導意見》(國辦發〔2016〕47號),將健康醫療大數據上升為戰略資源;2018年國家衛生健康委頒發的《國家健康醫療大數據標準、安全和服務管理辦法(試行)》,引領我國醫療大數據的應用與發展,并對“健康醫療大數據”做出了明確定義:指在人們疾病防治、健康管理等過程中產生的與健康醫療相關的數據。另一方面,在“健康中國2030”發展規劃影響下,特別是在人工智能、大數據、云計算等新科技在醫療領域應用的影響下,醫療及醫學應用及研究進入到“新醫科”時代。在這一大背景下,醫學生的數據素養培養被提上日程,成為影響“新醫科”人才培養質量和效益的關鍵因素。
根據健康醫療大數據的定義,健康醫療大數據涉及的范圍非常廣泛,涵蓋公民健康檔案數據、EMR(Electronic Medical Records)數據、LIS(Laboratory Information Management System)數據、PACS(Picture Archiving and Communication Systems)數據、醫療費用及醫療保險數據、醫藥研發及流通數據、公共衛生健康數據、基因測序數據、遠程醫療數據、在線醫療數據、醫學科學研究數據、等等。基于這樣廣泛的范圍涵蓋面,健康醫療大數據除了具有大數據基本的數據量巨大(Volume)、數據增長速度快(Velocity)、數據結構多樣化(Variety)、數據價值大、價值密度低(Value)4V特性以外,還具備一些獨特的典型特性,具體如圖1所示。

圖1 健康醫療大數據的特性
如圖1所示,除了大數據的基本4V特性以外,健康醫療大數據還具有微觀性(microcosmic)、連續性(continuity)、全面性(comprehensive)、冗余性(Redundancy)等典型特性。其中,微觀性是指健康醫療大數據可以從關注特定某項疾病的診療數據、生命個體飲食數據、運動數據、睡眠數據等體現某個單一方面的數據等微觀性方面入手挖掘數據的價值;連續性包含兩個方面的含義,首先體現為涵蓋人類個體全生命周期的多點數據方面;其次則指包含診療全過程(從患病到痊愈)的數據,都體現了時間序列的連續性;全面性指健康醫療大數據不僅指生命體軀體健康相關數據,還包括生命體心理健康等的各個方面;冗余性則是指健康醫療大數據中存在著大量相同的、類似的診療信息,或與當前疾病診療無關的檢查信息等,數據的冗余性比較高。
健康醫療大數據的復雜特性,給相關的醫學生數據素養的內涵界定帶來了較大的困難。目前對于醫學生數據素養的內涵還未有統一的界定標準。本文在分析健康醫療大數據特性的基礎上,引入“生命周期理論”,對醫學生數據素養內涵進行分析。“生命周期”一般指一個事物、生物或一項技術等從“搖籃到墳墓”的整個過程。基于此,大數據生命周期則指“大數據從產生、獲取、分析、應用到歸檔、銷毀的全過程”。目前,關于大數據生命周期的階段并未有明確的統一界定,業界有“五階段(數據收集、數據分析、數據定價、數據交易、數據版權保護)”、“六階段(數據采集、數據存儲、數據處理、數據傳輸、數據交換、數據銷毀)”、“七階段(數據定義、數據采集、數據存儲、數據整合、數據呈現、數據分析和應用、數據歸檔和銷毀)”等分類方法。其中,從應用角度來看,七階段分類方法對應用流程的分解更為細化。本文基于大數據生命周期七階段應用流程,對大數據時代醫學生數據素養內涵進行分析,具體如表1所示。

表1 基于大數據生命周期的醫學生數據素養內涵解析
新醫科的知識結構具有多元交叉的復合特征,需要在傳統的醫學人才培養知識結構體系中融入與數據科學相關的大數據、云計算、機器學習等知識。因此,在“新醫科”建設時代,醫學生數據素養培養已經迫在眉睫,高等醫學院校必須將數據素養培養提上日程。基于此,本文在實踐基礎上提出以下醫學生數據素養培養方案。
高等醫學院校作為高等教育的重要組成部分,其人才培養模式以課堂教學為主,課程體系設計是高校教學工作開展的關鍵。基于表1所示的醫學生數據素養內涵,設計梯度遞進的醫學生數據素養培養課程體系。具體如表2所示。

表2 醫學生數據素養培養課程體系
2.1.1 基礎梯度
高等醫學院校擔任著為社會培養新醫科人才的重任,一方面基于健康醫療大數據的類型及特征,基礎梯度課程主要幫助醫學生認知健康醫療大數據對醫療行業及醫學研究的價值,培養醫學生對健康醫療大數據進行范圍界定、價值評價等的能力;另一方面還要注重對醫學生進行健康醫療大數據應用相關倫理道德等方面的教育,培養其規范、合理使用健康醫療大數據的道德感、責任感及安全意識,從而促進我國新醫科建設的發展。
2.1.2 核心梯度
通過醫療數據采集與處理、醫療大數據分析與應用(Python)等大數據技術相關核心課程的學習,幫助醫學生在就職后的衛生信息化工作環境中,能夠獲取有效的健康醫療大數據,并能夠對其進行分析、呈現及應用,支撐其做出更為優化的診療、健康管理方案等。在智慧醫療突飛猛進的時代背景下,提升醫學生的職業能力。
2.1.3 高階梯度
通過高階課程,培養醫學生的創新思維及高階能力,推動醫學生積極參與到基于健康醫療大數據的醫療服務智能化研發及應用進程中,并在“醫教協同、科教協同、科衛協同”的醫學教育改革過程中,以各類科研項目、創新大賽、畢業設計等形式為抓手,從做中學,培養醫學生應用大數據技術的能力,提升其智能醫療水平,從而推進新醫科建設發展。
在三級梯度的醫學生數據素養培養課程體系的基礎上,構建多元化的醫學生數據素養培養模式。
2.2.1 多元融合的數據素養培養模式
醫學院校結合日常教學工作,可采用多元融合的方法,培養醫學生數據素養。首先,以講座、研討等第二課堂形式,將健康醫療大數據前沿知識融入醫學生的學習體系中,拓寬學生視野,激發學生的學習興趣;其次,在醫學生專業課程中設置數據素養培養的知識模塊,或以實際案例的形式在專業課課程教學中,融入數據素養培養知識,實現數據素養培養知識體系與醫學專業知識體系的深度融合,以應用需求引領學生主動學習;最后,要落實新醫科建設,新醫科復合型的創造性人才和實踐性人才培養至關重要,醫學高等院校應拓寬思路,以產教融合為切入點,產學研用一體化發展,提升數據素養知識體系的實踐性,將數據素養培養落到實處。
2.2.2 基于教育信息化的多元混合教學模式
2018年教育部發布《教育信息化2.0行動計劃》,標志著我國教育信息化進入了2.0時代。在“互聯網+教育”理念影響下,教育信息化應用模式不斷創新,例如,翻轉課堂、移動學習、BYOD(Bring Your Own Device)學習、SPOC學習、MOOC學習、UOOC學習等多元模式的應用,對新時代的教育起到很大的促進作用。醫學院校應充分挖掘教育信息化的教學輔助潛力,采用多元混合的教學模式,在保證醫學知識體系教育質量的前提下,積極推進數據素養培養。例如,數據素養培養課程體系采用線上線下雙線混合的教學模式,可以幫助學生很好地預習、復習課程內容,并能夠使教師的翻轉課堂教學獲得更好的效果;而采用SPOC學習、UOOC學習、MOOC學習等模式,則可以幫助學生利用碎片化的時間隨時隨地開展學習,特別是可以更加深入地開展自主學習,學生根據自身的學習情況,自主安排學習進程,獲得更好的學習體驗。
2018年4月教育部高等教育司司長吳巖指出“新醫科將推進醫工理文融通,緊密結合以人工智能為代表的新一輪科技革命和產業革命,全面整合精準醫學、轉化醫學等方興未艾的醫學新領域”,而大數據和算法是人工智能應用的前提。因此,醫學生數據素養已成為新醫科人才培養的基礎及關鍵因素。健康醫療大數據的特性復雜,導致醫學生數據素養內涵界定存在一定難度。本文首先基于數據生命周期理論,從“數據定義、數據采集、數據存儲、數據整合、數據呈現、數據分析和應用、數據歸檔和銷毀”等應用層面,分析挖掘醫學生數據素養的能力內涵;然后從構建梯度遞進的醫學生數據素養培養課程體系、多元化數據素養培養模式建設等方面展開研究,以期能更好地開展醫學生數據素養教育,培養適應大數據時代發展需求的新醫科人才。