張云秋,郭明昊
(吉林大學公共衛生學院,吉林 長春 130021)
隨著大數據時代的到來,大數據對教育的影響將是巨大而深遠的。在醫學領域,伴隨著現代技術的發展,精準醫療的推進,大數據將與醫學進行高度融合。獲取數據、管理數據、分析與利用數據將成為醫學工作者和醫學科研人員進行研究和學術交流的必要素養之一。為了培養適合未來醫學科學發展需要的創新型醫學人才,開展針對醫學生的數據素養教育研究已迫在眉睫。
最早提出數據素養概念的Schields M認為數據素養是信息素養的延伸,強調了數據的訪問、處理和組織能力[1]。雖然對于數據素養的定義尚未形成統一,但數據素養離不開數據。在大數據語境下,數據的范疇要大于信息的范疇。因此,較之信息素養,數據素養的外延應更廣,數據素養應是指貫穿于數據生命全周期的數據采集、表示、描述、發現與檢索、選擇與評價、分析、利用、引用、整合、復用、保存、管理等一系列活動所需的技能,其核心是數據的分析與利用。
當前,對學生數據素養能力評價的相關研究主要面向研究生。例如李楣利用包括數據意識、數據收集與評估、數據組織與管理、數據處理與分析、數據利用與歸檔及數據倫理等六大類19個指標的數據素養評價量表對305名研究生進行了調查[2];程璐設計了包括數據意識、數據知識、數據能力、數據倫理和道德四個方面共20個題的問卷對武漢大學345名研究生的數據素養現狀進行了調查[3]。對不同學生群體數據素養現狀的調查與分析是開展數據素養教育實踐的基礎。本研究針對醫學本科生這一群體,設計數據素養調查問卷,以吉林大學為例,對其醫學本科生的數據素養現狀進行調查,并據此提出教育策略,為開展相應的數據素養教育提供參考。
基于數據素養概念及其評價指標,針對醫學生的特點,確定了數據意識、數據獲取、數據組織與管理、數據分析、數據共享與安全、數據倫理6個評價維度17個指標的數據素養評價體系。該評價體系將數據素養作為一個表現數據生命周期各環節要素綜合能力的基礎,保證了整個體系的完整性,并且各維度以及指標間有內在的邏輯關系。維度1到6是遞進的過程,表示數據生命周期中各環節需要掌握的能力,也可以看成是利用數據的流程。
據該評價指標體系采用李克特五點法的測量方法設計,涵蓋各維度和指標,包括被調查者基本信息以及用以篩查無效問卷而設置的問題共計52道題的調查問卷。為確保調查問卷的精確程度,首先隨機發放50份問卷,回收50份,根據結果對問卷的信效度進行檢驗。
結果顯示該調查問卷信、效度良好(α系數為0.951,KMO值為0.941)。
(一)現狀調查。
1.樣本說明與被調查者基本情況。本研究使用問卷星系統通過微信、QQ等方式發放給吉林大學白求恩醫學部各學院、各年級、各專業的共822份電子問卷,回收822份問卷,回收率100%。剔除無效問卷67份,剩余755份,有效率達到92%。對有效問卷的基本情況進行統計。
被調查者的基本情況為:男生占29.8%,女生占70.2%;三年級接受調查的人數最多,占48.87%;學院分布中,臨床學院和藥學院受調查者占總人數的55.89%。68.48%的被調查者上網時間范圍在1~5小時/日;其上網目的順序為:休閑娛樂、查閱資料、網上聊天、瀏覽新聞;獲取數據信息途徑的順序為:手機、電腦、紙質文獻、廣博和電視;在掌握數據處理與分析工具方面,利用Excel和SPSS的人較多,但相較于被調查總人數,其占比仍然比較小,說明總體上掌握利用相關工具的人數很少。
從被調查者基本情況可以推測,雖然醫學本科生經常使用網絡,但少有學生能利用網絡來獲取數據,分析數據,并且能掌握相關技能。為了驗證這一推測,繼續對調查問卷的結果進行統計分析。
2.數據素養水平分析。(1)總體水平分析。本研究調查問卷包含38道主體問題,反映數據素養水平,通過對調查問卷這部分內容的結果進行統計分析,得出總體的得分情況。數據呈偏態分布,被調查者的平均得分為(123.76±21.44),最大值為190,最小值為38,四分位間距P25=114、P50=125、P75=137,其均值處于P25~P50之間,說明被調查的醫學本科生數據素養總體屬于中等偏下;標準差為21.442,說明總體水平的波動較大,被調查者的數據素養水平差異明顯。(2)各維度水平分析。本研究的調查問卷共分為六個維度,分別對其結果進行統計,結果如下(見附表)。由結果可以看出,各維度的得分都在中等偏下,均值都在P50左右分布;“數據分析”維度的標準差較其他維度來說更大,說明結果波動較大,該維度上被調查者的差異性明顯,能力參差不齊。數據倫理得分較其他維度偏高,說明被調查者在數據倫理維度水平較其他維度好。

附表 吉林大學醫學本科生數據素養各維度水平情況
3.數據素養影響因素分析。根據調查結果,進一步分析性別、學院和年級對被調查者數據素養水平的影響。由于這幾個特征下的數據素養得分均服從非正態分布,所以對于性別采用Mann-Whitney檢驗方法;對于學院和年級采用Kruskal-Wallis檢驗、中值檢驗以及Jonckheere-Terpstra檢驗方法。
性別的結果上P<0.05,說明數據素養在性別間的差異有統計學意義,為進一步分析男女在數據素養的哪個維度存在差異,采用以上的方法對各維度的結果進行進一步分析。結果顯示:性別在數據意識、數據獲取、數據組織管理、數據分析維度上P<0.05,存在統計學差異,而且均值得分上均表現出男生的得分略高于女生。
學院的結果上P>0.05,表現出各學院的被調查者在數據素養能力上沒有統計學差異;但在年級的結果中P<0.05,說明不同年級間的數據素養差異有統計學意義,進一步通過兩兩比較后發現四年級與一、二、三年級之間都存在統計學差異。
(二)現狀分析。
從吉林大學醫學本科生的調查結果看其數據素養現狀如下。
1.醫學本科生的數據素養水平總體屬中等偏下,尤其在數據素養的核心內容“數據組織與管理”與“數據分析”維度上結果不佳,說明醫學本科生對數據的組織管理以及數據分析中的流程、使用方法以及工具掌握方面還很弱。數據倫理維度得分較高,說明醫學本科生具有較高的相關法律意識。
2.醫學本科生的數據素養總體水平和各維度水平均呈現出個體差異,尤以數據分析維度最為嚴重。分析其原因是當前數據素養教育尚未系統展開,雖然醫學本科生總體數據素養水平較低,但依然有學生根據個人興趣,有意識地培養自己的數據意識和學習相關的知識,因而會呈現出這樣的差異。
3.性別與年級對醫學本科生的數據素養水平有影響。性別上的影響表現在數據意識、數據獲取、數據組織與管理、數據分析維度上,分析可能原因是性別本身的特性所致;年級上,數據素養水平隨著年級的增加而增加,并且這種增加到四年級才有統計學差異。說明隨著年級的升高,數據處理分析的需求在增加;另外,隨著年級的升高,學生通過某些課程,如醫學信息檢索課和一些專題講座的滲透也獲得了一些與數據有關的知識。而不同學院的學生數據素養水平沒有明顯差別,說明數據素養可能在學科專業上的差別較小,也可能與未開設數據素養專業教育和有針對性的數據分析利用的課程有關。
面向當前醫學生數據素養水平偏低,數據素養存在個體差異以及年級對數據素養的影響等現狀,在目前階段提升醫學生數據素養,從高校的視角,需綜合考慮學校和學生的實際情況。從學校層面,需要進行數據素養教育的基礎條件建設,包括組建教師團隊,構建課程群,建設實踐平臺;同時,從學生層面,需要考慮醫學生的培養目標、學制、課程安排等特點。形成意識引導、教育實踐和環境創造為主線的分階段、分層次、多維提升策略。
在意識引導方面,雖然從調查結果看,目前的醫學本科生均有一定的數據意識,但數據管理與分析能力的缺乏又表明其數據意識尚待深入。意識引導應從新生入學開始,持續滲透,樹立數據素養理念。在教育實踐方面,應確立培養目標,確定教學內容,組建多學科協作的教學團隊,構建多層次、動態的、開放的課程體系;在環境創造方面:(1)加強校園數據素養文化建設,搭建流暢的數據素養交流平臺;(2)要與企業機構聯合,建設數據素養實踐平臺。
分階段、分層次、多維提升策略綜合考慮了醫學本科生的培養階段、教育目標分類和數據素養能力構成。分階段是指醫學本科生的培養大致分為通識教育、學科基礎教育和學科專業教育三個階段;分層次是指學生的認知過程包括記憶、理解、運用、分析、評價和創造六個層級;多維是指數據素養包括數據意識、數據獲取、數據組織與管理、數據分析、數據共享與安全、數據倫理等能力指標。該提升策略在醫學本科生通識教育階段,通過專題講座和文化滲透培養學生的數據意識,同時進行數據素養基本課程,如計算機科學的相關知識學習;在學科基礎教育階段,開展課程群的核心課程,如統計學和數據分析的學習,并按照學生認知層次,由淺入深設計課程內容和教學方式,旨在形成數據素養的核心能力;在學科專業教育階段,結合實際的專業需求和認知層次,借助數據素養實踐平臺,著力培養學生圍繞解決問題的數據分析的實際操作能力。
要將醫學本科生數據素養教育落到實處,對現狀進行調查分析,并提出可行的提升策略至關重要。本文在對數據素養相關概念進行界定的基礎上,設計數據素養能力調查問卷,對筆者所在高校的醫學本科生數據素養進行調查,對現狀分析,并提出以意識引導、教育實踐和環境創造為主線的分階段、分層次、多維提升策略。旨在拋磚引玉,希望能引起關于醫學本科生數據素養教育的廣泛討論,為其教育實踐打下基礎。