(內蒙古醫科大學計算機信息學院,內蒙古 呼和浩特 010110)
2016 年國務院辦公廳印發的《關于促進和規范健康醫療大數據應用發展的指導意見》(國辦發〔2016〕47 號)明確提出,健康醫療大數據是國家重要的基礎性戰略資源。健康醫療大數據應用發展將帶來健康醫療模式的深刻變化,將滿足人民群眾多層次、多樣化的健康需求,同時也將對本領域內專業技能人才提出更高要求。如何培養高質量的技術、經濟、管理、社會等領域知識能力并重且能滿足多領域需求的大數據類人才是高校面臨的巨大挑戰[1]。目前,以醫療和大健康行業為依托與背景進行大數據人才培養的高校少之甚少,既具備必需的醫學基礎知識,又精通醫療健康大數據知識與技能的專門人才較為缺乏[2]。2017 年內蒙古醫科大學(以下簡稱學校)申報數據科學與大數據技術專業(以下簡稱大數據專業),并于2018 年獲批,同年9 月開始招收第一屆本科生。該專業定位為立足內蒙古自治區,面向全國,培養健康醫療大數據領域復合應用型人才。依托學校蒙醫藥學、臨床醫學、中醫學、藥學、護理學等優勢專業,為開辦以健康醫療大數據為特色的大數據專業提供了基礎條件,同時也為師生在醫療衛生領域開展大數據研究提供了平臺與保障。在充分吸收借鑒了學校信息管理與信息系統專業(醫學方向)與生物醫學工程專業的豐富辦學經驗基礎上,以及對行業發展動態、人才市場需求等方面進行廣泛深入調研,構建了具備自身鮮明專業特色的大數據專業的培養方案與課程體系[3]。本文針對數據科學與大數據技術專業的大數據導論課程進行教學改革,從知識體系與能力體系等方面分析了培養的要求與目標定位,在知識點的串接、動手能力意識的培養與實際操作方面提出了可供參考的方案。
大數據導論是針對大數據專業本科生設置的一門先導基礎課程,在眾多的專業課程中具有舉足輕重的地位。大數據導論主要探討大數據時代及其背后的科學問題--數據科學的理念、理論、方法、技術、工具、應用及最佳實踐,為學生更好地掌握專業知識以及提升自己的核心競爭力打下堅實基礎[4]。通過大量文獻查閱發現,大數據導論課程一般是在學生第一學年基礎課程教學后的第三或第四學期開設,旨在為學生普及相關專業知識,引導學生進行下一步的專業學習。大數據導論課程在學科基礎課和專業課之間起到了承上啟下的作用。學校大數據專業的大數據導論課程與其他核心課程之間的關系見圖1。

圖1 大數據導論課程與其他核心課程之間的關系
2.1 專業教學與健康醫療領域知識融合不夠 學校大數據專業定位是培養健康醫療領域應用型大數據專業人才,專業特色必須通過課程體系作為載體并且予以體現。醫學與醫學信息類課程數量在課程體系中占有較大比例,旨在要求學生掌握中醫、蒙醫、臨床、預防、藥學、醫學信息學等基本理論知識,實現與后續開設的專業課交叉融合。目前大數據導論課程教學以基本概念和基本理論講授為主,輔以教學案例幫助學生理解掌握,但是在教學過程中存在領域知識與專業內容相互獨立,缺乏滲透融合的問題。當前健康醫療大數據涌現出豐富多樣的新業態與產業鏈,只有在健康醫療領域知識應用的場景下,循序漸進開展理論與實驗教學,學生才能深入了解行業動態,把握正確努力方向。
2.2 學生現有的專業知識結構水平不能滿足案例教學實踐需求 在大數據導論課程開課階段,學生掌握的專業知識有限,獨立解決部分教學案例的實際問題有較大難度。在實驗教學環節,可以布置驗證性實驗,即教師分析案例的主要解決問題思路,將核心代碼交于學生,由其在實際環境中測試運行程序,查看最終結果是否與預期結果相同,達到讓學生深入理解相關大數據理論的內涵以及了解大數據處理分析技術的使用場景的教學目標。在此基礎上,課后可以布置模塊作業,進一步激勵學生通過SPOC、MOOC平臺或其他教學資源,學習專業知識解決遇到的實際問題,如此,可以促進其自主學習能力的培養。
2.3 學習的專業知識碎片化,缺乏有機統一 修讀完不同課程,學生掌握了不同學科的專業知識,很容易出現知識“碎片化”的現象,即知識之間沒有交集,各自為營,缺乏有機統一。設計大數據導論課程的教學案例以及綜合實訓,將所學內容進行整合,真正實現“學以致用”,同時教學案例以及綜合實訓的解決問題思路也可以指導學生后續的專業學習。
按照大數據專業的培養健康醫療大數據領域應用型人才的定位要求,為了實現學科深度融合,體現專業特色,在專業課程體系中,增加了醫學與醫學信息課程模塊。在專業總學分固定的限制下,各門課程在滿足教學基本需求的基礎上對學時進行了壓縮。大數據導論課程在大二上學期(第3 學期)開課,課時為32 學時。到目前為止,已經完成該課程的第一輪教學,通過學生的反饋,教學效果總體較好。但由于以上提及的原因,該課程在教學內容的廣度與深度以及教學方式上,還有較大的提升空間。
3.1 大數據導論課程教學改革目標 知識與能力的培養離不開課程學習、訓練與實習實踐[5]。課程目標是實現專業人才培養目標的基礎[6]。根據大數據導論課程的現狀以及教學中存在的問題,在健康醫療大數據視角下,對大數據導論課程的理論與實驗教學內容以及教學方式進行教學改革,構建基于領域知識大數據導論課程的能力培養遞進模式,旨在為應用型人才的培養奠定堅實基礎。通過基于數據科學基本流程的理論教學,培養學生理論知識能力;通過基于領域知識的真實案例教學,培養學生實踐操作能力;通過基于SPOC 的拓展學習,培養學生自主學習能力;通過基于解決領域問題的綜合實訓,培養學生綜合應用能力。基于領域知識大數據導論課程的能力培養遞進模式見圖2。
3.2 大數據導論課程教學內容改革 這門課程在設計時,首先需要回答一個問題,即如何處理和后續課程的關系,亦即大數據導論課程在廣度和深度方面應該如何設計,才能既避免和后續課程的簡單重復,同時又能夠起到入門和引領的作用[7]。
3.2.1 理論教學內容設計 針對大數據導論課程的定位,在原有的七章教學內容的基礎上進行整合,去粗取精,調整為六個章節。大數據導論課程理論教學內容設計見表1。總之,大數據導論課程教學涵蓋數據科學各個環節,包括基礎理論、數據采集、預處理、存儲與管理、處理與分析、可視化等理論內容,以及各流程的處理方法和技術。
3.2.2 實驗教學案例設計 課程實驗是學生實踐教學的重要組成部分[8]。大數據導論課程的實驗教學案例均來源于醫院內去除隱私信息的真實病歷數據,課程實驗時學生可以盡早熟悉健康醫療領域知識與專業融合的應用場景,達到潛移默化的效果。大數據導論課程實驗教學案例設計見表2。

圖2 基于領域知識大數據導論課程的能力培養遞進模式

表1 大數據導論課程理論教學內容設計

表2 大數據導論課程實驗教學案例設計
3.3 大數據導論課程教學方式改革
3.3.1 以案例分析為主、理論講授為輔,側重學生實踐的課堂教學 根據上述理論教學內容可以看出,大數據導論課程中的概念、定義、知識體系等內容較多,抽象而且晦澀難懂。如果教師在課堂上單純進行理論講授,很難調動學生的學習興趣與積極性。為了加強學生應用實踐能力的培養,教師在講解重點和難點內容之后,對案例進行分析,然后由學生動手完成實驗。案例來源于健康醫療領域真實數據,把大數據理論知識、領域知識以及相關技術融合,有助于學生加深對理論的理解,同時也可以提高其實踐操作能力。
3.3.2 鼓勵借助于SPOC 進行拓展學習的課外教學為了彌補在有限的學時內,課堂內容不能完全覆蓋所有知識面的弊端,可以借助于校企合作建設的SPOC 幫助學生進行拓展學習。SPOC 平臺涵蓋大數據開發技術(Hadoop)、分布式數據倉庫(Hive)、數據庫技術(NoSQL)、消息發布訂閱系統(Kafka)、Scala編程、大數據處理技術Spark(基礎、中級、高級)、Python 編程、數據分析與挖掘、大數據可視化技術、機器學習(基礎、中級、高級)等模塊。期末按照平臺內學生在線時長、作業完成情況等折算一定分數計入本門課程的最終成績,以此鼓勵學生積極開展課外自學與實踐,達到培養自主學習能力的目的。
3.3.3 設計以數據科學基本流程解決現實問題的綜合實訓 課程伊始,教師提前布置綜合實訓。要求2~3 人組成一個團隊,按照數據化、數據加工、數據規整化、探索性分析、數據分析與洞見、結果展現以及數據產品提供的數據科學基本流程,運行環境和開發工具不限,團隊自行設計主題,在期末前完成1 個解決醫學領域現實問題的綜合案例。期末教師安排課外時間,組織各團隊演示答辯,教師和其他組同學按不同權重,共同評分折算分數,計入本門課程的最終成績。綜合實訓不僅可以對學生課程學習效果進行檢驗,而且也可以培養學生的團隊協作能力和綜合應用能力。
開設大數據專業的不同高校立足學科融合,大數據導論的教學內容也不盡相同,各有側重。大數據導論課程改革只有在明確課程目標的前提下,提高課程建設規劃性、系統性,避免隨意化、碎片化,才能達到滿意的教學效果,從而為應用型人才培養提供幫助。