閻 潔 楊俊麗 王建文 楊 帆
(山西醫科大學計算機教學部 太原 030001)
生物信息學是綜合計算機科學、數學、生物學等多門學科理論及方法,通過對研究對象相關數據的采集、處理、計算模擬和分析認識其本質,揭示其內在機理的學科[1-2]。目前生物信息學主要應用于生物學研究中蛋白質組、代謝組、基因組、轉錄組等各種組學數據的分析和處理。隨著各學科數據的積累,運用數據揭示學科中某一類共性問題的本質具有重要意義。醫學作為以人體復雜系統為研究對象的科學,在解決具體病癥時常需要綜合考慮和分析引發某一病癥的多維數據[3]。在具體實踐中生物信息學綜合運用計算機科學、數學對已有的診斷和治療數據進行深入分析,對相關病癥的準確診斷及治療方案的合理制定和優化具有重要意義[4-5]。生物信息學技術其具有的通過對數據采集、處理、分析以確定研究對象本質的特點,在醫學領域中的應用得到逐步推廣,各大醫學院校相繼開設生物信息學課程作為醫學專業本科生的必修課或選修課,以培養學生運用現代新技術,提高其在醫學實踐中準確診斷病癥和合理制定治療方案的能力[6-7]。
隨著生物信息學所處理數據的數據量和復雜性增加,需要一種功能全面的專業語言和軟件工具,R語言較傳統統計軟件具有更好的可編程性、體量小、功能強大及易于擴展的特性,在現代生物信息學大數據統計分析中得到廣泛應用[8-9]。目前各醫學院校為適應大數據時代醫學生基于已有診療數據進行診斷分析等需求,所開設的生物信息學課程大多以R語言作為相關實驗教學工具。因此如何有效地結合R語言設計生物信息學課程實驗內容并有效開展,對提高生物信息學課程實驗教學效果具有重要意義。本文在借助文獻分析生物信息學及R語言特點的基礎上,結合醫學院校學生在實際工作和研究中對生物信息學的應用需求特點,探討基于R語言的生物信息學課程實驗設計并結合教學實踐評價實驗設計效果。
生物醫學數據特點由生命本質所決定,生命體內部運行機理、生理生化反應以及病理變化等是其復雜性的內因。得益于高通量生物技術如二代測序技術的發展,生物醫學數據呈現出爆炸性增長趨勢。
生物信息學是基于分子生物學和多學科交叉而形成的一門前沿學科,在生物和醫學領域有較廣泛的研究和應用,國內外眾多高校相繼開設生物信息學課程。醫學院校學生雖然對生物化學、分子生物學、生理學、遺傳學、細胞生物學等學科基礎知識的掌握較為全面和扎實,但生物信息學課程理論性較強、覆蓋面較廣,學生認為其與其他生物醫學課程結合不夠緊密,較難將生物信息學的知識和原理融入到現有的知識體系當中。
生物信息學主要借助于統計算法分析生物大數據所包含的生物學意義,要求學生有一定的計算機技術和數學基礎,能夠結合計算機編程和算法實現對具體問題的分析。目前在生物信息學相關數據統計和處理中常用的工具有Matlab和開源的R語言,由于Matlab屬于商業收費軟件,在實際應用尤其是高校教學中受到一定限制;R語言因其自由、免費及源代碼開放等優勢得到了廣泛應用。
生物信息學主要借助計算機,通過統計學方法分析生物學數據以揭示其中包含的內在信息,因此需要一種功能強大的數據處理和分析軟件作為工具。R語言具有強大的數據分析能力、簡捷高效的編程及用戶自定義功能。
一是自由。R語言編譯軟件免費且源代碼開放,學習者可在其鏡像或學習網站免費下載安裝包、源代碼及相關學習資料。二是可編程性。R語言與其他統計學軟件如SAS,Matlab等相比語法更加通俗易懂且允許使用者編制個人函數以擴展現有語言。三是更新快。R語言軟件標準安裝包中包含基本常用的程序包,且隨著新算法的出現,新版本中會及時更新新算法對應的程序包。四是互動性強。R語言可以實現同窗口輸入和輸出,且兼容多種圖片格式的圖形文件輸出。五是跨平臺性。R語言軟件包可在Windows、Linux及Mac OS等系統中兼容運行。此外R語言具有強大的數據分析和處理、整合及圖形圖像顯示功能,對強調訓練學生統計、數據分析等能力的專業優勢明顯。
R語言應用于生物信息學教學實踐中不僅可以很好地結合理論、案例分析,還可極大地調動學生學習積極性,因此R語言在生物信息學相關課程的實踐教學中得到廣泛應用。目前國外眾多大學統計及生物醫學和環境科學專業相關課程都將R語言作為教學工具軟件。在結合生物信息學課程及R語言特點的基礎上,本研究開展基于醫學生的生物信息學實驗設計和教學工作,通過以學生為中心的實驗教學設計提高學生對生物信息學知識應用的掌握。
一是教學內容設置寬泛。由于生物信息學理論知識覆蓋面廣等特點,目前在實驗教學的開展中重點不聚焦、不突出,實驗課教學內容、實施方式、教學大綱及實驗指導書內容不完善,難以形成具有針對性的教學案例。二是教學方式單一,缺乏培養學生解決問題能力的理念。實驗課內容設置較為簡單或抽象,常演變為驗證性實驗或單純執行教師提供的代碼,缺少分析、解決問題的思路和過程,缺乏以解決某個具體問題為目的的設計性或綜合性實驗。
4.2.1 教學計劃 山西醫科大學從2016年開始為生物制藥專業本科生開設生物信息學課程,針對開課專業學生的知識背景及培養目標,結合生物信息學課程特點,課程團隊結合參考教材、教學經驗、學術科研和學生專業背景等因素對生物信息學實驗進行綜合設計。根據實驗教學的12個學時進行教學內容的劃分和整合,設計生物信息學教學計劃,見表1。

表1 生物信息學實驗教學計劃
4.2.2 特點 一是以學生為中心的教學設計。使學生充分利用文獻檢索、網絡教學視頻、多媒體和技術等學習方式,在掌握基本理論知識的基礎上通過自主探索、分析解決實際問題,進一步培養學生學習積極性和主動性,加深對所學內容的理解和應用。二是多種教學模式相結合下以R語言為工具的實驗模式設計。根據生物信息學課程特點和R語言功能,采用“教師講授+案例演示+實驗實踐+基于問題學習+個性化自學”的生物信息學實驗教學模式,以醫學相關專業學生在具體工作實踐中的需求為導向,通過實驗培養學生自主能動性和團隊協作能力。三是基于網絡平臺的擴展訓練。針對實驗教學學時有限,教學內容從廣度和深度均不能滿足具體專業學生解決實際問題需求的情況,教學團隊在課堂實驗的基礎上設計基于E-learning教學平臺的實驗擴展訓練,平臺整合課程教學課件、相關專業實驗數據、實驗手冊供學生課后練習,進一步鞏固其對相關內容的掌握。
4.2.3 實驗實例 采用R語言擴展包ggplot2中的函數對生物數據鳶尾花數據集進行分類。所分析數據包含150個數據集,分為3類,每類含50條數據,每條數據包含4個屬性。可通過花萼長度和寬度屬性預測鳶尾花卉的具體類別,分類結果,見圖1。

圖1 鳶尾花數據集分類結果
4.2.4 成效 基于上述實驗教學方案的改革和設計,經2017、2018級生物制造專業生物信息學實驗教學實踐,表明兩屆學生期末實踐能力考核成績較2016級分別提高3.5%和4.25%,進一步說明生物信息學實驗實踐訓練及合理設計實驗的重要性。
生物研究領域中基因測序技術的發展極大地促素養的評估、評價等方面還有待進一步研究。總之,構建“三位一體”的信息素養教育模式是提高護理人員信息素養的有效途徑和方法,但需要不斷探索、改進、完善。