張一名,褚卓棟,侯志敏,韓曉光
(廊坊師范學院,河北 廊坊 065000)
生物信息學(Bioinformatics)是解決生命科學領域實際問題的工具學科,其定義為:“研究生物系統中的信息和信息流的科學分支”。[1]早期的生物信息學伴隨計算機技術的發展,主要對小規模的數據進行處理。[2-4]而近年來,在“互聯網+”、“大數據”以及“高通量技術”的大背景下,生物信息學隨著 基 因 組 學(genomics)[5]、轉 錄 組 學(transcrip?tomics)[6-7]、蛋白質組學(proteomics)[8]、代謝組學(metabolomics)[9-10]以 及 微 生 物 組 分 析(microbi?ome analyses)[11]等組學(omics)技術的發展,進入了一個嶄新的階段。
通過美國國立生物技術信息中心(National Center for Biotechnology Information,NCBI)數據庫PubMed索引的文獻計量數據來看,生物信息學相關檢索論文數量在全部論文總數中的占比逐年上升,逐步超過了模式植物擬南芥(Arabidopsis thaliana)與主要作物大豆(Glycine max)、小麥(Triticum aesti?vum)相關論文檢索數量的總和,2005年甚至超過了模式生物大腸桿菌(Escherichia coli)與酵母(Sac?charomyces cerevisiae)的檢索數量之和。直至2017年,大約每20 篇生命科學領域的論文中就有1 篇應用了生物信息學相關技術。加之近幾年生物信息獲取技術產業化發展迅速,研究成本逐年降低。越來越多的生命科學工作者在較少的經費支持下就可以與生物公司合作進行獨立的生物組學研究。[12]由此不難看出,生物信息學研究手段在生命科學研究領域已經進入了普及階段,掌握生物信息學技術也成了從事生命科學研究的基本要求[13],同時也給生命科學的教育領域帶來了革命性的改變[14]。
由于對專業深度、知識廣度等方面有著較高要求,生物信息學教育一直屬于高等教育的范疇,從廣義上可定義為:利用計算機和信息技術,收集、存儲、分析、解釋和整合數據以解決生物學問題的教學和學習活動。[15]最早的生物信息學教育已難以考證,有報道顯示,在上世紀80年代,以計算機技術著稱的美國卡耐基梅隆大學(Carnegie Mellon Universi?ty)就已經開設了“計算生物學”(computational biolo?gy)本科專業。[16]當時,“生物信息學”的概念尚未形成,“計算生物學”在技術水平的限制下,其學科體系難與現今的生物信息學相提并論。當時的“計算生物學教育”已經在“應用計算機技術解決生物學問題”的領域內開始了教學和學習的實踐探索。因此,上個世紀末的“計算生物學”教育就是現今生物信息學教育的前身。
1998 年,當人們還在爭論生物信息學的學科定義時,羅斯·奧特曼(Russ Altman)就提出了生物信息學教育的根本問題:如何設置課程來適應生物信息學人才的培養[17],同時也是生物信息學教育步入正規化的開始[18]。2001年,“國際計算生物學學會”(International Society for Computational Biology, IS?CB)“教育委員會”(Education Committee of ISCB)從“理論與方法”“技術適用范圍”“數據類型”三個方面,首次指導性地推薦了生物信息學教育應包含的核心內容,2001 年4 月在其網站(http://www.iscb.org/iscb-edu.shtml)發布。[15]同年六月,首屆生物信息學教育研討會(Workshop on Education in Bioinformat?ics, WEB)作為國際分子生物學智能系統會議(In?ternational Conference on Intelligent Systems for Mo?lecular Biology, ISMB)的分會議在丹麥哥本哈根召開。[19]WEB 開創了首個生物信息學教育國際交流平臺,其致力于基本的生物信息學教育教學問題,探討各教育層次的性質、程度、內容以及傳播工具,并提供指導建議。[18]2002 年,英國的生物信息學教育在當時已經處于領先地位,全國有25所高校開設了相關課程,達米·康塞爾(Damian Counsel)在對這些院校進行調研后,歸納出了當時以研究生教育為主的生物信息學教育特點(表1)[20],該成果至今仍具有重要意義。

表1 生物信息學教育的主要特點
隨著技術的快速發展,僅憑研究生階段的課程建設已經不能彌合生命科學領域日益明顯的信息學“技能裂隙”(skills gap)[15]。在德國,在“國家研究基金會”(Deutsche Forschungsgemeinschaft, DFG)以及“聯邦教育與研究部”(Bundesministerium für Bildung und Forschung, BMBF)資助和倡議下,經生命科學、計算機科學、數學、化學等領域的研究人員共同努力,從1998到2007年間,已有17所大學和科研機構新開設了生物信息學課程。其教學主要針對碩士或博士研究生,并且已有少數機構同時開設了面向本科學生的生物信息學課程。[21]在美國,較早的有斯坦福大學的“生物醫藥信息學培訓計劃”(Biomedical Informatics training program)以及耶魯大學的“生物信息學跨學科博士”(Interdepartmental Ph.D. program in computational biology and bioinfor?matics),都是在研究生水平展開的專業教育,能夠授予生物信息學學位。而且兩者都在消除了學科壁壘的前提下,又強調了根據不同學生的知識背景,分別設置不同課程的教育策略。[22-23]
這樣,從上世紀末到在本世紀初,隨著生物信息學技術進入成熟期[24],生物信息學教育也迅速發展起來。生物信息學的課程和學位建設已經覆蓋了包括碩、博士研究生以及本科的各個高等教育層次,[25]甚至在以色列,已經開始嘗試在高中階段中融入生物信息學教育內容的探索。[26]時至今日,除西方發達國家以外,許多發展中國家,也開展了不同形式的生物信息學教育工作,形成了全球范圍內百花齊放、共同繁榮的局面。
作為包含生物學、計算機科學、數學和統計學等眾多領域內容的交叉學科,生物信息學內容覆蓋范圍極其廣泛,學習個體難以同時掌握所有相關領域的全部內容。因此,根據不同人群對生物信息學教育的個性化需求,歸納學科核心素養,進而構建教育目標分類方案,是當下該學科教育研究工作的主流方向之一。
有研究指出,對于科研機構的生物信息分析崗位和專門從事生物信息分析的中心機構,其技術人員的生物信息學能力應該包括:(1)熟悉基于UNIX的操作系統;(2)熟悉各種編程語言,以及命令腳本的應用;(3)了解UNIX 集群的并行計算環境;(4)了解基于網絡的數據存儲;(5)了解生物學和生物組學的一般知識;(6)能與非IT背景的研究人員無障礙交流;(7)能夠開發新的軟件、工具或分析方法;(8)了解相關數據庫和數據庫體系結構;(9)能夠發現、制定和測試新的生物信息學軟件和分析規程。[27]從中可以看出,此類崗位的技能需求偏重于信息技術(Information Technology,IT)領域。對于生命科學背景的學生或科學家,幾乎不可能全面掌握以上內容,他們尋求生物信息學培訓大多是為了實現個人的研究構想,或者從現有數據中發掘新的潛在研究方向。作為“普通用戶”的一般生命科學研究人員,生物信息學多限于“計算機分子生物學”,與之相適應的培訓項目也更多側重軟件工具的使用,而非分析工具的開發。[15]
面對不同學習群體在知識背景和應用領域方面的巨大差異,生物信息學教育急需一個指導性解決方案。為此,“國際計算生物學學會教育委員會課程工作組”(ISCB’s Education Committee Curricu?lum Task Force,CTF)對世界范圍內的研究機構以及從業人員進行了大量調查、研究。基于調研結果,概括性地將需求類型分為:“生物信息學用戶”(Bio?informatics users)、“生物信息學科學家”(Bioinfor?matics scientists)以及“生物信息學工程師”(Bioin?formatics engineers)三個群體(表2)[28];此外,CTF 以多年前期工作為基礎[29],兼顧概括性和精準性兩方面考慮,歸納出了包含16項內容的生物信息學核心素養框架(表3)[16],涵蓋了目前從事該領域相關工作的全部內容,并依據“布盧姆教育目標模型”(Bloom′s Taxonomy),對常見的目標群體進行了針對性的教育目標分類(圖1)。該成果是現今最新、最全面的開放式生物信息學教育指導方案。以此方案為框架,教育工作者可以通過有針對性的調研結果,對其內容進行調整和完善,以適合不同社會背景。依據該方案的指導,可以為不同目標群體精準劃定教育內容,從而最大程度上滿足生物信息學教育的個性化需求。
在認識到生物信息學教育的重要性并廣泛展開相關展教育工作之后,該領域的教學探索一直沒有中斷,雖然也積累了一定的經驗,但是如何將生物信息學教育更加有效地融入目前已經成熟的高等教育體系仍是當前教研工作的一個重要方向。
國外在生物信息學課程教育的融合方面,應用最多的方式是通過開設一門或者一系列相關課程來實現。但是,當前越來越多的高校和機構開始在原有的課程基礎上,融入生物信息學的相關學習模塊,并且已經得到了更好的教學效果。在課程建設過程中,西方更重視將生物信息學內容融入生命科學相關專業的教學體系中,[30]提倡“問題導向式學習”和“探究式學習”的教學模式,不僅易于調動學生的積極性,而且契合生物信息學作為工具學科解決生物學問題的初衷。此外,由于生物信息學的網絡特性,使得遠程教學一直是生物信息學科課程教學的重要手段之一。[31]

表2 生物信息學應用需求分類

表3 CTF歸納的生物信息學核心素養

圖1 生物信息學部分應用群體的核心素養教育目標分類(布盧姆模型熱力圖;根據文獻[16]數據繪制)
當生物信息學作為一個獨立專業融入高等教育時,多數高校開設的學歷教育都是面向研究生層次;或者在開設研究生專業的同時,設置相應的本科專業;極少有院校單獨開設生物信息學的本科專業。這種現象也印證了一般新興學科的教育首先出現在研究生水平,而其對應的本科教育是隨著該學科的進一步發展逐漸建立起來的。[31]此外,對于新專業的學院歸屬問題,許多高校根據不同的自身定位和特點將生物信息學專業歸口于生命科學學院或計算機學院[20],除此之外,有的高校開始打破學科和專業界限,使生物信息學的專業教育獨立于具體的某一個學院,專門為其創建全新的跨學科課程體系[22-23]。
在教育工作者的努力下,生物信息學教育在正規教育體系中的融合已日趨成熟,但在個別領域依舊存在障礙。比如,美國生物信息學與生命科學教育整合網(Network for Integrating Bioinformatics into Life Sciences Education,NIBLSE)針對生物信息學在目前生命科學本科教育體系中的融合問題,對目前美國全國的大學生命科學教育體系進行了考察,結果表明:缺乏教職人員是生物信息學融入當前教育體系的主要障礙,而接受生物信息學訓練最多的新進博士教師往往面臨著大量的科研任務,而不能成為生物信息學教學的主力軍。此外,學生學習興趣低迷,缺乏前期知識儲備以及難以獲得教學所需的軟、硬件支持等情況也不同程度地阻礙了生物信息學在當前教育體系中的融合。[32]該結果雖然僅僅代表了美國國內的教育經驗,但為世界范圍內的類似問題解決提供了參考,也為今后的生物信息學的教育融合研究指明了努力的方向。
鑒于生物信息學教育內容的復雜、龐大,以及生命科學和相關信息技術的迅速發展,使生物信息學的教育方案必須不斷完善,以保持其時效性[28],但即便如此,目前的高等教育體系也難以完成生物信息學全部的教育內容[13]。NIBLSE 的一項調查顯示,在從事生命科學領域的研究人員中,“自學”超過“大學教育”(或“正規教育”),成為了獲取生物信息學技能的最主要途徑。此外,研究人員對生物信息學短期培訓(In-time training or short courses,1-5 days;Extended bioinformatics courses, 2-3 weeks.)的需求一直十分強勁。而通過網絡是“自學”和“短期培訓”的主要途徑。[32-35]
由于生物信息學的計算機及網絡技術背景,網絡資源一直是生物信息學教育的重要組成部分,許多國外高校也在網絡上共享自己的課程資源[20],除此之外,專門的社會團體網站也提供了大量資源。總部設在美國的ISCB 一直專注于全球范圍內的生物信息學教育事業,其下設的“教育委員會”通過其網站(https://www.iscb.org/professional-devel?opment-training-and-education)為所有對生物信息學感興趣的群體提供培訓和教學支持,并致力于將生物信息學教育推廣到所有與生命科學相關的教育項目中。該網站資源面向全世界受眾,涵蓋從新手到高級實踐者的各級培訓資源,此外,還針對準備投身于生物信息學專業領域的人群提供了更進一步的提高學習資料。“歐洲分子生物學網”("The European Molecular Biology Network" or "The Global Bioinformatics Network",EMBnet)是歐洲乃至全世界最重要的生物信息中心和網路節點之一(https://www.embnet.org),是最早通過網路提供生物信息學專門課程以及相關訓練的歐洲生物信息學組織。“生物信息學培訓網”(Bioinformatics Training Net?work,BTN)是專門應對廣大科研人員對生物信息學短期培訓的旺盛需求而設立的。該網站(http://www.biotnet.org/,國內訪問困難)為生物信息學的專業知識、教學材料和教學經驗提供交流平臺,并對一些實際的問題提出解決方案。[36]2012 年,EMBnet牽頭,聯合ISCB、BTN等9家機構,合作成立“全球生物信息學學習、教育和培訓組織”(The Global Organ?isation for Bioinformatics Learning, Education and Training,GOBLET),其是首個專門關注生物信息學教育的全球性合作組織。GOBLET 以“包容、共享、開放、創新”為宗旨,通過網絡(https://www.mygoblet.org/training-portal)為世界范圍內的教師和學員提供持續、可靠的生物信息學教育支持。此外GOBLET還致力于促進各國生物信息學能力發展,制定生物信息學教育標準和準則,以及幫助學校教師培養下一代生物信息學人才等相關工作[13]。此外,還有其他諸多網站可獲取教學資源。
我國的生物信息學教育起步并不晚,上世紀90年代末,我國部分高校就已經開設了生物信息學領域相關課程。[37]從2002 年,哈爾濱工業大學開設我國最早的生物信息學本科專業,[38]到2018 年高考招生,全國已有24所大學在招收生物信息學專業本科學生。而在2019年的研究生招生目錄中,開設生物信息學相關專業碩、博士教育的高校總共也只有20所,這與西方發達國家的生物信息學學歷教育集中于研究生階段的情況完全相反。此類現象可能一定程度上與我國的碩、博士點審定制度有關,但考慮到“一般的新興學科教育,都是從研究生階段向本科逐步發展”的趨勢,使我們不得不開始警惕我國生物信息學本科階段的學歷教育建設是否存在一定程度的盲目性。
當前,我國多數高校對于生物信息學教育的培養目標尚缺乏明確的定位。在相關課程建設中,主要以統一的教材為基礎,再結合教師自身經驗來確定課程內容。缺乏對于生物信息學技術在不同領域,比如育種、制藥或臨床診斷等應用場景的專門內容設置。學歷教育方面,我國大多數高校更是定位模糊,只是一味追求將生物信息學相關的各學科內容盡可能多地納入到教學當中,[39]沒有針對性,而是堆砌大量傳統課程,致使講授內容臃腫、缺乏銜接,從而影響學生知識體系的形成和未來的專業發展。因此,推進我國的生物信息學教育建設,應當借鑒國外經驗,在廣泛調研的基礎上,針對不同應用領域對學科核心素養的不同要求,建立符合本國國情的生物信息學教育目標分類方案。[40]在未來新方案的指導下,各高校以及相關教育機構再根據自身特色條件,對各自的生物信息學課程或專業的教育目標乃至建設方針進行精準定位,進而優化課程結構,提高教學效率。
目前,在我國已經廣泛開展了對生物學和醫學相關專業學生的生物信息學教育,但是,作為解決生物學問題的重要工具學科,生物信息學在生命科學領域的教育融合仍不理想。絕大多數高等院校的生物信息學教育還是以專門課程的形式開展,而且多數生物信息學課程在教學體系中尚屬于選修課的范疇。[37]這樣的課程設置,要么在講授內容上淺嘗輒止,難以為學生提供適應未來需求的生物信息學能力;要么讓學生猛然面對學科差異巨大的海量陌生知識,致使學生積極性普遍較低,教學過程中難以形成有效知識網絡。在國外,對于生物信息學課程設置更為靈活多變,越來越多的院校開始將本科階段的生物信息學內容化整為零,在專業內已經成熟的傳統課程中增設生物信息學內容模塊,通過“問題解決”等教學模式調動學習積極性,逐步、穩健地向學生傳遞生物信息學的思維方式和研究理念。這為我國未來的生物信息教育改革提供了思路。