馮世鵬,袁紅梅,牛曉磊
(海南大學農學院海南省熱帶生物資源可持續利用重點實驗室,海南海口 570228)
?
生物信息學課程內容設置研究
馮世鵬,袁紅梅,牛曉磊
(海南大學農學院海南省熱帶生物資源可持續利用重點實驗室,海南海口 570228)
分析了生物信息學課程設置的現狀,通過比較不同大學的培養方案,總結了生物、數學、計算機方面的主要專業課程。介紹了生物信息學的教材情況,并根據各教材生物信息學課程內容,將相關內容分為必選、可選、實驗3部分,進而分別闡述了這3部分課程內容的設置。
生物信息學;課程內容設置;教材
隨著人類基因組計劃的實施及測序技術的進步,人類獲得生物數據的能力越來越強,不斷有新物種被測序的報道。大量數據的積累進一步推動生物信息分析技術的開發,而新技術的開發又反過來吸引人們去獲取更多的數據,這樣循環往復,極大地推動生物信息學及其他生命科學的發展。生物信息學已經成為生命科學不可分割的一個重要組成部分,所有生命科學相關專業的學生都必須具有一定的生物信息學知識,否則其今后的學習或工作將會碰到很多困難。因此,生物信息學課程教學在各大專院校幾乎所有與生物相關專業廣泛開展。
生物信息學科程有幾個特點[1]:一是涉及生物學、數學、醫學、計算機科學等多個相關學科,內容繁雜,幾乎沒有人能掌握生物信息學的所有內容。二是待授課學生水平參差不齊,所屬專業包括生物學、醫學、農學等。生源的多樣性及所學專業的多樣性決定了學生的生物信息水平存在差距。三是沒有統一的教材。目前市面上銷售的教材有四十余種,由各學校自行選取,增加了大學教學的自主性。四是教師的學識有限,并偏向講授自己擅長的部分。生物信息學課程的上述特點決定了其教學內容的繁雜性,筆者對生物信息學課程教學內容進行探討,希望對今后生物信息學課程的教學有所幫助。
目前我國已經有多所高校設置生物信息學院(或系)、生物信息中心(或研究所、實驗室),如重慶郵電大學、哈爾濱醫科大學、南京郵電大學設有生物信息學院;同濟大學、上海交通大學、天津醫科大學、鄭州大學等建有生物信息系;北京大學、天津大學、復旦大學、中國農業大學、哈爾濱工業大學、華中科技大學、第三軍醫大學、蘇州大學、華中農業大學等建有生物信息中心;清華大學、浙江大學、東南大學等建有生物信息學研究所或者國家級實驗室;南京大學、武漢大學、華中理工大學、四川大學等高校設置了生物信息學專業;另外,中國科學院、華大基因等科研機構設置了生物信息分析部門。這些機構在我國生物信息學研究中最具影響力,也極大地推動我國生物信息科學的發展。大專院校生物信息專業的設置也為我國培養了一批生物信息學后備人才。
生物信息學作為一個招生專業,在多個大學進行招生。通過比較不同大學的培養方案[2-4],將其主要專業課程總結如下。①生物方面:分子生物學、細胞生物學、生物化學、遺傳學、基因組學、普通生物學、動物學、植物學、微生物學、解剖學等;②數學方面:概率論與數理統計、生物統計學、線性代數、高等數學、微積分等;③計算機方面:計算機原理、網絡技術、Linux操作系統、高級語言程序設計、Perl(或Python)語言、R語言、數據庫技術等。
通過生物信息學專業課程設置情況來看,生物信息涉及生物、數學、計算機方面的課程,且各課程獨立設置,深化了學生對生物信息各方面知識及能力的培養,目標在于培養生物信息分析方面的專業人才。在不同學校,這些課程的選擇可能各有側重。
對于其他非生物信息學專業的學生,生物信息學作為課程的目的在于培養學生獲得基礎的生物信息學知識,輔助學生更好地學習和理解其他生物學知識。因此,課程內容的設置既要考慮生物信息學學科所涉及的各方面內容,又要通俗易懂,更要有實用性,讓學生更好地利用生物信息學工具解決學習中的問題。其教學內容如何選擇,后面將做詳細探討。
初步統計,目前由我國教學科研人員撰寫的生物信息學教材有四十余本,時間跨度在2000~2016年[5-6],出版社包括科學出版社、高等教育出版社、清華大學出版社等多個國家一級出版社。其中,國家“十一五”規劃教材有4本,分別由陶士珩[7]、李霞[8]、王勇獻[9]、劉娟[10]編撰;國家“十二五”規劃教材有3本,分別由孫清鵬[11]、李霞[12]、陳銘[13]編撰;國家“十三五”農林規劃教材1本,由呂巍等[6]編撰。這些教材在教學內容選擇及深度方面各不相同,適合不同學校選用。
總結現有的生物信息學教材,根據各教材生物信息學課程內容的情況,可將相關內容分為3部分:一是各教材均有的內容(也稱為必選內容);二是僅有部分教材有的內容(稱為可選內容);三是實驗部分內容。
3.1必選內容
3.1.1緒論。緒論部分的內容選擇要達到3個目的:一是介紹課程的目的、意義及發展歷史;二是回顧所涉及的部分專業知識,包括生物、數學、計算機方面;三是介紹課程學習內容并提出學生應該采納的學習方法。因此,緒論部分建議包括以下內容:生物信息學定義及其發展歷史,生物學基礎知識、數學基礎知識、計算機及網絡基礎知識,研究內容及發展前景,學習態度及方法。
3.1.2數據庫。生物信息學相關數據庫貯存了生物大分子相關文獻、序列、結構、表達、定位等海量信息,這些信息對于學生今后的學習及工作助益很大,因此數據庫是學生需要重點掌握的內容之一。數據庫學習的內容要使學生了解有哪些重要數據庫、各數據庫分別貯存哪類信息、數據格式如何、怎樣使用等。因此,這部分內容包括:數據庫總體特點、分類、幫助文件的查找;常用數據格式介紹,如fasta、fastq、genbank、gff3;核酸序列數據庫Genbank、ENA、DDBJ;蛋白質序列、結構數據庫,如Uniprot、PIR、PDB、PFam、Prosite;模式物種基因組數據庫,如MGI、RGD、Oryzabase、Tair、WormBase;基因表達數據庫,如GEO;代謝通路數據庫,如KEGG;基因組注釋及瀏覽數據庫ENSEMBL、UCSC;非編碼RNA數據庫,如miRBase;綜合數據庫NCBI、EMBL、ExPASy等。
3.1.3序列特征分析。這部分內容需讓學生了解對DNA、RNA、蛋白質序列進行相關生物信息分析。因此,這部分課程包括如下內容。①DNA序列特征分析:常規轉換(如大小寫轉換、序列反向、反向互補等),酶切位點分析,引物設計,基因預測、啟動子預測、CpG島預測、終止信號預測等。②RNA序列特征分析:RNA類型預測、RNA結構分析等。③蛋白序列特征分析:理化性質分析、親疏水性分析、信號肽預測、跨膜區預測、亞細胞定位預測等。
3.1.4序列比較。這部分內容設置需讓學生掌握序列比較軟件的原理及使用方法。序列比較主要包括序列兩兩比較、多序列比較,其中序列兩兩比較軟件主要是blast、fasta、blat,而又以blast使用最廣泛;多序列比較軟件包括cluster、DNAstar、DNAMAN。教學內容包括序列比較算法(Needleman-Wunsch、Smith-Waterman、Karlin-Altchul),得分矩陣(PAM、BLOSUM、DNA替換矩陣),blast種類及使用,在線blast使用方法,blast參數設置及結果解讀,fasta及blat軟件的使用,多序列比較軟件cluster、DNAstar、DNAMAN的使用。3.1.5進化分析。這部分內容設置需要讓學生掌握通過生物大分子的比較來判斷物種進化關系的方法。教學內容包括分子進化相關概念,可選建樹序列類型、建樹算法及軟件的選擇,不同進化樹的選擇優化,MEGA、PHYLIP建樹軟件介紹。
3.1.6蛋白質結構預測。蛋白質序列決定其結構,結構決定功能,因此,蛋白質結構在基因功能研究中發揮了重要作用。通過相關內容的學習,讓學生掌握蛋白質結構的種類、預測方法及通過蛋白質結構進一步預測其功能。教學內容包括蛋白質I~IV級結構特點、二級結構預測及解讀、三級結構預測及解讀、基于結構預測蛋白質功能。
以上內容基本在各個學校生物信息學課程中均有反映,只是內容的詳細程度、排列順序稍有差異。
3.2可選教學內容這部分內容由各個教師根據實際情況選擇授課。各個學校,甚至同一學校不同教師的授課內容均有一定差異。
3.2.1非編碼RNA介紹。非編碼RNA是目前生物學研究的一個熱點,通過學習,要使學生掌握常見非編碼RNA的特點及其研究應用方法。課程內容包括非編碼RNA種類、各自特點、miRNA預測注釋、miRNA靶基因預測篩選、miRNA功能研究等。
3.2.2Linux系統&Perl語言介紹。這部分內容是為了讓有志于在生物信息學方面發展的學生準備,目的是讓他們掌握生物信息分析時常用的Linux操作系統及Perl語言。課程內容包括Linux系統簡介、安裝、常見命令使用、Perl語言簡介、常有命令、簡單的程序編制及解讀。
3.2.3siRNA介紹。RNAi技術已經成為生命科學的常規技術。通過這部分內容的學習,可以讓學生了解siRNA技術原理及應用。設置內容包括siRNA來源、siRNA特點、siRNA設計合成等。
3.2.4基因表達分析。通過相關內容的學習,能讓學生掌握基因表達分析方法,熟悉基因芯片、qPCR、深度測序等操作原理及流程。設置內容包括qPCR原理及數據分析、Northern Blot雜交原理及數據分析、基因芯片原理及結果解讀、RNA-seq基因表達分析原理及結果解讀。
3.3實驗內容
3.3.1數據庫檢索。在介紹完數據庫之后,可以安排上機進行數據庫的檢索實驗,目的是熟悉數據庫及掌握常用數據庫檢索方法,如NCBI、KEGG、UCSC等。
3.3.2序列比較分析。通過NCBI在線blastn、blastp練習,掌握blast軟件的使用方法,為今后生物信息分析奠定基礎。
3.3.3引物設計。引物設計是生物學相關專業從本科生到博士生均會面臨的問題。通過相關課程練習,學生能熟悉引物設計原則,掌握常見設計軟件的使用,如Primer5、Oligo等,以及對所設計引物進行篩選。
3.3.4進化分析。通過練習,讓學生掌握進化樹的構建及Cluster、Mega、Phylip等軟件的使用方法。
生物信息學課程主要是針對生物類專業學生的一門實踐操作性強的自學課程,課程內容的設置要面向學生今后繼續學習和工作的要求,因此,教學內容的選擇既要實用、易學,又要有一定的深度,以為學生今后繼續從事生物信息分析奠定基礎。當然,課堂教學內容和時間畢竟有限,應著重強調學生的自主學習。
[1] 呂巍,李濱.農業院校生物信息學本科教學的實踐與心得[J].高校生物學教學研究(電子版),2015,5(1):20-23.
[2] 王宏,李霞,徐良德.面向實踐能力培養的生物信息學課程體系建設[J].中國科技創新導刊,2013(19):47-49.
[3] 袁超,谷小青,朱偉,等.生物信息網絡資源在教學中的應用與探索[J].農業網絡信息,2013(2):122-125.
[4] 胡建平,楊彩萍.生物信息學內容改革研究[J].安徽農學通報,2012,18(15):173-175.
[5] 郝柏林,張淑譽.生物信息學手冊[M].上海:上海科學技術出版社,2000.
[6] 呂巍,李濱.生物信息學實踐教程[M].北京:高等教育出版社,2016.
[7] 陶士珩.生物信息學[M].北京:科學出版社,2007.
[8] 李霞.物信息學[M].北京:人民衛生出版社,2010.
[9] 王勇獻.生物信息學導論:面向高性能計算的算法與應用[M].北京:清華大學出版社,2011.
[10] 劉娟.生物信息學[M].北京:高等教育出版社,2014.
[11] 孫清鵬.生物信息學應用教程[M].北京:中國林業出版社,2012.
[12] 李霞.生物信息學[M].2版.北京:人民衛生出版社,2015.
[13] 陳銘.生物信息學[M].2版.北京:科學出版社,2016.
Study on Content about Bioinformatics Course
FENG Shi-peng, YUAN Hong-mei, NIU Xiao-lei
(Hainan Key Laboratory for Sustainable Utilization of Tropical Bioresource, College of Agriculture, Hainan University, Haikou, Hainan 570228)
The status of bioinformatics course was analyzed, the main courses in biology, mathematics and computer were summarized through comparing different universities’ training scheme. Teaching materials of bioinformatics were introduced, the relevant contents were devided into required, optional, and experiment three parts, the content of three parts were further elaborated.
Bioinformatics; Curriculum content arrangement; Teaching material
海南省中西部高校提升綜合實力工作項目。
馮世鵬(1980- ),男,湖北安陸人,講師,博士,從事miRNA功能與作用機制研究。
2016-07-31
S-01;G 420
A
0517-6611(2016)27-0230-02