生物信息學的誕生和發(fā)展
生物信息學是1991年左右才在文獻中出現(xiàn)的(美國國立醫(yī)學圖書——NLM生物醫(yī)學文獻數(shù)據(jù)庫——Medline中1993年才在正式文獻中出現(xiàn))。該學科雛形可以追溯到20世紀50年代,1956年在美國田納西州蓋特林堡召開了首次“生物學中的信息理論研討會”。1987年,秫華安博士正式把這一領域稱為生物信息學(Bioinformatics)。到20世紀末期,隨著分子生物學與計算機技術(shù)的迅猛發(fā)展和數(shù)據(jù)資源急劇膨脹,迫使我們必須擺脫手工勞動的束縛,轉(zhuǎn)而尋求強有力的工具去組織它們。與此同時,蘊藏在這些生物學數(shù)據(jù)資源中的生物學規(guī)律已無法繼續(xù)沿用傳統(tǒng)手段以人腦來加以分析和歸納,因此人們同樣需要尋求強有力的工具。
生物信息學正是通過它獨特的橋梁作用和整合作用,以數(shù)學、信息學和計算機科學為主要手段,以計算機硬件、軟件和通信網(wǎng)絡為主要工具,對浩如煙海的原始數(shù)據(jù)和紛繁復雜的生命信息進行存儲、管理、注釋、加工、解讀。生物信息學對21世紀的生命科學和醫(yī)學科學的發(fā)展具有非凡的推動作用,是當今生命科學的重大前沿領域之一。
生物信息學的發(fā)展可以分為以下3個階段:
第一階段,前基因組時代。早在1962年,美國的Pauhng和Zuckerkerkandl就將DNA序列的變異與其生物進化聯(lián)系起來,從而開辟了分子進化的嶄新研究領域。20世紀60年代,美國建立了蛋白質(zhì)數(shù)據(jù)庫;1964年Davies開創(chuàng)了蛋白質(zhì)結(jié)構(gòu)預測研究。1970年,Needlman和Wunsch發(fā)表了序列比對算法。美國洛斯阿拉莫斯國家實驗室1979年就建立起Genbank數(shù)據(jù)庫;歐洲分子生物學實驗室(EMBL)1982年就已經(jīng)提供核酸序列數(shù)據(jù)庫的服務;日本也于1987年開始提供DNA數(shù)據(jù)庫服務。
第二階段,基因組時代。標志性工作包括基因發(fā)現(xiàn)和識別、網(wǎng)絡數(shù)據(jù)庫系統(tǒng)的建立和交互界面的開發(fā)等,建立和發(fā)展了表達序列標簽數(shù)據(jù)庫以及電子克隆。
第三階段,后基因組時代。標志性工作是大規(guī)模基因組分析、蛋白質(zhì)組分析以及各種數(shù)據(jù)的比較與整合。
二 生物信息學的學科性質(zhì)
生物信息學到底應歸屬于生物學范疇,還是屬于以計算機為中心的信息領域,是生物信息學科體系所無法回避的問題。字面上理解“生物信息學”是“生物”加“信息”的交叉學科。廣義地說,生物信息學通過對基因組的研究,獲取、加工、儲存、分配、分析和解釋相關生物學數(shù)據(jù)的應用范疇。這一定義包括了兩層含義,一是對大量數(shù)據(jù)的收集、整理與服務,也就是如何管理好這些數(shù)據(jù);另一層是從中發(fā)現(xiàn)新的規(guī)律,也就是用好這些數(shù)據(jù)。前者表明“生物信息學”是以研究生命科學為對象的“信息學”,研究重點在于分析工具的發(fā)展、數(shù)據(jù)庫的建立與使用者接口的開發(fā)。后者則強調(diào)整合、分析數(shù)據(jù)庫中的生物信息,尋找致病基因,預測基因的功能等。是利用生物信息學技術(shù),解決生物學問題的學科,因此它是“生物學”的一種,或稱之為“信息生物學”。實際上,我們可以認為這兩個方面的內(nèi)容屬于生物信息學包含兩個層次的內(nèi)涵。具體地說,生物信息學發(fā)展出精致的算法或完善的分析方法使我們能更好地利用數(shù)據(jù)進一步開展疾病相關基因?qū)ふ遥鞍踪|(zhì)結(jié)構(gòu)和功能預測,分子進化等研究;生物信息學的最終研究目標是為了破譯隱藏在DNA序列中的遺傳語言規(guī)律;在此基礎上歸納、整理與基因組遺傳信息釋放的數(shù)據(jù),認識蘊藏于其中的有關生命代謝、發(fā)育、分化和進化的規(guī)律。例如,就疾病而言,生物信息學有助于系統(tǒng)地理解導致機體功能異常的生理機制,并從而得出科學的治療方案;從而為人類疾病的防治提供嶄新的途徑。就生物進化而言,生物信息學有助于系統(tǒng)地解釋生物進化中從微觀分子到表觀個體水平的基本規(guī)律,從而使人類更清醒地給自己在自然界中定位,科學地認識和改造自己的未來。
三 發(fā)展生物信息學教育的意義
過去人們對生命的認識有很大的局限性,對生物學的認識僅僅停留在觀察上。到了19世紀,達爾文發(fā)表“物種起源”之后,生物學開始總結(jié)出有重大哲學意義的普遍規(guī)律。此后,孟德爾發(fā)現(xiàn)了遺傳學規(guī)律,沃森和克里克發(fā)現(xiàn)DNA雙螺旋結(jié)構(gòu)以及核酸是生命本質(zhì),為生物學發(fā)展奠定了堅實的基礎,從而生物學正式擺脫了那種僅靠觀察和比較的方法,發(fā)展成為一門實驗科學。伴隨著21世紀后基因組時代的到來,生物學的重點和潛在的突破點已經(jīng)由20世紀的試驗分析和數(shù)據(jù)積累,轉(zhuǎn)移到數(shù)據(jù)分析及其指導下的實驗驗證上來。
人類科學研究史表明,科學數(shù)據(jù)的大量積累將會導致重大的科學規(guī)律的發(fā)現(xiàn)。例如,對數(shù)百顆天體運行數(shù)據(jù)分析導致了開普勒三大定律和萬有引力定律發(fā)現(xiàn);數(shù)十種元素和上萬種化合物數(shù)據(jù)的積累導致了元素周期表發(fā)現(xiàn);氫原子光譜學數(shù)據(jù)積累促成了量子理論的提出。生物學確實有非常重要的問題等著我們?nèi)ソ鉀Q,比如腦信息學、生命起源,這些重要問題就像當初20世紀初期遺傳學家面臨的問題,看著染色體卻不知道要用怎樣的技術(shù)去解開基因的謎。最重要的遺傳學上的突破,是發(fā)現(xiàn)如此復雜的生命居然只是由四種不同的脫氧核糖核苷酸(A、T、c和G]按照特定的編碼規(guī)則串聯(lián)成的脫氧核糖核苷酸串(DNA),其中卻蘊藏著生物體中所有的結(jié)構(gòu)信息和控制信息,著實讓人詫異。借鑒歷史的經(jīng)驗,有理由相信,當今生物學數(shù)據(jù)的巨大積累也將導致重大生物學規(guī)律的發(fā)現(xiàn)。
放眼世界,一些發(fā)達國家在生物信息學上已先行一步,爭相投入巨資,爭取通過生物信息研究與開發(fā)獲得知識產(chǎn)權(quán)。中國科學家正聯(lián)合起來,共同推進中國生物信息學的研究和發(fā)展。充分利用網(wǎng)絡上大量免費的數(shù)據(jù)資源,去發(fā)現(xiàn)新線索、新現(xiàn)象和新規(guī)律,關鍵在于迅速培養(yǎng)一批在數(shù)學、信息科學、計算機科學以及分子生物學方面均有造詣的跨學科人才。
四 生物信息學人才的培養(yǎng)
進入21世紀,全國高校都按照“基礎扎實、知識面寬、能力強、素質(zhì)高”的人才培養(yǎng)要求開展了新一輪專業(yè)課程體系改革。生物信息學既是一門學科也是生物領域研究的工具,其課程教學內(nèi)容符合當前課程體系改革中人才培養(yǎng)“厚基礎、寬口徑”的要求。首先,生物信息學是一門交叉性、平臺性學科,其研究的內(nèi)容相當廣泛,涉及計算機科學、數(shù)學、信息學、統(tǒng)計學、生物學、物理學等眾多學科,能培養(yǎng)學生從整個自然科學的高度和不同角度分析問題的能力。其次,生物信息學發(fā)展日新月異,知識不斷更新,學習生物信息學有利于學生了解自然科學研究進展和方向。最后,生物信息學也是一種研究工具,學習和掌握這門工具為今后從事生物、醫(yī)藥、農(nóng)業(yè)、環(huán)境、食品領域的研究提供了新的研究手段和途徑。
目前,生物信息學在我國尚處于起步階段,對研究人員要求很高,需要生物大分子結(jié)構(gòu)和功能方面的背景知識,需要扎實的應用數(shù)學或統(tǒng)計學知識,還需要精通計算機。但我們面臨的實際情況是大部分從事生物學研究的人不熟悉計算機,而從事計算機科學的人員多數(shù)又缺乏對生物學的了解。盡管知道生物信息學及其重要性的計算機科研人員為數(shù)不少,但對于計算機學科如何與生物學進行有效的融合尚未給予足夠的思考與研究。
新世紀國家與國家之間的經(jīng)濟、科技實力的競爭從本質(zhì)上講是人才的競爭,人是一切科學研究的主體因素,離開研究者的創(chuàng)造性思維,科學也就無法進展。生命信息學對從事其研究者提出更高的要求,不但要具有廣博的知識,更要具有在此基礎上進行比較、創(chuàng)新、歸納以及上升為理論高度的科學研究能力;同時還要求研究者具有敢于突破前人的氣魄,即高素質(zhì)的復合型通才。他們能夠?qū)⒆匀豢茖W與社會科學溝通起來發(fā)展生物信息學教育、培養(yǎng)綜合性高水平的生物信息學專門人才必將為我國的學科和產(chǎn)業(yè)的發(fā)展注入強大的動力。
五 課程體系
課程體系是學校教學工作的中心環(huán)節(jié),同時也是人才培養(yǎng)的模板。在某種意義上,有什么樣的課程體系就能培養(yǎng)什么樣的人才。加強知識能力和素質(zhì)的培養(yǎng),提高學生創(chuàng)新意識和創(chuàng)新能力是21世紀人才培養(yǎng)的基本要求。
培養(yǎng)生物信息學專門人才是發(fā)展生物信息學的關鍵所在,現(xiàn)階段交叉學科人才培養(yǎng)工作中要明確學習動機和實際需求的關系。專門人才的培養(yǎng)可以從本科、碩士、博士三個層次展開。本科層次課程體系設置中,要在短短的本科學習的4年時間內(nèi)既要達到堅持基礎,強調(diào)技能,拓寬專業(yè)口徑,但又不增加學生的學習負擔,有利于學生個性發(fā)展,還要充分體現(xiàn)生物信息學交叉學科的特點,對整個課程體系的規(guī)劃尤其重要。
值得注意的是,這些課程的教學內(nèi)容必須按照生物信息學學科內(nèi)容的要求設計,有增有略,有所綜合,在保證知識體系必備性和銜接性的同時,避免填鴨式的教學方式。讓學生有更多時間關注自身感興趣的研究方向,培養(yǎng)學生向以興趣出發(fā)的主動學習方向發(fā)展。專業(yè)課程體系設置在學科人才培養(yǎng)成功與否中起著決定性作用,國外一些高校課程設置值得借鑒,如美國加利福尼亞大學洛杉磯分校的生物信息學專業(yè)課程設置,包括專業(yè)先導課程(Premajor)和專業(yè)課程(Major)兩個模塊,每個模塊規(guī)定了最低學分數(shù)和必修課程要求,同時又留給學生很大的選課自由度。
研究生的培養(yǎng)規(guī)劃強調(diào)培養(yǎng)跨領域之人才。由于生物信息學多學科交叉特點,學生招生面應盡可能廣泛,可以是數(shù)學、信息、物理、化學、計算機、生物等專業(yè),這既有利于學科融合,又可以防止學科過于朝單一方向發(fā)展。在課程設計上,根據(jù)學生背景,兼顧高校和研究所現(xiàn)有研究領域。比如針對數(shù)學和計算機背景的學生,開設生物類課程的必修課;而針對生物背景的學生,則開設系統(tǒng)的數(shù)學和計算機課程的必修課。研究生層次的培養(yǎng)還需要與其他學科的研究領域和產(chǎn)業(yè)相結(jié)合,及時掌握研究方向,提高研究成果轉(zhuǎn)化力。
六 教學內(nèi)容和手段
在教學內(nèi)容組織方面,除了要注意對各門課程間的內(nèi)容協(xié)調(diào)外,還要注意到生物信息學在理論研究和應用研究處于不斷的發(fā)展完善中,同時隨著新的應用領域和新問題的發(fā)現(xiàn),也不斷地滲透到生物信息學領域,進一步增加了其多學科交叉融合的深度和廣度。因此在教學工作中必須緊跟學科發(fā)展方向,隨時進行知識更新,了解最新的前沿動態(tài),掌握新方法,將最新的知識和方法教給學生。在高年級本科生和研究生交叉學科課程中增加案例分析,可以在很大程度上彌補交叉學科人才培養(yǎng)缺乏系統(tǒng)性的問題。在教學中鼓勵學生進行探索式學習,培養(yǎng)其終身學習的能力和創(chuàng)新意識,正是生物信息學教學的特點。
1 生物信息學給學生提供探索式學習的基礎
用生物信息學培養(yǎng)探索式學習,取代枯燥的教學模式。人類基因組爆發(fā)式數(shù)據(jù)的產(chǎn)生,產(chǎn)生了生物信息學,聚焦在對大量涌現(xiàn)的DNA和蛋白質(zhì)數(shù)據(jù)的獲取、儲存、分析、建模中。科學的基本原則就埋藏在探索式的學習中,探索是一個理解科學基本原理非常有效進程。探索式學習是學生直接從教室面向社會,學生需要去解決他們在學校或者社會上遇到的問題。
科學基本原則埋藏在探索式學習中,探索是一個理解科學基本原理非常有效進程。探索式學習是學生直接從教室面向社會,學生需要去解決他們在家里,學校或者社會上遇到的問題。用生物信息學工具,學生可以得到真實數(shù)據(jù),并用這些工具去獨立解決問題。在這個過程中,學生實際上經(jīng)歷了從被動的學習到積極的學習,再到有效的學習的過程。生物信息學課程強調(diào)理解,推理和解決問題,而不是純粹地記憶詞匯解釋和運算規(guī)則。教師應該鼓勵學生有針對性地利用計算機或其它工具。生物信息學在科學活動中通過新技術(shù)的運用來幫助老師和學生實現(xiàn)這個目標。
2 運用真實的數(shù)據(jù)去解決問題
學校只要有計算機和網(wǎng)絡,就可以免費獲得大量可靠的教學資源。用生物信息學工具,學生可以得到真實的數(shù)據(jù),更重要的是可以用這些工具去獨立解決問題。在這個過程中,學生實際上經(jīng)歷了從被動的學習到積極的學習,再到有效的學習的過程。現(xiàn)在我們只是需要引導學生強烈的好奇心和求知欲,就可以帶領學生進入真實的科學世界進行探險,把他們從教科書中帶出來,奔向科學的殿堂。
在課堂上整合生物信息學知識的目的是學生易于接觸到真實世界。各種在線指南幫助學生和老師學習怎樣利用這些工具去收集數(shù)據(jù)。一些尚未解決的問題,如人類進化歷史、系統(tǒng)發(fā)育樹和種系起源等問題。這些問題會出現(xiàn)在學生的頭腦中,通過這些數(shù)據(jù),引導學生開展進一步的探索。這些技術(shù)的合理運用,學生有能力進行相關的探索,增加他們學習的動機,并且與真實世界聯(lián)系起來。在教室里就可以讓學生都加入到過去只是老師才關心的領域。
3 理解完整的生物學概念之間的關系
生物信息學是一個很好的整合工具,它可以起到穿針引線的作用,把你所學的課程都聯(lián)系起來。生物信息學提供了一個思路把你所學的主題都連接起來:分子生物學、遺傳學、遺傳疾病、進化、細胞生物學、植物學、動物學、微生物學等。而這些課程一直都是獨立授課的,盡管老師也會強調(diào)這些知識的統(tǒng)一性,但學生還是很難將這些知識連接起來。生物信息在講授分析和解釋知識時,產(chǎn)生一種學習環(huán)境。先將整個中心法則融會貫通,DNA和復制、RNA和轉(zhuǎn)錄、蛋白質(zhì)和翻譯,然后再運用它去解決遺傳疾病、生理和進化等問題,從而激發(fā)學生將視線聚焦到這些內(nèi)容上,產(chǎn)生強烈的求知欲。學生可以很好地理解學習內(nèi)涵,極大地提高了把知識串接起來的能力。要提高學生在工作、學習和今后的科研工作中分析解決問題的能力,培養(yǎng)復合型、交叉型人才,提高學生綜合素質(zhì)進而提高就業(yè)競爭力。
參考文獻
[1]羅遼復,從生物信息學到信息生物學[J],合肥學院學報(自然科學版),2007,17(2):1-9
[2]Cattley,s,2004,A Review ofBioinformatics Degrees in Australia,Briefings in Bioinformatics 5(4):350-354