向 恒 張瑞芝 潘國慶 周澤揚*
(1.西南大學蠶學與系統生物學研究所;2.西南大學動物科技學院;3.西南大學生物技術中心,重慶 北碚 400715)
當今,高通量技術的應用對于生物分子定量和定性的研究來說具有重要意義,也表明生命科學正在從一種以描述性為主的學科發展到以信息為主的學科。因此,生物學家就需要提高數學、計算機和統計分析等方面的技能,而提高學生在生命科學中信息分析能力的需要也是迫切的。然而,由于計算機硬件、軟件條件或者教師知識程度等多個方面的原因,基因組與生物信息學的教育水平卻遠落后于生物化學和分子生物學,表現出了諸如序列分析等多個方面技能上的不足。正是由于存在這些限制,基因組與生物信息學課程經常被限制在研究生階段,而未引入本科生的學習范疇。隨著當前基因組和蛋白質組數據的爆炸性增長,本科生關于基因組與生物信息學的學習需要就如過去學習色譜層析和電泳技術的需要一樣,同等重要。早在2003年,西南大學家蠶研究團隊就完成了家蠶基因組的框架圖譜,在此基礎上,2008年又公布了精細圖譜,序列覆蓋度高達8.48倍,精確鑒定了14.6萬個以上的基因。基于這些基因組數據,開展蠶學專業學生的基因組與生物信息學教學具有明顯的平臺優勢。
近幾年,一些基于網絡的易操作程序,諸如Biology Workbench(http://workbench.sdsc.edu/)和 Protein Explorer (http://www.umass.edu/microbio/chime/pe_beta/pe/protexpl/),已經大大降低了基因組與生物信息學的教學難度,可以運用于該門課程中。這些程序大多都是免費的,學生只要有能上網的電腦就可以訪問它們。這使得老師可以布置作業,讓學生訪問基因組數據并進行分析,進而掌握這些程序及其生物信息分析思路。Biology Workbench是一款新穎的軟件,學生可以通過它的服務器存儲序列數據。這一應用也相當有用,因為師生們可以不必用移動磁盤攜帶著數據來進行教學。而Protein Explorer是一種免費的瀏覽器插件,與常用的RasMol軟件相似,能顯示出蛋白質和核酸等大分子的三維結構。而且,與RasMol輸入命令的方式不同,Protein Explorer采用菜單的形式,使得學生可以不用去死記那些命令,就能容易的進行三維結構分析。最終,學生可以利用Protein Explorer軟件對比已知晶體結構的大分子序列,分析未知分子的結構。
運用上述軟件,我們可以設計兩套課程方案來傳授蠶學專業學生掌握家蠶基因組數據及其信息分析的方法。第一套方案是將基因組與生物信息學和目前學生正在開設的分子生物學課程進行整合。在此前提下,學生將基因組與生物信息學認作為一種分析生命科學問題的應用性學科。該學科是開放式的、探究式的,允許學生從中學會如何去分析一些基因或蛋白質所包含的具體生物學信息。總之,相對于開展生物學實驗而言,學習基因組與生物信息學可以更容易的讓學生知道怎樣去發現生命科學問題,以及如何著手解答這些問題。這樣就給予了學生自主學習,以及利用計算機輔助生命科學實驗開展研究的機會,提高了他們的科學研究素養。
例如,利用昆蟲桿狀病毒表達系統對家蠶熱激蛋白基因(heat shock protein,HSP)進行亞克隆及cDNA表達的常規實驗課程,老師能夠對其進行優化。首先,可以教會學生怎樣從家蠶基因組數據中提取出該基因的DNA序列,并告訴他們如何利用軟件進行翻譯,從而得到蛋白質序列。再將該序列輸入Biology Workbench中,并利用BLAST軟件檢索它的同源序列以進行后續分析。接下來,學生可以通過分析開放閱讀框(open reading frame,ORF)得到該基因的cDNA序列及其編碼的蛋白質序列。最后,學生還可以利用軟件分析該cDNA的限制性酶切位點,從而更好的設計出亞克隆策略。所有這些生物信息分析的內容與實驗課程有機的結合在了一起,而在學期期末還可以讓學生提供除實驗報告外的另一份信息分析報告。這樣的話,學生不僅獲得了實驗操作的動手能力,還學會了生物信息的分析能力,以及將基因組與生物信息學用于實驗中,指導實驗、輔助實驗,進行真正的生物學研究的能力。比如,當學生在挖膠抽提用于亞克隆的cDNA時,就可以基于基因的預測信息知道哪條帶是自己需要的。同樣的,當他們通過聚丙烯酰胺凝膠電泳(SDS-PAGE)比較表達的重組蛋白的時候,通過生物信息預測的蛋白質大小就能派上用場。當然,如果表達蛋白的分子量比預測的大,就認為該蛋白很可能發生了糖基化作用,導致其分子量變大,更多的研究內容隨之也被引出。因此,將基因組與生物信息學傳授給學生,不僅可以鼓勵他們拓寬挖深自己的實驗結果,讓他們認識到生物學的問題不是那么容易就能解決的,書本上的知識是多么的淺顯,還可以激發他們對生物學的興趣,以及采用更多更新的手段分析生命科學問題的能力。
第二套方案是針對學生單獨開設與家蠶基因組數據相關的基因組與生物信息學課程。該套方案僅需要一間配備有多臺計算機及其局域網的教室,而該條件在西南大學已經得到滿足。而且,除了進行上機實行直接操作外,還應該具備相應的理論課程。在理論課中,老師可以傳授學生家蠶基因組數據所包含的內容、生物信息學常用軟件及其模型算法的理論背景知識、以及如何運用這些軟件分析數據的方法思路。而在實驗課中,學生可以利用這些軟件進行常規的DNA、RNA和蛋白質分析。大致設計為以下四個單元:1)基因組,2)蛋白質結構,3)數據庫和多重序列對齊,4)小亞基核糖體RNA和系統進化分析。每個單元開展至少10學時(7學時理論,3學時實驗),以使得學生能掌握基因組與生物信息學的理論知識,以及能通過分析一個基因或者蛋白質數據來充分理解這些知識,這樣在今后的研究過程中,他們就可以學以致用了。
比如,在蛋白質結構單元,老師可以提供家蠶銅鋅超氧化物歧化酶(Cu/Zn superoxide dismutase)的蛋白質序列給學生,并告訴他們這是他們在基因組單元分析檢索到的基因所翻譯的。然后,學生可以利用Biology Workbench中的程序預測出該蛋白質的功能基序、α螺旋、β折疊和跨膜結構域等內容。也可以利用Protein Explorer軟件分析它的三維結構,并對預測準確性進行測試。其次,學生可以運用Biology Workbench對該蛋白質及其其他物種中的同源序列進行多重序列對齊,并使用Protein Explorer基于三維結構來分析它們的多重序列重疊位點。這就讓學生理解了蛋白質活性位點的氨基酸殘基保守性。最后,學生還可以利用多重序列對齊的結果,構建系統進化樹,對銅鋅超氧化物歧化酶基因在不同物種中的進化歷程進行探討。從而,將四個單元的知識都串了起來,讓學生可以更好的綜合掌握住基因組與生物信息學的理論知識和操作方法。當然,也反過來促使學生更好的理解了分子生物學中關于基因和蛋白質的結構以及進化的基本概念。
目前,基因組與生物信息學已經成為了一套完整的學科,并在生命科學研究的多個方面都有所運用。無論是將它與現有其他課程進行整合,或者將其作為單獨的一門課程,都應當讓學生弄清掌握生物信息工具來解決生命科學問題是必要的也是必須的。幸運的是,在國外,基因組與生物信息學已經融入到了本科生的課程中,并取得了良好的效果。而通過西南大學蠶學專業的試點工作,我們相信國內的高等院校最終也會發展到這條路上來。
[1]Ditty J L,et al.Incorporating genomics and bioinformatics across the life sciences curriculum[J].PLoS biology,2010,8(8):e1000448.
[2]Cooper S.Integrating bioinformatics into undergraduate courses[J].Biochemistry and Molecular Biology Education,2001,29(4):167-168.
[3]張春霆.生物信息學的現狀與展望[J].世界科技研究與發展,2000,22(6):17-20.