李方
“基因組”(genome)是指一種生物的全套基因和染色體。“基因組學”(genomics)一詞由Thomas Roderick 在1986年提出。目前基因組學存在兩個分支,一個是結構基因組學,以構建生物的遺傳圖譜、物理圖譜和轉錄圖譜及其全序列測序為主要目標;另一個是功能基因組學,利用結構基因組學研究獲得的大量數據與信息評價基因功能,包括生化功能、細胞功能、發育功能、適應功能等,其主要手段結合了高通量、大規模的實驗方法、統計和計算機分析技術。1995年,生物學家提出“后基因組學”的概念,即在基因組靜態的作圖、堿基序列分析基礎上轉入對基因組動態的生物學功能研究,亦稱“功能基因組學”。植物基因功能研究起步相對較晚,但發展迅速。
一、植物功能基因研究的概念
功能基因組學研究的最終目標是解析所有基因的功能,即從基因水平上大規模批量鑒定基因的功能,進而全面研究控制植物生長發育及響應環境變化的遺傳機制,在基因組序列與細胞學行為之間架起橋梁,使其共同承擔起從整體水平上解析生命現象的重任。植物功能基因組研究是利用植物全基因組序列的信息,通過發展和應用系統基因組水平的實驗方法來研究和鑒別基因組序列的作用,研究基因組結構和組織與植物功能在細胞、有機體和進化上的關系以及基因與基因間的調控關系。植物功能基因組學是植物后基因時代研究的核心內容,它強調發展和應用整體的實驗方法分析基因組序列信息、闡明基因功能,其基本策略是從研究單一基因或蛋白質上升到從系統角度研究所有基因或蛋白質。植物功能基因組的研究方法有T-DNA標簽法、轉座子標簽法、反義RNA技術的基因破除、基因陷阱和化學誘變的新發展—TILLING技術,其中,T-DNA標簽法是應用最為廣泛的研究手段。
二、植物功能基因組研究內容
(一)植物基因組的大規模測序
植物基因組的大規模測序是深入進行基因組研究的前提,其提供了數據和信息支撐。如模式植物擬南芥和水稻基因組測序的完成,公共數據庫中已經積累了大量基因序列信息,獲得了許多與植物發育相關的功能基因。鑒定和發現表達基因最快的途徑是確定cDNA的部分序列(即EST)。這種方法主要是通過對隨機挑選的cDNA克隆進行一端或兩端長為300~500 bp的測序,這種序列在大多數情況下已足夠用于確認對應的基因。
(二)植物基因功能研究
基因的主要功能包括:生物化學功能,如作為蛋白質激酶對特異的蛋白質進行磷酸化修飾;細胞學功能,如參與細胞間和細胞內的信號傳遞;發育上的功能,如參與形態建成等。研究發現,高等植物中約54%的基因與已知功能基因的序列有相似性。目前,獲得一段DNA序列的功能信息的最簡單的方法是將該DNA序列與GeneBank中公布的基因序列進行同源性比較,如利用BLASTn和BLASTx兩種軟件分別進行核苷酸和氨基酸序列同源性比較等。進行功能基因網絡的構建是基因功能研究的難點和熱點。功能基因網絡是指網絡中的2個基因相互關聯以行使相同的功能,即如果2個基因處于同一生物學過程或者通路,代表這2個基因網絡中的2個節點在網絡中是相互連接的。
(三)植物蛋白質組研究
基因功能的實現最終是以蛋白質形式體現的,今后生命科學的重點將是在蛋白質組水平上揭示生命現象的本質和活動規律。蛋白質組是指一種基因組、一種生物或一種細胞、組織在精確控制其環境條件下,特定時刻所表達的全套蛋白質。當今,蛋白質研究技術正在不斷發展。蛋白質組研究技術主要有:用于蛋白質分離的雙向凝膠電泳技術(2D-PAGE)、用于蛋白質鑒定的Edman降解法測N端序列技術、質譜技術、用于蛋白質相互作用的酵母雙雜交系統、蛋白質芯片等。
(四)生物技術信息研究
生物信息學是以計算機為工具,用數理及信息科學的理論和方法研究生命的現象,對生物信息進行儲存、檢索和分析的一門新興交叉學科,由數據庫、計算機網絡和應用軟件三大部分組成。通過搜索、分析、比較大量的基因和蛋白質序列數據,建立理論模型,進行基因結構的鑒定、分子設計、蛋白質空間模擬和預測、蛋白質結構與功能關系的研究。對日益增長的DNA和蛋白質的序列結構進行收集、整理、儲存、發布、提取、加工、分析和發現各DNA片段的功能。同時,在發現了新基因信息之后,了解基因表達的調控機理,根據生物分子在基因調控中的作用,描述生物體生理生化反應的內在規律。
三、展望
植物基因組的研究深度和廣度是隨著相關研究技術的創新和發展而不斷加深和擴展的,所以在功能基因組研究過程中,在完善現有研究手段和技術的同時,還必須發展一些新的基因功能研究技術,加強國際間的學術交流,建立全球共享的植物基因組數據庫系統,以最終闡明植物基因組的結構和功能。單獨運用一種技術已經很難滿足真正獲知基因功能的要求,只有將多種技術有機融合起來,取長補短,采用生物技術對植物進行高效、安全的遺傳改良才能使真正獲知基因功能成為可能。