摘要:目前,人類已經完成了擬南芥、葡萄、楊樹、番木瓜、水稻、高粱和玉米等植物的基因組測序工作。果樹分子生物學研究也因葡萄和番木瓜的基因組測序完成而步入后基因組學和系統生物學時代。以葡萄為例介紹并綜述了葡萄基因組和后基因組學、比較基因組學、轉錄組學、蛋白質組學、代謝組學方面的研究進展,以及它們之間的關系。提出了葡萄生物學進入后基因組學和系統生物學時代后所面臨的挑戰及其相應的解決方案,并對中國葡萄后基因組及系統生物學研究提出了建議。
關鍵詞:葡萄;分子生物學;系統生物學:后基因組時代
中圖分類號:$663.1 文獻標識碼:A 文章編號:1009-9980(2011)02-321-09
通過各種基因組計劃,許多生物的基因組已被測序,并且測序費用一直在降低,可能最終測序單個基因組只需要幾千美元。截止2009年,人類已經完成了人、牛、豬、擬南芥、葡萄、楊樹、番木瓜、水稻、高粱等物種的基因組測序任務。隨著這些基因組計劃的完成,各種組學開始發展和完善起來,并突破了原有的學科界限形成多門交叉學科。經典的分子生物學研究是一種垂直型的研究,即采用多種手段研究個別的基因和蛋白質功能。而基因組學、蛋白質組學和其他各種組學則是水平型研究,即以單一的手段同時研究成千上萬個基因或蛋白質的功能及它們的關系。而新興的系統生物學則把水平型研究和垂直型研究及傳統的生物學整合起來,成為一種三維的研究。各項基因組計劃的完成以及相關組學技術的發展,標志著生物學研究進入了后基因組和系統生物學時代。
當前基因組測序技術以及各種組學的迅速發展也為果樹研究領域提供了前所未有的機遇。2007年,兩個研究小組公布了歐亞種葡萄的基因組框架圖,美國的一個研究團隊2008年完成了番木瓜的基因組測序。除了葡萄和番木瓜外,其他果樹(如蘋果、梨,柑橘等)的全基因組測序正在進行之中或即將完成。這些果樹全基因組測序的完成或即將完成預示著果樹學研究進入了一個新時代,即后基因組學和系統生物學時代?;蚪M測序是果樹功能基因組研究的基礎。研究者可以根據基因序列,利用分子生物學及生物工程技術手段研究基因的功能。更為重要的是,研究者可以在系統水平上來研究果樹基因組、轉錄組、蛋白質組、代謝組、以及表型組之間的關系。不僅從理論上可以闡明生物系統的機理,而且可更有效的將優良的基因通過遺傳轉化的方法導人栽培品種,培育優良新品種,這對于提升果樹育種水平和培育新品種具有重大意義。我們系統地介紹并綜述了葡萄基因組和后基因組學、比較基因組學、轉錄組學、蛋白質組學、代謝組學、表型組學等方面的研究進展,以及它們之間的關系。提出了葡萄生物學進入后基因組學和系統生物學時代后所面臨的挑戰及其相應的解決方案,并對中國葡萄后基因組學及系統生物學研究提出了建議。這也為其他果樹作物后基因組學和系統生物學的研究提供了參考。
1、生物學研究進入系統生物學時代
以往的分子生物學只是對個別的基因和蛋白質進行研究,而基因組學、轉錄組學、蛋白質組學、代謝組學以及表型組學則是對群體的研究。這些組學的關系見圖1。隨著計算機技術的成熟和應用,人類已經悄然的跨入系統生物學時代。所謂系統生物學(Systems Biology),是指研究一個生物系統中所有組成成分,包括基因、mRNA、蛋白質等,以及在特定條件下這些組分問的相互關系的學科。顯然,系統生物學使多方面的生物信息整合成為一個網絡。系統生物學的研究過程是先取得一個生物、組織或細胞系統,分析各種內部因素,獲得DNA、RNA及蛋白質相互作用的信息,整合各類信息后,開發出能描述系統結構和行為的模型,最后可以根據這個模型,預測生物系統的行為。因此,系統生物學是結合許多不同學科領域,通過彼此相互的網狀合作,針對一個生物現象所進行的研究。
2、植物基因組測序項目
隨著人類基因組測序項目的順利完成,科學家們同時開展了多種生物的基因組測序項目。在人類基因組草圖公布后的10a間,擬南芥、水稻、楊樹、葡萄、番木瓜、高粱等植物的測序工作相繼或接近完成,或正在進行中。其中雙子葉植物包括擬南芥、番木瓜、苜蓿、大豆、楊樹和葡萄,單子葉植物包括玉米、高粱和水稻。這些植物的進化樹如圖2。雙子葉植物中擬南芥和番木瓜的親緣關系較近,苜蓿與大豆聚為一類,葡萄是已測序的類真薔薇植物中分化最早的植物。另外在單子葉植物中,玉米與高梁聚為一類。
3、葡萄基因組
葡萄是多年生藤本植物,漿果為非呼吸躍變型,大多數葡萄種的染色體數為2n=2x=38,但V,rotuni-flolia的染色體數為2n=2x=40。葡萄是繼擬南芥、楊樹、水稻之后,基因組測序完成的第4種顯花植物,也是第1種被測序的果樹類雙子葉植物。Soltis等利用多種方法,對被子植物的起源和早期進化進行分析,葡萄大約在8400萬年前已經分化出來了,在物種的進化中起著非常重要的作用。葡萄基因組的測定為顯花植物中雙子葉植物的Ⅰ類真薔薇和Ⅱ類真薔薇植物出現分化這一重要進化過程提供了基因資料,使我們有可能發現它們共同的古老遺傳構成特點和物種起源與進化關系(圖2)。法國和意大利的科學家以釀酒品種黑比諾(Pinot Noir)的多代自交型(PN40024)為測序對象,于2007年8月完成了歐亞種葡萄基因組序列框架圖。黑比諾自交系PN40024由法國國家農業研究院(INRA)下屬的Colmar研究中心培育,雜合率為3%-13%。Jaillon等對葡萄測序的基因組進行分析后發現,葡萄的大部分基因都具有原來大小3倍的明顯特點和標記,認為葡萄在進化的早期已成為六倍體而保留至今,葡萄基因組未出現基因組加倍。因此認為現在的是古老六倍體(圖3),這一點和已證明的楊樹、擬南芥和水稻發生過整個基因組加倍是不一致的。Velasco等所測序的材料為Pinot Noir的一個高度雜合型(ENTAV 115單系),但他們的分析卻認為葡萄和楊樹、擬南芥一樣,基因組都曾在單、雙子葉植物分開后出現整個基因組加倍;擬南芥和楊樹經歷了2次基因組加倍,而水稻經歷過1次。2個研究的差別見圖3(左圖原圖中葡萄的進化位置不準確,葡萄的進化位置應在類真薔薇的基部)。
3.1葡萄基因組測序相關信息
葡萄基因組的全測序為我們提供了大量的信息,詳細信息可參考文獻,并可登錄葡萄基因組網站(http://www.genoscope.cns.fr/spip/Vitis-vinifera-whole-genome.html)搜尋/檢索基因名錄和序列。葡萄基因組大約為475Mb,約有基因30 434個,外顯子149351個,內含子118917個。表1中列出了葡萄、擬南芥、楊樹和水稻的染色體、基因、外顯子以及內含子的數量。表2中列出了葡萄與楊樹、擬南芥、水稻、雙子葉植物以及被子植物的同源基因數量和平均同源性。
3.2葡萄基因組中轉錄因子的分布
葡萄基因組中含有2004個轉錄因子,占基因組的6.7%。在葡萄基因組中發現62個轉錄因子家族,這些家族如MYB,AP2/EREBP,bHLH和MADS-box等含有很多成員。其中,葡萄的1617個轉錄因子分布于19個遺傳連鎖群中。連鎖群7和18的轉錄因子含量高于其他連鎖群。AP2/EREBP基因家族存在于連鎖群2、7、10和16,CCAAT基因存在于連鎖群6、8、10和13;MADS-box基因家族存在連鎖群5和13;MYB基因家族存在于連鎖群8和17。在葡萄基因組中,MYB基因家族是非常龐大的,MYB基因家族控制葡萄果實次級代謝產物的積累,該基因家族的成員調控花色苷和黃酮醇的合成。MADS-box基因家族調節開花相關現象,該基因家族在植物的進化中是非常重要的。在葡萄基因組中還有許多與抗病相關的轉錄因子,如亮氨酸拉鏈和bZIP類結合蛋白等。
3.3葡萄基因組中的抗病基因
根據基因對基因假說,植物的抗病性是由植物的抗病基因和病原菌的無毒基因互作決定的。植物的抗病基因及R蛋白有一些共同的結構域,富亮氨酸重復序列(leucine-rieh repeat,LRR)、核苷酸結合域(nueleotide binding site,NBS)、果蠅Toll蛋白和動物白介素-Ⅰ受體同源結構域(toll and interlukin-1 receptor homology region,TIR)、絲/蘇氨酸激酶結構域(serine/threonine protein kinase,PK)、跨膜結構域(transmembrane,TM)、卷曲螺旋域(coiled-coil,CC)、亮氨酸拉鏈(1eueine zipper,LZ或ZIP)結構域等。根據N’-末端結構的差異,該組又可分為2個亞組,即TIR-NBS-LRR(Ⅰ)亞組和CC-NBS-LRR(Ⅱ)亞組,LZ只是CC的一種特殊結構。
Velasco等對葡萄基因組中的抗病基因進行了系統的分析,葡萄基因組中含有341個NBS類基因,其中233個NBS類基因包括LRR結構域,CC-NBS-LRR類基因有84個,TIR-NBS-LRR類基因有37個。NBS類基因家族含有5個TIR-NBS類基岡,112個NBS-LRR類基因,103個僅含有NBS類結構域基岡。除NBS類R抗病基因外,葡萄基因組中還含有許多抗病信號轉導基因,如NPRl、EDSI、PAD4、COIl、MPK4、JAR1、ETR1、NDR1、RAR和EIN2等,NPR1、RAR和EIN2都是單拷貝。另外,葡萄基因組中含有許多病程相關蛋白,9個拷貝的PR-1,8個拷貝的PR-2,5個拷貝的PR-3,多拷貝的PR5,1個拷貝的PDFl和PDF2,以及一些蛋白抑制基因。葡萄基因組中還含有8個類似MLO基因。白粉病抗性基因PEN1,PEN2和PEN3,分別在葡萄基因組中含有5個、5個和10個拷貝。這些抗病基因分布在葡萄的19條染色體上,TIR-NBS-LRR類抗病基因分布在第18號染色體上,CC-NBS-LRR類基因分布在第9和13號染色體上,單一NBS類特征的抗病基因分布在第12和13號染色體上??共』蛟谌旧w上的分布呈叢或簇的形式。
4、葡萄后基因組學研究
葡萄基因組全序列蘊含了大量的信息,包括基因的序列和結構、非編碼區的特征、基因的拷貝數、基因的相對位置、染色體的結構等。研究者可從表現型研究轉入基因型研究,從對單一基因的研究轉入對整個基因組研究,進而可以研究基因之間的相互關系及其網絡結構。后基因組的研究主要包括以下幾個部分:1)比較基因組研究,包括種內的基因組比較和種間的基因組比較;2)轉錄組學、蛋白組學、代謝組學、表型組學以及DNA與蛋白、蛋白與蛋白之間的相互作用關系研究;3)基因和基因家族的系統特征研究,包括生長與發育、果實的質量與產量、抗病蟲、抗脅迫和對環境的適應情況、葡萄酒的質量與特性以及與人類健康相關的特性等。
4.1比較基因組學
比較基因組學(comparative genomics)是在基因組圖譜和測序的基礎上,進行基因組之間的比較研究以獲得生物類群中的基因數目、位置、功能、表達機制和物種進化的學科。基因組比較分為種間比較和種內比較。隨著葡萄基因組序列測序完成,科研工作者通過比較基因組學對葡萄基因家族進行分析。利用葡萄的基因組或者是基因家族,通過種內基因組或種間的基因組序列比較,可以得到我們感興趣的基因。然后利用基因工程的技術,通過轉基因將優良的基因轉入葡萄和其他植物,培育具有優良性狀的品種。
4.1.1MYB基因家族MYB基因家族是植物中最主要的轉錄因子之一。目前,在葡萄基因組中已經發現有279個MYB基因成員,而在擬南芥和水稻中分別為198、183個。這些成員包括R1R2R3、R2R3、MYB和MYB相關的亞家族成員。水稻和擬南芥的R2R3亞家族成員分別為126和109個,葡萄中有108個。除第10號染色體外,葡萄的MYB基因分布在其他每條染色體上,其中在第2、4和14號染色體上含有的MYB基因家族成員較多。
4.1.2 Ty1/copia轉座子家族Tvvl、VineI和Ty3/gypsy-like Gretl等3類逆轉錄轉座子已經被廣泛研究?;蚪M測序后。Moisy等在葡萄基因組中發現27個逆轉座子序列,并且將其中的24個新的逆轉座子序列通過氨基酸BLAST比對。建立系統進化樹,分成10個新的基因家族,分別為:Gentil、Edel、Huben、Rangen、Bran、Cremant、Gan、Kaste、Noble和Wintz。到目前為止,葡萄逆轉座子有13個家族,1709個拷貝,占基因組序列的1.24%。其中13個家族中,最少的拷貝數為91個,最多的達到212個。
4.1.3FT/TFLl基因家族和MADS-Box基因家族FT/TFLl基因可以促進或抑制開花基因的表達,Carmona等通過RACE技術從葡萄mRNA中克隆了5個同源基因,分別命名為VvFT、VvMFT、VvT-FLlA、VvTFLlB、和VvTFLlC。并且進行了基因組DNA的擴增,該5個基因都含有4個外顯子和3個內含子。這5個基因分別屬于FT、MFT和TFL1 3個亞家族。MADS-box基因家族在多種植物的發育過程特別是花器官和果實發育過程中發揮重要的作用。在植物、動物和真菌中發現的MADS-box基因分為Type Ⅰ和TypeⅡ兩種類型。在植物中,Type IMADS-box基因的功能仍不清楚,所有已知功能的基因都屬TvpeⅡ基因。其中Type Ⅰ基因只含有MADS-box保守區。TypeⅡ基因由保守程度不一的MADS-box、I、K和C結構域(domain)組成,所以又叫MIKC-type MADS-box基因。在葡萄基因組中含有38個MIKC-type基因,分別屬于13類亞基因家族。這些基因至少分布于13條染色體上,其中18號染色體含有6個,1號染色體含有5個。14和17號染色體上分別含有3個,10和15號染色體上含有2個,2、4、7、8、12、13和16號染色體上分別含有一個基因。AP1/FUL,SEP和FLC亞家族中的成員分布于第1、14和17號染色體上;SOC1亞家族成員分布于第2、15和16號染色體上;AGL15亞家族成員分布于第8和13號染色體上;AP3/PI和SVP亞家族分布于第4、7和18號染色體上;AG亞家族中的2個成員分布于第10和12號染色體,第3個成員分布在第18號染色體上。
4.1.4 AP2/ERF基因家族
AP2/ERF是植物所特有的一類轉錄因子,每個成員都含有由保守的乙烯應答結合元件(ethylene-responsive-element-bind—ing),即AP2/EREBP結合域。AP2/ERF家族在植物中廣泛存在,參與植物的抗病、抗逆、激素響應(乙烯)等生理生化反應的信號轉導以及花器官形成等。在葡萄中,通過全基因組搜索已發現132個AP2/ERF家族成員,分為4個亞家族(AP2、DREB、ERF、RAV和其他)。這些基因分布在19條染色體上,其中第7號染色體上有19個,第16號染色體上有22個,而第3、12、19上各有1個AP2/ERF類基因。通過和擬南芥中的AP2/ERF轉錄因子比較后發現,葡萄中ERF亞家族分布在擬南芥AP2/ERF的B1、B2、B3、B4、B5和B6組中,DREB亞家族則分布在A1、A2、A4、A5和A6組中。在第6和18號染色體上各存在一個10kb左右串聯分布的區段,而在第16號染色體415kh的區段內分布了20個AP2/ERF基因。
4.1.5其他基因家族水孔蛋白是膜水通道蛋白,在控制細胞和組織中水的含量起著非常重要的作用。葡萄基因組有28個水孔通道蛋白基因,分為4個亞家族,分別為質膜水孔蛋白(the plasmamem-brane intrinsic proteins,PIPs)、液泡膜水孔蛋白(thetonoplast intrinsic proteins,TIPs)、與大豆根瘤菌周膜上水通道蛋白NOD26類似的通道蛋白(the nodulin26-like intrinsic proteins,MIPs)及小分子量的膜內在蛋白(the small and basicintrinsic oroteins,SIPs)。在葡萄漿果成熟的過程中,水孔通道蛋白基因的表達水平下降。中性轉化酶(Neutral invertases。NIs)可以將蔗糖轉化為葡萄糖和果糖。葡萄基因組中含有9個中性轉化酶基因成員,其中8個成員分別位于葡萄的第3、5、6、13、14和18染色體上,第9個成員位于scaVold_203。通過氨基酸序列比對、內含子和外顯子結構以及染色體定位等多重結合分析,4個屬于a類Nis,5個屬于β類Nis。
4.2葡萄轉錄組學
轉錄組是指生物在特定的時間和空間條件下,所表達的所有基因的總和。通過對轉錄組學的研究,可以找到植物在特定的時期起關鍵作用的基因,分析基因之間的相互關系,研究基因網絡結構。從而找到對生產和育種有用的基因,進行更加深入系統的研究。
葡萄是非呼吸躍變型果實,有2個迅速生長期。果實成熟包括各種不同的生物學過程,如細胞分裂與擴大、初級與次生代謝以及各種生物與非生物脅迫等。在葡萄果實成熟的過程中,花色苷、有機酸和糖大量積累,同時對病原菌也相對敏感。da Silva等根據擬南芥的同源蛋白基因和葡萄相關方面的研究,將葡萄開花到漿果成熟過程中87個不同表達基因分成8個功能組,分別為:1)病程相關蛋白(幾丁質酶、β-1,3-葡聚糖酶、脂氧合酶、非特異性脂轉移蛋白、防御素等);2)非生物脅迫、細胞氧化還原平衡以及轉運蛋白(熱激蛋白、金屬硫蛋白、硫氧還蛋白、植物氧化還原酶家族和多酚氧化酶等);3)初級代謝(包括CO2同化作用、糖代謝、脂類代謝、氨基酸的生物合成);4)次生代謝;5)漿果的生長、膨脹和水分關系;6)乙烯代謝;7)過敏多肽和種子特異蛋白;8)其他有益蛋白質。Grimplet等對葡萄成熟果實3個組織(表皮、果肉和種子)的mRNA表達進行了系統的研究,在轉錄水平上,弄清了葡萄果實組織特異基因表達的網絡結構。通過葡萄微陣列分析,大約76%的基因在葡萄漿果組織表達,在mRNA水平上,其中約60%的基因表達具有顯著性差異,另外大于28%的基因具有極顯著差異。種子和果皮/果肉的mRNA表達差異最大。外果皮中,病原菌防御基因和色素相關基因的表達量高于果實其他組織的類黃酮生物合成、抗病和細胞膜修復基因。中果皮(主要的營養部分)中細胞膜功能和轉運作用的基因的表達量較高,種子(胚胎發育的主要資源)苯丙素生物合成酶、種子貯藏蛋白和胚胎晚期富集蛋白的表達量較高。Pilaff等通過對葡萄果實成熟過程中不同時期的基因表達分析,認為葡萄果實成熟有2個顯著的階段:轉熟期前表現細胞代謝過程,涉及激素信號和轉錄調控等大量基因的表達:轉熟期后為成熟果實表型特征相關的成熟特異代謝基因的表達。轉熟期階段發現了氧化爆發和抗氧化酶網絡的調節機制。
4.3葡萄蛋白質組學
隨著后基因組時代的到來。功能基因組研究成為研究的重點,而蛋白質組學研究是功能基因組一個重要的組成部分。
Giribaldi等對葡萄從開花到果實完全成熟過程通過雙向凝膠電泳分離了大約730個蛋白點,通過液體芯片蛋白指紋飛行質譜系統(MALDI-TOF)分析,有118個蛋白點有差異表達。這些蛋白質大多數與代謝、能量、蛋白合成與分解有關,較少與響應脅迫有關。并且認為在葡萄果實成熟過程中糖酵解普遍降低,病程相關蛋白增加,氧化脅迫降低,而大規模的細胞骨架重排。在果實成熟過程中,Zhang等分析葡萄果實成熟過程中質膜蛋白的差異表達,利用雙向凝膠電泳分離出了119個蛋白點,其中62個被認為是質膜蛋白,包括ATP合成酶、ABC轉運體和GTP結合蛋白等,分為8個功能組,分別為轉運、代謝、信號轉導、蛋白合成、能量、轉錄、細胞生物源以及一些未知蛋白。在果實成熟過程中,質膜蛋白含量逐漸降低。從葡萄轉熟期前到轉熟期后,泛素蛋白水解酶和細胞骨架蛋白增加。在葡萄轉熟期,玉米素O-葡萄糖基轉移酶表達量最高,泛蛋白連接酶E2-21下調。Vincent等研究了干旱和鹽脅迫對兩種釀酒葡萄Chardonnay和Cabernet Sauvignon的影響,發現品種Chardonnay較耐干旱和鹽脅迫。在品種Cabernet Sauvignon中,代謝相關蛋白含量有所增加,而在Chardonnay中,上調的蛋白質功能未知。
4.4葡萄代謝組學
所謂代謝組學是指某一生物或細胞所有低分子量代謝產物進行定性和定量分析的一門新學科,是功能基因組學研究的重要組成部分。代謝組的各種成分,即代謝產物是基因表達的終產物。代謝組是一個細胞或組織的生物化學表現型,可以全面了解該生物或細胞的生物化學狀態,獲得眾多信息。代謝組學將基因產物和基因聯系起來,揭示基因和表現型之間的關系,可以達到研究基因功能的目的。葡萄次生代謝產物尤其是多酚對葡萄酒的質量有很大的影響,而絕大多數的酚類物質是通過苯丙氨酸解氨酶途徑合成的。在紅色葡萄中,黃烷醇和花色苷的含量很多,花色苷主要積累在果皮中,而黃烷醇主要積累在種子中。葡萄基因組序列測序完成將會有助于弄清苯丙烷類代謝途徑。關于苯丙氨酸代謝途徑中的編碼相關酶的基因已經發現,這些基因大多數屬于大的基因家族如(PAL,F3’5’H)和較小的基因家族(如CHS,F3H,FLS,LAR),剩余的基因都是單拷貝基因,如C4H,4CL,CHI,F3’H,DFR,LDOX,ANR,UFGT)。萜類化合物是植物生長和發育過程中是必需的,在植物與外界環境之間的相互作用中起著非常重要的作用。異戊烯基焦磷酸IPP及其異構體二甲丙烯焦磷酸DMPP是大約22000類萜類化合物的前身。IPP在細胞質,DMAPP在質體中通過甲羥戊酸(MVA)以及(MVA)依賴DOXP/MEP途徑合成的。DMAPP、GPP、FPP或GGPP分別是單萜、倍半萜類和二萜的前身。
4.5表型組學
前面所闡述的是從“中心法則”“自上而下”地從基因序列一表現型來研究基因的功能并開發和利用,而表型組學則是“自下而上”地從表現型一基因序列來研究基因的功能并開發和利用(圖1)。這種研究方法也被認為是反向遺傳研究法。從葡萄的芽變人手研究其變異的機理是典型的反向遺傳研究法。人為的收集所有芽變或用不同方法誘導突變并將所有突變體保留并研究導致突變機理的則是表型組學。葡萄是比較容易發生芽變的樹種,但大部分無“有用價值”的芽變都沒有被保留下來。目前有很多方法來誘導突變,但有意識地誘導大量突變基本都是在其他模式植物上進行,如擬南芥、水稻和楊樹,特別是用各種T-DNA和transposon-插入法引導單基因變異。主要原因是葡萄缺乏高效的遺傳轉化體系。
5、各類和基因組學相關的數據庫
關于葡萄基因組學研究還有很多數據庫,為大家研究提供豐富的資源和數據,如VitisExpDB、全基因組芯片和ES%等。Genoseope(http://www.genoseope.cns.fr/sspip/Vitis-vinifera-whole-genome,html)存儲了葡萄基因組的序列和注釋信息,是研究葡萄基因組學的主要數據庫,由法國基因測序中心創建和維護。葡萄轉錄因子數據庫(DGTF)存儲了1625個葡萄轉錄因子,屬于67個家族。該數據庫對預測到的轉錄因子進行詳細注釋,每個轉錄因子條目均有基本信息、基因結構、功能域注釋和數據庫交叉鏈接。數據庫具有統一的界面,用戶可方便地進行瀏覽、檢索、BLAST搜索和數據下載,網址為:http://www.yaolab.sh.cn/dgtf/。多重平行定序(MPSS)是快速檢測基因表達的有力工具,葡萄MPSS數據庫(http://mpss.udel.edu/grape/)提供了葡萄的MPSS的詳細信息,便于研究葡萄的基因表達。EST是研究基因表達的重要數據,葡萄的EST主要收錄在NCBI的dbEST中。葡萄Unigene(http://www.nebi.nlm.nih.gov/UniGene/UGOrg,cgi?TAXID=29760)則對EST進行了聚類,使得同一基因的EST歸于一個條目中,并且提供電子表達譜數據(digital express profile),以便對基因表達作初步的分析。另外,NCBI的GEODatasets中還收錄了葡萄基因組芯片的數據(http://www.nebi.nlm.nih.gov/sites/entrez?db=gds),可用來對葡萄基因的時空特異表達作進一步的分析。
6、果樹后基因組時代帶來的挑戰和解決的方案
隨著多種植物基因組測序的完成,信息化、數字化技術的迅速發展,生物學信息量呈爆炸式增加。這給科研工作者帶來了更大的機遇和挑戰。在果樹的后基因組學領域主要表現在以下幾個方面:(1)缺乏研究基因組功能的資源。如基因組范圍的各種突變體庫,很大程度上限制基因功能的研究,導致目前大部分轉入葡萄的基因為外源基因;(2)在擬南芥等模式植物已經較為全面的研究了許多基因的功能,但是在葡萄等果樹樹種研究較少;(3)缺乏高效遺傳轉化體系,很大程度上限制了基因功能的研究和基因利用。由于目前仍沒有測序基因型的轉基因體系,導致仍無法建立各種突變體庫,如各種T-DNA、trans-poson插入庫。對存在的以上問題提出的擬解決方案:(1)盡快建立測序的基因型的轉基因體系,并創造研究基因功能的社區資源,如基因組范圍的突變體庫;(2)大量挖掘和篩選突變體庫以鑒定基因功能:(3)克隆和研究與其他植物同源的基因并研究其功能。
作者對中國葡萄(及其他果樹)后基因組分子生物學研究提出以下建議:(1)建立一個或多個基因型的高效遺傳轉化體系,特別是盡快建立測序的基因型的轉基因體系,并用該體系建立更多的研究社區可以分享的資源,如各種T-DNA插入突變體庫。(2)成立一個信息共享平臺,定期地交流研究成果,如在中國園藝學會下設中國果樹分子生物學分會(目前該工作已開展)。(3)建立與加強和國際同行的定期學術交流機制,如正在考慮中的中美果樹分子生物學和生物技術學協作會。(4)因我國在多種果樹的第一個測序工作中幾乎沒有參與,我國應認真考慮并盡快用下一代基因測序儀對我國特有的果樹進行測序,利用已測序的參考基因圖可以多快好省地獲得中國的特異果樹的全基因組序列和基因圖。