衛永樂,溫志芳,劉 芳,張杰偉,黃武剛,蘭彥平,程麗莉,曹慶昌,胡廣隆
(1.運城農業職業技術學院,山西 運城 044000;2.北京市農林科學院,北京 100093)
葉綠體在植物細胞中具有與光合作用密切相關的一整套基因。鑒于葉綠體基因組的大小、結構和基因型相對保守性,其已成為植物系統發育研究和識別物種的有力工具[1]。目前,某些葉綠體基因的功能已被研究,但有相當一部分基因是未知的,例如一大類基因,即開放閱讀框(ORF)。它的DNA序列所編碼的特定蛋白質名稱和功能仍在摸索中。由于ORF命名方法有諸多不妥,因此,學術界提出了一種新的YCF(假設葉綠體開放閱讀框)命名方法。例如,小麥的ORF38與菠菜ORF33的氨基酸序列相似性很高,因此都命名為ycf8基因[2]。
葉綠體DNA(cpDNA)序列已被分類學家廣泛用于重建植物系統發育[3],然而,相對較少的葉綠體基因組區域被用于系統發育研究[4-5]。蛋白質編碼基因容易比對,但通常更加保守,缺乏足夠的變異來解決種間和種內關系[6-7]。比較基因組的研究表明,葉綠體體基因 ycf1,(hypothetical chloroplast open reading frame 1)可以比matK基因變異度更高[8]。ycf1是葉綠體基因組中第二長的基因(僅次于ycf2),并存在于迄今測序的幾乎所有植物葉綠體基因組中[9]。YCF1蛋白的功能是未知的。盡管如此,DRESCHER等[10]研究已經證明,YCF1對植物生存至關重要。ycf1閱讀框通??缭降怪弥貜蛥^(IR)和小單拷貝(SSC)區域的邊界,這在葉綠體基因中是比較特殊的[9]。ycf1基因在系統發育研究中的效用最近才開始探索。NEUBIG等[11]研究表明,ycf1因為其保守的閱讀框,是相對容易擴增和比對的。此外,在蘭花分類學研究中,ycf1具有類似或僅低于細胞核核糖體DNA內轉錄間隔區(ITS)的高度變異性,比matK有更優異的分辨率。
榛屬植物約有20種,分布在北美洲、歐洲和亞洲;其中,我國有7種及3個變種,主要在東北、華北、西北和西南地區[12]。該屬植物的種子含油量大,在東北、華北地區當作油料;堅果可食用,為北方地區常見干果。喬木樹種木質硬,用于家具制作及建筑業。二代測序技術的應用加快了榛屬葉綠體全基因組研究,榛屬葉綠體全基因組的發表[13]為榛屬植物葉綠體基因奠定了生物信息學分析與鑒定的基礎。
本研究充分利用榛子葉綠體基因組數據庫,以榛屬ycf1基因家族成員為研究對象,著重分析其基因結構、跨膜區的結構特征和編碼區的保守結構域,并與擬南芥及相鄰的鐵木屬經過多重序列比對進行進化和分類分析,旨在為克隆榛子ycf1基因及進一步探索YCF1蛋白的功能奠定堅實的基礎。
榛屬、鐵木屬及擬南芥的ycf1基因及蛋白序列分別下載自 NCBI網站(https://www.ncbi.nlm.nih.gov)和 TAIR 數據庫(http://www.arabidopsis.org)。利用NCBI的Blast P檢索及CDS軟件(http://www.ncbi.nlm.nih.gov/cdd)預測所選蛋白有無YCF1結構域,判斷其是否屬于該基因家族。
利用數據庫,獲取榛屬中ycf1基因家族成員的基因注釋。
ycf1基因家族各成員所編碼蛋白質氨基酸的相似性分析[14]、α-螺旋、β-折疊及無規則卷曲等二級結構分析[15]、跨膜區結構[16]分析等分別采用Clustal Omega(http://www.ebi.ac.uk/Tools/msa/clustalo/),SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)和 TMHMMServer v.2.0(http://www.cbs.dtu.dk/services/TMHMM-2.0/)等軟件。
利用軟件 MEME(http://meme-suite.org/)分析擬南芥、鐵木屬和榛屬ycf1基因蛋白的保守結構域[17]。
榛屬和鐵木屬YCF1蛋白質空間結構模型的同源建模[18]由三級結構預測軟件 Swiss-Model(https://swissmodel.expasy.org/)的自動建模功能完成。
擬南芥、鐵木屬和榛屬的ycf1基因蛋白序列的比對利用Clustal X(2.0)[19]軟件進行;將比對結果用MEGA 6.0[20]軟件采用Neighborjoining法(bootstrap值設定為1 000)產生系統進化樹。
利用NCBI數據庫提供的Blast程序進行Blast P檢索(圖1),得到3個榛屬ycf1基因和1個鐵木屬ycf1基因。用保守域預測軟件CDS驗證了ycf1基因保守結構域的存在,初步確定榛屬中3個ycf1基因分別來自華榛、平榛、歐榛;另外,在同科相鄰的鐵木屬的天目鐵木中也確定了1個ycf1基因作為對比研究基因,即:YP009331532.1(華榛),AOZ20414.2(歐榛),YP009318292.1(平榛),YP009179114.1(天目鐵木)。這幾個基因均沒有內含子。


表1 YCF1蛋白氨基酸相似性分析%
ycf1基因家族各成員編碼蛋白質氨基酸的相似性分析結果表明,歐榛YCF1蛋白和華榛YCF1蛋白之間的相似性最高,達99.74%;歐榛YCF1蛋白和天目鐵木YCF1蛋白之間的相似性最低,為97.00%(表1)。二級結構預測分析結果表明,榛屬YCF1蛋白中 α-螺旋的比例最高(34.90%~35.89%),其次為無規則卷曲(29.91%~30.25%),再次為β-折疊(25.29%~26.15%),β-轉角最低(8.73%~9.04%)(表2)。榛屬YCF1蛋白的跨膜區結構分析結果表明,榛屬及鐵木屬YCF1蛋白均含有跨膜區(圖2)。

表2 榛屬及天目鐵木YCF1蛋白的二級結構信息 %
利用保守結構域預測軟件MEME分析了擬南芥、鐵木屬和榛屬ycf1基因家族的保守結構域,結果顯示,擬南芥、榛屬和鐵木屬ycf1基因家族包含3個保守結構域。其中,基序1的相似度為2.0e-625;基序2和基序3的相似度分別為3.7e-276和4.5e-343(圖3)。除了擬南芥ycf1基因At1YCF1,無論在樺木科的榛屬和鐵木屬中,還是在十字花科的擬南芥中,ycf1基因家族均含有3個結構域(圖3)。

本研究通過Swiss-Model對榛屬及鐵木屬YCF1蛋白進行同源建模,只發現有5%的序列能與已知模板匹配,即只與轉運蛋白AcrB的一個亞基同源。從圖4可以看出,Swiss-Model預測的榛屬及鐵木屬YCF1蛋白亞基三級結構的空間結構非常相似,暗示不同樺木科YCF1蛋白在生物學功能上存在相似性。

利用軟件MEGA 6.0對8個擬南芥YCF1蛋白、4個榛屬及鐵木屬YCF1蛋白的序列進行系統進化樹分析,結果表明,這12個YCF1蛋白序列基本按照物種聚類。YCF1蛋白系統進化樹大致上按照科別進行聚類,推測YCF1蛋白在樺木科和十字花科中生物學功能不盡相同。華榛YCF1(YP009331532.1)與歐榛 YCF1(AOZ20414.2)聚類在一起,暗示華榛YCF1可能具有與歐榛YCF1相似的進化過程和生物學功能(圖4)。YCF1蛋白在樺木科的進化并沒有完全按照屬聚類在一起,相對于平榛,天目鐵木的YCF1蛋白與歐榛及華榛的關系更近(圖 5)。

YCF1具體編碼的蛋白質名稱和功能仍在探索中。作為葉綠體基因組中2個最大的開放閱讀框架之一,ycf1常被認為是失去功能的假基因[21-23]。然而,YCF1的敲除試驗顯示,YCF1是細胞存活所必需的[24]。楊小飛等[25]研究發現,核基因組編碼的RNA結合蛋白PBR1,通過調控擬南芥YCF1在葉綠體中的翻譯效率,進而調節3個光合作用復合體的協同生成及穩定性的維持。目前,榛屬ycf1基因家族具體功能尚未鑒定。本研究通過生物信息學鑒定榛屬ycf1基因家族3個基因均含有跨膜區,均含有3個結構域,表明榛屬中不同種間ycf1基因家族中重要結構域存在高度保守性。另外,除了擬南芥ycf1基因編碼蛋白At1YCF1,無論在樺木科的榛屬和鐵木屬中,還是在十字花科的擬南芥中,ycf1基因家族均含有3個結構域。推測YCF1的3個結構域在植物諸多生理過程中發揮相似的作用。
進化分析結果表明,華榛YCF1(YP009331532.1)與歐榛YCF1(AOZ20414.2)聚類在一起,暗示他們可能具有相似的進化過程和生物學功能;YCF1蛋白在樺木科的進化并沒有完全按照屬聚類在一起,相對于平榛,天目鐵木的YCF1蛋白與歐榛及華榛的關系更近。基因的進化并非完全與種屬分類進化一致,同樣的情況出現在蘭花磷酸肌醇特異性磷脂酶C基因家族的進化中[26]。由此可見,榛屬YCF1各成員的生物學功能還需要進一步分析研究。
榛屬植物葉綠體基因組中ycf1家族基因,均不含有內含子。榛屬YCF1蛋白均含跨膜區和3個高度保守結構域。進化分析結果表明,華榛ycf1與歐榛ycf1可能具有相似的進化過程和生物學功能。