張玉葉,黃 寧,肖新換,蘇煒華,黃 瓏,羅 俊,闕友雄
(福建農林大學農業部福建甘蔗生物學與遺傳育種重點實驗室國家甘蔗產業技術研發中心,福州350002)
細胞色素C(Cytochrome C,Cyt C)是呼吸鏈中一個重要的電子傳遞體,由核基因編碼的多肽和線粒體編碼的亞鐵血紅素組成,其主要功能是通過分子中的半胱氨酸巰基與血紅素共價結合,通過血紅素輔基中心鐵離子價態的變化在細胞色素C還原酶(Cytochrome c reductase)和細胞色素c氧化酶(Cytochrome c oxidase) 之間傳遞電子[1-3]。Cyt C松散地結合在富含不飽和脂肪酸的線粒體內膜外側心磷脂上,表面帶正電荷,無法自由通過線粒體外膜[4]。Cyt C一般由103~113個氨基酸組成,其分子量小,多介于1.2~1.3 kDa。Cyt C蛋白含有18個賴氨酸,屬于堿性蛋白質,等電點10.5~10.8。該蛋白的性質很穩定,這是由于在Cyt C中,血紅素輔基heme除與軸向配體甲硫氨酸和組氨酸形成配位鍵外,還通過兩個半光氨酸形成兩個硫醚鍵和肽鏈共價相連[5]。此外,前人研究還發現,Cyt C在誘導細胞凋亡[6-9]和抗氧化[10]中也起著重要的作用。另一方面,鑒于Cyt C在生物進化中的高度保守性,可以應用于生物系統進化分類。綜合以上,Cyt C的相關研究一直受到生物學研究中的熱點問題之一,但在甘蔗中Cyt C的研究還處于初步階段,通過文庫的構建有測到相似基因的EST[11],但具體的功能驗證研究仍然需要完善。
電子克隆(In silico cloning)是一種基于EST或基因組的序列組裝和拼接,快速地獲得部分或全長cDNA的技術。該技術首先被運用在人、鼠和水稻等EST豐富的模式生物中[12-13],隨后在其它植物中此技術得到廣泛運用,在甘蔗中也有相關報道[14-15]。電 子 表 達 分 析 (Electronic expression analysis)是通過整合某物種中特定基因的所有相關表達序列標簽(Expression sequence Tag,EST)信息,從而獲得該基因表達相關信息的一種新型基因表達分析技術[16-17]。目前,電子表達分析常與電子克隆技術相結合,共同應用于新基因挖掘和基因功能分析,已被成功應用于多種植物目標基因的表達分析,此技術在甘蔗中也得到逐步運用[15-16]。
本研究利用電子克隆方法,以甘蔗類似細胞色素C的EST序列CF576943.1為探針,通過電子克隆技術獲得了甘蔗細胞色素C基因,用生物信息學方法對該基因氨基酸序列與組成、亞細胞定位、跨膜區與信號肽、疏水性/親水性、蛋白質二、三級結構以及功能等進行分析與預測,而后采用電子表達分析技術分析該基因表達情況。研究為深入解析甘蔗細胞色素C基因的結構與功能提供了參考與借鑒依據。
以甘蔗類似細胞色素C的EST序列CF576943.1為探針,使用Blastn檢索甘蔗EST數據庫,選取與探針序列同源性較高的甘蔗EST序列,使用在線工具CAP3(http://pbil.univ-lyon1.fr/cap3.php)進行拼接,以拼好的contig重疊群為新探針,再次比對檢索,直到沒有新的 EST可供拼接為止[15-16]。將拼接所得的 contig用 ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)軟件查找其開放讀碼框,有完整的開放讀碼框則為基因序列。
利用 ExPASy中ProtParam pI/Mw(http://web.expasy.org/compute_pi/)分析基因的理化性質;SignalP 4.1 Server(http://www.cbs.dtu.dk/services/SignalP/)分析編碼蛋白的信號肽有無;利用 ProtScale(http://web.expasy.org/protscale/)分析蛋白的親疏水性;利用Profun 2.2 Server(http://www.cbs.dtu.dk/services/ProtFun/)預測蛋白的功能;利用 Psort(http://www.psort.org/)分析查看蛋白的亞細胞定位;SWISSMODEL(http://swissmodel.expasy.org/) 進行蛋白質三級結構預測。最后利用Blast查找同源氨基酸序列。
將得到的同探針序列同源性較高的甘蔗EST序列在NCBI中逐一分析;根據這些EST序列的登陸信息得出所有EST序列組織來源,最后計算出在不同組織中的出現比例及各EST序列來源材料受到的生物或非生物脅迫情況,分析該基因的組織特異性表達情況和不同脅迫條件下的表達特性[14-16]。
以甘蔗類似細胞色素C的EST序列CF576943.1為探針,在甘蔗EST數據庫中比對檢索,選中1條同源性高的甘蔗EST序列。CAP3拼接重組該EST聚類(Unigene)的28條非冗余甘蔗EST后獲得2條重疊群序列,通過ORF Finder軟件和Blast分析比對,最終得到一個全長為1 073 bp的基因序列。該cDNA序列具有完整的開放閱讀框(ORF,377~715 bp),編碼112個氨基酸,說明此序列為一條完整的甘蔗細胞色素C基因的cDNA序列,命名為ScCyt C。圖1為電子克隆所得的序列。

圖1 電子克隆獲得的甘蔗ScCyt C基因的cDNA序列及其推導的氨基酸序列(*終止密碼子)Fig.1 Nucleotide acid sequence and deduced amino acid sequence of sugarcaneScCyt C gene obtained by in silico cloning(* stop codon)
2.2.1 甘蔗ScCyt C基因編碼氨基酸的一級結構預測
通過在線工具ExPASy對甘蔗ScCyt C基因編碼氨基酸進行一級結構預測(見表1),可知,在甘蔗中Cyt C的一些一級結構預測結構與前人在其他不同植物中研究的Cyt C表現普遍的理化性質大致相符[5]。
2.2.2 甘蔗ScCyt C蛋白二級結構預測和分析
通過在線軟件GOR IV對甘蔗ScCyt C蛋白進行二級結構預測(見圖2,表2),結果顯示無規則卷曲所占比例最大65.18%,主要集中在1~50aa。α-螺旋和延伸鏈所占的比例相差不遠分別為15.18%和19.64%。α-螺旋主要集中在100~110aa。

表1 ScCyt C的一級結構預測分析Table1 Primary structure analysis of ScCyt C

圖2 甘蔗ScCyt C蛋白二級結構預測Fig.2 Predicted secondary structure of sugarcane ScCyt C protein

表2 甘蔗ScCyt C蛋白二級結構預測分析Table 2 Secondary structure prediction of sugarcane ScCyt C protein
2.2.3 甘蔗ScCyt C蛋白信號肽預測和分析
ScCyt C基因的蛋白序列進行信號肽預測結果如表3、圖3所示:第23位半胱氨酸殘基具有最高的原始剪切位點分值0.110和第1位甲硫氨酸具有最高的信號肽分值0.112,第12位脯氨酸殘基具有最高的綜合剪切位點分值0.112。由于最后算得氨基酸殘基的加權平均值較小0.112(?0.5),則推測ScCyt C基因所編碼的蛋白不存在信號肽,說明該蛋白為非分泌性蛋白,在細胞質中合成后不能進行蛋白轉運。與前人研究該基因在線粒體內膜外側上,不能自由通過線粒體外膜的結果相符[4]。

圖3 甘蔗ScCyt C蛋白信號肽預測Fig.3 Signal P-NN prediction for sugarcane ScCyt C protein

表3 甘蔗ScCyt C蛋白信號肽預測Table 3 Signal P-NN prediction for sugarcane ScCyt C protein
2.2.4 甘蔗ScCyt C蛋白疏水性/親水性的預測和分析
ScCyt C基因所編碼氨基酸序列的疏水性/親水性預測結果如圖4所示,第107位具有最高分值為0.700,則疏水性最強;第96位具有最低分值-2.122,則親水性最強。Cyt C基因所編碼蛋白序列GRAVY值為-0.651,故推測甘蔗ScCyt C是一種親水蛋白。

圖4 甘蔗ScCyt C蛋白氨基酸疏水性/親水性預測Fig.4 Predicted hydrophobicity/hydrophilicity of the amino acid sequence of sugarcane ScCyt C protein
2.2.5 甘蔗ScCyt C蛋白質三級結構預測
甘蔗ScCyt C蛋白質三級結構預測結果如圖5所示:ScCyt C的空間結構以無規則卷曲和螺旋為主。將該蛋白與玉米、粟米和高粱中Cyt C蛋白的三級空間結構虛擬圖,結果顯示甘蔗的三級空間結構在四個近緣物種中高度相似。

圖5 甘蔗ScCyt C蛋白三級結構預測Fig.5 Predicted third structure of sugarcaneScCyt C protein
2.2.6 甘蔗ScCyt C蛋白的功能預測
甘蔗ScCyt C蛋白功能預測結果如表4所示,該蛋白的最主要功能為翻譯,也有一定可能性參與了復制與轉錄、中間代謝、脂肪酸新陳代謝、能量新陳代謝。

表4 甘蔗ScCyt C蛋白功能預測Table 4 Function prediction for sugarcane ScCyt C protein
2.2.7 甘蔗ScCyt C蛋白的亞細胞定位
ScCyt C蛋白亞細胞定位預測結果如表5所示,甘蔗ScCyt C蛋白可能定位于細胞質或葉綠體中。由于細胞色素C是生物氧化的一個非常重要的電子傳遞體,在線粒體和葉綠體中,細胞色素常常結合在電子傳遞和相關代謝途徑的復合物酶中,則預測結果與實際相符。

表5 甘蔗ScCyt C蛋白的亞細胞定位Table 5 Subcellular location ofScCyt C protein
2.2.8 甘蔗ScCyt C蛋白的保守結構域分析
ScCyt C蛋白的保守結構域預測結果如圖6所示,甘蔗ScCyt C蛋白包含Cytochrom C superfamily一個保守結構域。

圖6 甘蔗ScCyt C蛋白的保守結構域分析Fig.6 Conserved domain prediction of ScCyt C protein
2.2.9 甘蔗ScCyt C蛋白的同源氨基酸序列比對與進化分析
使用NCBI中的Blastp程序,對甘蔗ScCyt C蛋白的氨基酸進行同源性分析。選擇玉米(Zea mays_gb|NP_001170028.1||)、粟米(Setaria italica_gb|XP_004962043.1||)、高粱(Sorghum bicolor_gb|XP_002439820.1||)、馬鈴薯(Solanum tuberosum_gb|AFX66977.1||)番茄(Solanun lycopersicum_gb|XP_004230430.1||)、水稻(Oryza sativa Japonica Group_gb|NP_00105 5578.1||)、向日葵(Helianthus annuus_gb|P00070.3|)和二穗短柄草(Brachypodium distachyon_gb|XP_003568426.1|)進行分析,蛋白的氨基酸序列相似性分別為99%、99%、98%、94%、94%、93%、92%和91%。
用軟件DNAMAN軟件多重地對甘蔗與上述8個近緣物種中的Cyt C蛋白的氨基酸序列(圖7),并輸出有根系統進化樹(圖8)。從圖7可以看出,同屬單子葉植物的甘蔗和玉米同源性最高。圖8系統進化樹顯示:單子葉植物甘蔗、玉米、粟米和粟米為一分支,同屬雙子葉植物的番茄、馬鈴薯和甘蔗同源性較低,但不同物種件同源性高達90%以上,僅有幾個氨基酸的差別。因此,該基因在不同物種間具有高度的保守性,它們對應的蛋白屬于同一個家族。

圖7 甘蔗ScCyt C蛋白與其它植物種蛋白的氨基酸序列比對Fig.7 Homology analysis of ScCyt C encodes amino acid sequences and those from other plant species

圖8 九種植物基于Cyt C基因氨基酸序列的系統進化樹Fig.8 Phylogenetic tree of nine plant species based on amino acid sequences of the Cyt C gene
甘蔗ScCyt C基因的電子表達結果如表6和圖9所示,在甘蔗根尖、根頸、花序、葉片、莖、全株和芽中組成型表達,與其他組織類型中表達量相比,其中在根和莖中的表達量高。此外,該基因的表達受低溫調控(見表6,圖9)。

表6 甘蔗ScCyt C基因電子表達分析的EST分類結果Table 6 EST classification results analysis

圖9 甘蔗ScCyt C基因電子表達分析結果Fig.9 The electronic expression analysis result of ScCyt C gene
電子克隆和電子表達分析技術由于其簡便高效的特性已經被廣泛應用于已用于動植物基因克隆及其表達分析[11-18]。甘蔗EST數據庫中包含了大約28萬條EST,已經能夠非常好地覆蓋甘蔗的全基因組,這也說明了基于電子克隆和電子表達分析技術克隆目標基因并對其表達特性進行分析的可行性和準確性。本研究通過電子克隆技術獲得了甘蔗細胞色素C基因的一條cDNA全長序列,生物信息學方法結果表明:甘蔗Cyt C基因全長1 073 bp,編碼112個氨基酸,蛋白質結構穩定,分子量為1.29 kDa,氨基酸帶正電荷,偏堿性。該基因位于細胞質或葉綠體中,編碼蛋白為非分泌型親水蛋白,無規卷曲為主要二級結構原件,含有1個保守功能域,主要功能為翻譯。分析還揭示,甘蔗細胞色素C是分子量小,帶正電荷,穩定的親水蛋白,這與前言研究結果是相似的[4-5]。甘蔗的Cyt C蛋白與其他植物同源序列比對,表現出高度保守性,其三級結構與同為C4單子葉植物的玉米、粟米和高粱極為相似,與單子葉植物馬鈴薯、番茄的同源性也高達90%以上,這從一定程度上說明Cyt C蛋白可以成為研究生物進化的代表性蛋白。另一方面,本研究利用Unigene數據庫分析了甘蔗細胞色素C基因的電子表達情況,檢索到28條同源性較高的EST序列,該基因在甘蔗各個組織均有表達,其中在莖和根中的表達量比其他組織類型中表達量高,此外,該基因的表達可能受到低溫的調控。但是,鑒于Cyt C基因與電子傳遞鏈相關,定位于葉綠體,理論上在葉片中的表達量應較高,故電子表達分析的結果需進一步通過定量PCR或者Northern雜交等技術分析的修正與完善。本研究為進一步深入研究甘蔗天細胞色素C基因的結構及其功能奠定了一定的基礎。
References)
[1] DOPNER S,HILDEBRANDT P,ROSELL F I,et al.The structural and functional role of lysine residues in the binding domain of cytochrome c in the electron transfer to cytochrome c oxidase [J]. European Journal of Biochemistry,1999,261,(2):379-91.
[2] WANG Y,MARGOLIASH E.Enzymic activities of covalent 1∶1 complexes of cytochrome c and cytochrome c peroxidase[J].Biochemistry,1995,34(6):1948 -58.
[3] MEI H,WANG K,PEFFER N,et al.Role of configurational gating in intracomplex electron transfer from cytochrome c to the radical cation in cytochrome c peroxidase[J].Biochemistry,1999,38(21):6846 -54.
[4] 馬偉科,張宏艷.線粒體細胞色素C與細胞凋亡[J].實用醫學雜志,2007,23(23):3786-3788.MA Weike, ZHANG Hongyan. Therelationshipof cytochrome C in the mitochondrial and cell death [J].The Journal of Practical Medicine,2007,23(23):3786-3788.
[5] 馬志科,昝林森.細胞色素C在生物醫學方面的研究進展[J].畜牧獸醫雜志,2006,25(5):30-35.MA Zhike,ZAN Linsen.The advancement of cytochrome C on biology medicine[J].Journal of Animal Science and Veterinary Medicine,2006,25(5):30-35.
[6] 孫英麗,趙允,劉春香,等.細胞色素C能誘導植物細胞編程性死亡[J].植物學報,1999,41(4):379-383.SUN Yingli, ZHAO Yun, LIU Chunxiang, etal.Cytochrome c can induce programmed cell death in plant cells[J].Acta Botanica Sinica,1999,41(4):379 -383.
[7] 王艷杰,鄧雯,張鵬飛.細胞色素C與細胞凋亡研究進展[J].動物醫學進展,2012,33(7):89-92.WANG Yanjie, DENG Wen, ZHANG Pengfei. The research progress of cytochrome c about cell death [J].Progress in Veterinary Medicine,2012,33(7):89-92.
[8] LI K,LI Y,SHELTON J M,et al.Cytochrome c deficiency causes embryonic lethality and attenuates stress-induced apoptosis[J].Cell,2000,101(4):389 -99.
[9] LIU Z,LIN H,YE S,et al.Remarkably high activitiesof testicular cytochrome c in destroying reactive oxygen species and in triggering apoptosis[J].Proceedings of the National Academy of Sciences,2006,103,(24):8965-70.
[10] ZHAO Y,WANG Z B,XU J X.Effectof cytochromecon the generation and elimination of O2and H2O2in mitochondria[J].Jaurnal Biological Chemistry,2003,278(4):2356-60.
[11] CASU R E,DIMMOCK C M,CHAPMAN S C,et al.Identification of differentially expressed transcripts from maturing stem of sugarcane by in silico analysis of stem expressed sequence tags and gene expression profiling[J].Plant Molecular Biology,2004,54(4):503 -17.
[12]王海濤,暢繼武,馬小兵,等.人和大鼠自噬相關新基因WIPI-3的電子克隆和序列分析[J].現代生物醫學進展,2006,6(4):16-21.WANG Haitao,CHANG Jiwu,MA Xiaobing,et al.Identification and characterization ofhuman and rat autophagy-related novelgene WIPI3 in silico [J].Progress in Modern Biomedicine,2006,6(4):16-21.
[13]黃驥,王建飛,張紅生,等.水稻葡萄糖-6-磷酸脫氫酶 cDNA的電子克隆[J].遺傳學報,2002,29(11):1012-1016.HUANG Ji,WANG Jianfei,ZHANG Hongsheng,et al.In silico cloning of glucose-6-phosphate dehydrogenase cDNA from rice(Oryza Sative L.) [J].Acta Genetica Sinica,2002,29(11):1012-1016.
[14]黃寧,張玉葉,蘇亞春,等.甘蔗天冬氨酰半醛脫氫酶基因的電子克隆與分析[J].生物信息學,2013,11(2):91-99.HUANG Ning, ZHANG Yuye, SUE Yachun, et al.Electronic cloning and characterization ofsugarcane ScASADH gene using bioinformatics tools[J].Chinese Journal of Bioinformatics,2013,11(2):91-99.
[15]張玉葉,黃寧,闕友雄,等.甘蔗蘇氨酸脫氨酶基因的克隆與表達分析[J].熱帶作物學報(待發表).ZHANG Yuye,HUANG Ning,QUE Youxiong,et al.Cloning and expression analysis of threonine deaminase gene in sugarcane [J].Chinese Journal of Tropical Crops,2014,35(1):1 -7.
[16]黃寧,張玉葉,闕友雄,等.甘蔗二氨基庚二酸異構酶基因的克隆與表達分析[J].熱帶作物學報,2013,34(11):2200-2208.HUANG Ning,ZHANG Yuye,QUE Youxiong,et al.Cloning and expression analysis of a diaminopimelate epimerase gene in sugarcane [J].Chinese Journal of Tropical Crops,2013,34(11):2200 -2208.
[17]上官凌飛,王晨,房經貴,等.利用GenBank中大量葡萄EST序列分離有效基因的電子表達分析平臺[J].中國農業科學,2011,44(13):2748-2759.SHANGGUAN Lingfei,WANG Chen,FANG Jinggui,et al.Isolation of effective genes with digital northern platform of NCBI grapevine(Vitis vinifera L.)EST sequences[J].Scientia Agricultura Sinica,2011,44(13):2748-2759.
[18]王麗芳,杜希華,于涌鯤,等.番茄WRKY轉錄因子基因片段的克隆及序列分析[J].中國農學通報,2009,25(23):70-73.WANG Lifang,DU Xihua,YU Yongkun,et al.Cloning and Sequence Analysis of WRKY Transcription Factor GeneFragmentin tomato [J].ChineseAgricultural Science Bulletin,2009,25(23):70 -73.