孫洋洋,馬玉珍,石晶瑜
(1.內(nèi)蒙古師范大學,內(nèi)蒙古呼和浩特010000;2.內(nèi)蒙古醫(yī)院,內(nèi)蒙古呼和浩特010000)
在精子發(fā)生這一復雜的生理過程中,減數(shù)分裂時期顯得尤為重要。染色體的復制、分離,基因突變和缺失都可能使精子發(fā)生異常,進而導致男性不育。在與男性不育[1]相關的眾多調控因子當中,DAZ家族就是其中非常重要的調控因子。它包括三個基因成員:DAZ、DAZL、Boule。DAZ 位于 Y 染色體上[2],主要在靈長類動物中發(fā)現(xiàn)該基因;DAZL(Deleted in azoospermia-like)位于常染色體,在哺乳動物、脊椎動物中存在;Boule[3]基因也是位于常染色體上,在線蟲、哺乳動物、果蠅及脊椎動物中存在,并且在第一次減數(shù)分裂時期高表達。Boule是一個高度保守的基因,它編碼精子發(fā)生減數(shù)分裂所需要的RNA結合蛋白。Boule基因全序列為編碼區(qū)起始于序列的118,終止于322,存在CpG島,長度為205bp。編碼區(qū)兩側為254bp的5’非翻譯區(qū)和308bp的3’非翻譯區(qū),在3’末端的polyA尾上游處有一個加尾信號AATAAA。Kostova[4]發(fā)現(xiàn) Boule在睪丸組織中特異性表達的三個轉錄剪接體,其N末端又由三個選擇性剪接外顯子編碼。盡管調節(jié)精子發(fā)生的基因發(fā)生著迅速的進化,但是從昆蟲到人類的Boule基因仍維持著保守的功能域[5],果蠅的Boule突變會使精子發(fā)生在減數(shù)分裂時期受阻從而導致雄性不育。Eugene Yu jun Xu[5]等人在因 Boule缺失或突變導致的雄性不育蒼蠅睪丸中導入人的Boule基因轉錄組,發(fā)現(xiàn)雄性不育果蠅能產(chǎn)生正常的精子。人類與果蠅Boule基因相似的功能表明人的Boule基因與果蠅的Boule基因直系同源,并且在調節(jié)減數(shù)分裂上,它在人類中的功能很可能與果蠅類似。人類精子發(fā)生過程中,減數(shù)分裂M期的起始是受M期啟動因子MPF控制的,而MPF由細胞周期蛋白B和CDC2(Cell division cycle 2)組成。這個復合物是恢復減數(shù)分裂必需的,其活性受可逆磷酸化的調控,Wee1和 Myt1激酶使其磷酸化可致其失活,而CDC25磷酸酶可以使其活化,誘導細胞周期G2/M轉換的完成[6]。目前已發(fā)現(xiàn)3種人類CDC25基因,其中CDC25A在睪丸中高表達,對精子發(fā)生至關重要[7],特別是在初級和次級精母細胞中表達,與Boule蛋白的初始表達階段一致。在Boule缺乏的患者中,CDC25A磷酸酶基因mRNA仍然表達,有的甚至出現(xiàn)上調,但并沒有翻譯成具有功能的蛋白,而CDC25A磷酸酶的缺乏可能導致MPF超磷酸化,使MPF完全失活,這可能是患者精子發(fā)生阻滯的主要原因,Boule和CDC25A同時缺乏的患者減數(shù)分裂發(fā)生阻滯。Boule基因在哺乳動物其它組織器官中的功能,尤其是它在精子發(fā)生中的所起的作用尚不完全清楚[9],但Boule是精子生成所不可缺少的一個基因,它的表達在精子發(fā)生過程中起關鍵作用。
人 (Homo sapiens,AF272858)、斑 胸 草 雀(Taeniopygia guttata,XM-004175306.1)、虹鱒魚(Oncorhynchus mykiss,HQ696915)、曼氏裂體吸蟲(Schistosoma mansoni,XP-002575519.1)、擬南芥(Arabidopsis thaliana,NM-111126.3)、黑腹果蠅(Drosophila melanogaster,NM-079265)、小鼠(Mus musculus, AF272859)、牛 (BosTaurus, NM-001102115)、松鼠猴 (Saimiri sciureus,AJ717408)、倭黑猩猩(Pan paniscus,AJ717405)等10種Boule基因的mRNA序列及其相應的氨基酸序列,均來自美國國家生物信息中心(NCBI,National center for biotechnology information) 網(wǎng) 址:http://www.ncbi.nlm.nih.gov/。物種分類如圖1所示。

圖1 10個物種的分類圖Fig.1 The ten species investigated in this study
1.2.1 Boule基因的mRNA序列和蛋白序列分析
通過NCBI網(wǎng)站的Gene數(shù)據(jù)庫、Nucleotide數(shù)據(jù)庫和Protein數(shù)據(jù)庫查詢?nèi)恕⒓倚Q等10種Boule基因的mRNA序列、氨基酸序列,基因所在的染色體及其蛋白質質量。
1.2.2 Boule蛋白質序列比對分析
利用 EBI(網(wǎng)址:http://www.ebi.ac.uk)網(wǎng)站的Clustalw Omega(網(wǎng)址:http://www.ebi.ac.uk/Tools/msa/clustalo/),對10種動物的Boule蛋白的氨基酸序列做比對分析。
1.2.3 Boule蛋白分子進化分析
利用分子進化遺傳分析軟件MEGA5.05(Molecular evolutionary genetics analysis)對10種動物的全長Boule蛋白做序列比對分析。系統(tǒng)進化樹采用鄰接算法,自檢舉5 000次,采用泊松校驗計算距離。
1.2.4 Boule蛋白的氨基酸的理化性質分析
利用 Expasy(網(wǎng)址 http://www.expasy.org/)的ProtParam工具 (網(wǎng) 址:http://web.expasy.org/protparam/)對人的Boule蛋白氨基酸序列的相對分子質量、氨基酸組成、等電點(PI)、不穩(wěn)定系數(shù)等物理化學性質進行分析。
1.2.5 疏水性/親水性的預測和分析
利用Expasy網(wǎng)站的protscle(網(wǎng)址:http://web.expasy.org/protscale/)在線分析工具對人類Boule基因編碼的蛋白氨基酸序列的疏水性親水性進行分析。所有的參數(shù)按照軟件的默認值。
1.2.6 信號肽分析
對人類Boule蛋白氨基酸序列,利用在線分析工具SignalP 4.0 Server(網(wǎng)址:http://www.cbs.dtu.dk/services/SignalP/)分析該氨基酸序列的信號肽的存在位置及序列。
1.2.7 跨膜結構的預測和分析
跨膜結構域常常是由跨膜蛋白的效應區(qū)域所展現(xiàn),一般由20個左右的疏水性氨基酸殘基組成,主要形成α-螺旋。利用在線工具TMHMM Server v.2.0(網(wǎng) 址: http://www.cbs.dtu.dk/services/TMHMM/)對人類Boule蛋白進行跨膜結構分析。
1.2.8 卷曲螺旋域分析
在很多的天然蛋白質中,都存在卷曲螺旋,該結構具有重要的生物學功能,比如分子識別、運動和調控代謝等。利用在線分析工具COILS(http://www.ch.embnet.org/software/COILS-form.html)對 Boule蛋白進行卷曲螺旋域分析。
1.2.9 亞細胞定位分析
利用在線亞細胞定位工具TargetP-1.1 Server(http://www.cbs.dtu.dk/services/TargetP/),輸入Boule基因編碼的蛋白序列,在序列來源選擇Nonplant,其它選項用默認值,確認Boule基因編碼的蛋白主要在細胞中發(fā)揮作用的部位。然后再用PSORTⅡserver(http://psort.hgc.jp/form2.html/) 工具進一步分析來驗證上述工具分析結果的準確性。
1.2.10 與Boule蛋白相互作用的蛋白分析
在STRING數(shù)據(jù)庫中(http://string-db.org/)查詢與Boule蛋白相關作用的蛋白。主要研究與Boule蛋白直接或者間接作用的相關蛋白。之所以研究其蛋白之間的相互作用關系,是因為可以通過與其相關蛋白的功能信息,了解和預測該蛋白的功能及其它信息。
1.2.11 Boule蛋白的二級結構預測
利用基于 GOR算法的 GOR4(http://npsapbil.ibcp.fr/cgi- bin/npsa-automat.plpage=npsagor4.html)在線工具預測該蛋白是否具模體、無規(guī)則卷曲、β轉角、β折疊及α螺旋等結構。進一步用PredictProtein軟件對Boule的二級結構進行分析。
1.2.12 Boule蛋白的功能域預測和分析
分析蛋白質的組成及其中所包含的功能域是了解蛋白質功能的重要一步。蛋白質中的功能域是參加蛋白質之間相互作用的結構和功能單位。利用Pfam數(shù)據(jù)庫(http://pfam.janelia.org/search/) 檢測蛋白功能域的組成,主要對其進化過程中的高度保守的特異性區(qū)域進行分析。
從NCBI網(wǎng)站相應的數(shù)據(jù)庫中得到10種動物的全長Boule蛋白序列和 mRNA序列(見表1)。不同動物Boule基因的蛋白質大小不同,位于常染色體上。曼氏裂體吸蟲的Boule蛋白最大,為509 aa;虹鱒魚最小,為194 aa;小鼠的 Boule蛋白是297 aa;人、松鼠猴、倭黑猩猩的Boule蛋白質大小相等,均為283 aa;牛的Boule蛋白大小是295 aa;黑腹果蠅的Boule蛋白大小為228 aa;野豬則為293 aa。

表1 10種不同動物Boule基因查詢信息Table 1 Information of Boule genes in 10 different animals
對10種動物的Boule蛋白氨基酸序列做比對分析(見表2)。哺乳動物類人、鼠、牛、松鼠猴、倭黑猩猩之間的Boule蛋白序列的相似度很高,在90% ~99%之間。其中人與倭黑猩猩的Boule蛋白相似度很高,高達99%。哺乳動物與其它類動物Boule蛋白序列的相識度比較低,在31% ~52%之間,其中哺乳動物與黑腹果蠅的Boule蛋白序列相似度為31%~37%之間。曼氏裂體吸蟲與擬南芥Boule蛋白序列相似度最低僅為1%,表明了Boule基因在進化中其功能的高度保守性。

表2 不同物種的Boule蛋白全長序列多序列比對的結果Table 2 Mutiple sequence alignment of Boule protein in different animals
由分子進化圖(見圖2)中可以看出,Boule蛋白在這10個物種中,主要分為兩大類。擬南芥獨自一類,其它9個物種為一大類;在哺乳動物中,很明顯的又分為兩類,小鼠、牛、松鼠猴為一類,人、黑猩猩為一類并且親緣關系也最近。鳥類,魚類與哺乳動物的親緣關系也比較近。
Boule蛋白分析表明:Boule蛋白含有283個氨基酸,分子質量為31 299.86 Daltons,含量最豐富的氨基酸為 Pro、Ser、Val等(見表 3)。
蛋白質能夠折疊,主要因為其具有親水性/疏水性的氨基酸。對其疏水性和親水性進行分析可以更好地了解蛋白質。該蛋白的疏水區(qū)共有9處(圖3),分別為 33~36,38~40,123~128,167~169,171~173,205 ~207,232 ~234,237~238,265 ~267。親水區(qū)共有15處,分別為5~8,18~19,21~25,29~30,42~54,57 ~59,69 ~72,81 ~91,94 ~104,108 ~111,114 ~116,135 ~142,157~161,176 ~199,241 ~252。其中第168位最高,值為1.733;第98位最低,值為-2.622。P氨基酸分值最高表明其疏水性最強,Y氨基酸分值最低表明其親水性最強。縱觀Boule蛋白,氨基酸序列存在明顯的親水區(qū)和疏水區(qū)。

圖2 用鄰接法(NJ)構建的10種動物Boule蛋白的系統(tǒng)進化樹Fig.2 Phylogenetic tree of Boule protein sequence from 10 different animals

表3 boule蛋白的氨基酸理化性質Table 3 Physicochemical properties of boule protein
在核糖體合成蛋白后,往往需要到達細胞中制定的位置才能發(fā)揮其功能。而蛋白能否到達細胞中的特定位置,則完全由信號肽進行引導。經(jīng)SingnalP 4.0預測Boule蛋白的信號肽序列,結果見圖4。由圖4可知,Boule蛋白不存在信號肽,屬于非分泌型蛋白質。與 PredictProtein數(shù)據(jù)庫(http://www.predicprotein.org)分析的結果一樣。

圖3 Boule蛋白氨基酸序列的疏水性/親水性預測Fig.3 Hydrophobicity/phydrophilicity prediction of the Boule protein

圖4 Boule蛋白信號肽預測Fig.4 Signal peptide prediction of the Boule protein
用在線工具TMHMM-2.0對Boule蛋白進行跨膜結構分析如圖所示(見圖5),結果表明Boule蛋白跨膜的可能性為0,所以Boule蛋白不存在跨膜結構域,屬于非跨膜蛋白質類。

圖5 Boule蛋白跨膜區(qū)域預測Fig.5 Transmembrane domain prediction of the Boule protein
卷曲螺旋存在于很多天然的蛋白質當中,由圖6所示,在窗口為14和21的時候,在75~100處可能形成卷曲螺旋。

圖6 Boule蛋白的卷曲螺旋預測Fig.6 Coiled - coil prediction of the Boule protein
如圖7所示,Boule蛋白基本上排除了在分泌途徑上的功能,與信號肽分析的結果一致。與日本的PSORTⅡserver圖8比較,Boule蛋白在細胞質、細胞核和線粒體內(nèi)表達。文獻報道,Boule蛋白在第一次減數(shù)分裂(前中期)的生殖細胞中表達,從細線期精母細胞(Leptotene spermatocytes)開始表達,到偶線期精母細胞(Zygotene spermatocytes)表達量增加,在粗線期精母細胞(Pachytene spermatocytes)表達量達到最高水平,到雙線期(Diplotene)表達量顯著下降,在圓形精子細胞(Round spermatids)、長形精子細胞(Elongating spermatids)等精子發(fā)生更高級階段的細胞中Boule不表達,在胚胎早期、原始生殖細胞(Primordialgerm cells)和精原細胞(Spermatogonial cells)中均未檢測到Boule蛋白的表達[9],Boule蛋白在細胞質中特異表達在細胞核或接近減數(shù)分裂的染色體中未見表達。人類精子發(fā)生過程中,減數(shù)分裂M期的啟始受減數(shù)分裂啟動因子MPF控制,而MPF是一個由細胞周期蛋白 B和Cdc2(Cell division cycle 2)組成的復合物,這個復合物對減數(shù)分裂的恢復是必需的,其活性受可逆磷酸化的調控,Wee1和Myt1激酶使MPF磷酸化可致其失活,而Cdc25磷酸酶可以使MPF活化,誘導G2/M轉換的完成。

圖7 Boule蛋白的亞細胞定位Fig.7 Subcellular localization prediction of Boule protein

圖8 Boule蛋白的細胞定位Fig.8 Cellular localization prediction of Boule protein
每一種蛋白質并不是孤立地存在于細胞中,而是與其他蛋白質相互作用形成復合體或功能模塊,從而在細胞中進行各種不同的生理活動(見圖9)。在果蠅中,PUM2蛋白與 Boule蛋白相互作用[10]。Boule激活并調控CDC25A的表達并且促進CDC25AmRNA的翻譯,CDC25A蛋白進一步促使MPF中的Cdc2磷酸化,激活促成熟因子(Maturation-promoting factor,MPF),活化的MPF啟動減數(shù)分裂過程G2PM的轉換,完成減數(shù)分裂過程。Boule蛋白的缺失或突變可能導致雄性不育。

圖9 Boule蛋白相互作用的蛋白分析Fig.9 Analysis of protein interaction with Boule
該蛋白由 9.19% α-螺旋(Alpha helix)、22.26%延伸鏈(Extended strand)和68.55%無規(guī)則卷曲(Random coil)所組成。進一步用PredictProtein軟件對Boule的二級結構進行分析,螺旋=7.4%,股=8.8%,環(huán)=83.7%,非正規(guī)二級結構區(qū):92-283(見圖10)。

圖10 Boule蛋白的二級結構預測Fig.10 Secondary structure prediction of the Boule protein
在35位點開始,106位點結束,存在RRM(RNA recognition motif)保守域(見圖11),說明Boule基因在哺乳動物中具有RRM基序、編碼RNA結合蛋白的特性[11]。

圖11 Boule蛋白結構域預測Fig.11 Predicted the structure domain of Boule protein
RRM是RNA結合蛋白中廣泛存在的一種保守結構,它存在很多不同的RNA結合蛋白中,如異質性核糖蛋白(Heterogeneous nuclear ribonucleoproteins(hnRNPs)),在RRM基序中含有許多保守的氨基酸以保證對RNA的結合活性,但是這一家族的不同蛋白質卻能特異地結合各種不同的RNA分子。
另外,運行blastp程序服務器對Boule蛋白進行搜索,得到圖12。從圖中看到,Boule蛋白屬于RRM(RNA recognition motif)超家族,具有與 COG0724,PABP-1234,PLN03134,SF-CC1,U2AF_1g,ELAV_HUD_SF,half_pint,hnRNP-R-Q 相似的保守域。

圖12 Boule蛋白結構域預測Fig.12 Predicted domain site of Boule protein
Boule是果蠅、哺乳動物不育和雄性生殖細胞在阻滯在減數(shù)分裂時期的一個高度保守的關鍵調控因子。在與精子發(fā)生障礙相關的不育病人當中,Boule蛋白的表達顯著的下降。Boule是DAZ家族的一個成員,存在于靈長動物、哺乳動物和后生動物中。在果蠅中,研究表明,Boule表達在第一次減數(shù)分裂時期,調節(jié)Twine(phosphatase of Cdc25)的表達并開始促進成熟細胞因子(initiate MPF),比如Cdc2/cyclin B復合物,這些都是G2-M轉換和第一次減數(shù)分裂時期的關鍵因子。所以在果蠅中,Boule調節(jié)Twine來控制減數(shù)分裂。調節(jié)生殖細胞的通路似乎很大程度上是保守的。本文對Boule基因及其編碼蛋白信號肽、二級結構、親疏水性、結構域及同其它物種的蛋白相似度同源比對等進行了生物信息學分析。結果表明,該蛋白無信號肽,無跨膜結構是親水性蛋白,在75~100處可能形成卷曲螺旋。二級結構以α-螺旋為主。具有RRM功能域。Boule蛋白的同源性分析證明了Boule功能在動物中是高度保守的[12]。大量的實驗已經(jīng)表明Boule在精子形成減數(shù)分裂時期具有重要的調節(jié)作用。Xu等人發(fā)現(xiàn)Boule僅僅在精子發(fā)生時是必需的,但是在雌性的Boule基因缺失或者突變的時候仍可以正常生育。
References)
[1] Michael A.Crackower,Nadine K.Kolas,Junko Noguchi,Renu Sarao, Kazuhiro Kikuchi, Hiroyuki Kaneko, Eiji Kobayashi,Yasuhiro Kawai,Ivona Kozieradzki,Rushin Landers,Rong Mo,Chi-Chung Hui,Edward Nieves,Paula E.Cohen,Lucy R.Osborne,Teiji Wada,Tetsuo Kunieda,Peter B.Moens,Josef M.Penninger.Essential role of Fkbp6 in male fertility and homologous chromosome pairing in meiosis[J].Science,2003,300(5623):1291-1295.
[2] Renee Reijo,Tien-Yi Lee,Pia salo,Raaji Alagappan,Laura G.Brown,Michael Rosenberg,Steve Rozen,Tom Jafe,Donald Straus,Outi Hovatta,Albert de la Chapelle,SherMan Silber,David C.page.Diverse spermatogenic defects in humans caused by Ychromosome deletions encompassinganovelRNA2 binding protein gene[J].Human Reprouction,1996,11(4):27 -54.
[3] Eugene Yujun Xu,F(xiàn)rederick L.Moore,Renee A.Reijo Pera.A gene family required for human germ cell development evolved from an ancient meiotic gene conserved in metazoans[J].Proceedings of the National Academy of Sciences of the United States of America,2001,98(13):7414-7419.
[4] Yung Ming Lin,Yen Ni Teng,Chia Ling Chung,Wan Ching Tsai,Ying Hung Lin,Johnny Shinn Nan Lin,Pao Lin Kuo.Chung C L,et al.Decreased mRNA transcripts of M2phase promoting factor and its regulators in the testes of infertile men[J].Human Reproduction,2006,21(1):138-144.
[5] Eugene Yujun Xu,Douglas F.Lee,Ansgar Klebes,Paul J.Turek,Tom B.Kornberg,Renee A.Reijo Pera.Human boule gene rescues meiotic defects in infertile flies.Human Molecular Genetics..,2003,12(2),169 -175.
[6] Debra J.Wohlgemuth,Erika Laurion,Karen M.Lele.Regulation of the mitotic and meiotic cell cycles in the male germ line [J].Recent Progress in Hormone Research,2002,57(1):75 -101.
[7] Mei Shya Chen,Jonathan Hurov,Lynn S.White.Absence of apparent phenotype in mice lacking Cdc25C protein phosphatase[J].Molecular and Cellular Biology,2001,21(12):3853 -3861.
[8] Michael J.W.VanGompel,Eugene Yujun Xu,A novel requirement in mammalian spermatid differentiation for the DAZ-family protein Boule,Human Molecular Genetics[J],2010,Vol.19,No.12 2360 -2369.
[9] Nicola Reynolds,Howard J Cooke.Role of the DAZ genes in male fertility[J].Reproductive Biomedicine Online,2005,10(1):72-80.
[10] Kiran Padmanabhan,Joel Richter.Regulated Pumilio -2 binding controls RINGO/Spy mRNA translation and CPEB activation[J].Genes& development.2006;20(2):199-209.
[11] Douglas W.Houston,Jian Zhang,Jean Z.Maines,Steven A.Wasserman SA,Mary Lou King.Xenopus DAZ-like gene ecodes an RNA component of germ plasm and is a functional homologue of Drosophila Boule.Development,1998 125(2):171 -180.
[12] Gerald J.Wyckoff,Wen Wang,Chung-I Wu,Rapid evolution of male reproductive genes in the descent of man[J].Nature,2000,403(6767),304-309.