房守敏 伍春蓮
(西華師范大學生命科學學院,南充 637002)
熱休克蛋白(heat shock protein,HSP)是應激后細胞內優先合成的一組蛋白質,在原核和真核生物中普遍存在,參與蛋白質的合成、折疊、裝配、跨膜、轉運以及變性蛋白質的清除等(Feder and Hofmann,1999;程維杰等,2008)。熱激蛋白70(HSP70)是廣泛存在且是一組在進化上高度保守的應激蛋白,在原核生物和真核生物體內都存在,并存在于所有的細胞區室和器官中,是當前研究較廣泛的HSP家族。HSP70家族的成員數量在不同的生物有所不同,功能亦存在差異由分子量70 kD的熱休克蛋白(誘導型)在正常細胞中水平較低,在應激狀態下可顯著升高(Mc-Millan et al.,2005;Bahrndorff et al.,2009)。大量研究表明機體細胞在受到各種應激,如高熱,缺氧等有害應激時,產生的HSP70可以增強細胞對下一次有害損傷的耐受程度,維持細胞的正常功能代謝,提高細胞生存率(楊秉芬等,2009)。因此,HSP70對正常和非正常狀態下的生物體的生存作用是非常負責和重要的,深入全面的了解HSP70對機體的作用將對動物的生產,人類生活,生物機體疾病預防起到重大影響。
在大多數生物體中,HSP70家族是由分子量為68、70、72及78 kD的熱休克蛋白組成。它們的分子量相近,等電點為pH 5.2~6.3之間,幾乎分布于每個細胞器中(Feder and Hofmann,1999;Johnston et al.,1998)。大量研究證明HSP70是生物體中少數最保守蛋白之一,無論是何種物種(原核細胞和真核細胞)的HSP70的氨基酸序列均至少有45%的同源性,越是相近的物種同源性越高(Feder and Hofmann,1999)。HSP70都有“卷線樣”構象段,就象其它蛋白一樣有絞鏈部分(如肌球蛋白),是ATP依賴的構像變化,這些豐富的ATP結合蛋白已成為所有熱休克蛋白中最具特色和研究最多的之一(任寶波等,2005;王宇萍和蔣建東,2010)。
電子克隆(electronic cloning)是近年來伴隨著基因組計劃和ESTs計劃而發展起來的基因克隆新方法,主要原理是利用日益發展的生物信息學技術,借助電子計算機的巨大運算能力,通過EST或基因組序列組裝和拼接,進一步利用RT-PCR的方法快速克隆功能基因(Wang et al.,2007;林生等,2009)。本實驗利用電子克隆技術,以黑腹果蠅HSP70蛋白的氨基酸序列在家蠶的數據庫中進行查找、比對得到其同源的DNA序列和相應的EST,通過序列組裝和拼接來獲得家蠶的HSP70的cDNA序列,并利用生物信息學的軟件來分析其序列信息,預測和分析其基因結構、蛋白質結構、等電點、分子量等,為進一步克隆和功能研究奠定基礎。
黑腹果蠅Drosophilamelanogaster的HSP70(GenBank檢索號AAG22148.2)氨基酸序列下載自美國國立生物技術信息中心NCBI(http://www.ncbi.nlm.nih.gov)。家蠶基因組數據庫為西南大學SilkDB(www.silkdb.org/silkdb/)。
同源性比對采用從NCBI下載的BLAST(basic local alignment Search tool)工具。EST s序列的拼接使用DNASTAR中的SeqMan軟件。預測基因的外顯子、內含子結構采用Sim4程序:http://gamay.univ-perp.Fr/analyse-seq/sim4。蛋白質序列翻譯的在線工具:http://www.expasy.ch/tools/dna.html分子量MW/等電點pI的預測http://www.expasy.ch/tools/pi_tool.html。
以黑腹果蠅HSP70的氨基酸序列與家蠶基因組預測的基因數據庫(http://www.silkdb.org/silkdb/)進行tBlastn同源性檢索,挑取相似高的BGIBMGA002381基因作為本研究的候選基因。以家蠶基因組數據庫注釋的CDS序列與家蠶ESTs數據庫進行Blastn比對,獲得的EST s序列用DNASTAR中的SeqMan進行拼接,將延伸的序列為種子序列應用Blastn程序檢索家蠶EST s庫,將檢索到的EST s序列再次用DNASTAR中的SeqMan進行電子延伸,延伸步驟直到不能延伸為止。經SeqMan獲得的拼接序列與家蠶基因組進行Blastn比對,從而找到其相應的基因組序列。提取該家蠶HSP70所對應的基因組序列,以Sim4軟件分析基因結構。利用http://www.expasy.ch/tools/dna.html在線工具預測其氨基酸序列;利用http://www.expasy.ch/tools/pi_tool.htm l在線工具預測其蛋白質的分子量MW/等電點pI。
以黑腹果蠅的HSP70蛋白作為檢索序列與家蠶基因組數據庫(http://silkworm.swu.edu.cn)進行tBlastn比對搜索,共獲得了多個可能的熱休克蛋白70同源基因,我們挑取其中與黑腹果蠅的HSP70相似較高的BGIBMGA002381進行了電子克隆。將家蠶基因組數據庫中注釋的BGIBMGA002381編碼區序列(coding sequence,CDS)與NCBI中家蠶表達序列標簽(expressed sequence tags,ESTs)數據庫作Blastn比對檢索,共檢索得到20條可靠的ESTs(圖1)。利用DNASTAR軟件對家蠶HSP70的ESTs序列拼接和延伸,得到其長度為2 057 bp的cDNA序列。將拼接的cDNA在Softberry網站進行在線基因預測,結果表明該基因的編碼區全長為1 950 bp,共編碼649個氨基酸。

圖1 BmHSP70基因的ESTs分析
將BmHSP70基因的ESTs拼接序列與家蠶基因組序列進行Blastn比對,獲取BmHSP70基因的基因組序列,利用Sim4程序分析基因結構,結果如圖2所示。BmHSP70基因的ESTs拼接序列含有2個外顯子和3個外顯子,內含子邊界均符合標準的GT/AG規則。

圖2 家蠶BmHSP70基因的結構簡圖
BmHSP70基因的核苷酸序列和推到的氨基酸序列如圖3所示。經預測BmHSP70蛋白的分子量為71.18 kD,等電點pI為5.33。用蛋白質軟件Antheprot分析家蠶HSP70蛋白,發現3個HSP家族的簽名序列:IDLGTT YS(9-16殘基),IFDLGGGTFDVSIL(197-210殘基)和IVLVGGST RIPKVQK(334-348殘基);Dank特征基序DLGTT-S-V(10-18殘基),非細胞器基序RARFEEL(298-304殘基),胞質HSP70特征基序GPTIEEVD(645-652殘基)以及靠近C端的GGMP 4肽序列;2個糖基化位點NKSI和NVSA。根據所獲得的序列符合HSP70家族特有的氨基酸序列特征,因此確認該序列是家蠶HSP70基因完整編碼區cDNA序列(崔亞東等,2010)。
通過應用Clustral X和MEGA4.0軟件,以家蠶HSP70與其它昆蟲HSP70氨基酸序列建立建鄰近進化樹(Neighbor-joining method)。結果顯示,BmHSP70與粉莖螟和二化螟HSP70的親緣關系較近,在進化樹中聚為一支,而且有很高的置信值(圖4)。通過氨基酸相似性計算,表明家蠶BmHSP70與其他HSP70高度相似,特別是與粉莖螟和二化螟HSP70的相似性高達98.0%和97.2%,即使在進化樹中表現出與其親緣關系較遠的美洲斑潛蠅、黑腹果蠅、埃及伊蚊、淡色庫蚊和致倦庫蚊的HSP70間相似性也高達75%左右。

圖3 BmHSP70基因的核苷酸序列和推到的氨基酸序列

圖4 家蠶和其他昆蟲HSPs的NJ樹
本研究在生物信息學分析的基礎上,采用電子克隆技術,得到了家蠶HSP70的基因BGIBMGA002381。分析表明該基因的cDNA序列長2 057 bp,其編碼區長1 950 bp,共編碼649個氨基酸。該基因由2個內含子和3個外顯子組成,其內含子邊界均符合GT/AG規則。BmHSP70蛋白的分子質量為71.18 kD,等電點為5.33。序列分析表明BmHSP70蛋白具有HSP70保守的特征序列,而且具有大量的ESTs證據,表明該基因可能為家蠶體內有功能HSP70基因。BmHSP70與其他昆蟲HSP70的氨基酸序列非常保守,特別是與粉莖螟和二化螟HSP70的相似性高達98.0%和97.2%。
本實驗主要介紹了基于Internet網上生物信息資源對新基因全長cDNA的電子克隆策略,對于那些需要經常進行序列分析,或者分析規模較大的實驗室,可以構建本地的生物信息學數據分析平臺,把一些重復性的、可程序化的過程直接交由計算機完成,用戶的主要精力就可轉移到對分析結果進行后續分析及實驗設計上,能節約大量的人力和物力。
生物信息學方法的應用使新基因全長cDNA克隆和分析的方法不斷更新,朝著快速、經濟、準確的方向發展,但鑒于生物大分子結構和功能的復雜性,許多分析軟件的輸出結果存在較大的偏差,因此利用生物信息學進行的“虛擬”克隆的結果尚需回到實驗室進行驗證。但是,這種分析方法為實驗研究提供了重要的線索,對隨后的研究起到了“事半功倍”的作用,避免走彎路,極大地提高了工作效率。可以相信隨著基因組序列信息的日益豐富,計算方法和數據庫的不斷完善,生物信息學將在基因全長cDNA克隆和分析中扮演更加重要的角色。
[1]Bahrndorff S,Marien J,Loeschcke V,et al.Dynamics of heat-induced thermal stress resistance and hsp70 expression in the springtail,Orchesella cincta[J].Funct.Ecol.,2009,23(2):233-239.
[2]Feder M E,Hofmann GE.Heat-shock proteins,molecular chaperones,and the stress response:evolutionary and ecological physiology[J].Annu Rev Physiol,1999,61:243-282.
[3]Johnston J A,Ward C L,Kopito R R.Aggresomes:a cellular response to misfolded proteins[J].J Cell Biol,1998,143(7):1883-1898.
[4]McMillan D M,Fearnley S L,Rank N E,et al.Natural temperature variation affects larval survival,development and Hsp70 expression in a leaf beetle[J].Funct Ecol,2005,19(5):844-852.
[5]Wang H T,Chang J W,Guo Z,et al.In silico-initiated cloning and molecular characterization of cortexin 3,a novel specifically expressed in the kidney and brain,and well conserved in vertebrates[J].Int J Mol Med,2007,20(4):501-510.
[6]程維杰,李秋玲,孫延鳴,等.熱休克蛋70(HSP70)研究進展[J].畜牧獸醫雜志,2008,27(6):55-57.
[7]崔亞東,陸明星,杜予州.二化螟熱休克蛋白70基因的克隆及熱脅迫下的表達分析[J].昆蟲學報,2010,53(8):841-848.
[8]林生,潘大仁,周以飛,等.果蔗Hsp90基因的電子克隆及序列分析[J].熱帶作物學報,2009,30(12):1824-1830.
[9]任寶波,王玉艷,王純凈,等.HSP70家族的分類及基因結構與功能[J].動物醫學進展,2005,26(1):98-101.
[10]楊秉芬,孫啟,鴻曹誠.熱激蛋白70研究進展[J].生物技術通訊,2009,20(5):716-718.
[11]王宇萍,蔣建東.熱休克蛋白70的結構和功能[J].中國細胞生物學學報,2010,32(2):305-313.