于千 黃濤
摘 要: 對Genbank數據庫中的43條長度在546-906個氨基酸之間的HSP90蛋白序列,采用生物信息學手段對HSP90家族蛋白序列標識和保守基序進行了分析,并結合這些信息對這些蛋白進行了分子系統發育分析表明:藻類HSP90蛋白高度保守,家族內可以分為幾個亞家族,亞家族內既有原核又有真核藻類HSP90蛋白序列。
關鍵詞: 藻類熱休克蛋白;HSP90;系統發育
【中圖分類號】 Q51 【文獻標識碼】 A 【文章編號】 2236-1879(2017)12-0013-01
大多數熱休克蛋白的研究是以微生物、動物材料為主,關于植物熱休克蛋白反應的研究起步較晚,80年代初期才開始研究高等植物中的熱休克蛋白[1]。HSP90蛋白存在于從低等的原核藻類到陸生高等的植物中,在高等植物中,有些HSP90在常溫下即有較高的表達,有些需要熱激誘導產生,此外,低溫、光照和高鹽脅迫亦能使其高表達[2]。因此,以HSP90蛋白作為貫穿原核藻類到真核藻類間的紐帶,除了可以了解原核藻類與真核藻類HSP90家族間的進化關系,也能為進一步探索HSP90蛋白在藻類中的分子系統學的研究提供有價值的參考依據。
1 材料與方法
1.1 蛋白序列的獲得:
數據資料來源于NCBI的蛋白質數據庫。共檢索到33種藻類的336條HSP90蛋白提交記錄。對這些蛋白序列下載到本地后通過人工和軟件篩選,去除重復記錄和長度不足500bp的序列后,共得到43條長度在546-906個氨基酸之間的HSP90蛋白序列。
1.2 HSPs蛋白序列結構分析:
蛋白序列標識的繪制和分析在網站上完成;運用MEME程序分析基因家族的氨基酸保守基序,程序在設置上選擇做大的基序數為50,不同的基序數為15,其它均采用默認的參數;利用TargetP和SignalP工具進行信號肽和導肽預測。
1.3 HSPs蛋白系統發育關系分析:
將得到的氨基酸序列, 用CLUSTAL_X軟件進行比對, 并進行人工調整以避免缺刻(gap)對結果的影響. 系統發育關系的構建和距離計算使用MEGA3.1 軟件包進行。
2 結果與討論
2.1 蛋白序列標識的繪制和Motif分析:
TargetP進行導肽預測結果顯示(表1),其中預測可靠性等級最高為一級(隱藻的HSP90可能性=0.947),但細胞內定位未顯示;隱藻門的四個HSP90預測等級為3-4級,可能性平均在0.7左右,定位于線粒體中;定位于葉綠體的只有萊茵衣藻的HSP90(可能性=0.741),該導肽位于葉綠體的可能性較高。
對HSP90基因家族的氨基酸序列做保守基序的分析,最短的序列有546個氨基酸殘基,最長的序列有906個氨基酸殘基。發現基序1-15在HSP90蛋白家族的大多數的蛋白序列中都有,并且基序6、8、2、7和10只是在保守的HATPase_C結構域內,其余基序都位于HSP90中。HSPs的高度保守性說明他們在生物生命活動中具有重要的作用(圖1)。
2.2 利用SignalP和TargetP工具進行信號肽和導肽預測:
熱休克蛋白HSP90的信號肽剪切位點位于第第22 和 第23位氨基酸之間,即: VSA-MC之間,可能為信號肽的各個參數值為:(max.C=0.380;max.Y=0.467;max.S=0.972),其成為信號肽的可能性非常高。通過查詢該蛋白所在數據庫信息發現,此蛋白序列恰好是一種內質網型蛋白,屬于一種分泌型蛋白。
2.3 蛋白序列分子系統發育分析:
用鄰接法構建了HSP90氨基酸序列的系統發育樹,得到的無根樹顯示分為4個群,群1-4分別包括蛋白個數為:15,14, 5和9。用鄰接法構建的有根樹也支持這一結果。我們推測所分析的43個HSP90蛋白序列可初步分為2-4個亞家族,并且亞家族之間對應的編碼基因可能為旁系同源基因,即HSP90基因的復制先于物種的分離。對HSP90蛋白的基因序列分析提示,其在由原核向真核細胞進化過程中發生過基因復制事件,出現了細胞質型和內質網型兩種HSP90蛋白,這與無根樹中的分為不同的群是相符合的,但目前對HSP90家族的亞家族劃分還不明確,因此,今后在考慮用HSP90蛋白序列對不同藻類進行分子系統學研究時,應該注意旁系同源基因的干擾,隨著公共數據庫中藻類HSP90蛋白序列的增多和藻類HSP90蛋白各個亞家族劃分的明晰,HSP90將會更加成熟地應用與藻類分子系統學的研究。
參考文獻
[1] 陳亞瓊,肖調江,周浙昆(2006).熱激蛋白與生物環境適應及進化的關系.自然科學進展, 16(9):1066-1073.
[2] Isaacs JS, Xu W, Neckers L (2003). Heat shock protein 90 as a molecular target for cancer therapeutics. Cancer Cell. 3(3):213-217.