孟 婕,任一帆,張 貝,耿立英,張傳生,李祥龍
(河北科技師范學院 河北省特色動物種質資源挖掘與創新重點實驗室,河北 秦皇島,066600)
疾病是制約我國養禽業發展的重要因素,從遺傳角度出發,鑒定免疫相關的抗病基因,利用其培育抗病新品種,對養禽業疾病的徹底根治具有較好的理論和實踐意義[1,2]。腫瘤壞死因子受體相關因子(TRAFs),是機體抗病毒信號通路中重要的接頭分子。它主要通過參與腫瘤壞死因子受體家族(TNFR)、Toll樣受體/白細胞介素-1受體家族(TIR)和維甲酸誘導基因Ⅰ樣受體家族(RLRs)轉導上游信號[3~5],激活NF-κB(nuclear factor κB),MAPK(mitogen-activated protein kinase)和IRF(Interferon regulatory factors)下游通路[5,6]。目前已發現TRAFs家族有7個成員,分別命名為TRAF1,TRAF2,TRAF3,TRAF4,TRAF5,TRAF6和TRAF7。對哺乳動物的研究發現該蛋白在物種進化上較為保守,TRAFs的C端(TRAF7除外)有一個具有共同特征的TRAF結構域;除TRAF1的N端只有一個簡單的鋅指結構外,其他TRAFs分子都含有若干個鋅指結構和一個RING指基序[7~10]。
隨著雞基因組測序的完成,使得在基因組水平上研究雞TRAFs家族的信息成為可能。本次研究擬對雞TRAFs家族成員進行鑒定,通過蛋白質理化性質、系統進化關系、基因結構、直系和旁系同源基因的研究,為進一步研究TRAFs家族的功能、揭示雞TRAFs家族抗病分子機制奠定理論基礎。
從Ensemble數據庫(https://asia.ensembl.org/index.html)下載雞基因組序列信息和基因組基因結構注釋信息文件。以Pfam蛋白家族數據庫(http://pfam.xfam.org/)下載TRAF(PF00917,PF02176)的隱馬可夫模型(Hidden Markov Model,HMM)作為查詢搜索獲得雞可能TRAFs的蛋白序列,并利用Batch CD-Search(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)及 SMART(http://smart.emblheidelberg.de/)進行驗證分析,刪除缺失結構域的序列,最終獲得雞TRAFs家族候選基因。利用在線工具ExPASy(https://web.expasy.org/protparam/)預測雞TRAFs家族成員的等電點和蛋白分子量等屬性。
從NCBI數據庫(https://www.ncbi.nlm.nih.gov/)下載鼠和人的TRAFs蛋白序列,將其與雞TRAF蛋白序列整合。利用MEGA X的clustal W將鼠、人和雞TRAF蛋白序列進行多序列比對分析[11]。并通過鄰接法(Neighbour-Joining,NJ)在MEGA X中構建系統進化樹,自展值(Bootstrap)設定為1 000。
TRAF的外顯子和內含子位置信息參考雞基因組注釋信息GFF3文件,之后利用TBtools工具繪制雞TRAF基因在染色體上的位置及CDS(外顯子)-內含子結構[12]。利用在線網站MEME(http://meme-suite.org/tools/meme)預測分析TRAF蛋白序列的結構域,搜索motif值設定為10。通過TBtools工具繪制MEME結構并繪制TRAF的結構域[13]。
利用下載的雞基因組序列信息和基因組基因結構注釋信息文件通過TBtools工具提取位置信息并構建雞染色體定位圖。TRAF在雞基因組中的復制類型由TBtools及其他輔助工具獲得,并標注在染色體上。
通過TBtools工具的Graphics板塊結合基因組序列信息和基因組基因結構注釋信息GFF3文件對雞、鴨、鵝等3個物種進行分析。用Multipe synteny plot對物種間的共線性進行可視化[13]。
用生物信息學方法并經過后續的篩選驗證,去掉重復項后從雞全基因組中得到7條基因序列。將7條雞TRAFs家族基因序列按照基因ID從ChTRAF1~ChTRAF7命名。最后對雞TRAFs家族進行蛋白理化性質分析,結果見表1。雞TRAFs家族的氨基酸序列長度最長的為670 aa,最短的為195 aa。家族成員蛋白分子量最大的是74 943.36 ku,最小的為22 329.87 ku。從理論等電點來看,ChTRAF1,ChTRAF6和ChTRAF7的等電點小于7,為酸性蛋白。其中,ChTRAF6的等電點最小,為6.01。ChTRAF家族不穩定系數均大于40,鑒定為不穩定蛋白。所有成員的疏水性都小于零,均為親水蛋白。
為了進一步了解雞TRAFs家族和鼠、人之間的同源關系,用雞、鼠和人的蛋白序列構建系統進化樹。系統進化分析表明,雞的7個TRAF基因可分為7組(圖1)。7個成員與鼠和人的TRAF家族成員分別聚集,說明其進化關系較近。雞多個亞家族的成員與鼠和人對應亞家族的相似性達100%。

表1 雞TRAFs家族理化性質分析

注:ChTRAF表示雞,h表示人,m表示鼠。羅馬數字表示亞家族分類。遺傳距離標尺顯示在左下角。節點上的值為通過Bootstrap檢驗次數的百分數。圖1 雞、老鼠、人TRAFs家族系統進化樹
利用TBtools工具繪制了雞TRAFs家族成員的結構特征圖。對雞TRAFs家族的7個成員進行了蛋白保守結構域分析,共獲取了10個保守motif元件(圖2)。不同TRAF保守基元數量從4~10不等且分布不同,整體來說,亞家族Ⅰ,Ⅱ,Ⅲ,Ⅴ保守基元分布相似。亞家族Ⅳ的編碼序列較其他亞家族結構簡單。TRAF的保守結構域多位于N端。Ⅳ亞家族的內含子數量最少,而且從基因全長來看,有著相似CDS長度的基因全長不一樣,說明內含子長度具有較大差異性。

圖2 雞TRAFs家族成員的保守基序與基因結構
雞TRAFs家族成員的蛋白結構域特征見圖3。N端都有一個RING結構域,ChTRAF7的C末端為7個重復的WD40。TBtools作圖顯示,TRAF1結構域與前人研究結果不符,N端存在RING結構域(圖4)。

圖3 雞TRAFs家族成員特征結構域

圖4 TRAF1成員特征結構域
雞TRAF染色體位置信息顯示,7條基因不均勻的分布在3號、5號、14號、17號和19號等5條染色體上(圖5),其中ChTRAF5基因定位在3號染色體上,ChTRAF3和ChTRAF6基因定位在5號染色體上,ChTRAF7基因定位在14號染色體上,ChTRAF1和ChTRAF2基因定位在17號染色體上,ChTRAF4基因定位在19號染色體上。同一條染色體上的基因分布不相連,不存在重復區域。

圖5 TRAF在雞染色體上的位置
雞、鴨和鵝之間的共線性關系見圖6。除了ChTRAF4之外,其余6個雞TRAF基因可以在鴨和鵝染色體上找到對應的旁系同源基因。

圖6 雞、鴨和鵝TRAFs家族共線性分析結果
TRAF家族成員屬于一個重要的信號轉導家族,存在于各種動物中。TRAFs家族的全基因組鑒定僅在極少數物種中被分析報道[15~17]。TRAF1和TRAF2主要參與介導抗凋亡信號、受體信號的反饋調節及JNK的活化;TRAF3參與介導T細胞依賴的抗病毒機制;TRAF4與氣管的形成有關;TRAF5介導CD40與CD27信號;TRAF6可直接與白細胞介素受體相關激酶、NF-κB受體激活因子及CD40結合來參與信號轉導;TRAF7主要介導caspase依賴的凋亡信號[18~20]。雖然雞TRAFs家族成員在先天免疫系統中的作用已有報道[21,22],然而雞TRAFs家族的系統鑒定鮮有報道。
本次研究通過隱馬可夫模型對雞基因組中TRAFs家族的搜索分析,鑒定其有7個成員。ChTRAF基因家族可分為7個亞家族,Ⅴ亞家族定位在3號染色體上,Ⅲ和Ⅵ亞家族定位在5號染色體上,Ⅶ亞家族定位在14號染色體上,Ⅰ和Ⅱ亞家族定位在17號染色體上,Ⅳ亞家族定位在19號染色體上。對雞中TRAFs家族進行多方面的分析鑒定,發現ChTRAF1,ChTRAF6和ChTRAF7的等電點小于7,為酸性蛋白。ChTRAF家族不穩定系數均大于40,鑒定為不穩定蛋白。所有成員的疏水性都小于零,均為親水蛋白。對染色體定位分析發現,雞TRAFs家族成員不存在串聯重復關系,說明基因間差異較大。通過共線性分析發現,只有6個基因在不同物種之間找到了旁系同源基因,說明TRAFs家族成員在不同物種的進化過程中,承受不同的選擇壓力但也存在一定保守性。
基因結構是研究基因功能和基因進化的重要依據。本次研究詳細分析了雞TRAFs家族的結構特征和保守結構域。基因都含有外顯子內含子,從基因全長來看,有著相似CDS長度的基因全長不一樣,說明內含子長度具有較大差異性。功能域分析發現,每條基因所翻譯的蛋白結構中都含有該亞家族的特征結構域。ChTRAF家族成員含有典型的TRAF分子的功能結構域,包括MATH結構域、指環結構域和鋅指結構域[23]。Bradley等[7]研究顯示,TRAF1在N端沒有RING結構域,但本次研究鑒定表明ChTRAF1的N端含有RING結構域。在NCBI搜索人、鼠、日本鵪鶉等物種的TRAF1蛋白序列進行特征結構域分析顯示,某些物種TRAF1的N端含有RING結構域(圖4)。這一現象表明,TRAFs家族在物種間進化保守的同時有物種差異性。