訾臣 曾德新 蔣魯巖 袁飛 蔣原 薛峰
摘要[目的]對空腸彎曲菌空腸彎曲菌flaA基因的序列及功能進行預測分析。[方法]分析了多個空腸彎曲菌flaA核酸及氨基酸序列組成和序列差異性;預測分析了flaA基因密碼子使用偏好性、蛋白結構和功能域、FlaA與相關功能蛋白的互作情況。
[結果]不同菌株的flaA基因序列存在差異性,且差異主要存在于序列的中間區域。不同空腸彎曲菌菌株的同一基因在密碼子選擇上存在差異。FlaA與多個蛋白存在不同形式的相互作用。[結論]該研究可為空腸彎曲菌flaA基因序列分析和功能研究應用提供基礎和依據。
關鍵詞空腸彎曲菌;flaA基因;密碼子偏好;蛋白結構域;蛋白互作
中圖分類號S188文獻標識碼
A文章編號0517-6611(2017)32-0156-05
Analysis of Gene Sequence and Function Prediction of flaA in Campylobacter jejuni
ZI Chen1,2,ZENG Dexin1,JIANG Luyan1 et al(1.APFIC,Jiangsu EntryExit Inspection and Quarantine Bureau,Nanjing,Jiangsu 210019;2.College of Veterinary Medicine,Nanjing Agricultural University,Nanjing,Jiangsu 210095)
Abstract[Objective] To analyze and predict gene sequence and function of flaA in Campylobacter jejuni.[Method] The composition and variation of multiple nucleotide sequences and amino acid sequences of flaA were analyzed.The analyses of codon preference,protein structure and function domains,and proteinprotein interactions were performed.[Result]Gene sequence of flaA of different strains existed difference,the difference mainly existed in the intermediate region of the sequence.There were differences in codon choice on the same gene of different C.jejuni strains.FlaA interacted with multiple proteins in different forms.[Conclusion]The study provides the basis and foundation for the flaA gene analysis and function research of C.jejuni.
Key wordsCampylobacter jejuni;flaA gene; Codon preference; Protein domain; Protein interaction
基金項目訾臣(1985—),男,山東臨沂人,博士,從事食源性微生物致病機制研究。
作者簡介國家質量監督檢驗檢疫總局科技計劃項目(2016IK131);江蘇省出入境檢驗檢疫局科研項目(2017KJ46);南京農業大學科研資助項目(804121);質檢公益性行業科研專項(201510038)。
收稿日期2017-09-08
空腸彎曲菌(Campylobacter jejuni,CJ)屬于螺旋菌科彎曲菌屬,為革蘭染色陰性菌,是世界范圍內食物源性胃腸炎的主要病原菌之一,該病原菌主要通過禽肉等肉類食物傳播[1]。空腸彎曲菌的致病機制中會有許多毒力因子的參與,其中鞭毛蛋白是其在動物腸道黏附和定殖的重要功能結構[2]。鞭毛蛋白由2個基因組成,即flaA 和flaB,研究發現flaA基因與空腸彎曲菌侵襲功能有關[3]。該研究通過分析多個flaA基因和氨基酸組成特點,預測flaA基因密碼子偏好性特點、亞細胞定位、蛋白結構和功能域、互作蛋白等,為空腸彎曲菌的flaA遺傳分化和功能研究提供依據。
1材料與方法
1.1flaA基因序列遺傳差異分析
通過數據庫獲得多個菌株完整的flaA基因cds序列,比對分析各菌株核酸序列組成及遺傳信息差異情況。
1.2flaA基因密碼子偏好分析
利用CodonW在線程序[4]分析空腸彎曲菌flaA基因堿基組成、密碼子使用偏好性。
1.3FlaA亞細胞定位分析
基于SVM分類方法,CELLO軟件基于氨基酸的生理生化特性使用氨基酸組成(the amino acid composition)、二肽成分(the dipeptide composition)、分段氨基酸組成(the partitioned amino acid composition)、序列組成(the sequence composition) 等4種序列編碼策略對FlaA進行亞細胞定位分析[5]。
1.4FlaA蛋白修飾位點及功能域分析
利用在線軟件Motif Scan(http://hits.isbsib.ch/cgi-bin/PFSCAN)預測NCTC 11168和D2640菌株FlaA蛋白序列修飾位點及結構域情況。
1.5FlaA互作蛋白預測分析
通過在線軟件STRING(https://stringdb.org/)預測與空腸彎曲菌FlaA存在相互作用的蛋白,并分析相應蛋白的功能特點。
2結果與分析
2.1空腸彎曲菌flaA基因序列遺傳差異將空腸彎曲菌NCTC 11168菌株的flaA基因序列與NCBI核酸序列數據庫進行Blast,結果獲得空腸彎曲菌flaA基因相關序列共49個,對其進行核酸序列與氨基酸序列進化樹分析,結果見圖1、2。與NCTC 11168相比核酸序列遺傳差異最大的是ICDCCJ07001、
圖1空腸彎曲菌flaA基因核酸序列進化樹
Fig.1The evolutionary tree of flaA nucleotide sequences of Campylobacter jejuni
RM3196和RM3197(后三者序列完全一致),遺傳距離為0.226,其次為F38011,遺傳距離為0.222,D2640排第4位,為0.214;與NCTC 11168相比氨基酸序列遺傳差異最大的是D2640,遺傳距離為0.199,其次為CDCCJ07001、RM3196和RM3197,遺傳距離為 0.198。
利用Blast比對軟件對所有氨基酸序列比對分析,發現氨基酸序列差異主要位于序列中部區域(180 ~ 480 aa),結果見圖3。
2.2flaA基因密碼子偏好性
通過氨基酸序列的進化樹分析可知NCTC 11168和D2677菌株遺傳差異最大。根據Codon Usage Database數據庫可知空腸彎曲菌NCTC 11168菌株的密碼子使用情況,編碼序列中GC含量為30.83%,密碼子第1位堿基GC比例為42.70%,第2、3位分別為30.44%和19.35%。該研究所分析的NCTC 11168和D2640菌株的flaA編碼序列GC比例分別為37.00%、35.24%,均高于基因組水平(表1);flaA基因密碼子第1、2位GC含量均高于基因組水平,尤其是第2位GC含量接近甚至超過第1位的
比例,分別為44.71%、46.02%,該基因堿基成分比例與空
腸彎曲菌基因組水平的堿基使用存在差異。
進一步的密碼子偏好性分析發現,NCTC 11168和D2640的flaA基因分別對25和24種密碼子具有偏好性(RSCU>1),存在偏好性差異的密碼子為ATT、ATC、GTA、CCA,其中D2640編碼脯氨酸(CCA-Pro),而NCTC 11168不編碼該氨基酸。flaA基因密碼子第3位偏好使用T,幾乎所有同一密碼子中,均為T3的比例最高,除了NCTC 11168菌株的異亮氨基酸(Ile)偏好使用ATC而不是ATT(表2)。Codon Usage Database數據庫中5個空腸彎曲菌株全基因組水平Ile氨基酸的密碼子偏好順序均依次為ATT、ATA、ATC,分析結果顯示,D2640菌株flaA編碼Ile氨基酸的密碼子偏好性與全基因組水平相同,而NCTC 11168依次為ATC、ATA、ATT,偏好使用ATC編碼Ile氨基酸,說明不同菌株的flaA對Ile氨基酸編碼存在密碼子偏好性差異。
2.3FlaA亞細胞定位
NCTC 11168菌株FlaA蛋白亞細胞定位預測結果:內膜(inner membrane) (0.056),外膜(outer membrane) (1.196),周質(periplasmic) (0.075),胞外(extracellular) (3.654),胞質(cytoplasmic) (0.019),胞外和外膜定位的預測值為3.654和1.196,且達到顯著水平。預測結果說明該蛋白為分泌表達的外膜結構成分,結果與鞭毛蛋白結構及亞細胞定位特征一致。
2.4FlaA氨基酸修飾位點和功能域
在2個菌株中預測到可能發揮糖基化的天冬酰胺位點數分別為7和13個,CK2磷酸化位點數分別為8和9個,PKC磷酸化位點數分別為12和10個,烷基化位點數分別為23和26個。NCTC 11168菌株FlaA 的395~457區域有21個絲氨酸殘基,為絲氨酸富集區域;D2640菌株在398~641區域有21個絲氨酸殘基;二者的絲氨酸富集程度高度相似,而兩者在絲氨酸富集區域其他氨基酸組成差異較大,處于遺傳差異區域,說明此處富集的絲氨酸在FlaA蛋白功能中具有重要作用。二者具有相同的Flagellin N、Flagellin IN、Flagellin C結構域。Flagellin N和Flagellin C結構域為兩端保守區域,Flagellin IN所處的中間區域保守性相對較低(圖4和表3)。
2.5FlaA蛋白互作及功能分析
測到空腸彎曲菌FlaA與FliS等10個蛋白存在互相作用(圖5),其中參與鞭毛組分的蛋白有FliS、FlgE2、FliD、FlgE、FlgK、FlhA、FlaG等,Cj1340c是一種運動輔助因子(Motility accessory factor),FliA是鞭毛操縱子的RNA聚合酶σ因子,PseE參與蛋白的糖基化修飾。互作形式主要有鄰近作用、融合作用、基因共現等,其中與FliS、PseE、FliD、FlhA、Cj1340C等互作已有相關試驗驗證。
3討論
研究發現通過修復flaA和flaB突變體中的FlaA功能,鞭毛結構、菌體運動力、定殖和侵入以及毒力蛋白分泌等功能都得以恢復,可見鞭毛蛋白基因flaA在空腸彎曲菌腸道致病過程中的重要作用[6]。對其基因序列及相關功能域等進行分析,有利于對其相關功能的研究。該研究結合數據庫中的序列信息資源,分析多條空腸彎曲菌flaA基因核酸和氨基酸序列組成情況及保守性,結果發現不同菌株的flaA基因序列存在差異性,且差異主要存在于序列的中間區域。
基因編碼信息遵循“中心法則”:由DNA序列轉錄為mRNA序列,并最終翻譯成氨基酸序列。每3個核酸組成1個密碼子并決定1個氨基酸,每個氨基酸可對多個密碼子,而特定物種或某些基因的特定位點氨基酸對某種密碼子的使用存在偏好性[7]。空腸彎曲菌flaA基因序列中GC含量高于基因組水平,說明相對于全基因組水平flaA主要偏好使用含G/C的密碼子,而且flaA基因密碼子第1和第2位GC含量均高于基因組水平,第3位偏好使用T。NCTC 11168和D2640的flaA基因存在4個偏好性差異的密碼子,說明不同空腸彎曲菌菌株的同一基因在密碼子選擇上存在差異。對堿基組成和密碼子偏好性進行分析,有助于構建優化的基因外源表達模型。
氨基酸發生糖基化/磷酸化/烷基化等修飾會影響蛋白質的空間結構形成和功能發揮。分析結果顯示flaA基因存在多個修飾和功能位點,說明其在合成及功能形成過程中可能受多種形式的氨基酸位點修飾,在其發揮特定功能中至關重要。很多蛋白質不是獨立發揮作用,而需要通過與其他結構蛋白或者功能蛋白直接或間接作用,或形成蛋白質復合物在某些生物過程中發揮相應的生物學功能。鞭毛由多種結構蛋白組成,在其組成和發揮功能的過程中有其他多種功能蛋白的參與,因此對FlaA互作蛋白的預測分析有利于揭示鞭毛的組成情況,有助于其功能機制的研究。蛋白互作分析結果顯示,FlaA與多個蛋白存在不同形式的相互作用。互作蛋白主要為參與鞭毛組分的蛋白FliS、FlgE2、FliD、FlgE、FlgK、FlhA、FlaG等,這與FlaA及其他鞭毛蛋白在鞭毛組裝及功能發揮中的作用相一致;與運動輔助因子Cj1340c存在相互作用[8],說明FlaA參與鞭毛運動過程;FliA是作用于鞭毛操縱子的RNA聚合酶σ因子,分析表明FlaA表達受FliA調控;研究認為PseE 可能參與了鞭毛蛋白的糖基化修飾[9],這與FlaA糖基化修飾位點的預測結果相呼應,提示對相應位點深入研究的必要性和方向性。
對細菌致病基因遺傳信息和蛋白功能的預測分析是研究病原菌致病機制的必要基礎,該研究基于空腸彎曲菌flaA基因序列信息,利用多種預測軟件和分析方法,系統分析了flaA基因序列和功能特點,可為其基因功能和致病性研究以及相關功能基因分析提供基礎依據。
參考文獻
[1]
BLACK R E,LEVINE M M,CLEMENTS M L,et al.Experimental Campylobacter jejuni infection in humans[J].J Infect Dis,1988,157(3):472-479.
[2] AGUEROROSENFELD M E,YANG X H,NACHAMKIN I.Infection of adult syrian hamsters with flagellar variants of Campylobacter jejuni[J].Infect Immun,1990,58:2214-2219.
[3] WASSENAAR T M,BLEUMINKPLUYM NM,VAN DER ZEIJST B A.Inactivation of Campylobacter jejuni flagellin genes by homologous recombination demonstrates that flaA but not flaB is required for invasion[J].EMBO J,1991,10(8):2055-2061.
[4] PEDEN J F.Analysis of codon usage[D].Nottingham:University of Nottingham,1999.
[5]
YU C S,LIN C J,HWANG J K.Predicting subcellular localization of proteins for Gramnegative bacteria by support vector machines based on n-peptide compositions[J].Protein Sci,2004,13(5):1402-1406.
[6] KONKEL M E,KLENA J D,RIVERAAMILL V,et al.Secretion of virulence proteins from Campylobacter jejuni is dependent on a functionlal flagellar export apparatus[J].J Bacteriol,2004,186(11):3296-3303.
[7] 吳憲明,吳松鋒,任大明,等.密碼子偏性的分析方法及相關研究進展[J].遺傳,2007,29(4):420-426.
[8] GOLDEN N J,ACHESON D W.Identification of motility and autoagglutination Campylobacter jejuni mutants by random transposon mutagenesis[J].Infect Immun,2002,70(4):1761-1771.
[9] MCNALLY D J,HUI J P,AUBRY A J,et al.Functional characterization of the flagellar glycosylation locus in Campylobacter jejuni 81-176 using a focused metabolomics approach[J].J Biol Chem,2006,281(27):18489-18498.