張 雯 杜鵬程 王海印 于偉文 張媛媛 陳 晨*
(中國疾病預防控制中心傳染病預防控制所生物信息室,北京 102206)
腸桿菌科菌株基因組水平上的遺傳差異(ANI)及其在菌種鑒定上的應用
張 雯 杜鵬程 王海印 于偉文 張媛媛 陳 晨*
(中國疾病預防控制中心傳染病預防控制所生物信息室,北京 102206)
本研究探討了高通量測序方法在腸桿菌科菌種鑒定中直接應用的可能性,第一次提出并驗證了基因組平均遺傳相似度(ANI)指標在腸桿菌科鑒定中的有效性,為該技術的進一步發展提供了數據積累。
腸桿菌;基因組;ANI;菌種鑒定
腸桿菌科(Enterobacteriaceae)細菌是與人類關系最為密切的一類細菌,廣泛分布于人與動物的糞便、水、土壤和腐物中,包含多種重要的腸道致病菌,如痢疾桿菌和致病性大腸桿菌等。腸桿菌科菌具有一些共同的特征:革蘭染色陰性,桿狀,無芽孢等,并基于此發展出一系列檢測方法(分類培養+生化反應+血清分型+毒力試驗)。傳統方法檢測需經富集培養、分離培養、形態特征觀察、生理生化反應、血清學鑒定以及必要的動物試驗等過程,步驟繁瑣費時,一般7d才能獲得較確切的結果,難以及時指導疾病的治療。另外,對于難以培養的,或者生化反應差異模糊的,種系發生關系密切的近緣物種(如大腸埃希氏菌和志賀氏菌),很難依靠這些方法鑒定[1]。

表1 腸桿菌科15個屬的ANI值列表
隨著分子生物學技術的發展,對腸桿菌科細菌分子鑒定的技術逐漸成熟。典型的技術手段如16S rDNA/MLST[2]。相對于傳統鑒別方法,分子檢測具備靈敏度高、檢測快捷的優點,既可用于分離的細菌,也可直接用于糞便、食物或環境水樣品等的快速檢測,但存在自動化程度低、一次檢測信息量有限、難以實現高通量篩檢、對未知來源或新出現的菌株鑒定難度大等不足[3]。發展中的高通量測序技術正可以彌補這些不足。
近年來隨著454、Illumina、Solid等第二代高通量測序技術的大規模應用,已有越來越多的微生物基因組完成測序。截止2012年10月,美國國家生物技術信息中心(以下簡稱NCBI)的GenBank數據庫中已有1183個細菌全基因組序列。通過對以上細菌進行比較基因組學研究,可以從基因組水平研究細菌進化的機制,為細菌分類、分型提供依據[4]。已完成的對部分細菌的比較基因組學研究表明,每個分類群僅有10%~20%的基因是特異的,在其他種類中沒有同源基因[1]。因此,通過對腸桿菌科的所有基因進行比較分析,可以探索直接利用高通量測序結果進行菌種鑒定的方法的可能性,同時也可以從中找出新的鑒定候選位點,進一步提高菌種鑒定的可靠性。
1.1 腸桿菌科基因組序列的獲得
本文選用了包括大腸桿菌、鼠疫桿菌、志賀氏菌等在內的已有全基因組序列的102株細菌(15屬,36種),從Genbank數據庫(ftp∶//ftp. ncbi.nih.gov/genomes/Bacteria)下載了其全基因組序列及注釋文件。
1.2 全基因組比對并計算ANI(Average Nucleotide Identity)
使用BLAST(Basic Local Alignment Search Tool,version 2.2.17)[5]對102個菌株的基因序列進行兩兩比對比對,篩選掉序列相似性60%以下或者比對序列比例70%以下的基因。對于擁有多條比對結果的基因,僅考慮其相似性最高的比對結果。基因組比對結果中,比對序列的總長度為L,比對序列中完全相同的位點總數為I,則兩菌株的Average Nucleotide Identity (ANI)=I/L[6]。
在本文中,通過對腸桿菌科15個屬(其余各屬不包含測序菌株)36種102株細菌進行基因組兩兩比對(表1)。結果顯示,除埃希氏菌屬和志賀氏菌屬外,腸桿菌科同一屬內的菌株間的ANI值都高于不同屬間的ANI值(圖1)。以耶爾森氏菌屬(Yersinia)為例,13株耶爾森氏菌間的平均ANI值為0.96,顯著高于其他14個屬比對的ANI值(P<0.05,表1)。相同的情況也存在于其他12個屬。
由此可見,菌株間ANI值可作為基因組水平遺傳差異水平的標志,直接反應兩者之間的親緣關系,ANI值越高,親緣關系越近;反之,ANI值越低,則序列差異越大,基因差異較多,菌株的表型和生化特征也會有較大差異。

圖1 腸桿菌科15個屬的ANI值
目前,微生物全基因組測序雖然已在實驗室領域是較成熟的技術,但高通量測序在臨床中直接應用到菌種的鑒定分型中還不多。本研究探討了高通量測序方法在腸桿菌科菌種鑒定中直接應用的可能性,第一次提出并驗證了ANI指標在腸桿菌科鑒定中的有效性,為該技術的進一步發展提供了數據積累。
[1] 杜鵬程,張雯,劉翟,等.基于同源基因的病原菌鑒定和 分型靶位點的功能基因組學研究[J].中國科學,20111,41(9)∶640-648.
[2] Fo GE x,Pechman KR,Woese CR.Comparative cataloging of 16S ribosomal ribonucleic acid∶ molecular approach to prokaryotic systematics[J].Int J Syst Bacteriol,1977,27(1)∶44-57.
[3] Konstantinidis KT,Ramette A,Tiedje JM.The bacterial species definition in the genomic era[J].Philos Trans R Soc Lond B Biol Sci,2006,361(1475)∶1929-1940
[4] Deloger M,El Karoui M,Petit MA.A genomic distance based on MUM indicates discontinuity between most bacterial species and genera[J].J Bacteriol,2009,191(1)∶91-99.
[5] Altschul SF,Gish W,Miller W,et al.Basic local alignment search tool[J].J Mol Biol,1990,215(3)∶403-410.
[6] Oh S,Buddenborg S,Yoder-Himes DR,et al.Genomic diversity of Escherichia isolates from diverse habitats[J].Plos One,2012,7 (10)∶e47005.
R446.5
B
1671-8194(2013)13-0067-02
國家自然科學基金青年基金(課題編號81201322)和艾滋病和病毒性肝炎等重大傳染病防治重大專項(課題編號2013ZX10003006-002)資助
*通訊作者:E-mail:chenchen@icdc.cn