曹小利,程莉,周萬(wàn)青,張之烽,張葵,沈瀚
(南京大學(xué)附屬鼓樓醫(yī)院檢驗(yàn)科,南京210008)
肺炎克雷伯菌是醫(yī)院和社區(qū)獲得性感染的主要病原菌,主要引起尿路感染、肺炎、敗血癥等感染性疾病[1]。目前已知,肺炎克雷伯菌是全球主要流行的碳青霉烯耐藥腸桿科細(xì)菌(carbapenem resistant enterobacteraceae, CRE)[2]。KPC-2是碳青霉烯耐藥肺炎克雷伯菌(carbapenem resistanceKlebsiellapneumoniae, CRKP)中主要的碳青霉烯酶,ST11是CRKP的主要流行克隆[3]。本研究主要對(duì)南京地區(qū)不同醫(yī)院分離的3株CRKP-ST11進(jìn)行基因組測(cè)序,并與上海、杭州、美國(guó)/印度的相應(yīng)菌株進(jìn)行基因組比對(duì),進(jìn)行基因組學(xué)特點(diǎn)分析,報(bào)道如下。
1.1實(shí)驗(yàn)菌株 在前期的研究基礎(chǔ)上,挑取南京鼓樓醫(yī)院、南京明基醫(yī)院、南京醫(yī)科大學(xué)醫(yī)學(xué)院附屬第二醫(yī)院分離的3株CRKP-ST11菌株[4],樣本分別從患者血液、尿液及痰液培養(yǎng)中獲得。細(xì)菌經(jīng)基質(zhì)輔助激光解吸電離飛行時(shí)間質(zhì)譜技術(shù)鑒定。本研究中CRKP定義為對(duì)亞胺培南耐藥,ST11經(jīng)肺炎克雷伯菌多位點(diǎn)序列分型確定。
1.2儀器和試劑 磁珠法通用型基因組DNA提取試劑盒DP705(北京天根公司);NanoDrop 2000分光光度計(jì)(德國(guó)Thermo公司);恒溫震蕩培養(yǎng)儀器ZWY-211B(ZHICHENG公司);全自動(dòng)快速微生物質(zhì)譜檢測(cè)系統(tǒng)(法國(guó)生物梅里埃公司)。
1.3基因組提取和全基因組測(cè)序 取新鮮培養(yǎng)的單個(gè)菌落接種至50 mL LB培養(yǎng)液中,37 ℃ 200 r/min過(guò)夜培養(yǎng)后,4 ℃、(4 000~8 000)×g離心10 min,棄上清液,細(xì)菌沉渣用無(wú)菌水洗2次后,使用磁珠法通用型基因組DNA提取試劑盒DP705,按說(shuō)明書提取細(xì)菌基因組DNA,并用NanoDrop 2000分光光度計(jì)檢測(cè)基因組的濃度和純度。基因組濃度要求:DNA≥5 ng/μL;純度要求:A260 nm/A280 nm=1.8~2.0。本項(xiàng)目委托廣東美格基因公司進(jìn)行基因組高通量測(cè)序。提取的DNA樣品經(jīng)電泳檢測(cè)合格后,用Covaris超聲波破碎儀隨機(jī)打斷成長(zhǎng)度約350 bp的DNA片段。經(jīng)末端修復(fù)、加A尾、加測(cè)序接頭、純化、PCR擴(kuò)增等步驟完成文庫(kù)制備;構(gòu)建的文庫(kù)先使用Qubit 2.0進(jìn)行初步定量,稀釋文庫(kù)至2 ng/μL,隨后使用Agilent 2100對(duì)文庫(kù)的插入片段進(jìn)行檢測(cè),片段符合預(yù)期后,使用Q-PCR方法對(duì)文庫(kù)的有效濃度進(jìn)行準(zhǔn)確定量,以保證文庫(kù)質(zhì)量。庫(kù)檢合格后,進(jìn)行Illumina HiSeq 測(cè)序,測(cè)序平臺(tái)采用Illumina Hiseq PE150。獲得的核苷酸片段在CLC genomics workbench軟件(蘇州協(xié)云基因科技公司)上進(jìn)行拼接,通過(guò)軟件去除測(cè)序質(zhì)量較差的片段后,使用de novo拼接成contigs。
1.4細(xì)菌單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)分析 以中國(guó)浙江(JM45)、上海(HS11286)和美國(guó)/印度(ATCC BAA-2146)的報(bào)道的CRKP-ST11全基因組為對(duì)照菌株,進(jìn)行比對(duì)分析。將獲得的3株草圖基因組的contigs,采用CLC Main Workbench進(jìn)行首尾串連成一條假的完整DNA,然后將6個(gè)基因組的核苷酸序列導(dǎo)入Mauve軟件[5],進(jìn)行多序列比對(duì),比對(duì)完成后,選擇導(dǎo)出SNP分析結(jié)果即可獲得所有SNP位點(diǎn)信息。采用Circos軟件[6],以每1 000 bp內(nèi)發(fā)生的SNP數(shù)量為數(shù)據(jù),分別對(duì)每個(gè)基因組的SNP分布進(jìn)行可視化。
1.5親緣關(guān)系分析 為獲得核心區(qū)域的高質(zhì)量SNP位點(diǎn)信息,采用Perl對(duì)Mauve生成的SNP位點(diǎn)信息進(jìn)行過(guò)濾,標(biāo)準(zhǔn)如下:(1)不允許出現(xiàn)“-”;(2)每一個(gè)SNP位點(diǎn)只能出現(xiàn)2種不同的堿基。采用自編寫的Perl腳本對(duì)過(guò)濾后的SNP位點(diǎn)進(jìn)行串聯(lián),共獲得14 052個(gè)SNPs,然后導(dǎo)入RAxML構(gòu)建最大似然樹(shù)[7]。
1.6莢膜多糖(capsular polysaccharide,CPS)基因簇組成及GC含量分析 將基因組gbk格式(序列及基因注釋)文件導(dǎo)入CLC Main Workbench,對(duì)CPS區(qū)域基因組成進(jìn)行共線性分析,并導(dǎo)出基因簇組成圖(SVG格式);根據(jù)基因注釋并進(jìn)行人工核對(duì),確定基因名。選擇導(dǎo)出每個(gè)基因組的CPS區(qū)域核苷酸序列,然后采用自編寫的Perl腳本程序?qū)塑账嵝蛄羞M(jìn)行GC含量步移法(步長(zhǎng)設(shè)置為120 bp)掃描分析。最后采用Adobe Illustrator CS對(duì)圖形進(jìn)行編輯。
1.7基因組的獲取號(hào) 本實(shí)驗(yàn)中測(cè)序得到的基因組已上傳NCBI,基因組獲取號(hào)分別依次為:RZKL00000000、RZME00000000和RZMP00000000;本實(shí)驗(yàn)中的對(duì)照基因組從NCBI中下載,基因組獲取號(hào)如下:肺炎克雷伯菌HS11286:NC_016845.1;肺炎克雷伯菌JM45:NC_022082.1;肺炎克雷伯菌ATCCBAA-2146:NZ_CP006659.2。
2.13株CRKP-ST11的基因組組裝結(jié)果 3株測(cè)序細(xì)菌的基因組組裝結(jié)果見(jiàn)表1。

表1 3株碳青霉烯耐藥肺炎克雷伯菌ST11菌株的基因組組裝結(jié)果
2.2CRKP-ST11菌株的SNP特點(diǎn) 6株細(xì)菌基因組的單核苷酸位點(diǎn)多態(tài)性見(jiàn)圖1。結(jié)果顯示,在整個(gè)肺炎克雷伯菌基因組中,CPS基因簇是CRKP-ST11的主要的SNP位點(diǎn)分布區(qū)之一。

注:紅色標(biāo)記表示CPS基因簇的SNP變化,箭頭的幅度越大,顯示該區(qū)的多態(tài)性越大。
2.3CRKP-ST11菌株的親緣關(guān)系特點(diǎn) CRKP-ST11菌株的群體結(jié)構(gòu)分析見(jiàn)圖2。結(jié)果顯示,6株CRKP-ST11菌株分為4個(gè)進(jìn)化枝,其中,南京地區(qū)分離的3株CRKP-ST11菌株在同一進(jìn)化枝中,親緣關(guān)系最近;其次,這3株細(xì)菌與上海、杭州的CRKP-ST11也有較近的親緣關(guān)系,而與美國(guó)/印度的CRKP-ST11較遠(yuǎn)。

注:NJ699、NJ323和NJ212是在南京分離的3株CRKP-ST11菌;HS11286(中國(guó)上海)、JM45(中國(guó)杭州)、ATCC BAA-2146(美國(guó)/印度)的基因組從NCBI數(shù)據(jù)庫(kù)中下載。
2.4CRKP-ST11菌株的CPS基因簇結(jié)構(gòu)特點(diǎn) CRKP-ST11的CPS基因簇結(jié)構(gòu)分析見(jiàn)圖3。結(jié)果顯示,從南京地區(qū)分離的3株CRKP-ST11菌株,其CPS基因簇5′端的galF、orf2、wzi、wza、wzb和wzc及3′端的gnd和ugd基因間的成對(duì)核苷酸相似性為99%(galF)到55%(wzc),組成相當(dāng)一致,具有很好的共線性;但是與杭州、上海及美國(guó)/印度的3株CRKP-ST11菌株主要在可變區(qū)存在差異。
2.5CRKP-ST11菌株CPS的GC含量特點(diǎn) 南京地區(qū)分離的3株CRKP-ST11的CPS區(qū)GC含量見(jiàn)圖4。結(jié)果顯示,CPS可變區(qū)的GC含量大多<50%,顯著低于其保守區(qū)域(GC含量>50%)以及基因組平均GC含量(約57%),表明CPS可變區(qū)的GC含量明顯不同于基因組核心保守區(qū)。

注:藍(lán)色區(qū)域表示5′端保守區(qū),紅色區(qū)域表示3′端保守區(qū),綠色區(qū)為可變區(qū)。粉色陰影部分表示堿基序列相似或相同。
本研究中,我們獲取的3株細(xì)菌的基因組組裝結(jié)果與以往的研究結(jié)果一致[8],并且提交NCBI時(shí)已通過(guò)審核,表明我們?cè)诨蚪M提取、測(cè)序與組裝方面的結(jié)果比較可靠,可以深入分析。通過(guò)SNP分析,我們發(fā)現(xiàn),CPS基因簇是CRKP-ST11的主要的SNP位點(diǎn)分布區(qū)之一。目前已知全球CRKP主要流行克隆組(clonal group,CG)258包括ST11和ST258等,CG258的對(duì)比基因組學(xué)分析顯示cps基因簇是CRKP的熱點(diǎn)重組區(qū)域,容易發(fā)生重組或替換而導(dǎo)致莢膜轉(zhuǎn)換[9],這種莢膜轉(zhuǎn)換在CG258中相當(dāng)常見(jiàn),更接近于或在CPS基因簇內(nèi),可能是CG258進(jìn)化的主要特征[10],很可能是CG258全球播散主要的和潛在的共同驅(qū)動(dòng)力[9,11]。此外,CPS基因簇內(nèi)常存在編碼轉(zhuǎn)座酶或噬菌體相關(guān)蛋白的基因[3],表明轉(zhuǎn)座以及和轉(zhuǎn)座相關(guān)的水平基因轉(zhuǎn)移可能也在CPS基因簇內(nèi)發(fā)生。其內(nèi)外的DNA交換可能是肺炎克雷伯菌快速多樣化和進(jìn)化的重要機(jī)制[12]。
親緣性進(jìn)化分析表明,南京地區(qū)分離的3株CRKP-ST11的親緣性相近,這與我們前期的研究結(jié)果一致[13],表明CRKP-ST11在南京地區(qū)存在播散流行。此外,雖然南京和杭州距離上海很近,但不同地區(qū)來(lái)源細(xì)菌位于不同的進(jìn)化枝,表明CRKP-ST11菌株的流行可能有地域特點(diǎn)。
目前已知,CPS由染色體基因編碼,在基因組CPS位點(diǎn)成簇,大小一般為21 000~30 000 bp,有16~25個(gè)開(kāi)放讀碼框架(open reading frame,ORF)[14]。其有一個(gè)基本結(jié)構(gòu)特征:由兩端的保守區(qū)和中間的高度可變區(qū)組成,5′端高度保守區(qū)由6個(gè)基因(galF、orf2、wzi、wza、wzb和wzc)組成,參與CPS易位運(yùn)輸和細(xì)菌表面蛋白加工;3′端有高度保守的葡萄糖-6-磷酸脫氫酶(gnd)和UDP-葡萄糖脫氫酶(ugd)基因;中心區(qū)域(wzc-gnd區(qū))為可變區(qū),隨不同的莢膜類型而變化,通常含有編碼葡萄糖轉(zhuǎn)移酶(GTs)、翻轉(zhuǎn)酶(wzx)、聚合酶(wzy)和修飾酶(乙酰轉(zhuǎn)移酶、丙酮酰轉(zhuǎn)移酶等)的基因,與特定CPS亞基的聚合和裝配有關(guān)。研究報(bào)道,CPS基因簇中心可變區(qū)具有很大的多樣性,很可能是進(jìn)化的起源[15]。然而目前研究?jī)H集中于CPS的保守區(qū)域,不足以解釋其多樣性特征。本研究發(fā)現(xiàn),南京地區(qū)分離的CRKP-ST11與杭州、上海及美國(guó)/印度的3株CRKP-ST11菌株的差異主要在可變區(qū)。Zhou等[16]報(bào)道,與非暴發(fā)肺炎克雷伯菌菌株相比,暴發(fā)菌株KP-ST1427的CPS基因簇可變區(qū)多了一段編碼GTs的3個(gè)ORF。奧地利學(xué)者發(fā)現(xiàn),作為全球最為流行的CRKP,ST258的2個(gè)進(jìn)化枝都具有D-半乳聚糖-Ⅲ,其編碼基因在CPS可變區(qū);相繼的流行病學(xué)分析顯示,200多個(gè)ST258的全基因組序列中,83%的肺炎克雷伯菌ST258的CPS可變區(qū)都有這種編碼GTs的3個(gè)基因的ORF[17],提示CPS可變區(qū)在ST258流行播散中的作用。最近的一項(xiàng)研究表明,CRKP-ST258的CPS分型與ST258的流行相關(guān)[18]。

注:CPS可變區(qū)的G+C含量大多<50%。A,NJ699 CPS可變區(qū)的GC含量;B,NJ323 CPS可變區(qū)的GC含量;C,NJ212 CPS可變區(qū)的GC含量。
此外,CPS區(qū)的GC含量分析發(fā)現(xiàn),可變區(qū)的堿基含量明顯低于保守區(qū)域和基因組平均GC含量。有研究發(fā)現(xiàn),細(xì)菌的基因組核苷酸含量變化很大,各物種之間的GC含量為13%~75%[19]。微生物進(jìn)化和環(huán)境都會(huì)導(dǎo)致微生物群體中的重組,而重組也會(huì)影響基因組堿基含量的變化。在大多數(shù)原核核心基因組中,GC含量的增加似乎是由系統(tǒng)發(fā)育慣性而維持的,而基因組相應(yīng)的附屬和非核心部分中更為多樣和豐富的堿基組成可能更多地受到環(huán)境和其他宿主堿基組成的影響。在核心基因組中觀察到的基因內(nèi)GC含量越高,GC變異越小,這很可能與選擇性限制有關(guān)[20],意味著該菌與其他微生物進(jìn)行胞內(nèi)重組和遺傳交換的頻率比其他微生物少[21]。因?yàn)榧?xì)菌的突變主要發(fā)生在AT上[22],噬菌體攝取也有AT偏向,所以比起宿主染色體,外源性DNA序列(如噬菌體和質(zhì)粒)富集更多的AT堿基[23-24]。所以,可變區(qū)GC含量越低,表明外源性DNA序列(如噬菌體和質(zhì)粒等的序列)越多,該區(qū)基因重組的可能性越大。
本研究中,不管是基因組GC含量,還是基因組SNP分析均顯示,CPS基因簇很可能是CRKP的熱點(diǎn)重組區(qū)域,這與以往的研究報(bào)道一致[25],表明CPS基因簇可變區(qū)可能通過(guò)同源重組等導(dǎo)致了CPS基因座基因內(nèi)容和總體長(zhǎng)度的差異,這可能在細(xì)菌的進(jìn)化中起著重要的作用。總之,CPS是CRKP-ST11的主要單核苷酸位點(diǎn),其可變區(qū)堿基含量<50%,可能是CRKP-ST11菌株的主要進(jìn)化區(qū),可能與CRKP-ST11的流行有關(guān)。