王穎芳, 王鵬飛,段廣才, 郗園林, 張曉萌, 詹煜慧
(1. 河南科技大學醫學院公共衛生教研室,河南 洛陽 471023;2. 鄭州大學公共衛生學院流行病學教研室,河南 鄭州 450001;3. 河南科技大學醫院,河南 洛陽471023;4. 河南科技大學醫學院,河南 洛陽 471023)
成簇的規律間隔短回文重復序列(clustered regularly interspaced short palindromic repeats,CRISPR)是近年發現的一種對外源核酸片段具有獲得性免疫能力的結構,主要由一段不連續的正向重復序列和插入其中的間隔序列組成[1]。重復序列和間隔序列構成的單元經常被整體刪除,使得CRISPR系統迅速進化,一定程度上也反映了細菌在進化中的保守性和包容性。志賀菌引起的細菌性痢疾(簡稱菌痢)是一個全球性的公共衛生問題,尤其給發展中國家造成重大危害,其引起的感染性腹瀉給我國帶來了巨大的經濟和社會負擔[2-3]。隨著抗生素的廣泛應用,志賀菌耐藥形勢越來越嚴重,且多耐藥菌株也越來越多,而外源性耐藥基因的獲得,即耐藥基因的水平轉移,是細菌增強耐藥性的主要方式之一[4-5]。
CRISPR及其相關蛋白(CRISPR-associated proteins, CAS)組成的CRISPR/Cas系統能夠形成特異免疫機制來處理外來遺傳物質入侵,這可能與致病菌耐藥性的變遷有密切關系[6]。每個CRISPR元件的重復序列對應著一種潛在的CRISPR/Cas靶標,CRISPR/Cas系統獲得新的間隔序列后能夠在未來識別相應的病原體而發揮作用,故間隔序列是CRISPR/Cas系統最終發揮功能作用的核心序列元件[7-8]。在志賀菌中一般包括3個CRISPR位點,即CRISPR1、CRISPR2和CRISPR3,其中CRISPR1和CRISPR2具有相同的重復序列,兩者距離比較近,關于志賀菌中CRISPR結構與其耐藥性和毒力研究[9-11]也逐漸增多。目前,國內外對細菌CRISPR的研究逐漸增多,CRISPR/Cas9是應用較為廣泛的一個系統,但是對CRISPR的基礎研究尚處于探索階段,CRISPR可能通過某一個位點來發揮功能,也可能存在一種共協調機制[7, 12-13]。本研究針對數據庫中的志賀菌CRISPR進行分析,對實驗室保存的志賀菌株CRISPR序列進行檢測,研究志賀菌中CRISPR-Q1的特點,同時闡述CRISPR各位點之間的聯系,為進一步揭示CRISPR的結構特征及其作用機制提供依據。
1.1 菌種、主要試劑和儀器
本研究采用GenBank中志賀菌基因組(共有107株,包含全基因組和鳥槍法全基因組)。本研究還選用了12株由實驗室保存的志賀菌菌株,均為河南省分子醫學重點實驗室收集保存。志賀菌的基本信息見表1。

表1 實驗室志賀菌的基本信息
SS:Shigellasonnei; SF:Shigellaflexneri.
細菌基因組提取試劑盒(上海萊楓生物科技有限公司)、酵母浸粉和胰蛋白胨(英國Oxoid公司),瓊脂粉(美國Sigma公司),水解酪蛋白(mueller-Hinten,MH)和瓊脂(上海化學試劑有限公司),pH精密試紙(天津市金達化學試劑廠),其他常規試劑均為國產分析純,液體培養基在本實驗室按配方配制。LabcyCler basic 梯度PCR儀和BP221S電子天平(德國SensoQuest公司),DYY-Ⅲ2型穩壓穩流定時電泳儀和DYC31B型水平電泳槽(北京六一儀器廠),Gene Genius Bioimaging System(美國Syngene公司),THZ-92C臺式恒溫振蕩器(上海躍進醫療器械廠),HVE-50型自動電熱壓力蒸汽滅菌器(日本Hirayama公司)。本研究采用的本地軟件和網絡服務器包括:DNAMAN、ClustalX、Bioedit、CRISPR database(http://crispr.upsud.fr/crispr/)和BLAST(https://blast.ncbi.nlm.nih.gov/Blast.cgi)。
1.2 CRISPR識別
根據本實驗室前期工作[14-17]獲得CRISPR1、CRISPR2和CRISPR-Q1共3個CRISPR的側翼序列信息。下載GenBank數據庫中的107株志賀菌序列后,采用Bioedit軟件創建本地志賀菌數據庫;使用BLAST和已有的側翼序列信息,下載每種志賀菌每個CRISPR位點的序列,然后利用多序列比對等方法獲得每個菌株CRISPR的重復序列、間隔序列及相應的序列信息。
利用CRISPR的引物對12株臨床分離志賀菌CRISPR進行擴增。引物序列信息為:CRISPR1的上游引物序列是5′-AGCGACTAACTGGAATCTTG-3′,下游引物序列是5′-CAATCTGGCTACTGGAAGTG-3′,退火溫度為56℃;CRISPR2的上游引物序列是5′-CGATCCAGAGCTGGTCGAATG-3′, 下游引物序列是5′-AGTGCTCTTTAACATAATGGATG-3′,退火溫度為56℃;CRISPR-Q1的上游引物序列是5′-ACCGCTGGCATCGTTGTTG-3′, 下游引物序列是5′-ATGAGCGTGGACGAAGTGC-3′,退火溫度為55℃。
1.3 PCR反應條件和擴增條件
CRISPRs序列擴增體系(50 μL):10×buffer(含Mg2+)5 μL,dNTPs 8 μL,上下游引物各2 μL,模板DNA 4 μL,Taq酶0.5 μL,ddH2O 28.5 μL。PCR反應條件:94℃預變性5 min,94℃變性60 s, 55℃或56℃退火60 s,72℃延伸1 min,共進行32個循環,最后72℃延伸 10 min。
1.4 CRISPR的檢測和分析
委托上海生物工程股份有限公司對擴增產物核酸序列進行純化和測序,獲得測序結果后,采用多序列比對等方法獲得12株志賀菌CRISPR的相關序列信息。結合數據庫中志賀菌的CRISPR信息,對CRISPR在志賀菌中的分布、CRISPR特點和CRISPR間的相關性進行分析。采用BLAST分析CRISPR-Q1的重復序列和間隔序列在菌株中的分布以及同源性。
1.5 統計學分析
采用SPSS 17.0統計軟件進行統計學分析。數據庫中志賀菌的CRISPR1/CRISPR2與CRISPR-Q1中間隔序列數間關系分析采用χ2檢驗,實驗室中志賀菌的CRISPR1/CRISPR2與CRISPR-Q1中間隔序列數間關系分析采用Fisher確切概率法。以P<0.05為差異有統計學意義。
2.1 CRISPR-Q1、CRISPR1和CRISPR2的識別及分布
2.1.1 數據庫中志賀菌的CRISPR-Q1、CRISPR1和CRISPR2的識別及分布 通過CRISPR的側翼序列,獲得志賀菌的CRISPR分布。有8個菌株的CRISPR1或CRISPR2含有多個間隔序列,不同菌株中所含的間隔序列數并不一致。CRISPR-Q1在志賀菌中分布廣泛,一些菌株中含有多個間隔序列。見表2。
2.1.2 實驗室中志賀菌的CRISPR-Q1、CRISPR1和CRISPR2的識別及分布 實驗室的12株志賀菌中,有6株并不含有CRISPR1和CRISPR2,12株菌株均含有CRISPR-Q1。有的志賀菌中,如71號菌株,其在CRISPR1含有9個間隔序列,在CRISPR2中含有6個間隔序列,CRISPR-Q1中含有4個間隔序列。有的菌株中,如4、7和8號菌株,含有的間隔序列數則比較少。見表3。
2.2 CRISPR-Q1的特點
2.2.1 CRISPR-Q1的序列特點 CRISPR-Q1的重復序列具有很高的序列一致性,可利用BLAST來探索重復序列在一個菌株的染色體上的分布情況。以sf2457T(ref|NC_004741.1)為例,對重復序列(41 bp,AATGCCTGATGCGACGCTTAACGCGTCTTATCATGCCTACA)進行BLAST后顯示:在染色體基因組的多個地方均存在此重復序列,盡管在某些地方的重復序列有個別堿基并不相同。CRISPR-Q1在多個菌株中存在多個間隔序列,但是這些間隔序列具有較高的序列相似性,故選擇一個間隔序列來進行分析。對間隔序列(60 bp,GGTTTGTGCCGAACCGTAGGCCGGATAAGG-CGTTCACGCCGCATCCGGCAGTTGGCGCAC)進行BLAST后顯示中段長度約為35 bp的序列在細菌染色體上廣泛分布。見表4。

表2 數據庫中志賀菌CRISPR-Q1、CRISPR1和CRISPR2的分布

表3 實驗室中志賀菌CRISPR-Q1、CRISPR1和CRISPR2的分布

表4 BLAST后重復序列和間隔序列部分結果
2.2.2 CRISPR-Q1的同源性 對僅含1個間隔序列的12號菌株的測序序列進行BLAST,結果顯示其與sf2457T具有很高的序列相似性(99%),CRISPR-Q1位于yjjV與yjjW基因之間。在sf2457T的這2個基因之間,是重復性外顯回文(repetitive extragenic palindromic elements,REP)元素,此段序列中共有4個REP序列。
2.3 CRISPR1/CRISPR2與CRISPR-Q1中間隔序列數的關系
2.3.1 數據庫中志賀菌的CRISPR1/CRISPR2與CRISPR-Q1中間隔序列數的關系 CRISPR1和CRISPR2具有相同或是相似的重復序列,在不同菌株中的分布并不相同,CRISPR-Q1在某些菌株中具有較多的間隔序列。當一個菌株中CRISPR-Q1的間隔序列數目超過2,則該菌株中CRISPR1或是CRISPR2總是具有完整的CRISPR結構(χ2=61.6,P<0.01),其通常也含有多個間隔序列。見表5。
表5 數據庫中志賀菌的CRISPR1/CRISPR2與CRISPR-Q1的關系
Tab.5 Correlation between CRISPR1/CRISPR2 and CRISPR-Q1 ofShigellain database

Number of CRISPR-Q1 spacerCRISPR1/CRISPR2 YesNoχ2PNumber of spacer>2Number of spacer≤213608761.6<0.01
2.3.2 實驗室中志賀菌的CRISPR1/CRISPR2與CRISPR-Q1中間隔序列數目的關系 通過研究實驗室保存的志賀菌CRISPR分布發現:當一個菌株中CRISPR-Q1的間隔序列數目超過2,則該菌株中的CRISPR1或CRISPR2通常含有多個間隔序列(P=0.015)。見表3和6。
表6 實驗室中志賀菌的CRISPR1/CRISPR2與CRISPR-Q1的關系
Tab.6 Correlation between CRISPR1/CRISPR2 and CRISPR-Q1 ofShigellain laboratory

Number of CRISPR-Q1 spacerCRISPR1/CRISPR2YesNoPNumber of spacer>2Number of spacer≤2 51060.015
研究[14-16]顯示:志賀菌CRISPR1和CRISPR2中存在的間隔序列相對較多,本研究結果同樣也顯示這2個位點中存在的間隔序列具有較大的差異性。CRISPR-Q1在志賀菌中分布廣泛, CRISPR1和CRISPR2中的間隔序列數目也是多樣的。數據庫中與臨床分離志賀菌的CRISPR-Q1具有相同的特點,CRISPR-Q1中的重復序列和間隔序列的部分序列在同一個菌株中分布廣泛,且CRISPR-Q1序列中存在REP元素。不同的菌株中CRISPR-Q1所含的間隔序列數不同,與CRISPR1或CRISPR2有關聯。
志賀菌的CRISPR類型與大腸桿菌類似,志賀菌中確定CRISPR包括CRISPR1、CRISPR2和CRISPR3,其中CRISPR3具有較高的保守性,CRISPR1和CRISPR2則變化比較大[16, 18-20]。研究[16, 21]顯示:CRISPR1和CRISPR2具有相同或相似的重復序列,但是間隔序列數則并不確定,CRISPR1的下游存在cas基因簇。本研究結果顯示:在某些志賀菌中CRISPR1和CRISPR2位點均缺失,有些僅留下這2個CRISPR中的1個,有些則有多個間隔序列。根據CRISPR1和CRISPR2的多樣性以及存在的cas基因簇,推測這2個CRISPR在某些菌株中仍具有活性。CRISPR-Q1在志賀菌中分布廣泛,且在很多菌株中包含多個間隔序列。研究[15]顯示:該CRISPR的重復序列在親緣關系較遠的菌株中也有發現,故其對于細菌可能具有特別的意義,其功能需要進一步研究。
不管是在同一個菌株中,還是在不同的菌株中,CRISPR-Q1中的重復序列均具有較高的保守性,僅在個別位置的堿基發生改變。本研究結果顯示:此重復序列在一個菌株中也有廣泛的分布,分布的位置遍布于菌株染色體基因組,差異也僅是個別的堿基。而此CRISPR中的間隔序列也具有較高的序列一致性,有的菌株中有多個間隔序列,這些間隔序列也同樣具有較高的序列一致性。本研究結果顯示:間隔序列中片段長度約為35 bp的序列在菌株中具有類似重復序列的分布特征,除了在該CRISPR位置上兩者相鄰,在其他位置上并未發現兩者相鄰。研究[15, 22]顯示:CRISPR-Q1間隔序列兩端序列與側翼序列具有相同的序列。結合上述特征,對測序的志賀菌CRISPR-Q1序列進行BLAST結果提示:CRISPR-Q1序列中包含REP元素,僅含1個間隔序列的sf2457T中,存在4個REP序列。其他一些菌株包含多個重復序列和間隔序列。
本研究結果顯示:CRISPR-Q1間隔序列數多的菌株中,常含有CRISPR1和CRISPR2。CRISPR-Q1序列中存在多個REP元素,這也提示REP元素與CRISPR之間存在一致性聯系,CRISPR-Q1中間隔序列數影響REP元素的個數。REP序列穩定,REP-PCR技術可以對細菌進行鑒別和分型等[23],CRISPR中間隔序列的變化也為分析各型的特征提供了可能。盡管本研究并未采用此方法對志賀菌進行分型,但是CRISPR-Q1與REP元素間的一致性、CRISPR1和CRISPR2與CRISPR-Q1間的關聯性以及CRISPR中間隔序列數目的多樣性為其提供了理論基礎。CRISPR和REP-PCR技術的聯合應用可對志賀菌進行分型,REP-PCR可以對志賀菌進行初步的分型,CRISPR則可以對每個型別進行更為有效的分型,來闡述型別間的差異。在志賀菌中運用REP-PCR進行分型已有研究[24],其能很好地分析志賀菌各個菌株的遺傳特點,但是并未對具有較近親緣關系的菌株進行有效的分析。利用CRISPR的多樣性特點,能夠結合較近親緣關系的菌株中CRISPR分布差異和間隔序列的數目對菌株類型以及特點進行多樣性分析。
本研究觀察了志賀菌中CRISPR-Q1的特點,初步探討了CRISPR間的相關性。12株臨床分離株研究結果也初步揭示了CIRSPR間的聯系,但是還需要進行更深入的研究,同時還要探討利用REP-PCR聯合CRISPR對志賀菌或是其他細菌進行有效的分型,使其更好地揭示細菌的遺傳特點以及變化特點。