張沐詩 毛明慧 謝丹 肖瑤 李樹春
中央民族大學藥學院民族醫藥教育部重點實驗室(北京100081)
大多數腸道微生物對人體生理和健康都有著重要影響,它們對人類生命至關重要[1]。腸道菌群與腸道細胞之間的相互作用可以調節屏障功能,不斷刺激免疫系統防御病原體[2]。腸道菌群與宿主之間的平衡如果發生了改變,可能會導致機體產生各種疾?。?]。
我國是一個多民族國家,少數民族人群存在聚集生活的狀態,且各民族間的腸道菌群存在差異[4]。蒙古族作為我國北部少數民族之一,飲食習慣、地理環境、社會文化等有自己獨特的地方,且純系人口較多,適合作為民族差異研究的對象。最近研究表明各民族之間疾病的患病率也存在著種族和民族差異[5-6]。已有研究表明,漢族和蒙古族糖尿病患病率存在差異[7]。孫剛等[8]在比較內蒙古地區蒙古族和漢族高血壓患病率及危險因素分布差異時,證實內蒙古地區蒙古族人群高血壓患病率高于漢族。另一項中國少數民族研究顯示[9],在漢族和蒙古族之間,人乳頭瘤病毒(HPV)患病率存在明顯的種族差異,漢族患病率(11.5%)顯著低于蒙古族(32.6%)。因此,種族、微生物群和健康差異之間的相互聯系非常有研究意義。鑒于此,為了探討漢族和蒙古族腸道菌群差異,本論文通過高通量測序和生物信息學分析尋找漢族或蒙古族特有菌群,為從民族角度分析腸道菌群和疾病關系研究提供新的研究思路和實驗支持。
1.1 樣本和信息采集本研究的開展經過了中央民族大學倫理委員會的審核(批準號:ECMUC 2019003CO),并讓每個志愿者都簽存了知情同意書。本研究的樣本采集地點為蒙古阿拉善盟阿左旗,受試者主要來自當地人群,一共獲得糞便樣本28 例,樣本采集后30 min 內用糞便儲存液保存,干冰運輸到實驗室后,置于-80 ℃冰箱中冷凍保存。研究對象的納入標準:漢族志愿者三代直系血親均為漢族人群,蒙古族志愿者三代直系血親均為蒙古族人群;所有志愿者都遵循其傳統的生活習慣。研究對象的排除標準:患有急性或慢性炎癥性疾病;患有慢性胃腸疾病;在采集樣本前三個月內使用過抗生素或益生菌;三個月內使用過激素類藥物;正在哺乳的女性。
1.2 糞便菌群DNA 提取糞便菌群基因組DNA提取采用PowerSoil? DNA Isolation Kit,具體操作按其說明書進行。PCR 擴增體系為:Phusion Master Mix(2×)15 μL,上游引物3 μL,下游引物3 μL,基因組DNA 10 ng,無菌水2 μL;PCR擴增條件為:98 ℃預變性1 min;30 個循環包括(98 ℃,10 s;50 ℃,30 s;72 ℃,30 s);72 ℃,5 min。使用提取出的DNA 作為PCR 擴增模板,測序區域為V3+V4 區,使用特定帶Barcode 的引物。將PCR 產物稀釋成同樣濃度,再將產物混勻。使用瓊脂糖凝膠電泳的方法純化產物,凝膠的配制為1×TAE 濃度的2%瓊脂糖凝膠。根據主帶大小,選擇在400~450 bp的條帶,并割膠回收,用于Illumina 制備試劑盒進行構建文庫,測序使用HiSeq2500。
1.3 生物信息分析及統計分析使用QIIME軟件[10]對原始序列進行過濾,舍棄低質量的原始序列,得到Clean tags,并構建α稀釋曲線。基于數據庫比對,使用USEARCH[11]舍棄序列中Barcode 文件,獲得可以用于后續分析的Final tags。USEARCH構建進化樹,生成OTU 豐度表和代表性序列。在QIIME 中生成Alpha 多樣性表,并利用R 語言ggplot2 包作盒形圖。使用未加權unifrac 算法和加權unifrac 生成β-多樣性,用來研究物種分布是否受到民族或疾病因素的影響,顯著性用adonis 方法檢驗。維恩圖用于統計漢族和蒙古族差異OTU 的交并集情況。使用RDP classifier 網頁的注釋文件對OTU 進行物種注釋,多數OTU 可以注釋至屬水平。使用KRONA[12]對漢族和蒙古族群體各層次的物種比例進行可視化顯示。
通過PICRUSt[13](http://PICRUSt.github.io/PICRUSt/)分別對漢族和蒙古族樣本進行功能和代謝途徑預測分析,利用QIIME 獲得Greengenes 數據庫注釋的OUT 表,與KEGG 數據庫進行比對,獲得功能預測信息。利用STAMP 軟件在P<0.05 顯著性水平對預測結果進行分析,獲得具有顯著性差異的代謝通路信息,并對結果進行可視化。
1.4 統計學方法所有樣本的數據均表示為均值±標準差,方差齊性的數據進行F檢驗,如果不滿足方差齊性,采用校正的t檢驗。以P<0.05為差異有統計學意義。
2.1 研究對象的臨床特征本研究最終納入10例漢族樣本,18例蒙古族樣本。漢族組平均年齡(52.50±8.56)歲,蒙古族組平均年齡(56.88±14.27)歲。結果顯示漢族與蒙古族兩民族之間差異無統計學意義(P>0.05),見表1。
2.2 微生物多樣性10 份漢族糞便樣本,每個樣本平均有47 391條Final tags;18份蒙古族糞便樣本,每個樣本平均有48 433 條Final tags。測序質量在QIIME 軟件中生成Rank-Abundance 趨向水平直線,表明測序的數據量足夠大,因此測序結果可用于生物多樣性分析和統計分析。Alpha 多樣性即樣品內部的生物多樣性,本研究根據OTU table 和系統發育樹計算參數,包括chaol 指數、Shannon 指數。本研究的α多樣性分析經Wilcoxon 秩和檢驗結果顯示,Chao1 和Shannon 指數在兩民族無顯著差異(P(Chao1)=0.87,P(Shannon)=0.58)。在R 語言中基于非加權距離矩陣(un)weighted_unifrac 作圖,組間差異使用adonis 檢驗,當僅納入菌群多樣性作為參考時(距離為非加權矩陣),漢族和蒙古族菌群之間差異有統計學意義(P=0.001);而同時把菌群種類和數量同時納入參考時(距離為加權矩陣),漢族人腸道菌群和蒙古族之間差異有統計學意義(P=0.001),見圖1。
2.3 微生物組成分析每個OTU 代表不同的微生物物種,Venn 圖可以表示兩種族群腸道微生物的多樣性情況。結果表明,漢族腸道菌群共分析出有1 011 個OTU,其中特有OTU 446 個,且特有的OTU 數量約為蒙古族的兩倍。蒙古族腸道菌群總共分析出有784 個OTU,特有OTU 219 個。兩組合起來分析出OTU1230 個,共有的OTU 為565 個,占總體的45.9%(圖2)。

圖1 微生物多樣性分析Fig.1 Microbial diversity analysis
使用R 語言中edgeR 包作漢族和蒙古族腸道菌群差異分析,其原理是基于負二項分布模型,為消除測序產生的誤差和聚類時產生的噪音,在用edgeR 作組間差異分析時,刪除豐度<0.001 的OTU,對OTU 表中的豐度信息進行過濾,即總體樣本中某個OTU 的豐度值小于總體OTU 豐度值的千分之一(P<0.05),則舍棄。本實驗共分析OTU 1 245 個,從火山圖知,漢族和蒙古族組間有309個差異OTU。注釋到科水平的OTUs 包括擬桿菌科(bacteroidaceae)、克里斯滕內爾科(christensenellaceae)、腸桿菌科(enterobacteriaceae)、erysipelotrichaceae、毛螺菌科(lachnospiraceae)、紫單胞菌科(porphyromonadaceae)、紅螺科普雷維菌科(prevotellaceae rhodospirillaceae)、瘤胃菌科(ruminococcaceae)、韋榮球菌科(veillonellaceae)。相較于漢族,蒙古族OTUs 豐度顯著增加的有170 個,顯著下調的有139 個(圖5),火山圖證實本實驗納入的漢蒙兩組人群腸道菌群存在差異。
2.4 物種注釋及菌群分布在USEARCH中對原始測序文件Final tags1 和Final tags2 進行拼接,拼接后過濾、去重,運行cluster_otus 腳本聚類并去除嵌合體,運行align_seqs.py 腳本構建進化樹,然后以默認的97%相似度進行OTUs 聚類分析,最后生成OTU 表。下載RDP classifier 網頁的注釋文件16S rRNA training set 16,將生成OUT 與之進行比對,進行注釋。利用Krona 軟件將注釋后的OUT表可視化,展示結果中,圓圈從內到外依次代表不同的分類級別,扇形的大小代表不同OTUs 注釋結果的相對比例。門水平上,漢族中豐度最高的是厚壁菌門(firmicutes)占比52%,其次是擬桿菌門(bacteroidetes)(36%)、變形桿菌門(proteobacteria)(9%)、放線菌門(actinobacteria)(3%)。蒙古族人群在門水平上,豐度最高的四個門是厚壁菌門(firmicutes)(53%)、擬桿菌門(bacteroidetes)(42%)、放線菌門(3%)(actinobacteria)、疣微菌門(verrucomicrobia)(0.75%)。見圖3。
在屬水平上,蒙古族和漢族豐度最高的前四個是擬桿菌屬(Bacteroides)、糞桿菌屬(Faecalibacterium)、普雷沃菌屬(Prevotella)、狹義梭菌屬(Clostridium sensu stricto)。此外,檢驗結果顯示在蒙古族人糞便中豐度含量大于1%且顯著(P<0.05)高于漢族組的細菌屬有:梭菌Ⅳ(ClostridiumⅣ)、副桿狀菌屬(Parabacteroides)、枝菌屬(Alistipes),在漢族組中豐度含量大于1%且顯著(P<0.05)大于蒙古族組的細菌屬有:瘤胃球菌屬(Ruminococcus)、克雷白氏桿菌(Klebsiella)、布勞特氏菌屬(Blautia)、毛螺旋菌屬(Parasutterella)。綜上所述,兩種族腸道微生物中優勢菌門和菌屬相同,但其他細菌屬的豐度差異較為明顯。

圖2 微生物組成分析Fig.2 Microbial composition analysis

圖3 物種注釋及菌群分布Fig.3 Species annotation and flora distribution
2.5 PICRUSt 功能預測分析使用QIIME 軟件運行cluster_otus 命令對測序獲得的16S rRNA 基因序列進行OUT 聚類,得到BIOM 格式的OTU table;運行single_rarefaction.py 對OTU 表進行校正,得到每個OTU 更加真實的豐度;使用predict_traits.py 命令映射、推斷、量化代謝功能,得到兩民族間腸道菌群代謝功能差異,使用STAMP 軟件對結果進行可視化展示。通過PICRUSt 分別對漢族和蒙古族樣本進行腸道菌群的功能和代謝途徑預測分析,結果發現漢族與蒙古族之間共有11 個代謝通路有顯著差異,其中蒙古族顯著高于漢族的代謝通路有10 個,包括N- 糖鏈的生物合成代謝通路、醚脂代謝通路、異喹啉生物堿的生物合成通路等。漢族顯著高于蒙古族的代謝通路只有1 個為胰島素信號通路(圖4)。

圖4 漢族和蒙古族腸道菌群功能預測分析Fig.4 Functional prediction analysis of intestinal microflora of Han and Mongolian
許多常見疾病與腸道微生物的組成和種族有關,這提出了一個核心假設,即種族之間的腸道微菌群差異是否可以反應出種族之間的體質差異。中國的蒙古族和漢族在社會經濟,文化,地理,飲食和遺傳多樣性有很大不同,并且個體差異和環境因素也會影響整個微生物群的組成。為了證實種族-微生物群假說,我們評估了蒙古族與漢族健康個體中總腸道微生物群的差異。最后得出結論,蒙古族和漢族之間腸道菌群存在較大差異,并找到了差異菌屬。
本研究從蒙古族和漢族兩個數據集的結果中發現,漢族人和蒙古族人腸道細菌的優勢細菌門和優勢菌屬相似,優勢菌門均為厚壁菌門(Firmicutes)和擬桿菌門(Bacteroidetes),優勢細菌屬均為擬桿菌屬(Bacteroides)、費氏菌屬(Faecalibacterium)、普雷沃菌(Prevotella)、敏感梭菌(Clostridium sensu stricto)。厚壁菌門(Firmicutes)和擬桿菌門(Bacteroidetes)在健康人體腸道菌群中占比最多,已經有多項研究表明了這一現象[14]。擬桿菌屬和費氏菌屬是腸道中的有益菌。臨床前實驗表明擬桿菌屬被廣泛認為是控制新陳代謝、預防癌癥和減輕炎癥的新靶點,原理是通過調節淋巴細胞和細胞因子的表達[15],而費氏菌屬的減少則和人體內炎癥性腸?。?6]、肥胖[17]、非小細胞肺癌[18]相關。Prevotella 和Clostridium sensu stricto 在腸道中主要參與碳水化合物分解代謝,促進人腸道營養吸收[19]。這四種優勢菌屬是人體內的主要菌屬,在腸道中發揮重要作用。
但基于α、β多樣性研究和火山圖,發現漢族和蒙古族組間有顯著差異,相較于漢族,蒙古族OTU 豐度顯著增加的有170 個,豐度顯著下調的有139 個,組間共有309 個差異OTU(P<0.05),科水平上的主要差異菌群擬桿菌科、克里斯滕內爾科、腸桿菌科等;注釋到屬水平有Acetatifactor、鮑曼不動桿菌(Acinetobacter)、放線菌屬(Actinomyces)等。先前有研究表明漢族和蒙古族糖尿病患病率存在差異[20],兩族人群發病率差別可能主要與飲食習慣等有關,但腸道菌群的差異也可能會影響兩組間的疾病發病率。例如雙歧桿菌屬(Bifidobacterium)在蒙古族腸道菌群中豐度位列第五,其可產生膽堿代謝物,并且可能參與飲食誘導肥胖和糖尿病[21]。蒙古族瘤胃球菌屬(Ruminococcus)豐度低于漢族,一些飲食碳水化合物可能會直接有利于產生丁酸的細菌生長如該菌屬[22]。瘤胃球菌屬(Ruminococcus)可以幫助宿主參與淀粉的分解,分解淀粉產生的短鏈脂肪酸和能量對機體有幫助作用[23]。瘤胃球菌屬(Ruminococcus)菌群的顯著上調可能與兩民族間飲食差異有關,蒙古族有以奶食、肉食等高脂蛋白為主的飲食習慣,而漢族人則主要以碳水化合物為主食,因此瘤胃球菌屬(Ruminococcus)在漢族人腸道菌群中豐度較高也可能是食物調控的結果。
通過PICRUSt 分別對漢族和蒙古族樣本進行功能和代謝途徑預測分析,發現漢族顯著高于蒙古族的代謝通路為胰島素信號通路,在此之前,有人研究發現蒙古族糖尿病發病率高于漢族[11],這預示著也許腸道菌群的胰島素信號通路在正常人的降糖功能中發揮了作用,種族間的腸道微生物差異間接影響著種族的發病率。不同種族腸道中共生菌群差異可能由多種因素引起,包括飲食結構[24],環境暴露,社會文化影響,人類遺傳變異[25]等。不管原因如何,導致的差異都最終會影響到人體內代謝過程和體內平衡。
本研究采用的是是基于16S rRNA 基因高通量測序技術對漢族和蒙古族人的腸道菌群進行研究,盡管得到的結果是顯著性的,但是仍然需要考慮到研究中的不足之處,比如樣本處理和OTU 聚類的變化以及抽樣不均等,這些只能通過加大樣本量來解決。研究結果強調了在健康人群中兩民族腸道菌群的差異性,意味著在將微生物群差異與疾病聯系起來的研究中,需要考慮種族差異作為潛在的混雜因素。這些結果的進一步研究方向,可能是將特定的微生物族群作為健康差異的潛在診斷或治療方法。