吳祎程,冉 濤,周傳社*,譚支良
(1.中國科學院亞熱帶農業生態研究所 亞熱帶農業生態過程重點實驗室 畜禽養殖污染控制與資源化技術國家工程實驗室 湖南省動物營養生理與代謝過程重點實驗室 農業部中南動物營養與飼料科學觀測實驗站,長沙 410125;2.中國科學院大學,北京 100049;3.蘭州大學草地農業科技學院,蘭州 730020;4.蘭州大學草種創新與草地農業生態系統全國重點實驗室,蘭州 730020)
反芻家畜瘤胃是一個復雜且多樣的微生態系統,其內棲息了細菌、真菌、原蟲、古生菌和病毒等多種微生物,瘤胃內病毒主要由噬菌體(bacteriophage)構成[1]。在微生物生態系統中,病毒尤其是噬菌體的侵染作用會極大地影響微生物群落的結構及功能[2]。但由于病毒基因組缺乏合適標記基因和分析基準,且多數病毒無法被歸類或找到對應宿主,因此,難以通過PCR等常規技術來檢測未知病毒序列[3],以致病毒組研究相對滯后。近年來,宏基因組學和生物信息學的發展極大地促進了宏病毒組的研究,并已應用于研究不同環境樣本中的病毒群落,如海洋[4]、土壤[5]、人類糞便[6]等。研究人員很早便關注瘤胃液中的病毒群落,陸續分離鑒定了多種瘤胃噬菌體,包括以壞死梭桿菌(Fusobacteriumnecrophorum)、白色瘤胃球菌(Ruminococcusalbus)、溶纖維丁酸弧菌(Butyrivibriofibrisolvens)和瘤胃擬桿菌(Prevotellaruminicola)等為宿主菌的10種噬菌體[7]。但是,目前仍缺乏對瘤胃病毒群落的整體認知。
宏病毒組測序的關鍵在于從待測樣品中富集病毒組分(virus-like particles,VLPs),獲取高質量的病毒核酸用于宏基因組測序。已有研究發現,DNA病毒占據了病毒的絕大部分,本研究僅關注DNA病毒。由于病毒的基因組非常小,如果直接對樣品中所有的微生物組DNA進行宏基因組測序,雖然能夠獲得部分病毒的基因序列,但是容易丟失那些讀長短、豐度低的病毒序列,不能真實反映病毒的群體構成[8]。同時,病毒組分中的噬菌體具有溶源性、溶菌性和慢性感染等生命周期,其中溶源性噬菌體在溶源性周期中將遺傳物質整合到其細菌宿主的基因組中[9],通過生物信息學分析可以從細菌宏基因組數據中挖掘到溶源性噬菌體的基因序列,但是不能有效獲取僅有溶菌性周期的噬菌體。因此,VLPs的富集對全面解析樣品中游離病毒組分尤為重要。由于瘤胃液樣本具有特殊性,如存在飼料大顆粒、厭氧環境、中性偏酸環境,因此有必要建立專門的瘤胃病毒顆粒分離方法[10]。理想情況下,該方法應能快速、高效獲得病毒組分,易于在實驗室中操作。
氯化銫(CsCl)密度梯度離心是病毒濃縮和純化的常用技術之一,但是該方法需要用到超速離心機,不僅價格昂貴,而且操作耗時較長,更重要的是可能導致大量病毒組分的損失[11]。氯仿處理被認為是一種可代替 CsCl密度梯度離心的快速純化病毒的方法,其可通過破壞細菌的胞膜結構,以達到有效去除細菌的效果[12]。鑒于此,本研究在提取瘤胃液病毒組分基因組DNA之前,參考Castro-Mejía等[13]對人糞便樣品采用的聚乙二醇(PEG 8000)沉淀法,設計4種流程瘤胃液病毒組分富集流程:(P1)離心+稀釋、(P2)離心+過濾+核酸酶處理、(P3)離心+稀釋+過濾+聚乙二醇沉淀、(P4)離心+稀釋+過濾+聚乙二醇沉淀+氯仿處理。PEG 8000廣泛應用于病毒(噬菌體)的純化過程,可使病毒沉淀,而不受其他有機質的干擾。本研究旨在比較過濾、PEG沉淀以及氯仿處理對瘤胃液樣品中游離病毒組分DNA質量(產量、純度和完整性)的影響,并利用Illumina Novaseq 6000平臺對獲得的瘤胃病毒基因組DNA進行測序,通過對瘤胃病毒群體結構進行分析來評價不同流程對瘤胃病毒組分富集的效果,以期為進一步研究瘤胃病毒功能提供技術支撐。
所有動物程序均遵循動物護理和使用指南,并經中國科學院亞熱帶農業研究所動物護理委員會批準(批準號 ISA-W-201609)。選用3只體重相近((31.13±3.72)kg)、體況良好的成年雄性湘東黑山羊作為試驗動物,安裝永久性瘤胃瘺管,按本團隊成員曾波等[14]的報道進行術后護理和飼喂。試驗羊的基礎日糧由52%玉米秸稈、21.52%玉米、16.96%麥麩、5.98%豆粕、0.86%菜籽餅、1.08%尿素、0.60%食鹽以及1%預混料組成。日糧營養水平為10.72%粗蛋白、58.76%中性洗滌纖維以及27.79%酸性洗滌纖維。
山羊晨飼后4 h,通過瘤胃瘺管采集瘤胃內容物,用無菌攪拌棒攪動使瘤胃內容物樣品混勻,經4層無菌紗布過濾至50 mL無菌離心管,離心管裝至2/3處后立刻蓋嚴,投入液氮罐中速凍,置于干冰上迅速轉移至實驗室,于-80 ℃冰箱中保存備用。
試驗流程參考Castro-Mejía的方法[13],并加以修改,以有效分析瘤胃液病毒組。為消除動物個體差異,將3頭黑山羊的瘤胃液等體積混合,分成3份,操作流程如圖1所示。

將瘤胃液混合后,分成三份按照四組流程進行處理,命名為P1至P4,下同。步驟1(離心)、2(稀釋)為所有流程的共同步驟,且P1只執行步驟1和2,P2執行步驟1、2和3(微孔濾膜過濾),P3執行步驟1、2、3和4(聚乙二醇沉淀),P4執行步驟1、2、3、4和5(氯仿處理)The rumen fluid of three goats were collected and mixed, then divided into three parts and processed according to four routes named P1 to P4, the same as below. Steps 1 (centrifugation) and 2 (dilution) are the common steps of all processes, and P1 only performs steps 1 and 2, P2 performs steps 1, 2 and 3 (microporous membrane filtration), P3 performs steps 1, 2, 3 and 4 (PEG prrecipitation), and P4 performs steps 1, 2, 3, 4 and 5 (chloroform treatment)圖1 從山羊瘤胃液中分離富集病毒組分的流程示意圖Fig.1 Schematic representation of the procedures for the extraction of viruses from goat rumen fluid
離心:將解凍瘤胃液在4℃下以5 000×g離心15 min,將液體部分轉移至新的無菌離心管中,以去除瘤胃液樣品中的飼料殘渣;接著在4℃下以15 000×g轉速離心30 min,以去除其他小顆粒碎片,收集上清液。
稀釋:將上述含有游離病毒樣顆粒的上清液與預冷的SM緩沖液(200 mmol·L-1NaCl, 10 mmol·L-1MgSO4, 50 mmol·L-1Tris pH 7.5)進行 1∶2稀釋。
過濾:通過1.0 μm的玻璃纖維濾紙(Whatman,GF/C,UK)過濾,以去除瘤胃液中的粒徑較大的細菌、原蟲等,隨后經過孔徑為0.45 μm的PVDF無菌濾膜(Millipore Billerica,MA,USA)過濾,進一步去除細菌等。
PEG沉淀:將200 g PEG8000與146.1 g NaCl溶于1 L蒸餾水中,經高壓蒸汽滅菌后獲得PEG-NaCl溶液。將過濾步驟后得到的上清液轉移到新離心管中,向每個樣品中加入25%(v/v)的PEG-NaCl溶液,于4 ℃下震蕩孵育22 h,孵育結束后將樣品于4 ℃、13 000×g離心45 min,棄上清,沉淀即為病毒組分,并將其溶解于1 mL預冷的0.01 mol·L-1磷酸鹽緩沖液(PBS)中。
氯仿處理:向獲得的病毒組分濃縮液中加入等體積的氯仿,渦旋1 min,使氯仿與樣品均勻混合,形成乳狀物,于4℃、15 000×g離心5 min,小心吸取上清液至新的無菌離心管,即為病毒組分。
核酸酶處理:在提取DNA之前,用1.25 μL DNase I和1.25 μL RNase A處理樣品30 min,以消除游離DNA和RNA污染,隨后在37 ℃水浴中孵育10 min,接著加入1 μL 100 mmol·L-1EDTA使核酸酶失活,最后在65 ℃下水浴孵育10 min終止EDTA反應。使用DNA提取試劑盒(Omega D3892-01Viral DNA Kit, USA)提取制備的瘤胃液病毒組分樣品的核酸,提取步驟嚴格按照試劑盒說明書進行。完成病毒基因組DNA抽提后,使用Qubit?DNA廣譜分析儀(ThermoFisher Scientific)測定濃度、OD260 nm/280 nm及OD260 nm/230 nm,并使用1.0%(w/v)瓊脂糖凝膠電泳檢測基因組DNA的完整性。提取的DNA樣品儲存在-20 ℃,直至文庫制備及測序。檢測合格的DNA樣品采用Covaris M220超聲破碎儀將樣品DNA隨機打斷成長度約為450 bp的片段,經末端修復、加入A尾、加測序接頭、純化、PCR全基因組擴增等步驟完成文庫制備,質檢合格的文庫將采用Illumina Novaseq 6000平臺進行測序(上海凌恩生物技術有限公司)。
由于Illumina Novaseq 6000的原始測序數據中包含測序接頭序列、低質量讀段、N率較高序列及長度過短序列,這將嚴重影響后續組裝的質量。為保證后續的生物信息分析的準確性,首先對下機的原始測序數據進行質控,過濾掉低質量片段和宿主片段從而得到高質量的測序數據(clean data),以保證后續分析的順利。原始數據已遞交GenBank,登錄號為PRJNA788346。
按照Roux等[15]描述的方法,使用Megahit(https://github.com/voutcn/megahit)對高質量序列進行拼接、組裝,挑選≥ 2 000 bp的組裝序列,使用如下軟件進行病毒序列鑒定:VirFinder(https://github.com/jessieren/VirFinder)、VirSorter2 (https://github.com/simroux/VirSorter)、CAT(https://github.com/dutilh/CAT),并對初步鑒定為病毒的序列進行vOTUs(viral operational taxonomic units)分析。鑒定得到病毒序列后,獲得其物種分類學信息,并使用VPF-Class工具對病毒進行物種注釋和宿主預測。挑選置信度(Confidence_Score)> 0.36的結果,進行病毒科水平物種注釋;挑選置信度(Confidence_Score)> 0.5且成員比對率(Membership_Ratio)超過0.3的結果,進行病毒(噬菌體)潛在宿主預測[16]。
利用Microsoft Excel(Microsoft Inc., Washington, USA)對數據進行初步統計,隨后用SPSS 19.0(SPSS Inc., Chicago,USA)對不同流程提取的基因組DNA質量相關指標 進行單因素方差分析(ANOVA)[17]。對宏基因組數據進行正態檢驗和方差齊性檢驗,符合方差分析的數據用SPSS進行ANOVA分析,不符合方差分析的數據用SPSS軟件進行非參數分析,P<0.01表示差異極顯著, 0.01≤P<0.05表示差異顯著,0.05 ≤P<0.10表示存在趨勢。瘤胃液病毒相對豐度圖、箱線圖分別利用凌恩生物在線云平臺(http://cloud.biomicroclass.com/CloudPlatform)和聯川生物在線云平臺(https://www.omicstudio.cn/tool)的工具在線繪制。
各流程提取的基因組DNA質檢結果見圖2。由圖2a可知,P2流程中DNA產量顯著高于P1、P3和P4處理流程(P<0.001)。P1、P2與P3流程獲得的DNA的OD260 nm/280 nm均> 1.90,說明提取的核酸相對純凈(圖2b)。經氯仿處理(P4)的基因組核酸DNA,因產量過低(圖2a)而不滿足高通量測序需求,故沒有進行后續上機建庫及組學分析。

a. 核酸濃度;b. 核酸純度。*表示P<0.05,**表示P<0.01a. Concentration of nucleic acids; b. Quality of nucleic acids. * P<0.05 and ** P<0.01圖2 四種流程處理后所提取的山羊瘤胃液病毒組分的核酸質量(n=3)Fig.2 Quality of nucleic acids of ruminal viral-like particles extracted from the goat rumen fluid in four groups (n=3)
使用Illumina Novaseq 6000平臺對符合測序要求的9個樣本進行了病毒宏基因組學測序,共獲得1 058 773 724個reads,每個樣品的平均reads數為117 641 525,范圍為105 495 627至125 358 829。不同提取流程的瘤胃病毒α多樣性指數見圖3,不同提取流程對測序時獲得的goods_coverage比例沒有顯著影響(圖3a),同時不同流程間Chao 1指數(P=0.834)和Shannon指數(P=0.255)均無顯著差異。

a. goods_ coverage; b. Chao 1指數,用于估計群落中vOTU豐度;c. Shannon指數,用來描述群落中病毒多樣性a. goods_ coverage; b. Chao 1 index, represents the richness of vOTU; c. Shannon index, represents the diversity of virus圖3 不同處理流程獲得的瘤胃液病毒的α多樣性指數Fig.3 Alpha diversity indexes of ruminal virome obtained from different processing procedure
為評估不同樣品處理流程對瘤胃病毒群落組成的影響,進行了基于Bray-Curtis距離的PCoA分析及ANOSIM分析。在PCoA圖中,P2流程與P1和P3在PCoA2上分開(26.01),但差異不顯著(ANOSIM R=0.695,P>0.05;圖4)。結果表明,雖然不同DNA提取流程會導致病毒群落組成的差異,但對群落組成的影響較小。

圖4 不同處理流程對瘤胃病毒組分的主坐標分析(基于Bray-Curtis距離,n=3)Fig.4 Principal co-ordinates analysis based on Bray-Curtis distances of ruminal virome obtained from different processing procedure (n=3)
宏基因組測序結果表明,不論采用何種瘤胃液樣品病毒組分富集流程,均顯示山羊瘤胃中的DNA病毒主要為噬菌體(圖5)。其中,絕大多數噬菌體序列來自長尾病毒科(Siphoviridae,63.29%)、肌尾病毒科(Myoviridae,11.87%)和短尾病毒科(Podoviridae,5.64%),這3個病毒科同屬于有尾病毒目(Caudovirales)。進一步分析了不同富集流程對瘤胃病毒相對豐度的影響,結果表明PEG處理對Siphoviridae(P<0.05)及Ackermannviridae科(P<0.01)的病毒有顯著富集效果(圖6)。

a. 總體瘤胃微生物組成;b. 總體病毒組分組成;c. 不同處理流程瘤胃液中病毒相對豐度(科水平)a. Overall composition of rumen microbial; b. Overall composition virus-particles; c. Relative abundance of viruses in different processing procedures (family level)圖5 黑山羊瘤胃液中微生物組成Fig.5 Composition of rumen microbial of black goat

*表示P<0.05,**表示P<0.01* means P<0.05 and ** means P<0.01圖6 在不同流程中病毒相對豐度(n=3)Fig.6 Relative abundance of viral family in different processing procedures (n=3)

圖7 山羊瘤胃病毒群落的潛在宿主種類預測Fig.7 Prediction of potential hosts of ruminal viruses in rumen fluid of goats
利用VPF-Class工具對山羊瘤胃中最豐富的4個DNA病毒科噬菌體成員進行了宿主預測,并列出了噬菌體與宿主間的對應關系(圖6)。結果顯示瘤胃病毒的宿主多為細菌,優勢宿主預測排序結果為:節桿菌屬(Arthrobacter)、芽孢桿菌屬(Bacillus)、噬纖維素屬(Cellulophaga)、梭菌屬(Clostridium)、乳酸球菌屬(Lactococcus)、分岐桿菌屬(Mycobacterium)、綠膿桿菌屬(Pseudomonas)、里氏桿菌屬(Riemerella)、鏈球菌屬(Streptococcus)。其中,Myoviridae科的噬菌體主要侵染芽孢桿菌屬(Bacillus)細菌,Podoviridae科的噬菌體主要侵染噬纖維素屬(Cellulophaga)的細菌,而Siphoviridae科的噬菌體主要侵染芽孢桿菌屬(Bacillus)、梭菌屬(Clostridium)、里氏桿菌屬(Riemerella)和噬纖維素屬(Cellulophaga)等屬的細菌。
本研究將山羊瘤胃病毒群落與其他環境,如人類糞便[4]、海洋[5]或土壤[6]病毒群落進行比較(圖8)。結果表明,不同生境中病毒群落構成存在很大差異:在生境病毒群落多樣性方面,以土壤生境最高;在病毒群落相對豐度方面,人類糞便和山羊瘤胃病毒群落的相似性更高,均為以Siphoviridae科的病毒為主,但二者又有區別,體現在山羊瘤胃病毒群落具有更高豐度的Myoviridae科病毒;在病毒核酸類型方面,人類糞便和山羊瘤胃中的DNA病毒以雙鏈DNA(double-strain DNA,dsDNA)病毒為主,而土壤生境中還含有微病毒科(Microviridae)、球狀病毒科(Globuloviridae)、矮化病毒科(Nanoviridae)等單鏈DNA(single-strain DNA,ss-DNA)病毒。

圖8 山羊瘤胃液、人類糞便[4]、海水[5]及土壤[6]中的病毒相對豐度Fig.8 Relative abundance of viral communities in goat rumen fluid, human faeces[4], seawater[5] and soil[6]
瘤胃微生物組成十分復雜,絕大多數瘤胃細菌是嚴格厭氧或兼性厭氧,且目前僅有很少的瘤胃細菌被分離培養,這導致基于傳統培養手段的瘤胃病毒(主要是噬菌體)研究開展起來困難重重。近年來宏基因組學廣泛運用于動物胃腸道微生態的研究,可規避體外培養微生物的限制。該技術也逐步應用于病毒組的研究,借助各種生物信息學分析工具,極大地推進了病毒特異性序列數據集(病毒組)的獲取和分析[18]。高通量測序過程中,樣品DNA的質量尤為關鍵,提高瘤胃病毒組分基因組DNA的產量及質量,可以有效地提高后續生物信息學分析的準確性。在核酸提取和上機測序之前,病毒組分預處理的主要作用為病毒富集和病毒純化[11]。具體步驟需要根據所研究的樣本類型進行調整。本研究參考Castro-Mejía等[13]提出的方法,設置了4種流程來評估過濾步驟、PEG沉淀以及氯仿處理對DNA提取質量以及宏基因組測序結果的影響。
OD260 nm/280 nm是衡量DNA提取質量的重要指標,會受RNA污染以及DNA降解的影響[19]。P3流程所獲得的核酸產量并不是最高的,但P3流程OD260 nm/280 nm在數值上最高,P4流程所獲得的核酸產量最低。病毒學研究過程中常使用傳統的苯酚-氯仿提取法對病毒基因組進行提取[20],而如今市場上已經出現了多款用于從環境樣品中提取病毒基因組DNA的試劑盒[9,21]。本研究選用了價格為Qiagen試劑盒1/5的Omega病毒DNA提取試劑盒,該試劑盒原用于提取血清病毒基因組,本研究表明,該試劑盒也能用于提取瘤胃液樣品中的病毒基因組,且滿足測序需求。
不同流程間瘤胃病毒多樣性并沒有顯著差異,這可能是由于病毒組在整體微生物組中所占比例過小,正如Hess等[22]報道的,即使在大多數環境中噬菌體的數量級為細菌的10倍,但由于宿主DNA(細菌和真核生物)的污染,病毒reads只占可注釋DNA的2%~5%。
病毒群落結構分析表明,本試驗選用的山羊瘤胃中的優勢病毒群落依次為長尾病毒科(Siphoviridae)、肌尾病毒科(Myoviridae)和短尾病毒科(Podoviridae),這與前人發表的瘤胃病毒群落以長尾病毒科、肌尾病毒科和短尾病毒科占主導地位一致[9]。過濾步驟需考慮濾膜孔徑大小,常用微孔濾膜孔徑為0.22或0.45 μm。先前研究表明胃腸道中最豐富的長尾病毒科(Siphoviridae)及肌尾病毒科(Myoviridae)都大于0.22 μm[9],故本研究選用了孔徑為0.45 μm的微孔濾膜。本研究中豐度最高的為長尾病毒科(Siphoviridae),也證明了0.45 μm濾膜的有效性。由于病毒顆粒小,在核酸提取之前,通常使用PEG配合NaCl來沉淀樣品中的VLPs以實現病毒的濃縮。本研究表明,PEG可顯著富集有尾病毒目中的長尾病毒科(Siphoviridae)及Ackermannviridae科噬菌體。本研究還發現皰疹病毒科(Herpesviridae)的病毒在該瘤胃液樣本中的存在,但豐度十分低。
CsCl密度梯度離心步驟被認為是純化病毒的最佳方法[12],此法可對特定密度范圍內的噬菌體進行純化,并根據密度將VLPs與其他組分分離。但這一技術耗時、昂貴且需要特定的技術技能和實驗室設備。有研究發現,氯仿處理能代替氯化銫密度梯度離心步驟用于純化病毒[23],此方法已成功用于血清病毒純化和發酵食品病毒純化[24-25]。但本研究發現,氯仿處理在瘤胃液病毒純化中會造成大量顆粒損失,以至于不能滿足高通量測序的需求。這是因為瘤胃細菌仍為瘤胃液的主要部分,氯仿會嚴重干擾包膜類物質,比如細菌,而且有些病毒也存在膜結構,膜結構被破壞后,病毒的蛋白質外殼會變得不穩定[26]。而部分病毒蛋白質外殼也對氯仿十分敏感,氯仿處理則造成這類病毒的大量丟失[27]。DNA產量也因此出現顯著差異,P4提取流程的核酸因產量過低,不適用于高通量測序建庫。因此,氯仿處理代替CsCl密度梯度離心步驟用于純化瘤胃病毒還有待后續試驗進一步研究。
環境中病毒的多樣性和豐度與微生物群落息息相關。有研究表明同一環境中病毒群落具有很高的相似性,而來自不同環境的病毒及其宿主分布的相似性較低[28-30]。反芻動物會從外界攝入大量食物,瘤胃作為一個天然發酵罐,微生物群落共生于一個相對封閉的容器中,這導致瘤胃微生物具有非常獨特的群落特征[1],瘤胃液中病毒的豐富度反映了瘤胃微生物宿主的多樣性。由于病毒宏基因組學建庫限制以及測序平臺對核酸樣品擴增的需求,本研究主只檢測了山羊瘤胃液中的DNA病毒,發現樣品中主要為dsDNA病毒,它們都屬于有尾病毒目。之前的大量研究也表明瘤胃病毒以dsDNA為主,其中大部分為有尾病毒目的噬菌體[9,21,31-32]。另外,由于技術的局限性,本方法提取的DNA不一定滿足長讀長測序平臺,例如PacBio(www.pacb.com)or Oxford Nanopore(https://nanoporetech.com)。此外,本試驗只關注了病毒組分中dsDNA的核酸,此病毒組分富集方法是否適用于ssDNA或RNA病毒尚不清楚[33]。
本研究比較了不同DNA提取流程對核酸產量、質量、病毒多樣性以及病毒概況的影響,表明了PEG沉淀步驟對長尾病毒科及Ackermannviridae科噬菌體具有富集作用。研究人員可根據試驗需求進行選擇,當需要重點關注這類噬菌體的情況下,可采用P3流程,即對瘤胃液進行離心、稀釋以及微孔濾膜過濾操作,若對特定病毒沒有富集需求,則采用P2流程即可,即無需進行微孔濾膜過濾步驟,此兩種流程均能達到病毒宏基因組測序要求?;谝陨辖Y果,本試驗構建了提取瘤胃液中病毒組分DNA的流程,此方案可大大促進反芻動物瘤胃液中噬菌體群落的研究進程。