茅海燕 孫逸 樓秀玉 顏浩 程偉 姚文武 王欣瑩 潘軍航 張嚴峻
高通量測序技術具有通量大、速度快、精確度高、單堿基成本低等優勢[1]。近年來,高通量測序平臺已成功應用于新病原檢測與發現、病毒準種檢測和病毒全基因組測序研究等方面[2-4]。甲型流感病毒型別眾多,H7N9禽流感疫情之外,部分省份還發生了H10N8和H5N6亞型禽流感病毒感染人的疫情[5-6]。有了高通量測序技術,我們可以在病例發生之初,從臨床標本中快速獲得病毒全基因序列,準確快速地鑒定病毒亞型,并對病毒開展溯源和基因片段重配特征等研究。
Ion torrent個人化操作基因組測序儀(Personal Genome Machine,PGM)是基于新一代半導體測序技術的高通量測序平臺。與其他二代測序儀相比,其操作更簡單、測序成本更低、測序時間更短并具有強大的可擴展性[7]。
本實驗室自2013年起利用PGM平臺建立了甲型流感病毒二代測序技術,對外環境中采集的部分甲型流感病毒陽性而常規流感分型陰性的標本進行了二代測序,獲得了病毒序列,進一步通過病毒血凝素(hemagglutimin,HA)和神經氨酸酶(neuraminidase,NA)基因序列比對,對這些甲型禽流感病毒進行了亞型鑒定。
1.1 禽流感標本來源 用于PGM平臺測序的禽類拭子和外環境標本共9份,標本來源、類型和采集時間見表1。

表1 用于PGM平臺測序的禽類拭子和外環境標本信息Tab.1 The imformation of the avian swabs and environmental samples for PGM sequencing
1.2 病毒RNA提取 標本RNA用RNeasyMini病毒RNA提取試劑盒(Qiagen,德國)提取,標本前處理參照中國疾病預防控制中心下發的《職業暴露人群血清學和環境高致病性禽流感監測方案》(2011年版)進行,最終取標本200 μl按照廠家說明書提取病毒RNA,用50 μl洗脫液進行洗脫,提取的RNA-80℃保存或直接用于熒光定量RT-PCR檢測。
1.3 禽流感病毒熒光定量RT-PCR檢測 禽流感病毒熒光定量RT-PCR檢測采用AgPath-IDTM試劑盒進行(Applied Biosystems,美國),檢測項目包括甲型流感病毒通用型、H5N1亞型、H7N9亞型和H9N2亞型,引物探針序列由中國疾病預防控制中心病毒病預防控制所國家流感中心提供。反應體系25 μl:buffer(2x)12.5 μl,上下游引物(20 μmol/L)各 0.6 μl,探針(20 μmol/L)0.3 μl,Enzyme Mix 1 μl,RNA 5 μl,加水至 25 μl。 反應程序:逆轉錄 50 ℃,10 min;熱啟動95 ℃,10 min;PCR 循環94 ℃,15 s;55℃,35 s并采集熒光信號,共40個循環。擴增反應在ABI 7500熒光定量PCR儀(Applied Biosystems,美國)上完成。
1.4 甲型流感病毒全基因組擴增 甲型流感病毒基因組核酸擴增采用PathAmpFluA試劑盒進行(Applied Biosystems,美國)。反應體系配置和反應程序參照試劑盒說明書進行。擴增產物使用Ampure XP磁珠(Beckman,美國)進行純化,并通過瓊脂糖凝膠電泳檢測擴增質量,同時采用QUBIT 2.0(Thermo Fisher,美國)對純化產物進行定量分析。
1.5 二代測序混合文庫制備 取100 ng擴增純化后的標本核酸,使用Next Fast DNA Fragmentation&Library Prep Set for Ion Torrent試劑盒(New England Biolabs,美國)進行文庫制備。建庫流程包括DNA酶切打斷,片段化產物純化,片段化產物與barcode(Thermo Fisher,美國)連接、連接后產物片段篩選、PCR擴增、文庫定量、標本文庫稀釋及最終混合文庫制備等步驟。然后分別采用 QUBIT 2.0和Bioanalyzer 2100儀器(Agilent公司,美國)對文庫的濃度及平均長度進行檢測。
1.6 測序模板制備及測序 利用Ion PGM IC 200試劑盒在Ion Chef儀器(Applied Biosystems,美國)上完成測序模板的制備及測序芯片(Ion 314、316和318 Chip)上樣,之后在 Ion Torrent PGM測序儀(Applied Biosystems,美國)上進行測序反應,選擇讀長200 bp反應程序。
1.7 生物信息學分析
1.7.1 測序數據分析:測序數據處理在PGM服務器中利用Ion Torrent Suite v3.0進行,分析過程包括電信號轉化、堿基讀取、質量控制、比對控制及插件的運行等環節。在電信號轉化環節只保留活躍的孔信號數據。在SFF文件環節進行長度、信號活躍度、文庫片段、單克隆ISP確認、信號條件情況等篩選后,對符合各項條件的片段數據進行保留形成最終文庫讀長,以FASTQ形式進行下游各個插件的分析。
1.7.2 流感病毒亞型鑒定:采用FluAtyping v4.0和PathogenAnalyzer兩個插件進行分析,根據插件內自帶的甲型流感各亞型全基因組序列,對有效讀長進行拼接,獲得流感病毒8個片段的全基因組序列,繼而通過HA和NA序列比對完成流感病毒亞型鑒定。
2.1 熒光定量PCR鑒定結果 這9份標本經熒光定量PCR檢測,均為 fluA陽性,但用針對 H5N1、H7N9和H9N2亞型的引物探針檢測均為陰性或僅HA陽性而NA陰性,各標本檢測結果以及陽性結果的Ct(cycle threshold)值見表2。

表2 9份標本fluA、H5N1、H7N9及H9N2熒光定量RT-PCR檢測結果Tab.2 The results of real-time RT-PCR of nine samples for fluA、H5N1、H7N9 and H9N2
2.2 文庫構建起始模板濃度 甲型流感病毒核酸經擴增和磁珠純化后,利用QUBIT2.0測定9個純化產物的核酸濃度,分別為 100、94.8、47.2、69.8、84.6、34.3、104、133 和50.2 ng/μl,均能夠滿足后續文庫構建的要求。
2.3 測序數據質量分析 利用Ion Torrent Suite v3.0數據分析軟件,對9個標本測序數據結果進行分析,從總堿基數、質量高于Q20標準的堿基數、總讀長數、平均讀長長度、測序深度等方面對測序數據質量進行綜合評估,具體見表3,為更有助于亞型的判定,對HA和NA測序深度進行了進一步分析,具體見表4。

表3 9份標本測序數據質量評估Tab.3 The sequencing data quality assessment of nine samples
2.4 拼接數據比對與病毒型別鑒定 9個標本拼接后的序列在數據庫進行比對,共鑒定得到7種亞型(表 4),其中 H2N3、H5N6、H5N8、H7N1、H7N7、H11N3亞型流感病毒陽性標本各1個,H6N6亞型流感病毒陽性標本3個,未發現混雜亞型標本。
根據流感病毒表面HA和NA可以將甲型流感病毒劃分為18個HA亞型和11個NA亞型[8-9]。目前在人群中流行的甲型流感病毒主要是H1N1和H3N2亞型,能夠突破種間屏障傳播給人的禽流感病毒主要包括H5N1、H9N2和 H7N9等,但也有一些其他少見的新甲型禽流感病例被不斷發現和報告,如 H10N8、H5N6 和 H6N1 等[5-6,10]。 對禽流病毒開展監測,及時分析病毒的變異情況和流行趨勢,對于流感大流行的預測和預警具有重要意義[11-12]。然而流感病毒變異和重配速率較快,新亞型層出不窮,第二代測序技術能夠直接對標本中的病原體進行快速鑒定,獲得新病原的全基因組序列,特別適用于新病原或未知病原體的快速鑒定。
本研究通過對標本處理和建庫流程的優化,利用PGM二代測序平臺對禽流感監測項目中采集的9份甲型流感病毒陽性而H5N1、H7N9和H9N2亞型陰性的外環境標本進行了序列測定。共鑒定出7種流感病毒亞型,提示浙江省外環境中存在著多種禽流感病毒亞型的共同流行,其中H5N6和H7N7亞型經文獻報道均有感染人的疫情發生,因此在不明原因肺炎病例、外環境和禽類中開展新型流感病毒的持續監測和病原基因分析,對公共衛生具有重要意義[6,11]。此9份標本經二代測序亞型鑒定未發現混合標本,但是由于禽流感外環境標本來源復雜,存在多種亞型混合情況[11]。二代測序不需要亞型特異性引物進行擴增,適合對混合標本進行分析,今后的實驗需進一步加深此方面的研究。
在測序數據質量評估中發現3、6及7標本的測序深度較其他標本低,結合實驗過程及上機分析結果,本研究認為有兩個可能的原因:(1)該亞型實際存在的病毒載量偏低,如3號標本熒光定量PCR檢測Ct值已經大于30;另外雖然都經過了PathAmpFluA試劑盒的全基因組擴增,但不同亞型流感病毒的擴增效率可能存在差異,相較于常規存在于外環境標本中占據優勢的亞型(如H7N9及H9N2),6、7號標本中存在的流感亞型可能不具有擴增優勢,導致這些非常規亞型測序深度較低;(2)由于這些標本均與其他標本或毒株個體共享一張芯片,病毒載量高的常見亞型(H7N9及H9N2)可能在實驗及分析過程中占有大部分測序深度資源,從而導致部分標本深度較低。目前PGM二代測序平臺仍存在操作步驟和影響因素較多、對操作人員要求高等不足之處,需要進一步針對不同的標本類型和病原類別深入進行測序方法的摸索和優化,以便建立一套標準化的操作程序。
本研究實現了在收到標本后3天左右,通過建庫、測序及數據處理流程,即可獲得流感病毒序列和亞型鑒定結果,為應對新型流感病毒突發疫情提供了技術儲備。利用流感病毒的全基因組序列可進一步開展病毒基因溯源、重配和進化分析,為流感病毒病原學研究提供數據支持。
利益沖突:無