肖正午,肖 莉,傳 軍,李亞梅,彭 壯,林麗美,李 凱,戴愛國,庹勤慧*,廖端芳*
(1.湘產大宗藥材品質評價湖南省重點實驗室,湖南 長沙 410208;2.蘇州大學附屬第二醫院,江蘇 蘇州 215004;3.人和未來生物科技長沙有限公司,湖南 長沙 410000;4.湖南中醫藥大學醫學院呼吸疾病研究室,湖南 長沙 410000)
對病原體的基因檢測是感染性疾病確診的關鍵指標之一。根據病原體在機體內繁殖部位的不同,采集生物標本的方式相對應有所差異,包括采集各種體液(如血液、腦脊液、痰液、尿液)以及直接采集細胞(如咽喉拭子、宮頸刮片)等。一般情況下,由于病原體在感染人體后有較快速和較大量的繁殖,敏感性一般不是制約基因檢測的關鍵因素,但對特定種類的病毒如SARS-CoV-2,由于其感染的部位特點,檢測敏感性顯得尤為重要。
2019年底發生的COVID-19大流行,其嚴重程度都遠遠超過了醫學界的預期。觀察發現SARS-CoV-2主要在下呼吸道繁殖,上呼吸道細胞內的病毒拷貝數相對較低[1-2]。因此,導致以咽喉拭子作為檢測標本的SARS-CoV-2基因檢測假陰性比例相對偏高[3]。而假陰性的真陽性個體,無論是對患者的治療,還是對無癥狀感染者的追蹤朔源,都是新冠疫情防治中需要克服的重要節點。近期,國際上一些國家和地區再度出現的聚集性感染,特別是一些不可溯源的病例,極有可能是由于現有核酸檢測方法的敏感性不夠(假陰性比例相對偏高),導致一些無癥狀感染者沒能及時被發現所致。
目前臨床上采用的SARS-CoV-2檢測試劑盒,主要技術原理為二代測序,基于TaqMan探針的實時PCR,基于環介導等溫擴增技術(loop-mediated isothermal amplification, LAMP)的實時PCR和基于Cas核酸酶的檢測[4-7]。在檢測靶點上,大部分選擇1~2個靶點[8-10]。靶點的數量和探針的多少,一定程度上除決定檢測的特異性外,更對檢測的敏感性有直接的影響。本研究從生物信息學分析入手,并采用重疊PCR合成方法,選擇了可用于SARS-CoV-2檢測的8個新靶點。這些靶點在擴增引物和適宜于TaqMan探針檢測兩方面均呈現出很好的的SARS-CoV-2特異性。有望成為未來SARS-CoV-2高靈敏度檢測方法及試劑盒開發的重要對象。
本實驗所有寡核苷酸包括引物、模板片段、TaqMan探針均由上海生工合成。PCR所用聚合酶購自上海生工公司的Taq Mix。
1.2.1 SARS-CoV-2特異性序列比對采用如下策略
(1)選定代表序列;(2)提取近源序列;(3)從病毒序列數據庫排除代表序列和近源序列,作為非近源序列;(4)利用blast局部比對將代表序列與近源序列進行比對;(5)根據比對結果提取非同源保守區域;(6)利用blast局部比對將代表序列與非近源序列進行比對;(7)根據比對結果提取同源保守區域;(8)綜合排除非同源保守區域與同源保守區域,得到該物種的特異性保守區域;(9)選擇合適的特異性保守區域作為模板,用來設計引物及探針。
1.2.2 SARS-CoV-2特異性引物設計采用如下策略
(1)選擇refseq數據庫中的新型冠狀病毒序列作為代表序列;(2)選擇其它新型冠狀病毒株的完整序列作為近源序列;(3)從病毒序列數據庫排除SARS-CoV-2相關序列,作為非近源序列;隨后的6個步驟與SARS-CoV-2特異性序列比對步驟(4)~(9)相同。模板片段設計為側翼含有相應擴增引物的特異性序列和中間包含至少可以設計一個TaqMan探針的特異性序列。其中引物序列長度不短于20個堿基,探針長度不短于23個堿基。
擬合成和測試的SARS-CoV-2靶點片段采用重疊PCR合成。各片段重疊堿基為18個或以上。根據選取的靶點長度,分別合成4~5個片段用于重疊PCR,重疊PCR采用一步法或多步法。重疊PCR合成的產物最后送測序驗證。
表1列出了8個SARS-CoV-2特異性模板序列,用于重疊PCR的寡核苷酸片段和可用于熒光定量PCR的TaqMan探針及用于熒光定量PCR的引物。從表1可見,這些模板片段長度在100~300堿基之間,是熒光定量PCR擴增元的適宜長度;片段側翼含有連續18個以上的特異性序列;片段中含有至少一個可用于TaqMan探針設計、連續長度等于或大于23個堿基的SARS-CoV-2特異性序列。

表1 8個SARS-CoV-2特異性模板序列、引物和探針序列
模板序列5和6采用一步法合成,分別以兩段模板片段為DNA模板各1 μL加入PCR反應體系,2×Taq PCR Master Mix 12.5 μL,補水至總體積25 μL。PCR反應條件如下:95 ℃預變性2 min,95 ℃ 10 s,55 ℃ 20 s,72 ℃ 30 s,共30個循環,72 ℃ 10 min。其PCR擴增結果見圖1a。
模板序列1,2,3,4,7和8采用多步法合成。第一步分別以1號2號兩段模板片段為DNA模板各1 μL加入PCR反應體系,2×Taq PCR Master Mix 12.5 μL,補齊水至總體積25 μL。PCR反應條件如下:95 ℃預變性2 min,95 ℃ 15 s,52 ℃ 25 s,72 ℃ 10 s,共35個循環,72 ℃ 10 min。將第一步PCR反應產物稀釋10000倍作為第二步PCR的模板,并加入3號和4號模板片段各1 μL,2×Taq PCR Master Mix 12.5 μL,補齊水至總體積25 μL。PCR反應條件如下:95 ℃預變性2 min,95 ℃ 15 s,52 ℃ 25 s,72 ℃ 10 s,共35個循環,72 ℃ 10 min。以此類推,將第二步PCR反應產物稀釋10 000倍作為第三步PCR的模板,最終擴增得到PCR產物序列,分步結果見圖1b~d。8個SARS-CoV-2特異性模板序列最終產物電泳結果見圖1e。
將8個SARS-CoV-2特異性模板序列送上海生工進行Sanger測序,測序結果顯示均與預期結果相符(見圖2)。

圖1 8個SARS-CoV-2特異性模板片段重疊PCR合成電泳結果圖a:PCR一步法合成模板5和6的結果電泳圖;b:模板1,2,3,4,7,8分步法第一次連接電泳圖,連接成功之后的片段約100bp左右;c:模板1,2,3,4,7,8分步法第二次連接圖,連接成功之后的片段約為150bp左右;d:模板1,2,3,4,7,8分步法第三次連接圖,連接成功之后的片段約為200bp左右;e:SARS-CoV-2特異性模板序列1-8最終產物電泳結果

圖2 8個SARS-CoV-2特異性模板序列一代測序結果圖a~h所示為8個SARS-CoV-2特異性模板序列中TaqMan探針的部分測序序列結果
重疊PCR合成的8個SARS-CoV-2模板序列,利用相應的TaqMan探針檢測分析其用于熒光定量PCR的可能性。熒光定量PCR反應體系如下:2×Taq qPCR Master Mix 10 μL,SARS-CoV-2模板序列5 μL,探針工作液2 μL,補齊水至總體積20 μL。其中探針工作液包含正向、反向引物,和十分之一濃度的探針引物。PCR反應條件如下:95 ℃預變性2 min,95 ℃ 10 s,55 ℃ 20 s,72 ℃ 30 s,延伸步驟收集熒光信號,共40個循環。其PCR擴增結果見圖3。
結果如圖3所示,8個模板片段序列均能被相應的探針有效檢測,在使用模板拷貝數為300拷貝時,其Ct值大都位于21~24之間。

圖3 SARS-CoV-2探針檢測特異性模板的熒光定量PCR擴增曲線圖a:1號探針的工作曲線;b:2探針的工作曲線;c:3號探針的工作曲線;d:4號探針的工作曲線
模板1和模板8進一步進行了不同拷貝數的量效關系檢測。取起始拷貝數約為105cp/μL的SARS-CoV-2合成模板1 μL,依次按30倍、100倍、300倍、1 000倍、3 000倍、10 000倍等比稀釋,分別加入TaqMan探針檢測的熒光定量PCR反應體系中。qPCR擴增結果均表現為隨著模板拷貝數增加,Ct值下降的良好關系(表2,圖4)

表2 SARS-CoV-2合成模板1和8拷貝數與探針qPCR擴增的Ct數值

圖4 SARS-CoV-2合成模板拷貝數與探針量效關系的熒光定量PCR擴增曲線圖
傳染病的實驗室診斷屬于病因診斷的范疇。傳統的病因診斷包括病原體的培養、形態學觀察、抗原抗體檢測等。基因檢測為抗原檢測,在特異性上較其它實驗室檢測手段具有一定優勢。然而,基因檢測優勢的實現有賴于病原體靶點的選擇,即靶點的特異性和靶點的數量。鑒于現有SARS-CoV-2基因檢測試劑盒存在較高假陰性和低陽性率[3,8-10],本文針對該病毒的序列進行可檢測靶點的研究,獲得了8種可用于靶點的序列片段,并采用重疊PCR人工合成和通過設計TaqMan探針,驗證了這8個序列片段作為實時PCR檢測的可行性。
從表1可以看出,本文選擇的8個靶點片段,在SARS-CoV-2基因組上分布相對較廣,為其作為基因檢測靶點時避免基因降解和基因局部二級結構導致假陰性提供了可能性。另外,相對廣泛和互不連續的靶點序列,也為多靶點檢測試劑盒的研發時呈現不同靶點單獨形成擴增單元而不互相干擾提供了結構基礎。本研究雖然只從一個靶點、一個探針的層面對相關靶點進行了其實用性的初步研究,但這些靶點在SARS-CoV-2基因組上相對分散的序列位置,使這些靶點可望成為多重實時PCR檢測的良好候選對象。
本研究基于TaqMan探針確認和人工合成SARS-CoV-2 8個可用于基因檢測的新靶點,并利用TaqMan探針驗證了這些靶點的可行性。雖然這些靶點的片段長度相對較短,但其保守性相對較高,大部分均含有6個或以上連續20個堿基的序列片段,從而使這些片段同樣可以作為LAMP原理的基因檢測靶點。基于Cas酶的基因檢測對靶點要求不高[7,11],可以預期這些靶點片段能完全用于開發基于Cas酶的基因檢測。
綜上所述,本文通過生物信息學比對,在現有SARS-CoV-2檢測靶點之外,發現了多個具有可用于基于TaqMan原理的新靶點。在采用重疊PCR合成之后,利用TaqMan探針開展了一探針、一靶點的實時熒光PCR驗證,確認了這些靶點作為SARS-CoV-2基因檢測靶點的可行性。由于這些靶點同時還能作為基于Cas酶原理的檢測和基于LAMP原理的檢測,因而這些基因片段,為研發新的更高敏感性的SARS-CoV-2檢測試劑盒提供了多種可供選擇的靶點,尤其是對多重實時熒光PCR試劑盒的研發,價值尤為顯著。