曾四清
1. 廣東省疾病預防控制中心(廣州 511430)
2. 廣東省公共衛生研究院(廣州 511430)
混合檢驗的主要目的是提高檢測能力和效率,降低檢測成本。混合檢驗的方法主要包括單采混檢、混采檢測和混采混檢三種[1-4]。2020—2022 年間,我國新冠肺炎疫情防控大規模人群新冠病毒核酸篩查工作中,采用了5 至10份單采標本稀釋混樣檢測,5 合1、10 合1 和20合1 等多種混采檢驗技術[5-8]。有的地區還嘗試采用混采混檢技術,以進一步提高檢驗工作效率、降低成本[2]。目前,對于混合檢驗的效率研究主要集中于單采混檢,而對混采檢測和混采混檢的研究則較少[1-4,9-14]。不同于單采混檢,混采檢測涉及二次采樣檢測問題。研究表明,采用最適宜的樣本混合數是實現混合檢測工作效率最大化的關鍵[12-13,15-16]。Agarwal 等[17]認為有必要通過數學模型評估混采檢測的適宜采樣混合數。因此,本研究采用二項分布和群檢驗技術原理,探討了混采檢測的工作效率和最適宜采樣混合數[18]。
目前,我國發布的多項混采檢測技術規范中,提出的采樣混合數有 5 合1、10 合1 和20 合1。據此,本研究通過預分析,縮小采樣混合數至2合1,擴大采樣混合數至120 合1;假定人群中的感染率為1%~9%、1‰~9‰和1/萬~9/萬三個等級區間水平;假定采樣區域的總人口規模為N,每個人感染的概率均等且在采樣檢測期間保持不變。
假設采樣與檢驗單位工作量的權重分別為SW 和DW,SW ∶ DW=1 ∶ K,K 為二者權重比值,則SW=1/(1+K), DW=K/(1+K)。假設K 值依次為1/4、1/3、1/2、1、2、3 和4。
本研究所指的混采檢測(n-in-1 test)技術指將采集自n 人的n 支拭子集合于1 個采集管中進行核酸檢測的方法,n 即為采樣混合數。混采檢測結果為陽性、灰區或單個靶標陽性,則對該混采管的n 個受試者分別重新采集單管拭子進行復核,按照復核單管核酸檢測結果報告[7-8]。本研究假定檢測的靈敏度和特異度均為100%。
通過兩輪采樣檢測發現全部陽性感染者所需的人均采樣次數、人均檢測管數及其加權綜合工作量等指標的變化規律來評價混采檢測的工作效率。
研究主要采用二項分布和群檢驗技術理論進行分析[13,18]。二項分布是指在只會產生兩種可能結果如“陰性”或“陽性”之一的n 次獨立重復試驗中,當每次試驗的“陽性”概率π 保持不變時,出現“陽性”次數X=0,1,2,…,n 的一種概率分布。其概率可由下面的公式求出(式1)[18]:
X=0,1,2,…n。
對于抽樣調查,若從陽性率為π 的總體N 中,有放回隨機抽取個體數為n 的樣本,則出現陽性數為X 的概率分布即呈二項分布。若是無放回隨機抽樣,當抽取的個體數n 遠小于總體數N(如n<N/10)時,也可近似當作二項分布處理。群檢驗技術是二項分布的主要應用之一,主要用于估計總體感染率,也可用于混合樣品分析[18]。
本研究假設大規模人群N 中的感染率為π,混合采樣采用n 人一組(管)。n 人中只要有1人陽性,該組(管)檢驗結果即呈“陽性”,然后該組n 人即分別再次進行單獨采樣檢測。根據二項分布原理,n 人一組(管)混合采樣檢測結果呈“陰性”的概率為n 人中“陽性”人數X=0的概率,表示為P(0)(式2);n 人一組(管)混合采樣檢測結果呈“陽性”的概率為n 人中“陽性”人數X=1,2,…,n 的概率合計,表示為P(1 ≤X ≤n)(式3)。
據此,計算混合采樣檢測結果呈陽性的管數(number of positive tubes, NPT)(式4)、需再次單獨采樣的人數(number of resamplers, NRS) (式5),以及再次單管檢測管數(number of retest,NRT) (式6)。最后計算人均采樣次數(number of samples per capita, NSPC)(式7)和人均檢測管數(number of tubes per capita, NTPC)(式8)。如果采用單采單檢,人均采樣次數和人均檢測管數則均為1。因此,本研究采用混采檢測的采樣工作量增長率(sampling workload growth rate,SWGR)(式9)和檢測工作量增長率(detection workload growth rate, DWGR)(式10)反應采樣工作效率和檢測工作效率變化。同時,計算權重比值為K 時的采樣與檢測加權綜合工作量增長率(weighted comprehensive workload growth rate,WCWGR)(式11或式12),反應綜合工作效率變化。SWGR=((NSPC-1)/1)×100%
可見,如果不考慮單檢與混檢之間檢測靈敏度與特異度的差異,式9 和式10 兩指標均只取決于兩個參數π 和n 的大小,與N 無關;式11和式12 除與π 和n 的大小有關,還與權重比值K 有關,與N 無關。因此,本研究主要分析在較大規模人群中,不同感染率下,采用不同采樣混合數n 時的采樣工作效率和檢測工作效率,繪制不同感染率、不同采樣混合數情況下的SWGR 變化曲線圖和DWGR 變化曲線圖。同時,分別從不同感染率π 值、不同權重比值K 情況下,篩選出加權綜合工作量增長率最小值(minimum weighted comprehensive workload growth rate, MWCWGR)及其采樣混合數(m),即為混采檢測加權綜合工作效率最適宜的采樣混合數m 值,并制成圖表。
繪制SWGR 和DWGR 曲線時選用2 ≤n≤50示意;計算最小值和繪制MWCWGR 與m 曲線時選用2 ≤n≤120,以展現最佳工作效率和最適宜采樣混合數變化規律。
根據本研究結果,對采樣混合數為5 合1、10 合1 和20 合1 的最適宜人群感染率及混采檢測效率進行評估。
本研究采用Python 語言numpy、pandas、matplotlib.pyplot 和scipy.stats 等編程工具包進行數據整理分析和可視化[19-20]。
按照人群感染率π 在1%~9%、1‰~9‰和1/萬~9/萬三個區間取值并進行分析,繪制采樣混 合數n 為2 合1 至50 合1 的SWGR 和DWGR變化曲線圖,分別見圖1、圖2 和圖3。結果顯示,SWGR 隨著采樣混合數的增加而增加,感染率越高,增加幅度越大,但不超過100%;DWGR 隨著采樣混合數的增加呈現先下降后回升的變化趨勢,存在最低值,感染率越高,下降幅度越小,但不超過0%。

圖1 感染率為1%~9%的人群混采檢測的SWGR和DWGR變化曲線圖Figure 1. Curves of SWGR and DWGR for swab pooling detection in a population with an infection rate from 1% to 9%

圖2 感染率為1‰~9‰的人群混采檢測的SWGR和DWGR變化曲線圖Figure 2. Curves of SWGR and DWGR for swab pooling detection in a population with an infection rate from 1‰ to 9‰

圖3 感染率為1/萬~9/萬的人群混采檢測的SWGR和DWGR變化曲線圖Figure 3. Curves of SWGR and DWGR for swab pooling detection in a population with an infection rate from 1/10 000 to 9/10 000
根據感染率π、采樣混合數n 和權重比K,計算WCWGR,篩選出MWCWGR 及其采樣混合數(m),結果見表1 和圖4。結果顯示,感染率越高,最適宜采樣混合數越小,MWCWGR越大(負數的絕對值越?。?,即混采檢測效率提高越少;K 值越大,最適宜采樣混合數越大,MWCWGR越小(負數的絕對值越大),即混采檢測效率提高越多。然而,當感染率超過6%以上,且K 值小于1/2 時,MWCWGR 即為正數,表明混采檢測反而增加工作量,降低工作效率。此時,就不宜采用該方法。

表1 不同感染率人群中混采檢測加權綜合工作量增長率最小值(%)及其采樣混合數Table 1. Swab pooling sizes at the MWCWGRs (%) for swab pooling detection in people with different infection rates
表1 和圖4 顯示,當K 值依次為1/4、1/3、1/2、1、2、3 和4 時,5 合1 分別最適用于在感染率為7‰~1%、9‰~1%、1%~2%、2%、3%、3%~4%和4%的人群中進行混采檢測,相應的MWCWGR 分別為-12.55%~-11.10%、-15.58%~-15.10%、-21.93%~-17.24%、-30.39%、-39.21%、-45.87%~-41.54%和-45.54%;10合1 分別最適用于在感染率為2‰、2‰~3‰、3‰~4‰、5‰、7‰、8‰~9‰和8‰~9‰的人群中進行混采檢測,相應的MWCWGR 分別為-16.02%、-20.55%~-19.55%、-27.05%~-26.09%、-40.11%、-53.22%、-59.78%~-58.86% 和-64.28%~-63.36%;2 0 合1 分 別 最適用于在感染率為5/萬、6/萬~7/萬、8/萬~9/萬、1‰~2‰、1‰~2‰、2‰和2‰的人群中進行混采檢測,相應的MWCWGR 分別為-18%、-22.56%~-22.36%、-30.08%~-29.88%、-45.55%~-43.72%、-61.53%~-59.43%、-67.33%和-72.08%??梢姡S著K 值增大,采樣混合數5 合1、10 合1 和20 合1 混采檢測技術應用的最適宜感染率分別逐步提高,加權綜合工作量減少的幅度分別逐步增大。
本研究主要基于二項分布和群檢驗技術原理,推導出混采檢測的采樣工作效率和檢測工作效率計算公式,并據此分析了人群感染率在百分率、千分率和萬分率三個取值區間場景下,不同采樣混合數的采樣和檢測工作量增長率,得到了其變化趨勢圖。同時,按照采樣與檢測單位工作量七級權重比值,分別計算了各個水平感染率情況下的MWCWGR,篩選出其中的最小值及其采樣混合數。據此,對5 合1、10 合1 和20 合1 混采檢測的最適宜感染率及工作效率進行了評估。
本研究主要有以下發現:第一,混采檢測綜合工作效率的決定性因素(參數)是感染率、采樣混合數,以及采樣與檢驗的單位工作量權重,而與人口規模沒有直接聯系。第二,無論感染率高低和采樣混合數多少,混采檢測均會增加采樣工作量人次數,超過單采人次數,且隨著采樣混合數的增加,采樣人次數增加;感染率越高,增加的幅度越大,速度越快。第三,無論感染率高低和采樣混合數多少,混采檢測均會減少檢測工作量,且隨著采樣混合數的增加,檢測工作量呈現先減少后回升的變化趨勢,但總不會超過單采單檢的檢測工作量。因此,存在檢驗工作量減少幅度最大的最佳采樣混合數。感染率越低,檢測工作量減少幅度越大,減少的速度越快。第四,加權綜合工作量增長率分析顯示,在不同感染率的人群中進行混采檢測,可以得到相應的混采檢測加權工作效率最高的采樣混合數。感染率越高,最適宜采樣混合數越小,其提高的工作效率值越低;感染率越低,最適宜采樣混合數越大,甚至可以達到90 合1 及以上,其提高的加權工作效率值越高,可以達到75%以上。第五,當人群感染率超過6%,且K 值小于1/2 時,MWCWGR 即為正數,此時混采檢測會增加工作量降低工作效率,不宜采用。第六,不同的采樣與檢驗單位工作量權重下,5 合1、10 合1 和20 合1 混采檢測技術分別有各自最適用的人群感染率水平。然而,近兩年發布的多個混采檢測技術規范,均未指明其適用范圍,各地在實際工作中無法科學選擇使用[6-8]。對此,很有必要修訂完善,確保使用混采檢測技術時,能根據人群感染率高低和采樣與檢驗的單位工作量權重,正確選用最適宜采樣混合數,以最大限度地提高工作效率。
本研究主要采用的是數理分析方法,其中檢測效率部分的研究方法和主要研究結果與Robert D[21]對混合血清檢測梅毒抗原的研究,Abdalhamid等[9]和Brynildsrud[16]對SARS-CoV-2/COVID-19 混樣檢測效果研究及陳穎丹等[13]對混合血清檢測寄生蟲病的效果研究具有一致性,表明該數理分析研究方法用于實踐是可行的。然而,上述研究采用實驗室檢測效率對比分析方法,主要針對的是實驗室混樣檢測工作效率。本研究則是針對混采檢測,不僅針對實驗室檢測工作效率,同時還包括現場采樣工作效率。因此,本研究結果有助于制定最佳混采檢測策略,提高綜合工作效率。
本研究的結果分析及其應用需注意以下幾點:首先,從分析原理及計算模型直觀看,混采檢測的工作效率不受人口規模的影響,但為了滿足二項分布的應用條件,需假設人群中個人的感染概率保持均等且恒定,所應用場景的人口規模應足夠大。其次,由于傳染病具有一定的傳染性和聚集性,通常人群中的感染率分布并不均勻,應用時須考慮到這一點,可將人群根據感染率水平細分為亞群進行分析應用。再次,本研究主要以采樣和檢測工作量(人力成本)變化為指標,評估混采檢測的工作效率,并未考慮經濟成本和流行病學調查等其他成本權重。采樣工作與檢測工作的單位工作量成本與單位經濟成本存在一定差異,單位檢測經濟成本權重高于單位采樣經濟成本權重;如果采樣混合數過大,對混采檢測陽性管全體人員進行再次單獨采樣和流行病學調查時,會增加人力成本[22]。因此,對全要素成本—效益綜合評估有待進一步研究。最后,本研究假設混采檢測與單采單檢的檢測方法的靈敏度與特異度保持一致,實際上二者可能存在差異,樣本混合數過多會增加假陰性的風險,對檢測效果會產生一定影響[3,23]。
綜上,混采檢測能提高采樣檢測綜合工作效率,針對不同感染率的人群,存在提升加權綜合工作效率最大化的最適宜采樣混合數。本研究為分析評估混采檢測工作效率提供了技術方案,為疾病篩查檢測工作中針對不同的感染率水平確定能最大化提升綜合采樣檢測工作效率的適宜采樣混合數提供了參考。同時,也為開展混采檢測綜合成本—效益分析提供了研究方法基礎。通過研究混采檢測綜合工作效率最大化和成本投入最小化,可以實現最優的綜合成本—效益,從而為進一步優化完善疾病篩查混采檢測技術規范提供科學依據。