王 薇 張志新 張傳寶 周偉燕 王治國
(北京醫(yī)院 國家老年醫(yī)學中心 國家衛(wèi)生健康委臨床檢驗中心 北京市臨床檢驗工程技術研究中心中國醫(yī)學科學院老年醫(yī)學研究院,北京 100730)
如何設定性能規(guī)范是檢驗醫(yī)學領域多年來備受關注的問題。關于性能規(guī)范的設定,國內(nèi)外均有諸多研究方法和成果[1-7]。我國臨床檢驗項目室間質(zhì)量評價(external quality assessment,EQA)標準多參考美國臨床實驗室改進修正案能力驗證評價限,但這個標準缺乏客觀、合理的依據(jù)和大數(shù)據(jù)支持。本研究根據(jù)意大利米蘭會議最新確定的性能規(guī)范設定模式[3],分別基于分析性能對臨床結(jié)果的影響、基于被測量的生物學變異(biological variation,BV)數(shù)據(jù)和基于當前技術水平設定性能規(guī)范。基于BV導出的性能規(guī)范具有客觀依據(jù),適用已經(jīng)根據(jù)人群或特定個體建立BV數(shù)據(jù)的大部分檢驗項目;基于當前技術水平設定的性能規(guī)范主要來源于室內(nèi)質(zhì)量控制(internal quality control,IQC)數(shù)據(jù)。準確度、精密度和正確度[8]是臨床檢驗定量測定項目中非常重要的3個性能特征,其相應的性能規(guī)范可分別表示為允許總誤差(allowable total error,TEa)、允許不精密度[以變異系數(shù)(coefficient of variation,CV)表示]和允許偏移(bias,Bias)。目前,我國臨床實驗室廣泛開展的內(nèi)分泌相關檢驗項目有甲狀腺激素、性激素、腎上腺激素等,用于內(nèi)分泌疾病診斷、病情評估和療效監(jiān)測。本研究對22個內(nèi)分泌檢驗項目進行性能規(guī)范研究,旨在幫助臨床實驗室選擇和設定合理的性能規(guī)范,保證檢驗結(jié)果的準確性。
1.1.1 資料收集
訪問歐洲臨床化學和檢驗醫(yī)學聯(lián)合會生物變異數(shù)據(jù)庫[9],采集22個內(nèi)分泌檢驗項目(有19個查到BV數(shù)據(jù))最新的BV數(shù)據(jù),并通過公式[10](表1)分別推導出基于BV的3個水平的TEa、允許CV和允許Bias。22個項目為:游離三碘甲狀腺原氨酸、總?cè)饧谞钕僭彼帷⒂坞x甲狀腺素、總甲狀腺素、促甲狀腺激素、皮質(zhì)醇、雌二醇、卵泡刺激素、黃體生成素、孕酮、催乳素、睪酮、C-肽、葉酸、胰島素、甲狀腺球蛋白、甲狀旁腺激素、醛固酮、硫酸脫氫表雄酮、維生素B12、生長激素、促腎上腺皮質(zhì)激素。

表1 基于BV數(shù)據(jù)導出的TEa、允許CV和允許Bias的計算公式
1.1.2 EQA和IQC數(shù)據(jù)
收集參加國家衛(wèi)生健康委臨床檢驗中心2020—2022年內(nèi)分泌項目EQA活動的實驗室的回報數(shù)據(jù)(包括質(zhì)控品的批號、靶值和測量結(jié)果),每次EQA活動實驗室回報數(shù)據(jù)時,同時回報前1個月的IQC數(shù)據(jù),包括IQC的均值、標準差、質(zhì)控規(guī)則、在控結(jié)果個數(shù)、當月在控CV。EQA每年2次,每次5個批號,共收集30個批號的數(shù)據(jù)。IQC每次2個批號,共收集12個批號的數(shù)據(jù)。
1.2.1 基于BV的模式
1)TEa的推導。基于EQA數(shù)據(jù),根據(jù)公式:百分差值=(測量結(jié)果-靶值)/靶值×100%[7],計算每個批號質(zhì)控品測量結(jié)果的百分差值,將其與基于BV導出的不同水平TEa進行比較,如百分差值≤BV導出的某水平TEa,則確定為通過該水平TEa的要求。計算所有批號的通過率,如通過率達到80%,則該評價標準可作為該項目推薦TEa的要求。若經(jīng)比較和計算,基于BV導出的3個水平的TEa均不滿足作為推薦TEa的要求,則需要基于當前技術水平導出推薦TEa。
2)CV的推導。基于每年的IQC數(shù)據(jù),按照批號將每個實驗室上報的“當月在控CV”分別與BV導出的不同水平允許CV進行比較,如“當月在控CV”≤BV導出的某水平允許CV,則將其確定為通過該水平CV的要求。計算所有批號的通過率,如通過率達到80%,則該評價標準可作為該項目推薦允許CV的要求。若經(jīng)比較和計算,基于BV導出的3個水平的CV均不滿足作為推薦CV的要求,則需要基于當前技術水平導出推薦CV。
1.2.2 基于當前技術水平模式
基于當前技術水平模式適用于無BV數(shù)據(jù)的檢驗項目,或有BV數(shù)據(jù)卻無法使用基于BV導出的性能規(guī)范作為推薦性能規(guī)范的檢驗項目。
1)TEa的推導。百分差值分布曲線總體上呈近似正態(tài)分布,且中位數(shù)在0附近,數(shù)值有正有負,可將各批號所有實驗室百分差值的第10百分位數(shù)(P10)~第90百分位數(shù)(P90)作為該批號80%實驗室的百分差值分布區(qū)域。根據(jù)公式:TEa當前=1/2×(P90-P10)[7],計算當前技術水平TEa。為讓大多數(shù)實驗室可以通過要求,取各批號中最大的TEa當前作為推薦TEa。
2)CV的推導。在各項目的IQC數(shù)據(jù)中,每個批號“當月在控CV”的第80百分位數(shù)(P80)可作為該批號基于當前技術水平推導出的允許CV當前。為讓大多數(shù)實驗室可以通過要求,取各批號最大的CV當前作為推薦CV。
1.2.3Bias的導出
將Westgard提出的總誤差計算公式轉(zhuǎn)化為:|Bias|≤TEa-z×CV(z通常為1.65)[11],通過代入導出的推薦TEa和允許CV,計算出|Bias|的最大值。
2020—2022年,22個內(nèi)分泌檢驗項目中,參加實驗室數(shù)最多的項目是促甲狀腺激素(3 555家),最少的是硫酸脫氫表雄酮(291家)。見表2。

表2 22個內(nèi)分泌檢驗項目各年參加實驗室數(shù) 家
基于BV導出的性能規(guī)范見表3。對有BV數(shù)據(jù)的19個檢驗項目,分別計算各項目各批號質(zhì)控品百分差值通過率和當月在控CV通過率,其分布情況見表4。有13個檢驗項目使用基于BV導出的性能規(guī)范作為推薦性能規(guī)范;胰島素項目僅使用基于BV推薦的CV;有5個項目(游離三碘甲狀腺原氨酸、游離甲狀腺素、總甲狀腺素、黃體生成素、硫酸脫氫表雄酮)未推薦基于BV導出的3個水平性能規(guī)范(太嚴或太寬松),見表5。

表3 基于BV導出的性能規(guī)范 %

表4 19個檢驗項目基于BV的3個水平百分差值和當月在控CV通過率 M,%

表5 各檢驗項目推薦的TEa、允許CV、允許Bias %
本研究有3個檢驗項目(維生素B12、生長激素、促腎上腺皮質(zhì)激素)未查到相關BV數(shù)據(jù),有6個檢驗項目(游離三碘甲狀腺原氨酸、游離甲狀腺素、總甲狀腺素、黃體生成素、胰島素和硫酸脫氫表雄酮)未推薦基于BV導出的TEa,這9個檢驗項目基于當前技術水平推薦TEa。分別計算上述9個檢驗項目各批號百分差值的P10、P90和TEa當前,結(jié)果見表6。本研究有8個檢驗項目(維生素B12、生長激素、促腎上腺皮質(zhì)激素、游離三碘甲狀腺原氨酸、游離甲狀腺素、總甲狀腺素、黃體生成素、硫酸脫氫表雄酮)需要基于當前技術水平推薦允許CV,分別計算各項目各批號當月在控CV的P80,取各批號最大的P80作為推薦CV。

表6 基于當前技術水平導出的性能規(guī)范 %
將Westgard提出的總誤差計算公式轉(zhuǎn)化為下述公式:|Bias|≤TEa-z×CV(z通常為1.65),代入導出的推薦TEa和允許CV,計算出推薦的允許Bias。見表5。
本研究根據(jù)意大利米蘭會議最新確定的性能規(guī)范設定模式,基于BV和基于當前技術水平模式導出性能規(guī)范,參加實驗室眾多,且有EQA和IQC大量數(shù)據(jù)的支持,因此推薦的性能規(guī)范較為合理。
基于BV 導出性能規(guī)范的模式已經(jīng)較為成熟,直接受個體內(nèi)BV(CVI)和個體間BV(CVG)的影響。本研究所用的BV數(shù)據(jù)來源于國外,所以在基于BV推薦性能規(guī)范時要結(jié)合我國實驗室的情況,因此有些項目雖然滿足1個或多個水平的要求,但并未推薦。例如:游離三碘甲狀腺原氨酸 、游離甲狀腺素、總甲狀腺素和硫酸脫氫表雄酮4個項目,基于BV適當水平和最低水平的百分差值通過率均超過80%,若是推薦這個TEa,將給實驗室允許CV的設定帶來很大壓力;胰島素和黃體生成素這2個項目,基于BV的3個水平的百分差值通過率均超過80%,但相應的TEa或有些嚴格或過于寬松。鑒于以上情況,并未推薦基于BV導出的TEa,但在基于當前技術水平推薦TEa時,7個項目計算出的TEa當前也比較嚴格,因此推薦了2022年國家衛(wèi)生健康委臨床檢驗中心EQA使用的評價標準[12]。基于當前技術水平推薦TEa仍需深入研究,以提供更為客觀、合理的方法。
本研究也存在不足。首先,EQA數(shù)據(jù)百分差值部分,百分差值通過率普遍較高,且基于當前技術水平推薦的TEa較為嚴格,目前的EQA評價多采用分組(儀器或試劑)的方式,靶值是由參加者確定的公議值[13](穩(wěn)健平均值),說明實驗室同一檢測系統(tǒng)結(jié)果的一致性較好。EQA可以反映實驗室的當前檢驗水平,但也存在一定的局限性。其次,IQC數(shù)據(jù)CV部分。由于參加實驗室使用的質(zhì)控品、方法、儀器和試劑不同,上報的CV會有較大的差異,可能導致部分項目推薦的允許CV較大。第三,理想情況下,對任一分析物進行測定最為科學的方法是根據(jù)不同的濃度水平設定不同的性能規(guī)范,但在實際工作中這樣做難度較大。澳大利亞皇家病理學家學會質(zhì)量保證計劃[14]部分項目的評價標準設定了特定的濃度分界點,大于此分界點以百分位數(shù)表示,小于此分界點則用絕對值表示。第四,本研究用來計算推薦允許Bias的公式是以Westgard提出的總誤差計算公式為基礎轉(zhuǎn)化而來的。正確度驗證計劃可以獲得真正的偏移,但是由于目前開展的計劃有限,參加的實驗室較少,本研究根據(jù)Westgard提出的總誤差計算公式得出偏移,可為實驗室進行方法確認與性能驗證提供數(shù)據(jù)參考,鼓勵更多的臨床實驗室參與,從而為更多檢驗項目制定更為客觀、合理的允許Bias。
實驗室在制定性能規(guī)范的時候,應同時考慮TEa、允許CV和允許Bias。確定CV時,TEa制定得太寬,不利于實驗室的質(zhì)量改進,檢測結(jié)果敏感性不足以反映患者病情的變化,無法進行重大醫(yī)療決策;TEa制定得太嚴格,可能給實驗室本身造成過大的壓力。實驗室可通過轉(zhuǎn)化為西格瑪水平[σ=(TEa-Bias)/CV],用西格瑪度量進一步評價檢驗項目的性能,選擇適合的質(zhì)控規(guī)則[15]。