汪蓓蕾,侯秉璋,郭 剛
(天津醫科大學朱憲彝紀念醫院天津市內分泌研究所,天津 300134)
新生兒篩查(以下簡稱“新篩”)是我國出生缺陷三級防控體系的重要組成部分,其中主要內容之一是對苯丙酮尿癥(phenylketonuria,PKU)和先天性甲狀腺機能減低癥(congenital hypothyroidism,CH)兩種遺傳代謝疾病的篩查及診斷。對于早期臨床表現不特異的遺傳代謝疾病,每個新生兒只有一次篩查機會,其診斷主要依靠實驗室檢驗結果,因此“這是無法彌補的一次性檢驗”,實驗室結果的準確性、可靠性直接關系到患兒是否能得到及時治療以避免疾病進展對智力和體格發育造成的不可逆損傷甚至死亡[1,2]。本篩查中心實驗室承擔天津市部分地區的新篩工作,實驗室通過開展IQC、參加NCCL組織的EQA 活動和IQC 室間比對計劃等措施來保證篩查項目的檢測質量。然而,對IQC 中所采用的控制規則是否適宜、EQA 成績合格時實驗室質量是否需要改進以及如何改進的問題并沒有客觀認識。為此,本文擬利用Westgard 西格瑪規則和基于生物學變異的質量規范,客觀評價實驗室檢測項目的分析性能、科學地選擇質控規則、針對性提出質量改進措施,以促進實驗室質量的持續改進。
1.1 材料來源 2019年10 月-2020年10 月,實驗室依照NCCL 要求,按時對EQA 提供的4個批次質評樣本進行檢測,共20個批號的濾紙干血斑樣品(批號201931~201935,202011~202015,202021~202025,202031~202035);IQC 材料來自檢測試劑盒配套的濾紙干血斑質控品(Phe 質控品批號85QB1B-1、85QF2B-1、85QF1B-1,TSH 質控品批號667464、671932)。
1.2 儀器和試劑 美國PerkinElmer 公司生產的Wallac 1420 Victor TM 型時間分辨熒光分析儀、自動震蕩器、洗板機,電熱恒溫培養箱購自上海博迅實業有限公司。Phe 檢測試劑盒購置芬蘭Labsystems公司,TSH 檢測試劑盒購自美國PerkinElmer 公司。
1.3 方法
1.3.1 質量目標 采用2 種質量規范的TEa,一種是基于生物學變異導出的質量規范,在生物學變異數據庫[3,4]查找Phe、TSH 項目的個體內變異(CVI)和個體間變異(CVG)數據,根據公式分別計算最低、適當、最佳3個水平CV、Bias、TEa 的質量規范5;另一種是EQA 新篩項目TEa 要求(30%),以IQC 室間對比計劃規定的1/3TEa(10%)、1/4 TEa(7.5%)為不精密度要求。
1.3.2 偏倚估計 收集實驗室2019年10 月-2020年10 月4 次EQA 的回報結果,每個項目獲得20個偏倚絕對值(Bias),為防止個別過小或過大結果對規則選擇的影響,以Bias 中位數作為項目的偏倚估計。為更準確地評估項目σ值并選擇更加合適的質控規則,依據靶值將質評樣品分為低、高2個濃度水平(Phe 低水平level1 范圍為1.41~3.34 mg/dl,高水平level2 范圍為4.39~13.07 mg/dl;TSH低水平level1范圍為4.41~14.43mIU/L,高水平level2范圍22.35~54.83 mIU/L),逐一以低、高水平的Bias 中位數為偏倚進行分析。
1.3.3 不精密度估計 CV 來源于同期IQC 在控數據,同批號質控品測定值取得累計CV值,不同批號間的累計CV值做加權平均。因采用了2個濃度水平的質控品(Phe 低濃度2.00~3.00 mg/dl,高濃度5.95~7.05 mg/dl;TSH 低濃度15.00~15.90 mIU/L,高濃度59.82~63.00 mIU/L),得到2個水平的變異系數CVlevel1、CVlevel2,以合并CV 對檢測項目總體的不精密度進行估計,合并CV=[1/2(CVlevel12+CVlevel22)]1/2。
1.3.4 計算σ值、制作標準化σ 性能驗證圖并選擇質控程序 σ 水平將分析性能分為6個等級:世界級(σ≥6)、優秀(5≤σ<6)、良好(4≤σ<5)、一般(3≤σ<4)、差(2≤σ<3)和不可接受(σ<2)。根據公式σ=,計算不同質量規范下σ值。登錄醫學信息網(www.clinet.com.cn/),使用標準化σ 性能驗證圖在線軟件,以百分數格式輸入TEa、Bias 和CV 數據后,可獲得標準化σ 性能驗證圖以及針對σ水平的質控規則設計方案。
1.3.5 使用功效函數圖驗證候選質控方案的性能特征 Phe 基于生物學變異導出要求的最低水平,TSH基于適當水平,分別計算兩項目的臨界系統誤差(ΔSEc),公式為ΔSEc=(TEa-)/CV-1.65,查閱系統誤差功效函數圖[5,6],從候選質控規則功效曲線上的ΔSEc值讀出相應Y 軸值和Y 軸截距,即誤差檢出率(probability for error detection,Ped)和假失控率(probability for false rejection,Pfr);計算臨界系統誤差(ΔREc),根據公式ΔREc=(TEa-)/1.65CV,在隨機誤差功效函數圖上查找候選質控規則的功效曲線5,得出相應Ped 和Pfr。優先考慮系統誤差功效函數圖的參數,以Ped>0.90、Pfr<0.05 為標準選擇質控規則。
1.3.6 計算質量目標指數(quality goal index,QGI)按照公式QGI=Bias/1.5CV,計算每個項目及其各水平的QGI值。QGI<0.8,提示方法性能不佳主要由于精密度超出允許范圍,應優先改進精密度;QGI>1.2,提示存在系統誤差,優先改進準確度;QGI 在0.8~1.2,提示正確度和精密度均需改進。
2.1 檢測項目質量指標滿足不同來源質量要求的情況 依據上述EQA 標準,Phe、TSH 項目定量和定性結果均合格,符合率為100.00%(20/20);基于生物學變異導出質量規范,Phe 滿足最低性能下的CV、Bias 要求,TSH 滿足適當性能要求,見表1。

表1 Phe、TSH 項目不同來源的質量要求
2.2 應用σ值對檢測項目的分析性能進行評估 基于EQA 標準,Phe、TSH 項目σ值分別為5.02 和4.29。以生物學變異最低性能要求,Phe 性能良好(σ>4),但其中低、高水平性能評價相差較大,分別為3σ 和5σ 水平;TSH 可達到適當性能要求,分析性能一般(σ>3),其低、高水平的σ值與總體一致,見表2。
2.3 利用標準化σ 性能驗證圖選擇質控方案,使用功效函數圖驗證候選質控規則 EQA 標準下Phe 性能水平達到優秀,應采用13S/22S/R4S規則(N=2,R=1);以生物學變異導出最低性能為要求,依據標準化σ 性能驗證圖,項目需使用13S/22S/R4S/41S規則(N=4,R=1 或N=2,R=2)。其中低水平性能(σ=3.84)明顯低于高水平(σ=5.32),應采用最多規則的13S/22S/R4S/41S/8x-規則(N=4,R=2 或N=2,R=4)。TSH 在EQA 目標下,應使用13S/22S/R4S/41S規則(N=4,R=1 或N=2,R=2);采用生物學變異導出的適當水平為質量目標,依據標準化σ 性能驗證圖,應使用13S/22S/R4S/41S/8x-規則(N=4,R=2 或N=2,R=4),該項目低、高水平推薦使用的質控規則與總體一致,見圖1、圖2。依據系統誤差功效函數圖13S/22S/R4S/41S/8x-規則(N=4)的功效曲線5,6 和兩項目的ΔSEc值(表2),驗證可知此候選方案對于兩項目的系統誤差Ped 均大于90%,Pfr 為3%;依據隨機誤差功效函數圖上候選規則的功效曲線5 及兩項目相應ΔREc值(表2),驗證可知質控規則對兩項目的隨機誤差Ped 約80%,Pfr 小于5%。

圖1 EQA 質量標準下Phe、TSH 項目質控規則的選擇

圖2 基于生物學變異質量規范Phe、TSH 項目質控規則的選擇

表2 Phe、TSH 項目的實驗室參數和不同質量規范下σ值及質量改進方案
2.4 質量改進方案 除Phe 高濃度水平QGI>0.8,提示需同時改進準確度和精密度以外,兩項目總體及各水平QGI 均<0.8,皆須優先改進精密度。
本實驗室在日常IQC 中對項目均采用13S/22S質控規則,此規則對不同項目是否都具備足夠的誤差檢出效率,實驗室并沒有定量描述。對外部質量保證計劃的回報結果,也只對不合格結果加以分析改進。即使將實驗室CV、Bias 和TE 參數直接與EQA 標準逐項對比,這些合格成績往往也可滿足EQA 要求。在此情況下,實驗室可能并不會從本以改進檢測質量為目的EQA 活動中認識到自身的潛在問題。
六西格瑪質量管理由Nevalainen 等學者首次應用于醫學檢驗,Westgard 進而將這種動態的、預防性的管理方法與其經典的Westgard 多規則邏輯圖結合,稱為“Westgard 西格瑪規則”,相較于臨界誤差圖、質量控制選擇表等工具,其更加簡潔、直觀地選擇合適的質控規則[7,8]。但應用此規則時,不易確定的是檢測項目要達到什么標準(TEa)才能滿足其預期臨床用途。2014年歐洲臨床化學與檢驗醫學聯合會(EFLM)等組織在米蘭會議上達成共識:基于分析性能對患者臨床結局的影響、生物學變異的影響和當前測量技術水平3 種模型制定臨床檢驗質量要求,優先使用前兩種模型[9]。本研究采用2個模型的質量規范:EQA 標準屬模型三,組織者需考慮將大部分實驗室能夠達到的質量指標作為可接受水平,不利于質量目標的改進;基于生物學變異的質量規范位于第二層級,在2個主要臨床需求(監視患者病情變化和使用參考區間診斷)下使用的檢測結果最好依據生物學變異導出質量指標[10],最低、適當和最佳3個性能水平對實驗室的質量管理提出更高的要求,有利于質量目標的持續改進。
本研究發現,不同的質量目標下,檢測項目的性能評價截然不同。Phe 在EQA 標準下性能優秀,而基于生物學變異導出適當性能要求時,項目處于“臨界性能區”(2<σ<3),是σ 標準中不可接受區域[5]。由于Phe 在個體內生物學變異較小,故導出適當性能下CV 要求也較嚴格(<4.75%),而在實踐中,目前國內新篩Phe 項目所廣泛采用的熒光方法很難達到這一精密度要求[11],因此本研究選取較為“寬松”的最低性能要求作為Phe 的質量目標。TSH 項目在EQA標準下性能良好,在生物學變異最低性能要求時評價為國際一流的6σ 水平。由TSH 生物學變異數據可知其在個體內和個體間變異較大,因此導出生物學變異最低性能要求(TEa)要低于EQA 標準。可見,最低性能要求對于TSH 過于“寬松”,應選擇較“嚴格”的適當性能作為TSH 的質量目標。
由于國內未有對Phe、TSH 的CVI 和CVG 報道,本文采用國外學者對全球健康成年人的生物學變異研究數據。其中,Phe 引自Westgard 網站數據庫[3],是對2014年前發表的生物學變異研究數據進行篩選后制定;TSH 引自EFLM 網站生物學變異數據庫,EFLM 自2014年起基于前沿方法和分析技術的歐洲生物學變異研究,對前一數據庫進行了更新[12]。雖已有對包括亞裔在內的各年齡段兒童的TSH 生物學變異研究[13],但受檢測方法差異、人群異質性等因素影響,該研究顯示兒童,尤其是2 月齡內的新生兒TSH 的CVI 和CVG(分別為32.8%和71.8%)遠高于成人,因此目前基于成人生物學變異數據的質量規范可以滿足兒童人群。
區別于其他臨床檢測項目,新篩項目除報告定量結果外,還必須對定量結果做出陰性或陽性的臨床判斷,該定性判斷直接關系到患兒的確診或漏診,其質量的好壞理論上比定量結果更為重要[14]。依據我國《新生兒疾病篩查技術規范(2010年版)》[1,15],參照本實驗室及其他篩查中心采用的結果復查及疑似陽性召回切值(Phe:2 mg/dl,TSH:9 mIU/L)[16],質評樣品低濃度范圍更接近且包含了陽性切值,因此低濃度更客觀地反映了檢測系統在切值附近的偏倚水平。IQC 所用質控品低、高濃度分別接近質評品的低、高水平,結果顯示兩項目在低濃度的精密度皆低于高濃度,不同濃度水平需要分別設定質量要求[17]。本研究選擇與切值更接近的低水平CV 和Bias 所確定的σ值,作為項目的分析性能評價,并據此選擇了更為嚴格的質控規則(13S/22S/R4S/41S/8x-),這樣的選擇更為謹慎。受限于目前所用檢測試劑盒提供的低濃度質控品仍普遍高于正常參考值范圍,有研究者在檢測篩查樣本的同步,使用患者數據移動均值法質控對分析系統進行監測,對上述傳統質控方法進行補充[18]。
實驗室全面質量控制(TQC)還包括質量改進,后者可從本質上提高實驗室質量,而σ 質量管理在此方面也具有指導意義[5]。本研究中質量目標指數QGI 顯示,兩項目的質量改進皆須優先針對精密度采取措施。有必要加強操作者的技術標準化意識,對孵育箱、洗板機等設備進行定期維護,對測量設備進行定期校準,通過預防性措施降低隨機誤差和系統誤差。此外,試驗還受到溫度、濕度、粉塵等環境因素波動的影響[19],應監測并控制環境誤差,以提高分析系統的穩定性。
目前多有新篩實驗室對室間質評尤其是對不合格結果做回顧性分析,對已出現的偏差和錯誤提出相應糾正措施。相對此種被動的管理模式,本文嘗試選擇質量目標更高的生物學變異質量規范,遵循“Westgard 西格瑪規則”,利用互聯網數據庫資源、在線軟件及文獻,有效且經濟地制定符合實驗室自身需求的質控方案、提出預防性管理措施,為新篩實驗室質量的持續改進提供保證。