寧錚美
(江蘇省體育科學研究所,江蘇 南京210033)
實驗室檢測當中,更換或更新檢驗方法、檢驗儀器常常需要對兩種檢測系統所得到的結果的一致性進行評價,以保證新舊檢測系統測量結果的一致和等價 。面對一致性評價的問題,過去常常使用配對T檢驗,簡單相關系數,組內相關系數等來處理。然而這些方法也存在著各自的缺陷,配對T檢驗難以兼顧觀察對象內部每對數據的差異,只能根據總體均值來對測量結果是否一致作出評價,同時它也更適于樣本量較大情況使用;簡單相關系數不能較好的應對系統誤差問題,難以反映出一致性結果;組內相關系數在處理測量范圍局限的數據時會出現錯誤的結論[1]。對于定量數據一致性評價上bland-altman圖是近年來得到廣泛認可、最為活躍應用的方法之一,很多生化項目,離子項目,自建系統及試劑評估等都根據美國臨床和實驗室標準協會系列文件的要求來對檢測結果進行對比分析,而BA法是用于評價兩種測量一致性的標準方法,他將一致性界限的定量分析與散點圖分布的定性描述相結合,能夠對數據一致性進行較為準確的評價。
為了保證運動員機能監測與評定實驗室內不同檢測系統間檢測結果的一致性,減少不同儀器間血清睪酮(T)、皮質醇(C)結果之間的差異,本研究選擇Bland-Altman法對兩臺化學發光儀器進行一致性評價,以期為科研實驗人員對運動員機能狀態的監控和縱向跟蹤研究提供準確數據。
兩臺檢測儀器均為美國貝克曼全自動化學發光免疫分析儀,型號分別為ACCESS1、ACCESS2; 兩臺儀器均使用貝克曼配套ACCESS校準品組合,貝克曼睪酮試劑盒,貝克曼皮質醇試劑盒。
1.2.1 測試方案
受試者隨機挑選江蘇省省隊運動員179名,其中女運動員82名,男運動員97名;采集受試者晨起空腹靜脈血,分離血清,將血清樣本分為兩份,兩儀器可重復性良好前提下,分別使用兩臺貝克曼儀器測定一次各血清中的睪酮(T),皮質醇(C)。其中兩臺儀器分別檢測量睪酮項目男性77人,女性60人;皮質醇項目人數為138人。
1.2.2 統計方法
數據錄入medcalc 16.4.3醫學統計軟件進行統計分析。選擇bland-altman方法進行分析生成圖表,以ACCESS1測定結果作為軟件界面界定的第一種方法,以ACCESS2測定結果作為第二種方法,考慮到一致性評價的參考范圍,睪酮和皮質醇項目以兩種儀器測量結果的比值為縱軸(ACCESS1測定值除以ACCESS2測定值),兩種儀器測量結果的平均值為橫軸,選擇生成比率為1的均值線(或差異為0的均值線),95%一致性界限的上下限,95%一致性上下限的的置信區間。
1.2.3 數據行為分析
測量數據在適用條件方面的表現總稱為數據行為。數據行為的評價應根據不同設計情形,采取不同評價方法,且應采取目測和統計計算相結合。標準Bland-Altman方法,其應用有三個條件:一是差值的平均趨勢在測量范圍內保持不變,表現為圖中散點分布于x軸平行,通過差值與均值的直線回歸分析判定;二是差值的散布程度在測量范圍內保持一致,表現為圖中散點分布在同寬的離散帶內即方差齊同,通過差值與均值直線回歸分析的殘差絕對值對均值的回歸分析判定;三是差值的分布呈正態分布,通過直方圖和正態性檢驗判定[2]。
1.2.4 一致性評價
B-A圖中一般以上下兩條虛線代表95%一致性界限的上下限,上下限兩側虛線代表上下限的95%置信區間,中間實線代表差值的均數,虛線代表差值均數為0。兩種方法一致程度越高,代表差值均數的實線越靠近代表差值均數為 0的虛線,差值點更多的落在一致性界限的95%置信區間的上下限內,并且該上下界范圍在臨床上可接受。本研究以95%的點[3]都在一致性區間的95%置信區間且臨床可接受為一致性評價標準。臨床實驗室TEA可接受范圍[4]為,皮質醇、睪酮為靶值±25%,鐵蛋白為靶值±2S。
2.1.1 兩種儀器測量皮質醇結果的數據行為分析

表1 ACCESS1和ACCESS2測量皮質醇結果的數據行為情況
從表1可以看到,因為存在兩種儀器差值方差不齊的情況,因此認定該組數據行為不良,不適宜應用B-A法進行一致性評價。
2.1.2 兩種儀器測量皮質醇的B-A圖及結果

圖1 兩種儀器測量皮質醇的比值的B-A圖
圖1給出了ACCESS2與ACCESS1的測量皮質醇比值的平均值水平為1.0048,一致性上下限分別為1.1335和0.8760,約5%的點落在一致性界限外(7/138)。考慮上下限置信區間,約2%的點在一致性界限外(3/138)。
2.2.1 兩種儀器測量女性睪酮結果的數據行為分析從表 2可以看到,兩種儀器測量女性睪結果的數據行為良好,滿足使用B-A法的條件。

表2 ACCESS1和ACCESS2測量女性睪酮結果的數據行為情況
2.2.2 兩種儀器測量女性睪酮的B-A圖及結果

圖2 兩種儀器測量女性睪酮的比值的B-A圖
圖2給出了ACCESS2與ACCESS1測量女性睪酮的比值的平均值水平為1.11,一致性上下限分別為1.5183和0.7008,約 8%的點落在一致性界限外(5/60)。考慮上下限置信區間,約3%的點在一致性界限外(2/60)。
2.2.3 兩種儀器測量男性睪酮結果的數據行為分析

表3 ACCESS1和ACCESS2測量男性睪酮結果的數據行為情況

差值趨勢保 斜率b=-0.003 P值=0.893 滿足不滿足
從表3可以看到,因為存在兩種儀器差值方差不齊,差值不滿足正態分布的條件,因此認定該組數據行為不良,不適宜應用B-A法進行一致性評價。
2.2.4 兩種儀器測量男性睪酮的B-A圖及結果

圖3 兩種儀器測量男性睪酮的比值的B-A圖
圖3給出了ACCESS2與ACCESS1測量男性睪酮的比值的平均值水平為1.04,一致性上下限分別為1.1587和0.9226,約 4%的點落在一致性界限外(3/77)。考慮上下限置信區間,約1%的點在一致性界限外(1/77)。
通過查閱文獻可以看到,雖然Bland-Altman方法經提出后得到了廣泛的應用,但較多研究存在應用不合理和誤用,往往在應用Bland-Altman進行一致性評價前不對數據行為情況進行分析討論,另外也有忽略或者沒有很好考慮95%LoA可信區間的估計,而針對Bland-Altman法評價一致性的方法學研究也不多 ,內容也有所局限[5]。
使用 Medcalc16.4.3醫學統計軟件能夠快速的生成Bland-Altman的圖像和數據,但并未對數據行為進行評價,多數研究就此直接進行一致性的評價,往往造成錯誤。本研究從學習和應用Bland-Altman法開展一致性評價的角度出發,本案例按照規范要求首先對數據行為進行了分析,從研究結果來看,雖然從生成的B-A圖中較難觀察出某個結果存在明顯比例偏倚或者圖中散點較多的在一致性界限外,但是對數據行為的分析可以看到除兩臺貝克曼機器對女性睪酮的測量結果的數據行為良好,滿足差值趨勢保持不變,方差齊同,正態分布這幾個條件,其余所有內容均為數據行為不良,這否定了依靠測量原始值應用Bland-Altman 法來評價一致性的可能。
本研究也針對數據不良情況,參照一些學者提出的方法進行了轉換嘗試,雖然能夠構造V型95%一致限,但目前尚無用于判定是否一致的標準[2]。因此面臨數據行為不良,一方面極大的增加了數據的處理量,同時進行數據轉換后會遇到不能解釋是否一致的情形,因此這給使用Bland-Altman分析法帶來了很多困難,結果的一致性難以得到評價,該方法本身還需多方面規范和補充。
分析數據行為良好的女性睪酮研究結果,考慮一致性上下限的置信區間,有較多的數據點(超過95%)落入了區域內,但結合睪酮的臨床可接受范圍,僅看一致性區間的上下限,ACCESSS數據值上限達到了靶值的1.5倍,下限達到了靶值的0.7倍,均要明顯大于睪酮的臨床可接受范圍靶值±25%。因此ACCESS1和ACCESS2兩臺機器測量女性睪酮指標是不具有一致性的。雖然本研究以 95%的點[3]都在一致性區間的95%置信區間且臨床可接受為一致性評價標準,但在很多研究中并沒有過多談及一致性區間外散點或一致性區間上下限置信區間外散點對于解釋一致性有什么意義,另外也有文獻認為散點分布在上述兩個區間內的比例來解釋一致性是錯誤的[5]。對于這點,目前還沒找到確切的答案,還需要把握評價方法的本質進行探究。4 結論與建議
綜上所述,盡管Bland-Altman分析法在這些年來應用廣泛,但實際應用對數據還存在諸多要求,評價方法自身的系統性和全面性還有待完善,因此對于專業領域使用該方法來進行一致性評價還需慎重。
[1]周宇豪.診斷試驗中一致性評價方法的比較及應用[D].第二軍醫大學, 2011.
[2]繆華章.基于Bland-Altman法LoA可信區間的一致性評價[D].南方醫科大學, 2014.
[3]李榮娟,蘇武錦.Bland-Altman分析法在臨床檢驗方法比較的實例應用和繪圖介紹[J].國際檢驗醫學雜志,2013,34(20):2727-2729.
[4]葉應嫵,王毓三.全國臨床檢驗操作規程(第3版) [M].南京:東南大學出版社,1997:81.
[5]聞浩,陸夢潔. 定量測量Bland-Altman一致性評價方法研究及臨床應用[J].醫學研究生學報, 2015,28(10): 1107-1111.