陳衛中 張菊英
兩冠心病診斷試劑盒雙正態ROC曲線下面積及其等效性或非劣效性檢驗
陳衛中1,2張菊英1△
目的探討在雙正態假定下,應用標準化差法進行定量資料ROC曲線下面積的估計及其等效性檢驗或非劣效性檢驗,比較兩氧化低密度脂蛋白試劑盒在診斷冠心病中的價值。方法 從ROC曲線的定義出發,根據模型中參數的統計學意義,完成ROC曲線的構建、曲線下面積的估計,并利用標準化差結合等效性檢驗、非劣效性檢驗原理,進行參數檢驗,或在Bootstrap基礎上利用可信區間法得到結論。結果 兩試劑盒均顯示氧化低密度脂蛋白在冠心病診斷中具有較高的準確性。從非劣效性檢驗的結果可以看出,CHN試劑盒在冠心病診斷上非劣于已經投入臨床使用的SWZ試劑盒。結論 兩試劑盒具有較高的臨床推廣價值,且具有較高性價比的CHN試劑盒在國內臨床市場有較好的前景。同時為類似問題的解決提供了方法學參考。
等效性檢驗 非劣性效檢驗 標準化差 ROC Bootstrap
1.四川大學華西公共衛生學院衛生統計學教研室(610041)
2.成都醫學院公共衛生系
△通訊作者:陳菊英,E-mail:juying109@163.com
ROC(receiver operating characteristic,ROC)曲線是將診斷試驗結果劃分為若干臨界點,以每個臨界點對應的靈敏度為縱坐標,1-特異度為橫坐標作圖得到的曲線,是一種全面、準確評價診斷試驗的有效工具〔1〕,被認為是診斷試驗評價中的理想和經典的方法〔2〕,其曲線下面積表征了診斷試驗的準確性。
隨著人們對診斷試驗的認識不斷深入,根據研究目的的不同,如某種新的診斷方法相較于目前常用的方法更微創,更經濟,操作更簡便,此時的研究目的就在于驗證該方法的準確性是否等于或非劣于標準方法,因此除傳統的差異性設計外,標準陽性對照(非金標準)試驗中的等效性或非劣效性設計也被廣泛地提出,在統計學檢驗就屬于等效或非劣效性檢驗的范疇。Obuchowski〔3〕和 Zhou〔4〕等已經提出了針對 ROC 曲線下面積的非參數等效或非劣效性檢驗方法,本文在雙正態假定的基礎上,利用參數檢驗方法對兩冠心病診斷試劑盒進行了等效性和非劣效性檢驗。
1.對象 684名受試對象經冠狀動脈造影術(CAG)確定的冠心病病人176例,正常人508例。分別使用兩個試劑盒CHN、SWZ測定血漿中氧化低密度脂蛋白(Oxidized LDL,OxLDL)。
2.方法
(1)雙正態ROC曲線下面積
設X、Y代表疾病人群的和對照人群的檢測變量,其分別來自兩個不同的正態總體,即:

設檢測變量取值越大越有可能成為病人,根據Bamber〔5〕ROC 曲線下面積 θ定義:θ=P(X>Y),則有θ=P(X-Y>0)。由于X、Y均來自正態分布,則X-Y的分布為:

由此,ROC曲線下面積可推導為:



其中TPF為敏感度,FPF為假陰性率,即1-特異度。
(2)ROC曲線下面積的等效或非劣效性檢驗
由雙正態ROC曲線下面積的推導不難發現,進行兩檢測方法曲線下面積θ1和θ2在設定的等效臨界值Δ是否等效或非劣效時,可轉化為對標準化差λ進行假設檢驗即可,此時針對λ的等效臨界值ε〔6〕即為:ε=Φ-1(θ2+Δ)-Φ-1(θ2)。其中Δ為在一定范圍內相等/等效的允許值,一般認為應從專業角度反復論證并結合成本效益加以估計,當Δ難以確定時,可使用Zhou〔4〕推薦的0.05。提出的檢驗假設分別為:

等效檢驗多采用Schuirmann〔8〕提出的雙向單側檢驗的方法(two one-sided tests,TOST),即分別對下限和上限做兩次單側檢驗,故假設實際為:

其中nA、nN分別為疾病組和對照組的例數,SAi、SNi為疾病組的和對照組的樣本標準差為兩檢測方法疾病組和對照組的Pearson相關系數估計值,、為樣本均數。
(3)Bootstrap可信區間法
根據Bootstrap〔11〕的基本原理,以再抽樣方法估計標準化差的可信區間,并在此基礎上進行等效或非劣效性檢驗,其具體步驟為:
②按疾病狀態分組變量分層,用有放回的方法分別從病例組和對照組中抽取與各組例數相同的樣本,獲得用于計算標準化差的Bootstrap樣本;
④重復②、③,重復抽取B-1次,獲得B個Bootstrap樣本,一般來講B不小于2000;

(4)軟件實現
通過Rokit3.0,并結合PlotROC實現雙正態模型ROC曲線的構建和參數估計。利用SAS 8.0完成兩曲線等效性或非劣效性檢驗,及Bootstrap基礎上的可信區間檢驗。
從表1可以看出兩試劑盒均顯示作為冠心病的診斷指標,氧化低密度脂蛋白ROC曲線下面積分別為0.9747和0.9910,并有統計學意義,說明診斷準確性較高,具有臨床診斷價值。其ROC曲線如圖1所示。

表1 兩試劑盒曲線下面積及其參數估計
由于本次試驗的目的在于證實CHN試劑盒的診斷準確性非劣于SWZ試劑盒,故只進行非劣效性檢驗,取Δ=0.05,則ε=0.8024。由表3可以看出,Z=3.8114大于Z0.05=1.645,故拒絕 H0,可以認為 CHN試劑盒的診斷準確性非劣于SWZ試劑盒。同時,Bootstrap可信區間也表明大于-ε=-0.8024,結論和非劣效性檢驗結果一致。
有研究表明〔10〕,雖然雙正態模型是以正態分布假定為基礎的,但實際應用中可適當放寬這樣的假定,即使資料服從指數分布、二項分布、Poisson分布、χ2分布、Gamma分布等,利用雙正態模型仍能得到較好地近似,尤其在樣本量較大或結合使用MLE法對兩個參數進行估計的情況下,具有較好的穩健性。

圖1 兩試劑盒ROC曲線

表2 兩試劑盒統計描述
Liu等〔6〕通過模擬實驗認為,無論正態分布還是偏態分布(如指數分布),基于標準化差的等效性或非劣效性檢驗在控制假陰性的發生和檢驗效能方面均優于非參數檢驗方法,表現出了較好的穩健性,但若資料不服從雙正態假定時,利用在Bootstrap基礎上的標準化差區間法進行等效性或非劣效性檢驗更值得推薦。對于等級資料,雖然標準化差法的表現仍然優于非參數法,但在ROC曲線下面積的等效性或非劣效性檢驗中,其II型錯誤的發生率仍然較大,因此對于等級資料ROC曲線下面積的等效性或非劣效性檢驗仍有待進一步研究。

表3 兩試劑盒曲線下面積等效性檢驗結果
從本次研究的兩個試劑盒來看,兩試劑盒均顯示作為冠心病的診斷指標,氧化低密度脂蛋白具有較高診斷準確性,兩試劑盒均具有臨床診斷推廣價值。從非劣效性檢驗的結果可以看出,具有較高性價比的CHN試劑盒在冠心病診斷上非劣于已經投入臨床使用的SWZ試劑盒,在國內臨床市場有較好的前景。
1.Gregory Mark.Receiver-operating characteristic(ROC)plots:fundamental evaluation tool in clinical medicine.Clin Chem,1993,39(4):561-567.
2.Copas JB,Corabitt P.Overestimation of the receiver operating characteristic curve for logistic regression.Biometrika,2002,89(2):315-331.
3.Obuchowski N.Testing for equivalence of diagnostic tests.American Journal of Radiology,1997,168:13-17.
4.Zhou XH,Obuchowski NA,McClish DK.Statistical methods in diagnostic medicine.Wiley:New York,2002,188-192.
5.Bamber D.The area above the ordinal dominance graph and thearea below the receiver operating characteristic graph.J.Math.Psychol,1975,12:387-415.
6.Liu JP,Ma MCh,Wu ChY,et al.Tests of equivalence and non-inferiority for diagnostic accuracy based on the paired area sunder ROC curves.Statist.Med,2006,25:1219-1238.
7.Green DM,Swets JA.Signal Detection theory and Psychophysics.New York:Wiley,1966.
8.Schuirmann DJ.A comparison of the two one-sided tests procedure and the power approach for assessing the equivalence of average bioavailability.J.Pharmacokin.Biopharm.,1987,15(6):657-680.
9.Serfling RJ.Approximation theorems of mathematical statistics.Wiley:New York,1978,19-21.
10.Harley J,Hajian-Tilaki Kl.A comparison of parametric and nonparametric approaches to ROC analysis of quantitative diagnostic tests.Med.Decis.Making,1997,17(1):96-102.
11.Efron B,Tibshirani RJ.An introduction to the bootstrap.Chapman &Hall:New York,1993,168-176.
12.劉勤,金丕煥,高爾生.Bootstrap方法及其醫學統計學應用.中華預防醫學雜志,1998,32(1):52-53.
Application of Equivalence or Non-Inferiority Test for Diagnostic Accuracy under the Bi-normal Distribution Based on the Areas of ROC in Two OxLDL Kits for Coronary Heart Disease Diagnostic
ChenWeizhong,ZhangJuying.DepartmentofHealthStatistics,SichuanUniversity(610041),Chendu
ObjectiveTo assess equivalence or non-inferiority in accuracy between two OxLDL kits for coronary heart disease diagnostic,plot ROC curves and compare the are as using equivalence or non-inferiority test.MethodsAccording to the theory of ROC and the statistical meaning of the parameters,the bi-normal model ROC curves were plotted,the areas under the curves were estimated and compared using the standardized difference approach and the standardized difference confidence interval based on bootstrap for assessing equivalence or non-inferiority in diagnostic accuracy.ResultsThe different kits show conformably that the OxLDL is suitable for Coronary Heart Disease diagnostic,the kit of CHN is non-inferior to the SWZ.ConclusionResults from the trial have shown that the accuracy of OxLDL for coronary heart disease diagnostic.At the same time,explore a right way to put forward equivalence or non-inferiority test using the standardized difference approach under the bi-normal distribution and confidence interval approach based on bootstrap,provide a theoretical reference for similar problems.
Equivalence test;Non-inferiority test;Standardized difference;ROC;Bootstrap