張杏珍 黃 堅 奚煒煒 應 俊
1 浙江大學醫學院附屬金華醫院,321001 浙江 金華;2 浙江大學醫學院附屬邵逸夫醫院腎內科,310016 浙江 杭州
微小病變型腎病(minimal change disease, MCD)是特發性腎病綜合征(nephrotic syndrome, NS)的主要病因之一。其臨床表現特點是產生大量的蛋白尿,并導致水腫以及血容量的減少。在成人中,MCD約占特發性NS患者的10%~15%[1]。值得注意的是,在1歲以下的兒童中,MCD是NS最常見的病因,約占80%;在青春期前后,隨著其他腎小球疾病的發生,如膜性腎病,這一比例將會顯著下降[2]。但與其他腎小球疾病相比,MCD患者出現NS的癥狀和體征要更快。目前,腎活檢是腎實質疾病診斷、治療管理和預后預測的金標準,為醫生提供臨床診斷和相關檢測的信息,有助于提高對相關疾病的認識[3]。但腎活檢的缺陷是,作為一種有創的侵襲性檢查,有可能會引起并發癥,比如出血或感染。此外,由于一些地區的醫療條件、診斷標準的制定或患者自身的身體情況等原因,部分患者并不能接受腎活檢,從而導致無法及時診斷[4]。因此,迫切需要一種無創的數學模型來診斷MCD。
2018年,Zhu等收集798個腎病患者的相關數據,其中MCD患者47人,其它腎病患者751人,基于生物學參數,通過t檢驗與ROC分析進行參數篩選,并構建二元logistic模型,用以診斷MCD。作者認為,該方法建立的“總膽固醇+凝血酶時間”診斷模型可用于MCD的分類診斷[5]。盡管作者采用了一個很大的患者人群,但提出的模型因納入參數個數過少,可能會因此降低了大樣本的本來價值。本研究擬在該研究基礎及標準上[5],更換新的參數篩選軟件與方法,構建二元logistic模型,并用ROC分析與診斷準確度評價模型的診斷價值,用以更好更準確地無創診斷MCD。
本次研究的MCD和其他腎臟疾病的相關臨床研究數據是來自公共數據庫PeerJ,共包括798名患者,包括47名MCD患者和751名其他腎臟疾病患者。原始數據包括每個患者的臨床生物學參數數據以及疾病狀態以供建模。
采用MedCalc version 15.8軟件對全部生物學參數進行了ROC(receiver operating characteristic)曲線分析,計算曲線下面積(area under the curve,AUC),以評估相關生物學參數是否能有效地區分MCD和其他腎臟疾病患者(AUC>0.70,P<0.001)。AUC大于0.70的生物學參數作為構建二元logistic模型的協變量。這些參數包括白蛋白(albumin, ALB)、總膽固醇(total cholesterol, CH)、血漿纖維蛋白原(plasma fibrinogen, FIB)、高密度脂蛋白(high density lipoprotein cholesterol, HDL)、低密度脂蛋白(low density lipoprotein cholesterol, LDL)、總蛋白質(total protein, TP)、凝血酶時間(thrombin time, TT)。
將CH、HDL、LDL、TT和FIB作為協變量,疾病狀態作為因變量,應用向后步進法(似然比)構建二元logistic模型,定義為模型1。將所有滿足建模條件的生物學參數(ALB、CH、FIB、HDL、LDL、TP、TT),作為協變量,疾病狀態作為因變量,應用向后步進法(似然比)構建二元logistic模型,定義為模型2。
利用MedCalc version 15.8對2個模型進行了ROC曲線分析,計算AUC、約登指數(Youden index)、靈敏度、特異度,以評估基于相關生物學參數所構建的logistic模型是否能有效地區分MCD和其他腎臟疾病患者。根據約登指數的閾值,預測疾病的狀態,并據此分別計算2個模型的準確度,對比模型效果。
為評估相關生物學參數是否能有效地區分MCD和其他腎臟疾病患者,我們對28項生物學參數進行ROC曲線分析。如圖1所示,0.50 圖1 生物學參數ROC曲線分析分布圖 本文將AUC>0.70作為生物學參數可以滿足建模的篩選條件,來構建二元logistic模型,包括白蛋白(AUC=0.821)、總膽固醇(AUC=0.800)、血漿纖維蛋白原(AUC=0.706)、高密度脂蛋白(AUC=0.747)、低密度脂蛋白(AUC=0.777)、總蛋白質(AUC=0.824)、凝血酶時間(AUC=0.804)。 為建立MCD及其他腎病的分類模型,將相關生物學參數作為協變量,疾病狀態作為因變量,應用向后步進法(似然比)構建二元logistic模型。 在模型1中,將CH、HDL、LDL、TT、FIB作為協變量。 CH(P<0.001)和TT(P<0.001)是MCD的危險因素。見表1。 表1 兩自變量的多重logistic回歸分析 包括CH和TT在內的分類方程如下: 在模型2中,將所有滿足建模條件的生物學參數(AUC>0.70,P<0.001),包括ALB、CH、FIB、HDL、LDL、TP、TT作為協變量。 其中CH(P=0.038)、HDL(P=0.035)和TT(P=0.001)是MCD的危險因素,TP(P<0.001)是MCD的保護因素。見表2。 表2 4個自變量的多重logistic回歸分析 包括CH、HDL、TP與TT在內的分類方程如下: 為評估基于相關生物學參數所構建的logistic模型是否能有效地區分MCD和其他腎病患者,對基于預測概率的logistic回歸分析結果進行ROC曲線分析。模型1的ROC曲線分析結果如圖2所示,與Zhu等的研究結果一致[5]。 圖2 模型1的ROC曲線分析 模型2的ROC曲線分析結果如圖3所示。 圖3 模型2的ROC曲線分析 模型1最佳截斷點處的約登指數為0.528,靈敏度為82.98%,特異度為69.83%,此處相關標準為0.038 3,意指若PRE1>0.038 3,則判定為MCD患者,反之為其他腎臟疾病患者。模型2最佳截斷點處的約登指數為0.617,靈敏度為80.43%,特異度為81.31%,此處相關標準為0.073 5,意指若PRE2>0.073 5,則判定為MCD患者,反之為其他腎臟疾病患者。見表3。 表3 模型1與模型2的ROC曲線分析結果比較 根據“最佳”截斷點處約登指數的相關標準,預測疾病的狀態,并據此分別計算2個模型對MCD診斷的準確度。擁有4個生物學參數的模型2的準確度高于僅使用2個生物學參數的模型1的準確度。 MCD是特發性NS的主要病因。其中兒童特發性NS中,絕大部分都是MCD[6],而且發病迅速。在成人中,情況要復雜得多,MCD是特發性NS的第三大原因,僅次于局灶性節段性腎小球硬化和膜性腎病[2]。從臨床表現上看,MCD的特點是低蛋白血癥、高脂血癥、蛋白尿和水腫[7]。從組織學上看,MCD的免疫熒光染色通常是陰性的,而MCD的特點是足細胞內的足突融合,但只有通過電子顯微鏡才能檢測到。目前MCD的發病機制并不清晰[8]。但研究成果尚不能提出具有臨床應用價值的MCD診斷方法,以替代具有有創缺陷的腎活檢穿刺術。 Zhu等[5]構建的用以診斷MCD的“CH+TT”診斷模型的AUC為0.827,靈敏度為82.98%,特異度為69.83%。該模型的效果有待加強。作者過度地簡化了生物學參數的數量弱化了模型的實際應用潛能,忽略了部分校正AUC絕對值大于0.70的生物學參數,從而導致所構建的二元logistic模型并不完善。因此,我們基于同樣的臨床患者數據,將滿足條件(AUC>0.70,P<0.001)的生物學參數悉數納入,重構該二元logistic模型。本研究納入4個生物學參數的診斷模型與原來的僅包括2個生物學參數的診斷模型均可用于MCD的分類診斷。新的診斷模型更值得在臨床上嘗試應用。 值得注意的是,MCD是一種典型的兒童疾病,占兒童原發性NS病例的絕大多數[9]。而且,在發病過程中,兒童和青年人臨床特征是水腫,這是誘導父母尋求健康護理的主要臨床癥狀;而大于60歲的成人的臨床特征往往是出現腎功能損傷或高血壓[10-11]。因此,在成年人中,可逆性急性腎衰竭患者(可能與較高的蛋白尿水平有關)的發病率要高于兒童[8,12]。此外,在發病時,由于高凝狀態、血脂升高和血濃度升高而引起的血栓并發癥,在成年人中的比例更高,而且發病率更為穩定[8]。而本研究的MCD診斷數學模型包含參數分別是總膽固醇、高密度脂蛋白、總蛋白質以及凝血酶時間,這4個參數的臨床意義明顯與成年人的臨床特征更為契合,本模型更加適用于成年人群體,對于兒童和青少年患者,應謹慎使用本模型。
2.2 logistic模型構建


2.3 模型評價



3 討論