999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于現實世界研究中臨床隨訪數據的兩種動態預測建模方法的實證研究

2021-11-15 07:58:00尤東方黃麗紅魏朝暉
中國臨床醫學 2021年5期
關鍵詞:模型

楊 鋒, 陳 欣, 尤東方, 黃麗紅, 魏朝暉, 趙 楊,6*

1. 南京醫科大學公共衛生學院生物統計學系,南京 211166 2. 嘉興泰格數據管理有限公司,嘉興 314000 3. 南京醫科大學醫學大數據中心,南京 210000 4. 復旦大學附屬中山醫院生物統計室,上海 200032 5. 杭州泰格醫藥科技股份有限公司,杭州 310000 6. CSCO生物統計學專家委員會RWE項目組

現實世界研究(real-world study, RWS)中一種常見的研究方式是回顧性隊列研究。近年來,隨著電子信息化系統的不斷完善及大型專病隊列的不斷建立,這類研究開展得越來越廣泛。患者按照一定的時間間隔接受診療,從而產生了臨床隨訪數據。例如,重癥肺炎患者在ICU住院期間,每天都會進行若干次實驗室檢查,總計可達十余次;腫瘤患者術后,遵醫囑定期隨訪,每次也會獲得腫瘤標志物以及影像學檢查的結果。再以健康體檢為例,體檢者每年在相對固定的時間前往體檢中心,采血后對血常規、血生化及腫瘤標志物等實驗室指標進行測量,若受試者十余年來在同一體檢中心,則可積累十余次檢驗結果等。

除了采用生存分析分析結局事件的影響因素外,這類隨訪數據可用于建立臨床預測模型。所謂臨床預測模型,是指以年齡、性別及生物標志物等預測因素為條件,對某個體的疾病風險或某結局事件發生的可能性進行估計[1]。一般而言,臨床預測模型的建立需要通過變量篩選、模型建立、模型驗證、校準和模型表達等階段。例如,Hu等[2]報道了血漿微小RNA表達譜與非小細胞肺癌(non-small cell lung cancer, NSCLC)患者生存期的關系,首先將30例長生存期及30例短生存期NSCLC患者作為發現階段樣本,最終篩選出了4個差異表達的微小RNA。第二階段,選擇120例NSCLC受試者作為訓練集,利用發現階段選出的位點,基于Cox比例風險模型,最終建立的危險度得分模型能較好地區分長生存期和短生存期NSCLC患者。這種基于隨訪開始時的特征建立模型,對未來一段時間內的結局事件進行預測,稱為靜態預測。

近年來,醫學工作者越來越關心,如何充分利用疾病發生發展過程中具有預測價值的指標的動態變化,尤其是專病隊列、醫療大數據中不斷累積的隨訪數據,來對被觀察個體在未來某個時間段內是否發生感興趣的終點事件進行預測。例如,Kurtz等[3]利用腫瘤標志物的序貫變化來預測乳腺癌預后。He等[4]利用血小板相關實驗室指標的動態變化軌跡預測重癥肺炎患者預后。同時,臨床醫生常關注給定條件下觀察對象發生某種事件的概率。例如,若某腫瘤患者術后已存活3年,他再存活5年的概率有多大?即所謂的動態風險預測。

本研究將介紹如何通過界標法和聯合建模法,利用縱向歷史數據對未來結局進行動態預測,并以現實案例數據動態預測患者死亡風險的實證研究來探討2種方法的實際應用價值。

1 資料與方法

1.1 案例數據來源 案例數據來源于Yan等[5]于2020年1月10日至2月18日,在某醫院收集的375例某型肺炎患者的社會人口學信息及住院期間多次實驗室測量指標。375例患者中,包括197例普通患者、27例重癥患者和151例危重患者,其中男性占59.7%,患者平均年齡為58.83歲。375例患者中位隨訪時間為11 d,最長隨訪時間為35 d,最終201例(53.6%)患者存活。因部分患者數據缺失,最終分析使用了358例患者的數據。本研究所用數據可從https://www.nature.com/articles/s42256-020-0180-7#MOESM3下載。

Yan等[5]采用XGBoost機器學習算法,利用最后一次患者實驗室指標測量值,從數十個實驗室指標中,篩選了乳酸脫氫酶(LDH)、淋巴細胞百分比和高敏C-反應蛋白(hs-CRP)3個與預后密切相關的指標,建立預測模型。因此,本研究直接采用文獻[5]篩選所得的3個指標進行建模分析,分別使用界標法和聯合建模法預測患者條件生存概率,界標時間點分別為第5天、第10天和第15天。

1.2 基于界標法的動態預測 對于動態預測,一種典型的方法是由van Houwelingen等[6]提出的界標法。在使用界標法時,需首先將整個時間尺度,按照若干個界標時間點,劃分為若干個時間段。界標點的選擇可以按照醫學知識來確定,例如腫瘤術后1年、3年、5年等。令i代表個體,j代表訪視,對于某個界標時間點k,對此時仍處于觀察中的個體(即在上一個時間段沒有發生死亡這一結局事件,也未刪失),利用截止到時間點k的縱向數據以及基線特征信息, 擬合Cox比例風險模型為hik(t)=hk,0(t)exp(γ1Xi+γkYik)。

模型中,納入預測因子Y位于界標點k的變量值Yk,也可直接將k之前的Y以時依協變量的形式納入,X表示基線協變量。基于所建立Cox模型,可對于在k時刻尚處于觀察中的個體i,對在界標點k后一段時間內(k,t)的條件生存率進行估計,即πi(t|k)=P(Ti*≥t|Ti*>k,Yi(k),X),其中,t>k。

1.3 基于聯合建模的動態預測 聯合建模充分利用整個隨訪過程中的數據[7],其基本特征是縱向重復測量和生存數據同時建模。聯合模型一般可分解為2個子模型,最常見的是將縱向測量值的混合效應模型和生存結局的Cox比例風險模型通過共享(shared)隨機效應進行連接:

(1)Yij(t)=Y*i(t)+εij=βXij+BiWij+εij

(2)hi(t|Ki,Y*i(t))=h0(t)exp(γ1Ki+γ2Y*i(t))

以LDH為例,(1)式首先建立了一個描述了整個隨訪過程中受試者i的LDH隨時間變化,同時受其他因素影響的混合效應模型。其中,β為固定效應,體現了具有不同特征(X)的人之間在LDH上的平均差異;Bi為隨機效應,服從于均數為0的正態分布,體現了因素Wij(可以是時間或者其他因素)對LDH的影響在人與人之間存在不同。另外,混合效應模型中也包括了隨機誤差ε。基于模型(1),可將每個時間點上的Y*重新預測出來,再以預測出的預測因子Y*及其他變量,擬合(2)式中時依Cox比例風險模型,對某個界標時間之后一段時間內的死亡概率或累積生存率進行估計。聯合建模的參數估計可采用限制性極大似然法完成(restricted maximum likelihood method, REML)。

本研究案例數據分析研究中首先利用混合效應模型,在調整了年齡和性別影響后,擬合LDH、hs-CRP和淋巴細胞百分比3個預測因子的時間變化估計,然后將其與Cox模型聯合,利用聯合模型分別估計患者第5天、第10天和第15天后的條件生存概率。

1.4 分析步驟 統計分析使用R軟件完成,并需要安裝survival、survivalROC、survminer、JMbayes等幾個R軟件包。界標法和聯合建模法的分析步驟見圖1。

圖1 2種動態建模方法的分析步驟

1.4.1 界標法動態預測分析步驟 (1)首先整理數據,按照隨訪次數將某一個觀察對象的記錄轉換為若干行;(2)當選擇界標時間為第5天時,只需要選擇在該時間點仍然存活患者的第5天及以前的數據進行分析,擬合Cox回歸,其他界標時間對應的分析以此類推;(3)估計時間依賴的AUC。

1.4.2 聯合建模法動態預測分析步驟 (1)整理數據;(2)先分別建立LDH、hS-CRP和Lymphocyte與時間的混合效應模型,并納入年齡、性別等基線因素,其中時間為隨機效應,嵌套于個體中;(3)建立Cox比例風險模型;(4)使用JMBayes提供的函數,進行聯合建模;(5)進行模型預測。

2 結 果

2.1 案例數據特征分析 對上述某型肺炎預后數據進行分析發現:(1)在分析數據集包含的358例患者中,共計163例(45.53%)出現了死亡這一結局事件,剩余195例(54.47%)未死亡;(2)死亡患者中,中位死亡時間為6 d,而未死亡患者中,中位觀察時間為14 d;(3)患者最多進行了13次觀察,平均觀察次數為5次。

2.2 預后動態預測效果對比 2種方法所建立模型的受試者工作特征曲線下面積(AUC)表明,當界標點取第5天、第10天、第15天時,界標法對某肺炎患者未來死亡風險的預測精度略好于聯合建模法(表1)。

表1 界標法和聯合建模法的預測結果對比

動態預測可對每個個體在各個界標時間預測其未來某時間點發生結局事件的概率。以患者a(第5天死亡)、患者b(第10天死亡)和患者c(存活)為例,分別在患者a第1天、第5天,患者b的第1天、第5天和第9天及患者c的第1天、第6天和第10天預測其未來生存概率。橫軸表示患者隨訪時間,縱軸為患者的預測生存概率,藍色虛線和黃色點劃線分別為聯合建模法和界標法的預測結果(圖2)。患者a的死亡風險一直較高(圖2);患者b在存活10 d后死亡風險增加(圖2),表現為生存概率的明顯下壓;而患者c的死亡風險一直較小。

3 討 論

隨著國家對臨床專病隊列投入的不斷增加及電子病歷系統的廣泛應用,采用回顧性隊列研究形式的現實世界數據不斷產生。如何基于這類縱向數據,對疾病結局進行預測成為研究者所關注的問題。傳統的預測模型往往基于基線的生物學標志物和環境因素,對未來結局發生的可能性進行預測。近年來,研究者開始關注如何使用動態變化的歷史數據進行預測。基于不斷變化的數據,理論上應當比只使用基線的數據更為準確[8]。同時,動態預測模型可回答醫學工作者在臨床實踐中經常提出的問題,例如,若受觀察對象已暴露于空氣污染10年,他在未來10年發生心血管疾病的風險有多高?以“dynamic risk prediction”、“dynamic risk model”或“dynamic risk assessment”為關鍵詞在Pubmed進行搜索,自2001年以來共有25 000余篇,而2015年之后就有約15 000篇。不難想象,隨著大量基于電子病歷的現實世界研究和大型隊列研究的進一步開展和數據共享機制的不斷完善,動態預測模型也將得到越來越廣泛的應用。

隨著個體化醫療的發展,為臨床醫生提供有效、有力的工具來動態估計個體一定時間內的生存概率,有助于為患者規劃特定的最佳治療時間和治療策略。本研究對界標法和聯合建模法進行了實證研究,這兩種動態預測法均可較為便利地用于縱向實驗室指標的預測建模。兩者的主要區別在于對界標點前的數據利用方式不一樣。界標模型只將在界標時間點仍然存活的研究對象以及該時間點之前的變量測量信息(包括該時間點)納入分析。聯合建模法則主要是通過擬合預測因子的縱向變化軌跡,利用隨機效應將其與生存模型連接起來。

對于界標法,模型中既可納入預測因子位于界標點的變量值,也可直接將界標點之前的變量值以時依協變量的形式納入。也有學者提出,可直接將界標時間點之前所測量的預測因子采用某種方式整合成一個值。整合的方式有多種,最簡單一種是選擇最接近界標時間點的測量值。也可以先擬合一個在界標點之前預測因子隨時間變化的模型,預測該預測因子在界標時間點的取值。另外,也可借助于軌跡分析的思路[9],將患者界標點前的縱向測量結果轉換為一條軌跡,再用軌跡代替原測量結果進行建模。

聯合建模法可以用于隊列和臨床隨訪數據中存在測量誤差的情形。以腎功能不全患者的隨訪研究為例,利用肌酐等指標估計出的估計腎小球濾過率(eGFR)和利用同位素測量的GFR不一定恰好相等。這種測量誤差可能導致回歸“稀釋”偏倚,即因帶有測量誤差的自變量導致回歸系數向0偏倚[10]。聯合建模法利用混合效應模型,借用其他測量信息,考慮測量誤差,對界標點的暴露變量進行預測,在一定程度上校正了這種偏倚。此外,基于聯合建模的動態預測模型可以與機器學習方法緊密結合,獲得更為豐富的結論與精確的結果。例如,Chen等[11]基于近2 000例的新型冠狀病毒肺炎患者的預后數據,首先使用機器學習方法篩選了11個生物學標志物,利用聯合建模,在訓練集和2個驗證集中分別獲得了98.3%、96.5%和98.4%的AUC。此外,聯合建模法也可與軌跡分析、平滑模型等方式結合,獲得更為靈活的結果。

基于臨床隨訪數據建立預測模型時,不管是界標法還是聯合建模法,都有“變量篩選”的過程,即基于統計學方法或專業知識,選擇具有預測價值的指標進入預測模型。有部分學者認為,預測模型所納入的預測因子,應當是與結局存在因果關系的因子。但本研究認為,尋找“因果關系”的危險因素研究,與建立“預測模型”的預測研究,具有不同的“因果”含義。對于前者,應當盡可能排除已知和未知混雜干擾,并通過一系列敏感性分析展示結果的穩健性。而對于后者,只要變量具有預測價值,哪怕其與結局間不是因果關系,也可以被納入預測模型[12]。例如,攜帶打火機與肺癌是否發生并沒有因果關系,但知道某人習慣性攜帶打火機,卻可以預測其發生肺癌的可能性較大。

變量篩選和模型驗證是臨床預測建模的重要步驟。本研究案例分析中,因篇幅所限,直接使用了原案例建模使用的3個變量,也未進行模型的驗證工作。但在實際臨床預測建模工作中,應當將原樣本分成訓練集和測試集,通過訓練集完成變量篩選和建模工作,并將得到的模型在測試集中進行外部驗證;在樣本量有限時,也可考慮交叉驗證。動態建模中的變量選擇一般較單純基于基線變量的建模更為復雜,因為需要同時將變量的變化趨勢納入考慮,此時的解決方案包括時依Cox比例風險模型[13]、歷史回歸樹[14]等。在實際應用中,研究人員可根據具體數據情況,篩選對結局有預測效能的變量,再選擇合適的方法,建立合理的模型,從而獲得準確和有效的估計。

對于2種動態預測方法,R軟件都給出了相應的程序包。實際上,若僅使用界標法,由于混合效應模型和Cox比例風險模型是分開擬合的,故常規軟件(如SPSS、SAS等)均可使用,但聯合建模法則需一定的編程技巧方能實現。感興趣的讀者可以訪問作者網站(https://zyktz.coding.net/public/ketizudaima/Dynamic_risk_prediction/git/files),獲得分析代碼。

綜上所述,界標法和聯合建模法都可用于現實世界研究的縱向數據分析,這2種動態預測法較傳統的僅基于基線變量的靜態預測法能獲得更為豐富的信息,值得推廣。

利益沖突:所有作者聲明不存在利益沖突。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲一区二区三区麻豆| 国产人人射| 亚洲人成电影在线播放| 国产激情第一页| 天天干伊人| 99久久国产综合精品2020| 久久久久免费精品国产| 91伊人国产| 日韩精品资源| aaa国产一级毛片| 色久综合在线| 久久无码高潮喷水| 国产欧美日韩另类精彩视频| 国产成人久久777777| 亚洲一区二区约美女探花| 亚洲第一中文字幕| 国产香蕉97碰碰视频VA碰碰看| 国产熟女一级毛片| 欧美国产日韩在线播放| 亚洲AⅤ波多系列中文字幕| 999精品免费视频| 午夜国产精品视频| 精品国产自在在线在线观看| 高清欧美性猛交XXXX黑人猛交| 欧美一区精品| 超碰免费91| 亚洲人成网址| 午夜a视频| 亚洲精品国产精品乱码不卞| 狠狠久久综合伊人不卡| 久久永久视频| 成人午夜网址| www.91中文字幕| 国产a v无码专区亚洲av| 国产精品高清国产三级囯产AV| 国产综合色在线视频播放线视| 久久99精品久久久大学生| 日韩一级毛一欧美一国产| 在线a视频免费观看| 91青青视频| 久热中文字幕在线观看| 亚洲,国产,日韩,综合一区| 在线欧美日韩国产| 国产精品亚洲欧美日韩久久| 69免费在线视频| 国产97公开成人免费视频| 高清无码手机在线观看| 97青青青国产在线播放| 日本久久久久久免费网络| 亚洲中文无码h在线观看| 高清久久精品亚洲日韩Av| 国产成人在线无码免费视频| 日韩欧美中文在线| 亚洲欧美自拍一区| 波多野结衣无码AV在线| 国产精品微拍| 国产成熟女人性满足视频| 一级做a爰片久久毛片毛片| 国产一区二区免费播放| 国产免费精彩视频| 亚洲bt欧美bt精品| 国产精品熟女亚洲AV麻豆| 亚洲天堂网站在线| 91精品啪在线观看国产60岁| 波多野结衣中文字幕一区二区| 亚洲欧美精品日韩欧美| 国产麻豆精品在线观看| 日韩精品无码免费专网站| 日韩成人午夜| 97视频在线观看免费视频| av手机版在线播放| 亚洲一级毛片在线观| 最新亚洲av女人的天堂| 精品国产欧美精品v| 国产精品网址在线观看你懂的| www.av男人.com| 中文字幕在线看视频一区二区三区| 国产精品 欧美激情 在线播放 | 2020最新国产精品视频| 欧美一区中文字幕| 亚洲欧美日韩另类在线一| 国产理论一区|