孟曉琳,潘越,崔景景,孫樹偉,周暉,王瑞民*
1.解放軍總醫(yī)院第一醫(yī)學(xué)中心核醫(yī)學(xué)科,北京 100853;2.聯(lián)影智能醫(yī)療科技有限公司,北京 100094;*通信作者 王瑞民wrm@yeah.net
彌漫性大B 細(xì)胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)是非霍奇金淋巴瘤中最常見的類型,約占30%~40%[1]。其中50%~60%的患者通過基于利妥昔單抗的治療方案R-CHOP得到有效緩解,但部分患者仍會(huì)發(fā)展為難治/復(fù)發(fā)類型,預(yù)后差[2-3]。因此,及早準(zhǔn)確識(shí)別此類患者并制訂個(gè)體化治療方案是提高預(yù)后生存的關(guān)鍵。國際預(yù)后指數(shù)(international prognostic index,IPI)是目前應(yīng)用最廣泛的預(yù)后預(yù)測評(píng)分[4],但仍有不良預(yù)后無法準(zhǔn)確識(shí)別。為彌補(bǔ)這一局限性,臨床上將18F-FDG PET/CT作為預(yù)后評(píng)估和治療的常規(guī)工具[2]。PET/CT的常用代謝參數(shù),如標(biāo)準(zhǔn)化攝取值、腫瘤代謝體積(metabolic tumour volume,MTV)、總糖酵解量(total lesion glycolysis,TLG)等,在多種疾病的診療過程中具有應(yīng)用價(jià)值[5-7],但在反映腫瘤異質(zhì)性方面的能力有限。人工智能飛速發(fā)展衍生出的影像組學(xué)技術(shù)可以從定量醫(yī)學(xué)成像中提取反映腫瘤異質(zhì)性的潛在特征,并提供一種有效的方法對(duì)患者進(jìn)行風(fēng)險(xiǎn)分層和輔助制訂治療決策[8],有望彌補(bǔ)臨床指標(biāo)及PET/CT常用代謝參數(shù)的不足。
隨著多種新型藥物的問世,通過影像資料對(duì)患者重新進(jìn)行危險(xiǎn)分層并精準(zhǔn)治療的研究層出不窮,本課題組既往通過傳統(tǒng)臨床、影像資料建立模型[9],為了更好地改善DLBCL患者預(yù)后,本研究擬探討DLBCL患者治療前18F-FDG PET/CT影像組學(xué)特征對(duì)無進(jìn)展生存期(progression free survival,PFS)及總生存期(overall survival,OS)的預(yù)測價(jià)值,并分析影像組學(xué)特征、代謝參數(shù)和臨床因素構(gòu)建聯(lián)合模型的增益效能。
1.1 研究對(duì)象 回顧性分析2016年1月—2018年12月解放軍總醫(yī)院第一醫(yī)學(xué)中心135例DLBCL患者治療前的18F-FDG PET/CT資料。男66例,女69例,年齡14~89歲,平均(55.0±15.4)歲。納入標(biāo)準(zhǔn):經(jīng)病理證實(shí)為DLBCL;經(jīng)一線化療方案R-CHOP(利妥昔單抗+環(huán)磷酰胺+長春地辛+多柔比星+潑尼龍)治療;治療前行18F-FDG PET/CT。排除標(biāo)準(zhǔn):臨床或影像學(xué)數(shù)據(jù)集不完整;合并或既往有其他癌癥類型;不能配合臨床隨訪。
收集患者性別、年齡、病理Hans分型、美國東部腫瘤協(xié)作組(eastern cooperative oncology group,ECOG)評(píng)分[9]、乳酸脫氫酶、結(jié)外病變個(gè)數(shù)、B癥狀(在排除其他原因后,患者體溫≥38℃且持續(xù)3 d以上、盜汗、6個(gè)月內(nèi)體重降低>10%)、Ann Arbor分期[10]、IPI評(píng)分[4]等臨床資料。本研究經(jīng)本院醫(yī)學(xué)研究倫理審查委員會(huì)批準(zhǔn)(〔2007〕臨審第029號(hào)),受試者均知情同意。
采用電話和(或)門診隨訪,每6個(gè)月1次,直到患者死亡或研究截至2023年6月。PFS定義為首次治療至第一次復(fù)發(fā)、進(jìn)展、任何原因死亡或最后一次隨訪的時(shí)間。OS定義為首次治療至任何原因死亡或最后一次隨訪的時(shí)間。
1.2 PET/CT 使用GE Discovery 710 和Siemens Biograph 64 TruePoint PET/CT。患者空腹4~6 h,靜脈注射18F-FDG 4.44~5.55 MBq/kg后采集圖像。掃描范圍為顱頂至大腿根部,PET發(fā)射掃描均為2 min/床位。CT圖像掃描參數(shù):管電壓120 kV,管電流100 mA,螺距1 mm。圖像經(jīng)迭代法重建后獲得冠狀位、矢狀位和橫斷面圖像(圖1)。

圖1 男,64歲,ⅣB期DLBCL,18F-FDG PET/CT顯像
1.3 影像組學(xué)流程及方法 使用uAI Research Portal軟件(上海聯(lián)影智能醫(yī)療科技有限公司)。先使用標(biāo)準(zhǔn)化攝取值閾值分割工具半自動(dòng)生成PET圖像的感興趣區(qū)(ROI),再由2名分別有8年(醫(yī)師1)和5年(醫(yī)師2)工作經(jīng)驗(yàn)的核醫(yī)學(xué)科醫(yī)師進(jìn)行手動(dòng)調(diào)整,盡可能標(biāo)注患者所有淋巴瘤病灶作為ROI。使用該軟件組學(xué)模塊提取影像組學(xué)特征,同時(shí)測量并計(jì)算每例患者PET圖像的MTV、TLG。將135例患者以8∶2隨機(jī)分為訓(xùn)練集108例與測試集27例,再將訓(xùn)練集以8∶2分為訓(xùn)練集86例和驗(yàn)證集22例進(jìn)行模型構(gòu)建,使用測試集進(jìn)行模型的獨(dú)立測試。使用Z分?jǐn)?shù)歸一化方法對(duì)識(shí)別出的特征進(jìn)行標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化后的數(shù)據(jù)符合正態(tài)分布。用單因素COX回歸及最小絕對(duì)收縮選擇算子回歸算法進(jìn)行特征篩選。將篩選出的特征乘以相應(yīng)加權(quán)系數(shù)后,求和計(jì)算影像組學(xué)評(píng)分(Radscore)。
1.4 模型構(gòu)建 利用Radscore建立影像組學(xué)模型。將臨床指標(biāo)及傳統(tǒng)代謝參數(shù)(年齡、乳酸脫氫酶、B癥狀、ECOG、Ann Arbor分期、結(jié)外病變個(gè)數(shù)、MTV、TLG)納入單因素及多因素COX回歸分析,得到預(yù)測DLBCL預(yù)后的獨(dú)立因子并構(gòu)建傳統(tǒng)模型。結(jié)合臨床指標(biāo)、傳統(tǒng)代謝參數(shù)及Radscore建立聯(lián)合模型。為量化模型的判別性能,使用來自訓(xùn)練集的公式和cut-off值在驗(yàn)證集及測試集中分別進(jìn)行內(nèi)部及外部測試。
1.5 統(tǒng)計(jì)學(xué)分析 采用R 4.3、SPSS 26.0軟件。訓(xùn)練組、驗(yàn)證組及測試組的臨床信息差異采用χ2檢驗(yàn)。采用單因素、多因素Cox回歸分析確定OS和PFS的獨(dú)立預(yù)測因素。通過受試者工作特征(ROC)曲線確定Radscore判斷終點(diǎn)事件發(fā)生的cut-off值,并通過曲線下面積(AUC)評(píng)價(jià)其區(qū)分度。用Kaplan-Meier法行生存分析,基于Log-rank檢驗(yàn)判斷兩組的生存率差異。計(jì)算C-index、繪制時(shí)間依賴的ROC曲線、決策曲線(DCA)驗(yàn)證預(yù)測模型的效能。通過Delong檢驗(yàn)比較不同模型C-index的差異。基于最佳模型繪制列線圖及校準(zhǔn)曲線觀察預(yù)測結(jié)果與實(shí)際情況的符合程度。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 臨床資料 訓(xùn)練集、驗(yàn)證集及測試集患者基線資料差異均無統(tǒng)計(jì)學(xué)意義(P>0.05),見表1。隨訪后59例患者疾病復(fù)發(fā)或進(jìn)展,40例患者在中位隨訪時(shí)間(70個(gè)月)后死亡,發(fā)生進(jìn)展和死亡的比例分別為43.7%(59/135)和40.0%(54/135)。

表1 訓(xùn)練集、驗(yàn)證集、測試集患者臨床資料比較(例)
2.2 影像組學(xué)特征提取、篩選及Radscore構(gòu)建 對(duì)患者的PET圖像進(jìn)行影像組學(xué)特征提取,獲得2 264種特征,最后篩選出與OS相關(guān)的10個(gè)影像組學(xué)特征及與PFS相關(guān)的6個(gè)影像組學(xué)特征。分別計(jì)算Radscore,即特征和系數(shù)乘積之和。
ROC曲線分析顯示OS和PFS的Radscore在訓(xùn)練集的cut-off值均為-0.119,敏感度分別為0.886、0.806;特異度分別為0.843、0.800;AUC分別為0.919、0.873;且測試集、驗(yàn)證集的AUC均在0.75以上。按上述cut-off值分組,結(jié)果顯示高、低風(fēng)險(xiǎn)組患者死亡(進(jìn)展)情況差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖2、3。

圖3 DLBCL患者OS不同Radscore的生存曲線。A:訓(xùn)練集;B:驗(yàn)證集;C:測試集
2.3 單變量和多因素分析 單因素分析顯示,傳統(tǒng)預(yù)后因素中年齡、B癥狀、乳酸脫氫酶、ECOG評(píng)分、結(jié)外病變個(gè)數(shù)、分期、IPI評(píng)分、MTV、TLG與PFS和OS相關(guān)。將以上預(yù)后因素納入多因素分析中,得出IPI評(píng)分、TLG與DLBCL預(yù)后獨(dú)立相關(guān),見表2、3。

表2 DLBCL患者PFS的單因素及多因素COX回歸分析

表3 DLBCL患者OS的單因素及多因素COX回歸分析
2.4 預(yù)測模型構(gòu)建及評(píng)估 將多因素分析中的獨(dú)立預(yù)測因子(IPI評(píng)分、TLG)構(gòu)建傳統(tǒng)因素模型,Radsocre構(gòu)建Radscore模型,結(jié)合前2個(gè)模型中所有因素構(gòu)建聯(lián)合模型。
對(duì)于PFS和OS,在訓(xùn)練集中,聯(lián)合模型的C-index值分別為0.847、0.869,與傳統(tǒng)模型(0.818、0.833)和Radscore模型(0.802、0.848)相比差異無統(tǒng)計(jì)學(xué)意義,見表4、圖4。各模型預(yù)測1、3、5年P(guān)FS的C-index分別為:傳統(tǒng)模型:0.87、0.91、0.91;Radscore模型:0.86、0.87、0.88;聯(lián)合模型:0.90、0.93、0.94,其中Radscore模型與聯(lián)合模型(P=0.160、0.032、0.043)、傳統(tǒng)模型和聯(lián)合模型(P=0.212、0.036、0.034)預(yù)測3、5年P(guān)FS的C-index差異有統(tǒng)計(jì)學(xué)意義(Z=0. 962 1~2.133 3)。各模型預(yù)測1、3、5年OS的C-index分別為:傳統(tǒng)模型:0.82、0.88、0.90;Radscore模型:0.85、0.88、0.90;聯(lián)合模型:0.87、0.91、0.94,其中Radscore模型與聯(lián)合模型(P=0.578、0.040、0.027)預(yù)測3、5年OS的C-index差異有統(tǒng)計(jì)學(xué)意義,傳統(tǒng)模型和聯(lián)合模型(P=0.024、0.037、0.025)預(yù)測3個(gè)時(shí)段OS的C-index差異有統(tǒng)計(jì)學(xué)意義(Z=2.050 6~2.253 9)。DCA分析顯示,在對(duì)PFS和OS的預(yù)測中,聯(lián)合模型的凈收益均最大,見圖5。

表4 訓(xùn)練集、驗(yàn)證集、測試集C-index(95% CI)結(jié)果

圖4 AUC對(duì)比3種模型的預(yù)測效能。A:PFS;B:OS

圖5 3種模型的決策曲線分析。A:PFS;B:OS
2.5 預(yù)測列線圖的建立與驗(yàn)證 根據(jù)聯(lián)合模型構(gòu)建列線圖(圖6),校準(zhǔn)曲線見圖7。該列線圖對(duì)PFS和OS的實(shí)際觀測值與真實(shí)值一致性良好。

圖6 聯(lián)合模型預(yù)測DLBCL患者預(yù)后列線圖。A:PFS;B:OS

圖7 校準(zhǔn)曲線驗(yàn)證列線圖的效能。A:PFS;B:OS
3.1 傳統(tǒng)指標(biāo)對(duì)DLBCL預(yù)后的預(yù)測 IPI是結(jié)合系列的臨床參數(shù)(年齡、分期、結(jié)外病變數(shù)量、ECOG、乳酸脫氫酶)而建立的評(píng)分系統(tǒng),是應(yīng)用最廣泛的DLBCL預(yù)后評(píng)分系統(tǒng)[11]。多項(xiàng)研究證明IPI是預(yù)后的獨(dú)立預(yù)測指標(biāo)[12],與本研究結(jié)果一致。影像評(píng)估研究中,MTV和TLG等基于PET傳統(tǒng)定量參數(shù),反映腫瘤的代謝負(fù)荷,可作為DLBCL的預(yù)后生物標(biāo)志物提供額外的重要信息[13-15]。既往研究表明MTV、TLG是預(yù)后的獨(dú)立預(yù)測因素[16-17],本研究也證明TLG是獨(dú)立預(yù)后因素,而未得出MTV是獨(dú)立預(yù)后因素,可能是勾畫ROI的方式不同所致。
3.2 Radscore有效預(yù)測DLBCL患者預(yù)后 隨著影像組學(xué)的發(fā)展,從醫(yī)學(xué)圖像中提取的影像組學(xué)特征能夠在腫瘤細(xì)胞和遺傳水平提供關(guān)于腫瘤異質(zhì)性的額外信息[18]。PET圖像影像組學(xué)對(duì)DLBCL預(yù)后的預(yù)測價(jià)值目前已有一定數(shù)量的研究。Aide等[19]評(píng)估132例DLBCL患者預(yù)處理PET影像組學(xué)特征預(yù)測預(yù)后的能力,發(fā)現(xiàn)長區(qū)域高灰度強(qiáng)調(diào)是2年無事件生存的唯一獨(dú)立預(yù)測因子(HR=2.84),AUC=0.76。Lue等[20]從171例DLBCL患者中提取80個(gè)基于PET的放射組學(xué)特征,發(fā)現(xiàn)灰度游走矩陣與PFS(HR15.7)和OS(HR8.64)獨(dú)立相關(guān)。上述研究僅針對(duì)某一影像組學(xué)特征與DLBCL患者預(yù)后生存的關(guān)系進(jìn)行分析,最新研究顯示,利用Radscore對(duì)DLBCL患者進(jìn)行預(yù)后預(yù)測能夠得到更好的結(jié)果[21-22]。因此,本研究選取多個(gè)影像組學(xué)特征構(gòu)建Radscore并勾畫DLBCL患者絕大多數(shù)病灶。經(jīng)ROC曲線評(píng)估Radscore具有較好的區(qū)分度。基于ROC曲線得出的cut-off值對(duì)訓(xùn)練組進(jìn)行危險(xiǎn)分層,Kaplan-Meier曲線顯示高、低危組生存情況有顯著差異。因此,本研究構(gòu)建的Radscore有望成為改善DLBCL患者預(yù)后的有力指標(biāo)。
3.3 模型構(gòu)建與列線圖的繪制 本研究不僅包括大多數(shù)研究訓(xùn)練集訓(xùn)練模型及驗(yàn)證集調(diào)整參數(shù)的模型建立過程[20,23],還增加了測試集進(jìn)行外部測試,且測試結(jié)果較好,驗(yàn)證了模型的準(zhǔn)確度。本研究構(gòu)建的3組模型中,聯(lián)合模型對(duì)3、5年P(guān)FS及OS的預(yù)測性能均優(yōu)于傳統(tǒng)模型、Radscore模型,再次肯定了Radscore的增益作用。DCA結(jié)果也顯示聯(lián)合模型臨床凈收益最大。本研究結(jié)果表明聯(lián)合模型更適合預(yù)測個(gè)體生存,顯示了影像組學(xué)特征對(duì)DLBCL預(yù)后預(yù)測的增益作用。基于聯(lián)合模型繪制列線圖,其中包括IPI評(píng)分、TLG、Radscore 3個(gè)指標(biāo),每個(gè)指標(biāo)的賦值均對(duì)應(yīng)頂部的分值,3個(gè)指標(biāo)相加的總分值對(duì)應(yīng)底部預(yù)測1、3、5年的生存或進(jìn)展情況。利用校準(zhǔn)曲線驗(yàn)證列線圖對(duì)預(yù)測值與實(shí)際值的一致性,結(jié)果表明對(duì)3、5年生存或進(jìn)展情況的預(yù)測效果較好,而對(duì)1年的預(yù)測效果差,這可能是數(shù)據(jù)量較少所致。
3.4 本研究的局限性 由于為回顧性分析,存在選擇偏倚;在單中心數(shù)據(jù)的基礎(chǔ)上建立模型并進(jìn)行驗(yàn)證,缺乏外部模型驗(yàn)證,未來需在多中心研究中進(jìn)一步探索;DLBCL分子生物、基因?qū)W研究進(jìn)展對(duì)于預(yù)后評(píng)估及潛在發(fā)現(xiàn)新的治療靶點(diǎn)至關(guān)重要,如雙、三打擊淋巴瘤等預(yù)后不良類型的影像組學(xué)評(píng)估[24],有待進(jìn)一步研究[25]。總之,本研究系統(tǒng)分析了影像組學(xué)特征構(gòu)建的Radscore模型預(yù)測DLBCL患者生存結(jié)果的效能,結(jié)合Radscore的聯(lián)合模型為DLBCL患者預(yù)后評(píng)估起到增益作用。其中基于聯(lián)合模型繪制的列線圖有望成為一種簡單、方便的評(píng)估方法,可以應(yīng)用到臨床實(shí)踐中,有助于患者個(gè)體化治療方案的制訂。