侯 慧,朱銀杏,王太宇,張 翼,劉志鵬
(1.江蘇省泰州市第四人民醫(yī)院 影像科,江蘇 泰州,225300;2.南京醫(yī)科大學(xué)附屬泰州人民醫(yī)院 信息科,江蘇 泰州,225300;3.江蘇省泰州市中醫(yī)院 甲乳外科,江蘇 泰州,225300)
2020年乳腺癌在全球女性惡性腫瘤中的發(fā)病率及病死率均居首位[1]。人表皮生長(zhǎng)因子受體-2(HER-2)陽(yáng)性乳腺癌約占全部乳腺癌的20%~30%,相較于HER-2陰性,HER-2陽(yáng)性乳腺癌復(fù)發(fā)轉(zhuǎn)移率高、預(yù)后差[2]。激素受體(HR)陽(yáng)性乳腺癌是最常見的乳腺癌亞型,占所有乳腺癌的60%~70%[3],其特點(diǎn)是生長(zhǎng)相對(duì)緩慢,總生存期相對(duì)更長(zhǎng)[4],而HR陰性乳腺癌復(fù)發(fā)轉(zhuǎn)移率高、生存率低[5]。目前,主要通過(guò)免疫組化(IHC)和(或)原位熒光雜交(FISH)[6]檢測(cè)HER-2和HR表達(dá)水平,但需手術(shù)或穿刺活檢標(biāo)本,為有創(chuàng)性檢查。因此,臨床急需尋找快速、有效、無(wú)創(chuàng)的方法來(lái)預(yù)測(cè)乳腺癌的HER-2和HR表達(dá)水平。MRI具有無(wú)射線傷害、多方位及多參數(shù)成像、敏感性高等優(yōu)點(diǎn),其在乳腺癌的診斷評(píng)估、術(shù)后復(fù)查中發(fā)揮重要作用[7]。乳腺富含脂肪組織,磁共振T2WI 反轉(zhuǎn)恢復(fù)壓脂(TIRM) 序列使得缺乏脂肪成分的乳腺病灶對(duì)比度增加,可有效提高病變檢出率[8]。擴(kuò)散加權(quán)成像(DWI)序列通過(guò)衡量乳腺細(xì)胞中水分子擴(kuò)散運(yùn)動(dòng)的微觀狀態(tài),檢測(cè)組織細(xì)胞的生理學(xué)改變,間接反映出腫瘤細(xì)胞的侵襲能力。機(jī)器學(xué)習(xí)作為一種高效數(shù)據(jù)處理工具,目前已廣泛應(yīng)用于預(yù)測(cè)模型的構(gòu)建。其中,支持向量機(jī)(SVM)在小樣本訓(xùn)練數(shù)據(jù)上表現(xiàn)較好[9]。故本研究利用TIRM和DWI序列圖像的影像組學(xué)特征,借助SVM算法構(gòu)建乳腺癌HER-2及HR表達(dá)水平的預(yù)測(cè)模型,并評(píng)估模型的性能,篩選出權(quán)重較高的特征,以進(jìn)一步指導(dǎo)個(gè)體化治療。
回顧性收集2015年6月—2023年5月在泰州市人民醫(yī)院、泰州市第四人民醫(yī)院及泰州市中醫(yī)院就診的患者,經(jīng)病理(手術(shù)或穿刺活檢)診斷為乳腺癌。收集乳腺癌患者臨床資料(發(fā)病年齡、病理結(jié)果、免疫組化及原位熒光雜交結(jié)果)及磁共振成像檢查影像資料。納入標(biāo)準(zhǔn):① 乳腺磁共振成像檢查在手術(shù)及穿刺活檢前進(jìn)行者; ② 磁共振成像檢查圖像完整且包含TIRM、DWI序列圖像者; ③ 手術(shù)及穿刺病理結(jié)果明確者; ④ 臨床一般資料、免疫組化及熒光原位雜交結(jié)果完善者。排除標(biāo)準(zhǔn):① 患者磁共振檢查前接受過(guò)治療,如手術(shù)、放化療、內(nèi)分泌治療等; ② 患者有乳腺疾病方面手術(shù)史或其他腫瘤病史; ③磁共振檢查圖像質(zhì)量不佳,如偽影較大,無(wú)法診斷及分析者; ④ 邊界不清的非腫塊樣病灶及長(zhǎng)徑小于1 cm的腫塊樣病灶者。經(jīng)上述納排標(biāo)準(zhǔn),最終入組128個(gè)病灶,其中108例來(lái)自泰州市人民醫(yī)院。按照8∶2的比例采用隨機(jī)分層方法分為訓(xùn)練組及驗(yàn)證組,15例來(lái)自泰州市第四人民醫(yī)院,5例來(lái)自泰州市中醫(yī)院作為外部測(cè)試組。在訓(xùn)練組及驗(yàn)證組中,HER-2陽(yáng)性26例,HER-2陰性82例; HR陽(yáng)性71例,HR陰性37例。在外部測(cè)試組中,HER-2陽(yáng)性6例,HER-2陰性14例; HR陽(yáng)性13例,HR陰性7例。本研究經(jīng)泰州市人民醫(yī)院倫理委員會(huì)批準(zhǔn),倫理批件號(hào)為KY 2023-044-01。
本研究所有乳腺磁共振檢查均在德國(guó)西門子3.0 T超導(dǎo)型磁共振掃描儀上進(jìn)行?;颊咝写殴舱駫呙枨敖?~6 h。患者俯臥于乳腺專用線圈上,身體軸線與檢查床軸線保持一致,將雙側(cè)乳腺分別懸垂于乳腺線圈的2個(gè)凹槽中心內(nèi),掃描過(guò)程持續(xù)20~30 min。掃描平掃序列包括橫斷位TIRM序列、橫斷位T1WI序列、橫斷位DWI序列及左、右乳矢狀位脂肪抑制T2WI序列。
采用ITK-SNAP(版本 3.6.0)軟件在TIRM、DWI原始圖像上手動(dòng)逐層勾畫感興趣區(qū)面積,完成病灶感興趣區(qū)體積的分割。所有病灶的容積感興趣區(qū)(VOI)勾畫均由同一位具有3年乳腺影像診斷經(jīng)驗(yàn)的影像科醫(yī)師在不知道HER-2及HR表達(dá)水平的情況下完成,再由另一位具有20年乳腺影像診斷經(jīng)驗(yàn)的影像科醫(yī)師確認(rèn)。同時(shí)結(jié)合對(duì)照矢狀位脂肪抑制T2WI序列、橫斷位動(dòng)態(tài)對(duì)比增強(qiáng)序列圖像確定腫瘤位置,避開周邊正常乳腺組織、液化壞死區(qū)(見圖1及圖2)。采用Python平臺(tái)開發(fā)的開源軟件包 PyRadiomics(版本 3.0.1),將病灶的原始圖像與勾畫的VOI圖像同時(shí)導(dǎo)入以提取特征。最終,每個(gè)序列分別提取1 321個(gè)影像組學(xué)特征。

患者52歲女性,左乳12點(diǎn)~1點(diǎn)方向差分化癌,HER-2表達(dá)為陰性,HR表達(dá)為陰性。

患者53歲女性,左乳1~2點(diǎn)方向浸潤(rùn)性導(dǎo)管癌,HER-2表達(dá)為陰性,HR表達(dá)為陽(yáng)性。
采用Z-score數(shù)據(jù)標(biāo)準(zhǔn)化處理,以消除所提取的影像組學(xué)特征間的尺度差異。對(duì)提取的特征數(shù)據(jù)集,采用基于支持向量機(jī)的遞歸特征消除法,即SVM-RFE算法篩選出最佳的影像組學(xué)特征。最終,TIRM、DWI、TIRM+DWI模態(tài)分別篩選出10個(gè)最具預(yù)測(cè)性的影像組學(xué)特征。利用降維后的特征,分別構(gòu)建HER-2和HR表達(dá)水平的SVM預(yù)測(cè)模型。
本研究使用5折交叉驗(yàn)證方法保證模型性能的穩(wěn)定性,通過(guò)受試者工作特征(ROC)曲線來(lái)評(píng)估模型的鑒別能力,包括曲線下面積(AUC)、準(zhǔn)確度、靈敏度、特異度、精準(zhǔn)率和f1-score等定量指標(biāo)。使用DeLong檢驗(yàn)評(píng)價(jià)各影像組學(xué)模型AUC之間的差異。采用SHAP算法獲取TIRM、DWI序列的每個(gè)影像組學(xué)預(yù)測(cè)特征的權(quán)重,并按重要性依次排序列出前10位的特征,SHAP值表示每個(gè)特征對(duì)最終預(yù)測(cè)的貢獻(xiàn)程度。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
基于10項(xiàng)影像組學(xué)特征構(gòu)建的TIRM序列圖像的SVM預(yù)測(cè)模型訓(xùn)練組的AUC為0.85(95%CI,0.82~0.88); 驗(yàn)證組的AUC為0.80(95%CI,0.70~0.89)。DWI預(yù)測(cè)模型訓(xùn)練組的AUC為0.88(95%CI,0.80~0.95); 驗(yàn)證組的AUC為0.66(95%CI,0.48~0.84)。聯(lián)合模型訓(xùn)練組的AUC為0.94(95%CI,0.90~0.98); 驗(yàn)證組的AUC為0.90(95%CI,0.81~0.98),見圖3。在驗(yàn)證組中采用Delong檢驗(yàn)比較上述3種模型的性能,TIRM+DWI模型對(duì)HER-2表達(dá)的預(yù)測(cè)效能高于TIRM模型和DWI模型,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見表1。

表1 不同模型評(píng)估乳腺癌HER-2表達(dá)水平的預(yù)測(cè)效能

A:訓(xùn)練組的ROC曲線; B:驗(yàn)證組的ROC曲線; C:測(cè)試組的ROC曲線。
TIRM+DWI模型外部測(cè)試組的AUC為0.89(見圖3),SHAP算法得出DWI_wavelet-HLL_glszm_SmallAreaHighGrayLevelEmphasis特征貢獻(xiàn)較大,其他特征的貢獻(xiàn)程度如圖4所示。

圖4 預(yù)測(cè)HER-2狀態(tài)聯(lián)合模型測(cè)試組的SHAP特征權(quán)重分布峰圖及權(quán)重均值直方圖
基于10項(xiàng)影像組學(xué)特征構(gòu)建的TIRM序列圖像的SVM預(yù)測(cè)模型ROC曲線中訓(xùn)練組的AUC為0.84(95%CI,0.81~0.88),驗(yàn)證組的AUC為0.68(95%CI,0.48~0.88)。DWI序列圖像的SVM預(yù)測(cè)模型訓(xùn)練組的AUC為0.92(95%CI,0.90~0.93),驗(yàn)證組的AUC為0.86(95%CI,0.82~0.91)。聯(lián)合TIRM、DWI序列圖像的SVM預(yù)測(cè)模型訓(xùn)練組的AUC為0.96(95%CI,0.95~0.97),驗(yàn)證組的AUC為0.88(95%CI,0.78~0.98),見圖5。采用Delong檢驗(yàn)比較上述3種模型AUC之間的差異,在驗(yàn)證組中,TIRM+DWI模型(AUC=0.88)、DWI模型(AUC=0.86)對(duì)HR表達(dá)的預(yù)測(cè)效能高于TIRM模型(AUC=0.68),差異有統(tǒng)計(jì)學(xué)意義(P<0.05); TIRM+DWI模型的AUC稍高于DWI模型,但差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),見表2。

表2 不同模型評(píng)估乳腺癌HR表達(dá)水平的預(yù)測(cè)效能

A:訓(xùn)練組的ROC曲線; B:驗(yàn)證組的ROC曲線; C:測(cè)試組的ROC曲線。
TIRM+DWI模型外部測(cè)試組的AUC為0.90(見圖5),TIRM_ wavelet-HHL_glrlm_GrayLevelVariance特征的預(yù)測(cè)貢獻(xiàn)較大,其SHAP權(quán)重均值為0.11(見圖6),高于篩選出的其他9個(gè)特征。

圖6 預(yù)測(cè)HR狀態(tài)聯(lián)合模型測(cè)試組的SHAP特征權(quán)重分布峰圖及權(quán)重均值直方圖
乳腺癌是一種具有高度異質(zhì)性的疾病,不同的受體表達(dá)狀態(tài),其治療方式、生存期長(zhǎng)短存在顯著差異[10-12]。除接受常規(guī)的手術(shù)治療、放化療外,HER-2陽(yáng)性亞型可接受單克隆抗體的靶向治療,HR陽(yáng)性亞型還可采用內(nèi)分泌治療,因此對(duì)HER-2和HR表達(dá)水平的早期評(píng)估具有重大意義。乳腺癌多參數(shù)MRI廣泛應(yīng)用于臨床常規(guī)成像檢查,并用于腫瘤診斷和治療反應(yīng)評(píng)估[13]。影像組學(xué)已被用作一種定量分析方法,可提供關(guān)于腫瘤生物學(xué)特征的全面客觀信息[14]。目前,研究[15]表明,MRI磁共振影像組學(xué)模型在預(yù)測(cè)乳腺癌分子亞型、腋窩淋巴結(jié)轉(zhuǎn)移、新輔助化療反應(yīng)方面具有較好效能。本研究共收集128例乳腺癌病灶,其中HER-2陽(yáng)性32例、HER-2陰性96例,HER-2陽(yáng)性例數(shù)占樣本總量的25.0%; HR陽(yáng)性84例、HR陰性44例,HR陽(yáng)性例數(shù)占樣本總量的65.6%; 整體分布水平與大多數(shù)乳腺癌受體表達(dá)水平相關(guān)的流行病學(xué)調(diào)查一致[2-3]。
既往研究[16-17]表明,MRI影像組學(xué)可作為預(yù)測(cè)乳腺癌HER-2表達(dá)狀態(tài)的有效工具。研究[18]發(fā)現(xiàn),聯(lián)合多序列MRI的總特征構(gòu)建的多層感知器(MLP)模型具有較佳的預(yù)測(cè)乳腺癌分子亞型效能,證明了多模態(tài)MRI特征早期預(yù)測(cè)HER-2表達(dá)狀態(tài)的可行性。另一研究[19]結(jié)果也表明,基于對(duì)比增強(qiáng)的影像組學(xué)在預(yù)測(cè)乳腺癌組織學(xué)亞型方面表現(xiàn)良好。
本研究與既往研究不同,本研究采用TIRM和DWI序列圖像,即在平掃的圖像上構(gòu)建預(yù)測(cè)模型,評(píng)估不同模型的預(yù)測(cè)效能,發(fā)現(xiàn)基于TIRM和DWI序列圖像特征構(gòu)建的聯(lián)合模型評(píng)估HER-2及HR狀態(tài)的效能優(yōu)于單一序列,聯(lián)合模型在訓(xùn)練組和驗(yàn)證組均表現(xiàn)出良好的預(yù)測(cè)效能,外部測(cè)試組同樣證明了聯(lián)合模型的預(yù)測(cè)效能處于較高水平。這可能跟多序列圖像信息更加全面、綜合地反映病灶特點(diǎn)等相關(guān)。本研究采用SVM分類器構(gòu)建用于預(yù)測(cè)乳腺癌HR表達(dá)的模型時(shí),TIRM和DWI序列分別篩選了10個(gè)影像組學(xué)特征,大多數(shù)為高階變換特征,與相關(guān)研究[20]結(jié)果一致。本研究在訓(xùn)練組及測(cè)試組中表明,形態(tài)學(xué)特征和低階統(tǒng)計(jì)學(xué)特征與HER-2與HR表達(dá)狀態(tài)的相關(guān)性較小,而基于變換的高階紋理特征與受體表達(dá)狀態(tài)存在較大的相關(guān)性,機(jī)器學(xué)習(xí)模型解釋可視化工具SHAP結(jié)果表明高階變換特征DWI_wavelet-HLL_glszm_SmallAreaHighGrayLevelEmphasis和TIRM_ wavelet-HHL_glrlm_GrayLevelVariance在最優(yōu)預(yù)測(cè)HER-2和HR表達(dá)狀態(tài)方面具有較大貢獻(xiàn)力??赡艿脑蚴歉唠A特征能夠反映出空間上體素之間的差異[21],從而更加能夠量化腫瘤的異質(zhì)性。但研究存在一定局限性:首先,納入的乳腺癌病理類型較局限,主要為浸潤(rùn)性導(dǎo)管癌(104例),未來(lái)需要收集其他病理類型乳腺癌納入研究; 其次,本研究為多中心、回顧性研究,樣本量較少,僅納入128例病灶進(jìn)行研究,且過(guò)程中存在一定選擇偏倚,還需要擴(kuò)大樣本量來(lái)驗(yàn)證模型預(yù)測(cè)效能; 最后,本研究未分析乳腺癌MRI影像組學(xué)特征與其他基因表達(dá)的相關(guān)性,未來(lái)需要進(jìn)一步探討MRI影像組學(xué)預(yù)測(cè)乳腺癌分子分型的能力。
綜上所述,基于TIRM和DWI序列圖像借助SVM算法構(gòu)建的影像組學(xué)模型可以無(wú)創(chuàng)預(yù)測(cè)乳腺癌HER-2及HR的表達(dá)狀態(tài),可避免對(duì)癌癥患者進(jìn)行不必要的活檢。