謝玉海,馬培旗,王小雷,韓劍劍,馬文俊,曹雪花,張寧寧,楊楊,胡東
乳腺癌(breast cancer,BC)是最常見的癌癥之一,也是全世界女性死亡的主要原因[1],我國女性乳腺癌的發病率和死亡率均居世界首位[2]。腋窩淋巴結轉移(axillary lymph node metastasis,ALNM)在乳腺癌患者中很常見,與疾病的臨床分期、治療方案、手術方式和患者預后密切相關[3]。目前,乳腺癌患者的腋窩淋巴結轉移狀況是通過前哨淋巴結活檢(sentinel lymph node biopsy,SLNB)或腋窩淋巴結清掃(axillary lymph node dissection,ALND)來證實的,但這些手術有一定風險,可能會導致腫瘤植入性轉移、鄰近血管神經損傷以及上肢淋巴水腫等[4]。數字化乳腺X線攝影(digital mammography,DM)是乳腺癌體檢篩查的常用檢查方法,但評估腋窩淋巴結是否存在轉移的準確性較低[5]。影像組學通過提取肉眼無法觀察的高通量圖像特征來預測惡性腫瘤的生物學行為[6]。基于數字乳腺X線影像中包含的影像組學特征組合或單一影像組學特征的分析能可靠、準確、非侵入性和經濟有效地評估乳腺癌的特征,在預測組織學分級、ALNM、侵襲性、受體狀態、Ki-67增殖狀態、分子亞型以及復發和生存方面具有很大潛力[7-11]。雖然已有研究基于多參數MRI影像組學特征預測乳腺癌腋窩淋巴結轉移[12],但基于DM影像組學預測浸潤性乳腺癌腋窩淋巴結轉移的報道較少,且多為單中心研究[13-14]。因此,本研究旨在探討基于多中心DM影像組學預測浸潤性乳腺癌腋窩淋巴結轉移的臨床應用價值。
回顧性分析2016年12月至2021年12月間皖南醫學院第一附屬醫院弋磯山醫院(機構1)、2018年1月至2021年6月間阜陽市人民醫院(機構2)、2016年7月至2022年3月間太和縣人民醫院(機構3)經病理證實的女性乳腺癌患者728例,其中皖南醫學院第一附屬醫院弋磯山醫院413例、阜陽市人民醫院和太和縣人民醫院共計315例。病例納入標準:①經病理證實為浸潤性癌;②X線檢查前無穿刺、手術或新輔助化療史等;③乳腺X線檢查后2周內行穿刺或手術切除。病例排除標準:①病變顯示不清或瘤體顯示不全,無法行感興趣區(region of interest,ROI)勾畫;②有其他惡性腫瘤病史。將機構1乳腺癌患者隨機拆分為訓練組(n=289)和驗證組(n=124),將機構2和機構3乳腺癌患者視作外部測試組(n=315)。本研究為回顧性研究,經醫院倫理委員會審批通過免除患者知情同意。
機構1采用美國HOLOGIC數字化乳腺X線機,型號為selenia dimensions,圖像尺寸為24 cm×30 cm。機構2采用GE數字化乳腺X線機,型號為Senographe Ess entail,圖像尺寸為24 cm×31 cm。機構3采用聯影數字化乳腺X線機,型號為uMammo 590i,圖像尺寸為24 cm×30 cm。拍攝體位均包括雙側乳腺頭尾位(cranial caudal,CC)和內外側斜位(mediolateral oblique,MLO),曝光條件采用全自動曝光模式。本研究在特征提取前對所有圖像均進行分辨率重采樣以避免因掃描機器參數不同導致的誤差,重采樣像素間距設為(1.0,1.0,1.0)。
將所有患者X線圖像從PACS工作站以DICOM格式導出后導入深睿醫療多模態科研平臺(https://keyan.deepwise.com)進行圖像分割及特征提取、降維。圖像分割由2位具有5年診斷經驗的放射科醫師A和B完成。在進行分割時,2位放射科醫生在被告知腫瘤的確切位置后手動勾畫分割病灶,結合CC位和MLO位選擇病灶顯示最清晰且面積最大的體位進行ROI勾畫(圖1),醫師A于2周后再次對DM圖像進行ROI勾畫。圖像通過均一化處理后自動提取1562個組學特征,包括一階特征324個、形狀特征14個、灰度共生矩陣(gray level co-occurrence matrix,GLCM)特征396個、灰度區域矩陣(gray level co-occurrence matrix,GLCM)特征288個、灰度游程矩陣(gray level run length matrix,GLRLM)特征288個、灰度相依矩陣(gray level dependence matrix,GLDM)特征252個。

圖1 a) 乳腺癌腫塊原始圖像;b) 手動勾畫ROI示意圖(紅色區域)。
第一步將所有樣本量的特征參數通過特征剔除(剔除缺失值≥10%的特征)和組間相關系數(intraclass correlation coefficient, ICC)篩選出一致性較好的非零組學特征(ICC>0.85)。第二步使用深睿醫療多模態科研平臺,將機構1樣本量按照7:3隨機拆分為訓練組和驗證組,將機構2和機構3樣本量作為外部測試組,在訓練組中通過特征間線性相關性分析,相關系數(coefficient,C)=0.8與最小絕對收縮和選擇算法(least absolute shrinkage and selection operator,LASSO)方法進行特征降維篩選出最優組學特征,使用支持向量機(support vector machine,SVM)分類器參與構建影像組學模型,驗證組和外部測試組對模型的穩定性與可重復性進行驗證。
采用R軟件(Version3.6.0)進行統計學分析。采用ICC評估影像組學特征提取的觀察者間和觀察者內的一致性。使用MedCalc軟件(Version19.0.2)繪制受試者工作特征(receiver operating characteristic,ROC)曲線,采用曲線下面積(area under curve,AUC)和決策曲線分析(decision curve analysis,DCA)評價模型性能。以P<0.05為差異有統計學意義。
本研究納入的皖南醫學院第一附屬醫院弋磯山醫院413例浸潤性乳腺癌患者隨機拆分為訓練組289例(淋巴結轉移陰性197例,淋巴結轉移陽性92例)和驗證組124例(淋巴結轉移陰性85例,淋巴結轉移陽性39例);阜陽市人民醫院和太和縣人民醫院浸潤性乳腺癌患者共計315例(淋巴結轉移陰性221例,淋巴結轉移陽性94例)作為外部測試組。訓練組年齡30~84歲,平均(53.55±9.70)歲;驗證組年齡33~78歲,平均(55.19±9.83)歲;外部測試組年齡23~84歲,平均(53.04±10.20)歲。
第一步通過特征剔除(剔除缺失值≥10%的特征)和組間相關系數(ICC>0.85)分析剔除558個特征。剩余1004個組學特征通過特征間線性相關性分析(C=0.8)和LASSO回歸進行特征降維后篩選出8個與浸潤性乳腺癌腋窩淋巴結轉移預測最相關的影像組學特征(表1),經支持向量機分類器構建預測模型。

表1 影像組學預測浸潤性乳腺癌腋窩淋巴結轉移的最優特征
預測模型在訓練組、驗證組、外部測試組中預測乳腺癌腋窩淋巴結轉移的AUC分別為0.807、0.790、0.753,敏感度、特異度分別為84.8%和61.4%、79.5%和69.4%、44.7%和92.8%(表2、圖2)。決策曲線分析結果顯示在概率值為15%~80%時,預測模型鑒別乳腺癌腋窩淋巴結轉移具有較好的凈收益(圖3)。

圖2 預測模型訓練組、驗證組及外部測試組ROC曲線。a) 訓練組;b) 驗證組;c) 外部測試組。

圖3 預測模型的決策曲線。

表2 預測模型在三組間的診斷效能
乳腺X線攝影是目前臨床乳腺癌篩查最常用的影像學方法之一。本研究基于DM影像組學研究方法,通過多中心大樣本構建影像組學模型用于預測浸潤性乳腺癌發生腋窩淋巴結轉移的可能性,從而進一步挖掘DM的潛能,使患者和臨床受益。
腋窩淋巴結轉移對于評估乳腺癌患者的預后和制定治療方案具有重要意義[15],腋窩淋巴結清掃術是確定腋窩淋巴結狀況的最可靠方法,但手術會引起術區感染、神經血管損傷、功能區障礙以及植入性轉移等并發癥[16]。因此,為了減少不必要的手術損傷及過度醫療給患者造成的負擔,迫切需要一種新的術前預測方式,在提高診斷準確性的同時非侵入性地判斷腋窩淋巴結是否存在轉移。雖然影像學檢查可以顯示腫大的淋巴結形態學特征,但是無法與一些炎性淋巴結區分[5]。本研究通過乳腺X線攝影圖像構建的影像組學模型在訓練組、驗證組及外部測試組中的AUC分別為0.807、0.790和0.753,診斷效能較傳統影像學檢查方法得到進一步提高。陳春發等[17]研究表明,乳腺X線攝影診斷乳腺癌ALNM與病理診斷的一致性檢驗Kappa值僅為0.354。
影像組學可以提取高通量的組學特征,并通過分析獲取一些肉眼無法識別的紋理特征及高階特征[18-19]。本研究最終篩選出8個與腋窩淋巴結轉移相關的影像組學特征用于構建預測模型,其中1個灰度依賴矩陣特征(exponential_gldm_SmallDependenceLowGrayLevelEmphasis)、2個灰度游程矩陣特征(lbp-2D_glrlm_RunLengthNonUniformity、exponential_glrlm_ShortRunLowGrayLevelEmphasis)、4個灰度共生矩陣特征(exponential_glcm_ClusterShade、wavelet-LLL_glcm_Contrast、 gradient_glcm_Imc1、logarithm_glcm_Imc2)。灰度共生矩陣(glcm)中的Cluster Shade是衡量偏度和均勻度的紋理特征。李翠平等[20]研究表明宮頸癌Ki-67低表達組的Cluster Shade值低于高表達組,而本研究結果也表明浸潤性乳腺癌腋窩淋巴結轉移組的Cluster Shade值高于非轉移組。glcm中的Contrast、Imc1和Imc2主要反映紋理的粗糙性和復雜性,其絕對值越高,說明圖像越粗糙、紋理越復雜,腫瘤的異質性越高。本研究腋窩淋巴結轉移組的glcm_Contrast、glcm_Imc1和glcm_Imc2的絕對值均高于非轉移組,說明腋窩淋巴結轉移組的腫瘤異質性較高。朱海濤等[21]的研究結果也證實glcm_Contrast值越高,腫瘤的惡性程度越高。灰度依賴矩陣(GLDM)參數是描述圖像中的灰度相關性,是基于中心像素或體素與其鄰近區域之間的灰度關系,其中Small Dependence Low Gray Level Emphasis是計算ROI中小相關性與圖像中較暗部分的分散情況。本研究發現腋窩淋巴結轉移組的Small Dependence Low Gray Level Emphasis值高于非轉移組,說明ALNM組的圖像均勻性差,筆者認為這可能是由于ALNM組的惡性程度高、瘤內易發生壞死所致。灰度游程矩陣(glrlm)中的Run Length Non Uniformity和Short Run Low Gray Level Emphasis主要描述像素值的分布情況,前者描述整個圖像中游程長度的相似性,后者測量圖像中較短游程長度與較低灰度值的聯合分布,兩者的值越大,像素分布越不均勻,紋理越粗糙。本研究發現ALNM組的Run Length Non Uniformity和Short Run Low Gray Level Emphasis值高于非轉移組,說明ALNM組的DM圖像紋理較非轉移組更粗糙。此外,本研究最終采用支持向量機分類器(SVM),因為它是一種常用而有效的算法,該算法具有精度高、計算能力小等優點,SVM在識別復雜數據集中的微妙模式方面非常強大[22]。劉暢等[23]使用支持向量機分類器構建預測模型,能夠在術前無創評估和預測肝細胞癌微血管浸潤,可作為指導臨床后續個性化治療的有效工具。
本研究存在以下局限性:①影像組學特征是在二維圖像上進行手動勾畫后提取,存在一定的人為誤差;②在選擇病灶方面僅從MLO位和CC位兩者之一選擇病灶最大層面進行ROI勾畫,缺乏一定的對比,可能遺漏部分特征,影響最終預測效能;③未將基于DM影像組學標簽與MRI影像組學特征預測腋窩淋巴結轉移的效能進行比較。本研究結果與Han等[24]和Mao等[25]基于磁共振動態增強圖像的影像組學預測乳腺癌ALNM的效能一致,而Yu等[26]聯合磁共振增強T1WI、T2WI和擴散加權成像ADC圖構建的影像組學模型預測乳腺癌ALNM的效能在訓練集和驗證集分別為0.88和0.85,高于本研究結果。因此,今后將通過前瞻性設計,開展比較DM影像組學標簽與MRI影像組學標簽預測乳腺癌ALNM效能的后續研究。
綜上所述,基于乳腺X線攝影的影像組學預測模型可作為一種非侵入性工具,對浸潤性乳腺癌腋窩淋巴結轉移具有較高的診斷效能,對乳腺癌患者制定個性化的治療方案和預后評估有著重要的臨床應用價值。