劉沁峰,劉偉軍,楊靜波,于斌,張旋,馬良,劉輝,王濤
1. 陜西省人民醫院 a. 醫學裝備部;b. 放射科,陜西 西安 710068;2. 西安電子科技大學 生命科學技術學院,陜西 西安 710071
乳腺癌是臨床上最常見的癌癥之一,在全球女性相關癌癥中死亡率位居第二[1]。腋窩淋巴結轉移狀況是影響乳腺癌患者預后的重要因素,也是選擇外科治療及術后輔助治療方案的重要依據[2]。當前確定腋窩淋巴結轉移的方法是進行前哨淋巴結活檢(Sentinel Lymph Node Biopsy,SLNB),但SLNB 是侵入性的手術,并且可能會引起一些術后并發癥[3],因此,術前無創地進行腋窩淋巴結轉移預測研究是很有臨床價值和意義的。影像組學通過從腫瘤影像中高通量提取影像特征,篩選相關性高的特征進行分析建模,被證明是一種無創有效的腫瘤影像研究方法[4]。本研究嘗試通過對112 例乳腺癌患者的術前CT 影像及相關臨床病理數據進行研究,探索影像組學在乳腺腫瘤中的研究應用價值。
回顧性收集2018 年1 月至2019 年5 月陜西省人民醫院的523 例乳腺癌患者CT 影像及臨床病理數據,浸潤型和非浸潤型均包括在內,又經過多次篩選,本研究中共納入112 例病例,患者均為女性,年齡38~64 周歲,平均年齡55 周歲。納入標準:① 接受了乳腺癌手術;② 接受了淋巴結活檢;③ 在手術切除前七天內接受了我院同一臺飛利浦128 層CT 掃描;④ 有完整的多次出入院記錄;⑤ 病例中包含明確的TNM 分期。患者的排除標準:① 術后出現各類并發癥;② 術前接受過任何治療;③ 具有家族遺傳性癌癥史。
數據錄入完成后,將所有112 例數據按2:1 的比例隨機分配到訓練集和測試集中,其中訓練集75 例,測試集37 例。
為了保證獲取的材料具有更高的研究質量,選取了來自于飛利浦Brilliance128 層螺旋CT 機的乳腺癌患者影像資料,要求患者掃描時俯臥位,頸胸交界處和腹部墊高,乳房自然懸垂,檢查過程中,患者保持平靜呼吸,掃描參數為管電壓120 kV,管電流200~300 mA,螺距Pitch=1,準值0.75 mm,層距0.9 mm,層厚0.9 mm,512×512 矩陣,窗位-30~30 HU,窗寬350~500 HU。
圖像分割采用了基于影像灰度的半自動閾值分割法,使用3D Slicer 軟件進行操作。在本研究中邀請兩位具有多年乳腺腫瘤影像診斷工作經驗的放射科醫生對乳腺CT 影像進行感興趣區域(Region of Interest,ROI)分割,分割前兩位醫生對研究材料中每個病例的病理結果均不了解,兩位醫生分別對同一患者數據進行分割處理,分割完成后由一位具有15 年以上乳腺腫瘤影像診斷工作經驗的放射科主任醫生對每一位病例影像二選一篩選最佳分割影像,從而保證分割結果準確性。圖像分割完成后,為了最大限度消除圖像噪聲并降低計算復雜度,對分割后的圖像進行了量化處理。入組的某個病例影像的分割過程及量化結果如
本研究使用Matlab R2016b 軟件從ROI 中提取影像特征共計156 個,分別為基于一階灰度值特征21 個、基于七個不變矩的特征7 個、基于二維形態特征4 個、基于二維圖像的灰度共生矩陣特征(0,45°,90°,135°)92 個、基于二維小波變換特征(近似分量、水平細節分量、垂直細節分量、對角細節分量)32 個。
本研究采用R 語言的glmnet 包建立Lasso 模型來選擇特征,將所有提取的影像組學特征和腋窩淋巴結轉移結果作為特征選擇的輸入量,其中影像特征作為自變量X,腋窩淋巴結轉移狀態作為因變量Y,構建Lasso 模型選擇特征,選擇特征過程中用Bootstrapping 算法來降低估計偏差。
根據所選擇的影像特征及通過特征選擇算法獲得的相應特征系數,為每個患者構建影像組學特征標簽。計算得到每個患者對應的影像組學特征標簽值特征標簽值,并繪制相應的直方圖,特征標簽值計算方法如公式(1)所示。

公式中featurei代表選擇出的影像組學特征值,coefficien ti代表每個影像組學特征在glmnet 包選擇特征時所對應的系數值,它表示對應的影像組學特征與乳腺癌腋窩淋巴結轉移的相關性權重值,Compensation coefficient代表Lasso 選擇完特征時留下的補償系數[5]。
本研究采用R 語言建立Logistics 回歸模型,將特征標簽值以及臨床因素患者的年齡、TNM 腫瘤分期作為建立多變量Logistics 回歸預測模型的輸入,將CT 病例報告中的腋窩淋巴結轉移結果作為Logistics 回歸預測模型的輸出進行關聯。
為了更清晰的將特征標簽值、年齡(Age)、T 分期這些因素與獲取的患者CT 報告的腋窩淋巴結轉移結果之間的關聯關系表示出來,本文基于多變量邏輯回歸模型繪制了影像組學Nomogram,更直觀的量化變量關系。
入組病例統計信息如表1 所示。
通過特征提取從CT 影像中提取的156 個特征,用Lasso 算法進行特征選擇,特征選擇過程如圖2 所示,最終得到9 個影像組學特征,結果如表2 所示。
75 名訓練集病例患者相對應特征標簽值值計算結果如表3 所示,利用患者編號做x軸,特征標簽值值做y軸繪制有關特征標簽值直方圖,直觀表示每個患者特征標簽值值如圖3 所示。

表1 入組病例統計

圖2 Lasso算法篩選影像組學參數過程

表2 特征選擇結果

圖3 訓練集特征標簽直方圖
最終本文使用訓練集數據,選定T 分期與患者年齡、特征標簽值特征標簽值、腋窩淋巴結轉移情況相關情況下建立邏輯回歸模型,開發可用于臨床診斷的Nomogram 圖(圖4),得出相應的C-Index 為0.727(95%CI:0.719~0.736),用測試集數據對訓練得到的多變量模型進行驗證,得到的C-Index 為0.711(95%CI:0.703~0.718)。

表3 訓練集特征標簽值

圖4 乳腺癌腋窩淋巴結轉移預測Nomogram圖
根據本文實驗中得到的校正曲線(Calibration Curve)如圖5 所示,來說明本文所建立的邏輯回歸二分類預測模型的性能。由于樣本總數比較少,因此本研究在繪制校正曲線時利用所有樣本(訓練集和測試集總共112 個樣本)進行繪制,對訓練集數據以及測試集數據在預測模型中的分類結果與每個樣本所對應的實際分類結果作比較,利用Nomogram 所得到的樣本乳腺癌腋窩淋巴結轉移預測概率與樣本實際發生腋窩淋巴結轉移率分別作為x軸和y軸繪制校正曲線。由腋窩淋巴結轉移預測概率和腋窩淋巴結實際轉移概率計算得到預測模型的均方誤差為0.072,并且由圖可看出Apparent Curve 與Bias-corrected Curve 高度擬合,與此同時,它們分別與Ideal Curve 具有較好的擬合度,該預測模型在術前無創預測乳腺癌患者腋窩淋巴結轉移情況具有一定效能。

圖5 預測模型校正曲線
乳腺癌患者的腋窩淋巴結轉移狀態對患者的預后和治療有重要影響[6]。如果腋窩淋巴結沒有發生轉移,原則上不需要進行腋窩淋巴結清掃(Axillary Lymph Nodes Dissection,ALND)手術,若發生轉移,則需要執行ALND[7]。目前可以通過SLNB 來判斷腋窩淋巴結有沒有發生轉移[8]。雖然SLNB 的侵襲性要遠遠小于ALND 手術,但作為一種侵入性手術,仍然會給患者身體帶來一定傷害[9]。因此,開發高準確性、無創的方法對腋窩淋巴結轉移狀況進行預測具有重要的意義。
近年來興起的影像組學能夠更準確地反映腫瘤的異質特征和生物學特性,為精準醫學的開展提供了新的思路[10-11]。本研究嘗試采用影像組學方法對腋窩淋巴結轉移情況進行術前無創預測,通過從112 例乳腺癌患者CT 影像資料中提取腫瘤的156 個影像組學特征,用Lasso 算法對這些特征進行篩選,最終選定9 個相關性最高的特征建立影像組學標簽,選定T 分期、患者年齡、腋窩淋巴結轉移情況等臨床相關危險因素與影像特征標簽值特征標簽值一起建立影像組學Logistic Regression 模型,開發腋窩淋巴結轉移Nomogram 圖,得出相應的C-Index 為0.727(95%CI:0.719~0.736),用測試集數據對模型進行驗證,得到的C-Index 為0.711(95%CI:0.703~0.718)。最后繪制校正曲線對模型性能進行評價,計算得到預測模型的均方誤差為0.072,評價結果顯示模型性能較好,影像組學方法對預測乳腺癌腋窩淋巴結轉移狀況具有一定效能。
影像組學在乳腺癌的研究方面,2013 年,Noemí 等[12]通過研究發現乳腺癌患者的前哨淋巴結分子特征可以有效預測腫瘤向其他腋窩淋巴結的轉移;2016 年,Li 等[13]通過對美國國家癌癥研究所多機構TCGA/TCIA 的91 例經活檢證實的侵襲性乳腺癌進行了影像組學分析,證實利用MRI 圖像的腫瘤表型可以預測侵襲性乳腺癌的分子分類;2017 年,Dong 等[14]通過研究T 加權脂肪抑制(T-FS)和擴散加權成像(Diffusion Weighted Imaging,DWI)MRI 的影像組學特征,進行了乳腺癌前哨淋巴結轉移的預測,性能良好;2018 年,Ma 等[15]通過對診斷為侵襲性乳腺癌患者的53 例低Ki67 表達(Ki67 增殖指數小于14%)和324 例高Ki67 表達(Ki67 增殖指數大于14%)進行對比分析發現,從DCE-MRI 中提取的乳腺腫瘤影像組學特征與乳腺癌Ki67 表達高度相關。影像組學的發展和逐步成熟為乳腺癌的精準治療提供了新的研究思路和有效手段[16]。
本研究的創新性在于采用了影像組學的方法,對乳腺癌患者腋窩淋巴結轉移狀況進行術前的無創預測。影像組學方法具有穩定性和可重復性的特點[17-19]。但是本研究仍有很多不足之處,需要通過進一步的研究進行完善。首先,入組的病例數量不夠豐富,可能會導致模型成熟度不高;其次,本研究入組的病例均來自同一家醫院,模型未得到充分的訓練和驗證,后期還需要進行多中心研究來評估此方法的臨床應用價值。本研究采用了回顧性的研究方法,后續我們可以考慮采用回顧性和前瞻性研究相結合的方法,以進一步提高模型的泛化能力。
綜上所述,本研究基于乳腺癌患者術前CT 影像的影像組學特征及相應臨床病理數據,構建模型對腋窩淋巴結轉移狀況進行預測,效能評價良好,可以對臨床醫生治療決策提供參考。