張靖
中國中醫科學院西苑醫院 器材供應科,北京 100091
肺實質中細胞的不規則和不可控生長是肺結節形成的主要原因之一,在早期檢測和分析肺組織中的這些結節可大大提高患者的生存機會,并有助于治療。CT 因在肺結節篩查中的高性能而被廣泛用作體格檢查的工具。根據肺部CT 篩查報告,實性結節評分4 分以上(結節大小超過8 mm)則懷疑為惡性,建議進行額外的診斷[1]。除了結節大小外,放射科醫生還會根據毛刺、分葉和胸膜反應等放射學特征進行傾向診斷[2]。然而,由于這些病灶的錯誤分類,過度診斷和高假陽性率仍然存在,這與這些特征在CT 圖像上的外觀和掃描參數在層厚和對比度增強方面的相似性有關。在精準醫療理念及數字技術、深度學習網絡快速發展下,以醫學與數字技術緊密聯系,應用網絡模型診斷、預測各種疾病具有一定可行性[3]。基于U-Net 肺結節分割方法在肺結節分割中具有一定價值,但在肺內小結節分割方面的卷積神經網絡架構仍不成熟[4-5]。為應對有效特征提取和適應肺結節異質性的挑戰,本研究旨在提出一種改進的U-Net結構,即具有加權雙向特征網絡(U-Det),將其用于多種形式肺結節的分割中,以期提高惡性肺內小結節的確診率。
選取2021 年6 月至2022 年1 月于我院就診并經病理檢查的150 例肺內小結節患者作為研究對象,留取惡性樣本(n=104)及非惡性樣本(n=46)。納入標準:① 肺結節良惡性經病理學證實[6];② CT 檢查前未接受相關治療;③ 患者及其家屬簽署知情同意書。排除標準:① 厚度超過3 mm 的薄層CT 圖像;② 使用造影劑拍攝的CT 圖像;③ 既往存在肺部手術史。
1.2.1 CT圖像采集
病理確診前,研究對象均行胸部CT 平掃(儀器:GE Optima 型64 排CT 掃描儀),掃描范圍:肺尖處至雙肺后肋膈角。參數設置:管電壓:120 kV;管電流:200 mA;螺距:0.560 ∶1;圖像矩陣:512×512;視野:360 mm;層厚/層間隔均為10 mm。采用高分辨率算法重建,重建層厚為1.25 mm。結果由兩名胸部放射科醫師獨立審查影像歸檔和通信系統上的所有CT 圖像包括病變大小、毛刺和分葉等特征并達成共識后確定。留取惡樣本及非惡性樣本,擴增至各800 張。按照比例7 ∶3隨機分為訓練集樣本(n=1120)和驗證集樣本(n=480),同時選取1400 張LUNA16 數據集圖片作為測試集樣本。
1.2.2 數據預處理
采用統計參數圖軟件SPM12 將原始CT 圖像數據集行三維重建,利用CT 數據中的序列,將多個DICOM轉換為單個NIFI 格式文件,以保留肺的空間特征。采用寬×高×深(W×H×D)表示數據尺寸行切片層數整理,首先找到切片中第一層肺組織的切片位置,將此層位置作為Start 層,后根據標簽定位至End 層(最后出現肺組織的CT 圖像位置),以上述兩層所在位置為基礎,將切片層數擴展至S 層(數據最完整地包裹肺,根據數據量情況得知S 層為20)。該步驟存在以下幾種情況:① 以Start 和End 作為中心,向S 層擴展;② Start 層以上層數較End 層往下少時,以Start 為基礎,往End 層方向擴展至S 層,反之往Start 方向擴展至S 層;③ 若數據層數無法達到S 層,則將該部分數據去除。
1.2.3 肺圖像的分割過程
對CT 圖像進行下采樣操作以保留肺圖像的空間位置和形狀特征,降低圖像的尺寸大小,以最大限度保留目標器官的圖像位置信息。設置抽取因子(R=4),在橫截平面上對CT 圖像進行下采樣處理后得到CT 圖像數據為XR。經過預處理后,整理原始數據X 的尺寸(512×512×20)。基于下采樣原理,在橫截面下采樣后設置數據維度為(W/R)×(H/R)×20,使肺圖像維度降為128×128×20。采樣后的CT 圖像XR作為粗分割階段的U-Det 網絡訓練輸入,下采樣后CT 圖像作為輸入,根據上述步驟構建U-Det 網絡模型。以YR(Y為肺輪廓標簽集,抽取因子R=4)作為模型標簽,獲取感興趣的候選區域(根據粗分割模型輸出)。保持U-Det網絡結構基本不變,適當改進維度大小對粗分割的結果進行上采樣操作,將上述采樣操作獲得的特征作為細分割輸入,確保分割階段能將肺組織所有圖像包裹。
1.2.4 模型體系結構
U-Det 模型基于U-Net 的編碼器、解碼器主干,以及在Efficient-Det 中實現的功能豐富器Bi-FPN,特征網絡的輸出分別與解碼器結構相結合,用于肺結節分割。本研究提出的模型利用U-Network 的骨干網與Bi-FPN相結合的方式完成肺結節的分割任務,在U-Det 模型編碼部分,每一層分辨率包含3×3 的卷積核(2 個)和損失函數(1 個),為確保網絡模型快速收斂,行歸一化處理(標準差和均值),實現整體數據更新處理。另外,基于全卷積網絡的U-Net 編碼器獲取CT 圖像(CT 掃描的1 個切片),并輸出5 個相應深度處特征,這些特征是Bi-FPN 的相應輸入以特征網絡的輸出分別與解碼器架構相結合,獲得低層細粒度特征與高層語義特征的組合。具體U-Det 模型結構如圖1 所示。

圖1 基于U-Net的主干網絡使用ResNet50的卷積神經網絡進行下采樣
1.2.5 U-Det模型的構建
以512×512 圖像作為輸入,輸出512×512 掩碼。收縮路徑由兩個3×3 卷積重復應用組成,每個卷積后有1 個非線性Mish 激活函數和1 個2×2 最大步長的池化操作,用于輸入圖像特征的下采樣。將5 個深度處的特征輸入Bi-FPN 中,輸出的特征向量輸入擴展段中。展開路徑中的每一步均對特征圖進行上采樣,然后進行2×2 卷積,將每個深度上的特征通道數量減半。首先在骨干網的最后一層,得到512×512×64 特征圖經過兩次3×3 卷積;其次是Mish 激活函數和最后一個1×1卷積塊;最后是sigmoid 激活函數,從而得到形狀為512×512的輸入CT圖像的掩碼對應的logits。將在U-Det卷積神經網絡模型中輸入預處理圖片并進行訓練,最后將驗證集輸入模型中以進行驗證。
1.2.6 訓練方法
在模型的訓練階段,訓練過程中模型優化算法采用Adam 法,初始學習率:1×10-5,權重衰減:0.0001,動量:0.9。同時,利用兩個樣本的批次大小來訓練模型。在后處理階段,批大小batch_size 為8。數據預處理后得到肺結節圖片。
采用Python 3.6.5(Win64)軟件處理數據,計數資料采用n(%)表示,采用χ2檢驗;連續變量以±s表示,采用t檢驗,以P<0.05 為差異有統計學意義。采用Keras 人工神經網絡庫建立卷積神經網絡模型,以U-Net作為基線卷積,從預訓練基線卷積層中提取特征。
兩組結節位置、直徑比較,差異均無統計學意義(P>0.05),見表1。

表1 兩組臨床資料比較
U-Det 模型中訓練樣本的平均損失率為0.126%±0.046%,驗證樣本的平均損失率為0.135%±0.053%,見圖2。U-Det 模型中訓練樣本的平均準確度為88.42%±4.21%,驗證樣本的平均準確度為89.01%±4.09%,見圖3。

圖2 U-Det模型構中訓練組及驗證組損失情況

圖3 U-Det模型構中訓練組及驗證組準確度
如圖4 所示,U-Det 模型能有效預測結節良惡性,輔助臨床醫生對疾病進行診斷。

圖4 U-Det模型對肺內小結節的良惡性識別
U-Det 模型診斷準確度、敏感度、特異性、陽性預測值、陰性預測值最高;除特異性外,U-Net 模型的各項指標均高于ResNet50 模型,見表2。

表2 U-Det、U-Net和ResNet50模型的混淆矩陣
受試者工作特征(Receiver Operator Characteristic,ROC)曲線顯示,U-Det、U-Net 和ResNet50 模型預測準確度遞減,其中U-Det 模型預測AUC 最高為0.924(95%CI:0.900~0.943),U-Net 模型次之為0.801(95%CI:0.768~0.832),ResNet50 模型最低為0.728(95%CI:0.692~0.763),兩兩對比差異具有統計學意義(U-Detvs.U-Net,Z=4.966,P<0.001;ResNet50vs.U-Net,Z=2.195,P=0.028;ResNet50vs.U-Det,Z=4.966,P<0.001),見圖5。

圖5 U-Det、U-Net和ResNet50模型對肺內小結節預測價值ROC曲線
LUNA16 測試集下U-Det 模型的診斷準確度、敏感度、特異性、陽性預測值、陰性預測值最高,U-Net 次之,ResNet50 最低,見表3。

表3 LUNA16測試集下U-Det、U-Net和ResNet50模型的混淆矩陣
肺癌的早期診斷和分析需要在CT 圖像中精確有效地分割肺結節,這對隨后的分析結果有重大影響,為確保診斷準確度,放射科醫生必須檢查包含150~500 個切片的CT 掃描,這無疑會增加工作難度[7-8]。此外,CT圖像中結節的匿名形狀、視覺特征和周圍環境給肺部結節的穩健分割帶來了挑戰。臨床通過用簡單閾值和基于形態學的方法對肺結節進行分割,但由于肺結節的大小和類型有很大差異、從粘連型結節(胸膜旁和血管旁)到毛玻璃樣陰影結節導致穩健分割非常困難[9-10]。因此,急需一個穩健的分割網絡來適應大規模結節問題。
在計算機視覺領域,卷積神經網絡已成為主流架構[11-12],在乳腺癌[13]、頭頸癌[14]、肝癌[15]等癌癥中能為臨床醫生制定一個準確的診斷提供參考意見的形態學評估期間組織病理學圖像,以減少人為錯誤診斷。Peng等[16]對結節予以多視圖卷積神經網絡進行分割,可分別從3 個視點(矢狀面、軸面和冠狀面)對結節特征進行分析;Baldwin 等[17]認為采用增強金字塔池化卷積網絡可有效提高肺結節分割性能,該網絡架構能同時融合低級細粒度和高級功能的特征;另一方面,完全卷積網絡是分割CT 圖像的不同方法,U-Net 作為完全卷積神經網絡的一種架構,在生物醫學成像領域中,該模型在分割任務上取得了較好的成果。Tang 等[18]提出的2D U-Net 架構和3D U-Net 方法是更適合生物醫學成像的分割方法。然而,截至目前,用于肺結節分割任務的卷積神經網絡架構仍不成熟。因此,開發處理以前體系結構缺點的高級體系結構至關重要。由于部分肺結節圖像具有目標區域小、邊緣模糊等情況,其訓練時均采用原始U-Net 模型,將會出現特征利用率低、梯度消失等問題,最終對模型分割準確度造成一定程度的影響[19-20]。基于此,本研究嘗試在U-Net 模型的基礎上,針對原始U-Net模型的不足,提出了一種改進的肺結節分割法即U-Det模型。該算法可有效增強網絡算法對特征的傳遞與利用,緩解不平衡問題,并對肺結節等小目標區域的分割具有較大的改善作用。
本研究對肺內小結節患者CT 圖像建立U-Det 模型并對U-Det輔助診斷平臺進行深度訓練及臨床數據驗證,結果顯示,隨著迭代次數增加,U-Det 模型訓練和驗證損失隨之減小、準確度逐漸增加并趨于穩定,U-Det 模型能準確預測肺內小結節良惡性;且采用LUNA16 圖片作為測試集進行測試后發現,U-Det 模型診斷價值最高。但由于肺結節種類相對較多、肺結節的判斷標準相對復雜,本研究所收集的數據集尚不能充分體現肺結節的多樣性,后期需增加樣本量進行進一步研究。隨著技術的進步,在肺結節檢測中計算機輔助診斷系統或將發揮重要作用,未來還將開發基于U-Det 組件的3D 無監督膠囊網絡,用于肺癌的全自動惡性分類。
本文提出了一種使用U-Det 分割肺部結節的高效改進U-Net 結構的模型,是一種端到端的深度學習方法。該模型通過骨干U-Net 架構提取和解碼特征地圖,Bi-FPN 通過合并多尺度特征融合充當特征豐富器。通過對所提方法結果的評估和可視化,能成功地分割結節病例,提高肺結節分割的精度,并為醫生診斷提供輔助資料。