彭偉浩 鄭凱林 吳曉丹 張瑞 深圳信息職業技術學院
PET/CT 成像被認為是用來確診肺癌的有效方法之一。目前有很多學者投身到利用PET 和CT 成像對肺腫瘤進行智能篩查的相關研究中。Cuiying 等人提出應用支持向量機(SVM)訓練圖像向量及其特征,包括從PET 圖像和CT 紋理中提取的異質性,以提高肺癌的診斷和分期。Punithavathy 等人提出了一種基于模糊C均值(FCM)聚類的方法,旨在開發一種從PET/CT 圖像自動檢測肺癌的方法。王宏凱提出了一種基于反向傳播人工神經網絡(BP-ANN)的深度學習方法,利用PET/CT 圖像對非小細胞肺癌縱隔淋巴結轉移進行分類。Ding 提出了一種基于DCNN 的肺結節檢測新方法。
在本文中,筆者利用小樣本學習數據,提出一種基于Mask Region-based Convolutional Neural Network (Mask R-CNN)的肺癌智能篩查新方法。我們針對PET 和CT 圖像建立了兩個深度學習模型,這兩個模型分別通過訓練PET 與CT 圖像微調Mask R-CNN 來獲得并被用來檢測肺結節即肺癌候選區。之后通過集成學習的方法將兩個模型進行集成以減少肺癌候選區中的偽陽性數量從而實現肺癌的最終確診。
首先分別建立PET 和CT 圖像的訓練數據庫。用于本研究的PET 和CT 圖像來自長海醫院的PET/CT 中心。PET 和CT 圖像的訓練數據集分別包括300 張肺癌橫軸截面圖像。測試數據為80 個PET/CT 橫截面圖片,其中50 張為包含肺癌病變PET/CT 圖片,30張為無病變胸腔PET/CT 掃描圖片。所有訓練數據都在醫生的指導下進行了標注。
在這個步驟中,提出一個集成模型用來集合PET 與CT 對應的Mask R-CNN 模型。
(1)將PET 與CT 的篩查結果進行匹配
對于PET 模型中所檢測出的mask,我們將其與CT 模型中的mask 逐一進行匹配操作。如果PET 模型中的mask 與CT 模型中mask 的overlap 大于某一閾值,就認定該CT 模型中的mask 與PET 模型中的mask 為同一個mask,即該對mask 是匹配的。
(2)加權投票
對于在上一個步驟被認定為匹配的同一mask,第二個步驟是對它們進行加權投票。即兩者的置信度相加和并被重新賦值給mask。如果最終的置信度值小于某個固定的值,則該mask 被認定為假陽,否則認定為真陽。
在本文的方法中,PET 與CT 的單體模型被用于肺結節的提取,也就是肺癌候選區的提取。在該步驟的所有樣本測試中,肺結節絕大部分都可以被提取出來,PET 模型中的肺結節檢出率可以達到100%。但不可否認的是,也有非常多的偽陽性即“假的”肺結節也被檢測出來,因此雖然全部的肺結節都可以檢測出來,但是如何有效的降低偽陽性的結果是本文方法的重點。
Sensitivity 和Specificity 為 評 估 指 標。 Sensitivity 和Specificity 的計算公式如下所示:

其中TP 為真陽數量,FP 為偽陽數量,FN 為偽陰數量,TN 為真陰數量。其計算方法參考之前的文獻。
我們通過對比PET與CT 的單模型來評估本文提出的集成模型方法。 PET 模型、CT 模型與集成模型的Sensitivity 和Specificity的值在表1 中展示。在單模型中,PET 模型的Sensitivity 值為1,這說明PET 模型對于肺癌的檢出還是非常敏感的,對于真陽的結果檢測達到了非常好的效果。CT 模型的Sensitivity 值為0.98,該數值表明CT 模型對于肺癌的檢測率效果也較好,但相較于PET 模型要低,會出現漏診的情況。CT 模型和PET 模型的Specificity 值都為0.27。這是一個比較低的值,是正確判斷非癌癥病例能力的指標。這說明針對PET與CT的單體模型,對于非癌癥圖像的識別能力還是比較低的。PET 與CT 的單體模型在Sensitivity 和Specificity 的指標上沒有達到一個有效的平衡。
從表1 中我們可以看出集成模型在肺癌檢測中產生了更精確更有效的結果。集成模型的Sensitivity 和Specificity為0.96 和0.862。與單模型相比,集成模型抽取出了更全面的特征,通過使用加權投票策略來進行肺癌的檢測使得更有效且更精確的降低了偽陽性。因此在Sensitivity 和Specificity 的指標上達到一個較好的平衡。

表 1 Sensitivity 和Specificity
對于利用Mask R-CNN 分割出來的肺結節大小,我們通過計算像素數來計算本方法所分割出的肺結節的體積計量相對誤差。根據醫生提供的兩個直徑大于5mm 標記的肺癌CT 圖像,標注肺癌所占像素總數為6029 及7549,我們用本文方法對其進行了體積測量。本文方法分割出的肺結節像素總數為6291 及7854,則相對體積計量相對誤差分別為:4.3%和4.0%。,平均體積計量相對誤差為4.15%。
在本文中,我們利用小樣本訓練集,提出了一個基于Mask R-CNN 的新方法用于肺癌的智能篩查。以PET 和CT 圖像數據訓練的Mask R-CNN 模型,用于肺結節的檢出,即肺癌候選區域的提取,之后我們通過加權投票的方法將兩種模型集成用于減少偽陽性的數量,最終實現肺癌的檢測。實驗結果表明所提出的方法可以有效的檢測出癌癥,并且有效的減少偽陽性的產生?;赑ET 的模型肺結節檢出率達可以達到100%,本文方法對肺癌診斷的Sensitivity 和Specificity 可以的達到 0.96 和0.862,所抽取的直徑超過5mm 以上的肺結節體積計量相對平均誤差為4.15%。因此本方法可以輔助醫生進行圖片的分析診斷并且提供有效的輔助診斷信息。