楊春然,郭翌,汪源源
復旦大學電子工程系,上海 200433
·專題論著·
基于影像組學的肺結節惡性程度預測
楊春然,郭翌,汪源源
復旦大學電子工程系,上海 200433

楊春然,理學學士,本科畢業于復旦大學信息科學與工程學院電子工程系,現為復旦大學信息科學與工程學院電子工程系醫學信號處理實驗室在讀碩士研究生。研究方向為肺部CT圖像中肺結節的檢測與診斷,主要使用的方法為影像組學與機器學習等。
目的:探討基于影像組學的肺結節惡性程度預測。方法:對肺部圖像影像數據庫(The Lung Image Database Consortium,LIDC)-IDRI (Image Database Resource Initiative)中604例肺結節患者的CT圖像進行分析,其中含肺結節的CT圖像共2 803幅,醫師手工勾畫肺結節輪廓。根據肺結節診斷標準,共提取96個灰度、形態和紋理高通量特征,輸入基于隨機森林的多類分類器進行惡性程度預測。惡性程度分為5級,以數字1~5表示。隨機選取1 000幅CT圖像作為訓練樣本,剩余的1 803幅CT圖像作為測試樣本,實驗重復10次。結果:對于單個肺結節,5類惡性程度的平均預測準確率為77.85%。對于每一類預測,曲線下面積(area under curve,AUC)均在0.94以上。對于每例患者,肺結節惡性程度的預測準確率為75.16%。結論:該研究提出的基于影像組學的方法對肺結節惡性程度的預測性能良好,可為臨床診斷提供可靠的輔助信息,以利于早期發現病灶。
肺結節;CT圖像;隨機森林;影像組學
肺癌是當今世界范圍內發病率最高的癌癥。2015年,中國有73.33萬例肺癌新發病例和61.02萬例肺癌死亡病例,高居癌癥發病率和死因首位[1]。臨床研究表明,早期得到檢測與治療的肺癌患者,5年存活率從14%上升至49%[2]。肺癌在早期階段常表現為肺結節形式,因此對肺結節的檢測及早期治療能明顯提高肺癌患者的存活率。
CT相比于普通X線檢查,可消除骨骼重疊的影響,還可提供更高的圖像分辨率及灰度對比度。肺結節在CT圖像上表現為圓形或類圓形高密度亮影,長徑一般在3 mm~3 cm。為了能以較高的靈敏度檢測肺結節,CT采用對患者肺部進行層厚較小的掃描,目前最薄層可達0.5 mm。因此,在使用CT對肺癌患者進行診斷時,每次掃描均會產生上百幅全肺部CT圖像。放射科醫師在閱片過程中,對肺結節的惡性程度打分,以數值的形式來表示其惡性程度。惡性程度通常分為5級,以1~5表示,等級越高表示惡性程度越高。在肺癌發病率持續增高和醫學影像學數據量與日俱增的情況下,大量閱片工作給醫師帶來了很大負擔并可能發生漏檢。
針對以上問題,人們提出了各類基于醫學影像學的計算機輔助檢測與診斷系統,借此來減輕醫師的負擔,并去除診斷過程中的主觀因素,使結果更加標準化和定量化。近年來,數據技術與醫學影像輔助診斷的有機融合產生了新的影像組學方法。該方法通過從影像中提取海量信息,實現腫瘤分割、特征提取與模型建立,憑借對海量影像學數據進行更深層次的挖掘、預測和分析,幫助醫師作出準確診斷,具有重要臨床價值[3]。目前,影像組學方法已應用于肺結節診斷,預測肺結節良惡性的準確率達76.10%[4],表明其在肺結節診斷中的可行性。為進一步研究基于影像組學的肺結節惡性程度的預測,本研究提取肺結節CT圖像的高通量特征,建立了基于隨機森林的多類分類器,實現了肺結節惡性程度的預測。
1.1 實驗流程
本研究的實驗流程圖如圖1所示,主要包括3個部分。

圖1 實驗流程圖
首先,從數據集中篩選出含有肺結節的肺部CT圖像;然后,根據醫師勾畫的肺結節邊緣提取出相應的感興趣區(region of interest,ROI);接著對ROI提取高通量特征,輸入基于隨機森林的5類分類器進行訓練或預測。在訓練階段,以醫師打分的惡性程度作為金標準使分類器收斂。在預測階段,由收斂的分類器給出肺結節惡性程度預測結果。
1.2 資料來源
本研究所使用的數據來自美國國家癌癥研究所(National Cancer Institute,NCI)發起的大型公開數據集——肺部圖像影像數據庫(The Lung Image Database Consortium,LIDC)-IDRI (Image Database Resource Initiative),包含從7個學術中心和8家醫學影像公司采集到的1 018例患者的肺部CT掃描成像結果。圖2分別給出一幅含肺結節和不含肺結節的CT圖像。

圖2 肺部CT圖像示例
每例患者CT掃描層厚為0.6~5 mm[5]。對每例患者的肺部CT圖像,均由放射科醫師進行診斷。在診斷過程中,首先勾畫結節輪廓,對長徑≥3 mm的結節勾畫出輪廓,對長徑<3 mm的結節僅給出結節的中心點,并給出該結節的病理信息建議分級。病理信息共9類,包括精細處、內部結構、鈣化程度、球形度、邊緣、分葉征、毛刺征、紋理及惡性程度。其中惡性程度最重要,直接代表診斷結果[6]。肺結節的惡性程度分為5級,統一存儲于XML文件中,方便研究者參考與查看。
考慮到最新肺結節診斷標準已將長徑<3 mm的肺結節排除在外[7],故本研究僅考慮長徑為3 mm~3 cm的結節。根據該標準篩選數據集中的病例,獲得含肺結節病例604例,合計CT圖像2 803幅。每幅含結節圖像均有與之對應的惡性程度打分。
由表1可見,該數據集中5類樣本分布不均勻,其中第1級最少,僅317例,占11.31%;惡性程度最高為第5級,有603例,占21.51%。

表1 5類樣本的分布情況
1.2 ROI提取
為提取高通量特征,需先提取ROI和肺結節。XML文件包含了放射科醫師勾畫的肺結節輪廓。據此,可在CT圖像中定位肺結節并同時提取ROI。在提取ROI時,考慮到提取的高通量特征中有邊緣特征,因此需保留部分邊緣背景區域。本研究ROI提取采用以下方法:在橫向取已勾畫的肺結節最左、最右側各增加肺結節橫向最大距離的1/4,在縱向取已勾畫的肺結節最上、最下側各增加肺結節縱向最大距離的1/4。在提取ROI的同時,采用醫師勾畫的肺結節邊緣填充內部區域,產生相應的肺結節二值圖像。
圖3分別給出一幅標注了肺結節的CT圖像、提取的ROI圖像及其對應的肺結節二值圖像。為方便展示,這里將圖3A所示的肺部CT圖像縮小了4倍。
1.3 高通量特征提取
基于影像組學的肺結節高通量特征是進行肺結節惡性程度預測的重要參數。本研究根據肺結節影像學診斷指南設計相應的高通量特征[8],包括肺結節的形狀、大小、邊緣毛刺程度、密度與強化程度等。共提取96個計算機定量特征,其中灰度特征16個、形態特征15個、紋理特征65個,如表2所示。
灰度特征是最基本的圖像特征,用來描述圖像灰度分布的相關性質,包括灰度均值、灰度方差、灰度直方圖等。形態特征指肺結節的大小和規則程度等。紋理特征通過像素點及其鄰域的灰度分布來表現物體表面緩慢變化或周期性變化的組織排列屬性,體現了肺結節區域的強度以及密度等性質。
1.4 肺結節惡性程度預測
將96個高通量特征作為分類器的輸入,進行肺結節惡性程度的預測。肺結節的惡性程度分為5級,是一個5類的分類問題,選用隨機森林進行分類[9]。隨機森林由很多決策樹隨機組成,每個決策樹都是一個弱分類器。在使用訓練樣本將隨機森林訓練好后,當有一個新樣本輸入時,森林中的每一棵決策樹都獨立判斷輸入樣本的類別,最終被決策樹選擇最多的類別即為隨機森林對輸入樣本所屬類別的預測結果。

圖3 含肺結節的肺部CT圖像(白線為醫師勾畫的結節輪廓)

表2 臨床影像學特征與提取的高通量特征對應表
首先,對5類樣本各隨機抽取200例作為訓練樣本,即利用1 000例訓練樣本來建立隨機森林分類器,所建立的森林中共有500棵決策樹。然后,將剩下的1 803例測試樣本輸入分類器中,獲得每例測試樣本經過分類器判斷而給出的對應于5類中每一類的概率,取概率最大值對應的類別作為測試樣本所屬的類別結果。
在臨床診斷中,最終需給出的是對患者病情的整體判斷。因此,根據每幅CT圖像的肺結節惡性程度預測結果,可進一步得到每例患者肺結節惡性程度。對每一病例所有圖像的預測結果進行統計,出現次數最多的結果作為其對應肺結節的惡性程度,并與醫師診斷結果進行比對分析。分類器的評價指標選取靈敏度、特異度、預測準確率及受試者工作特征(receiver operating characteristic,ROC)曲線的曲線下面積(area under curve,AUC)。實驗重復10次,取上述指標的均值作為最終分類器指標。由于本研究設計的實驗為多類的分類,因此在對每一類的分類準確率的計算中,都視作一個兩類的分類問題。例如,在考察第1類的分類準確率時,將第1類的樣本視為陽性樣本,第2~5類統一視為陰性樣本。
實驗結果如表3和表4所示。

表3 單幅圖像的肺結節惡性程度分類器預測結果

表4 患者的肺結節惡性程度分類器預測結果
對于單幅圖像來說,每一類分類的特異度均在92%以上,準確率均在85%以上,對應的AUC值均在0.94以上。第2、3、4類的靈敏度相對稍差;但在惡性程度最低的第1類和惡性程度最高的第5類,分類器的靈敏度均較好;對于惡性程度最高的第5類結節,分類器的靈敏度達87.56%。結果提示,本研究提出的方法在預測患者肺結節惡性程度的準確率方面表現良好。
對于每例患者而言,每一類的預測結果與單幅圖像的預測結果基本吻合,分類器對肺結節惡性程度最低和最高的患者均有較好的識別能力,靈敏度均在84%以上,對肺結節惡性程度的預測準確率為75.16%。在CT與PET/CT聯合應用于診斷肺結節良惡性的臨床試驗中,診斷準確率達73.70%[10-12]。而在Wang等[4]的肺結節良惡性預測實驗中,預測準確率為76.10%。對肺結節進行良惡性預測是兩類預測問題;而本研究提出的方法是對肺結節的惡性程度進行5級預測,是多類預測問題。在相似的預測準確率下,本方法可提供更加精確的信息,從而幫助醫師更加有效地診斷肺結節。
本研究提出了一種基于影像組學的肺結節惡性程度預測分析方法。通過對604例肺結節患者的2 803幅CT圖像進行分析,表明該方法對肺結節惡性程度的預測性能良好。對于單幅圖像,5類惡性程度預測的準確率為77.85%,靈敏度在70%以上,特異度在90%以上,AUC值超過0.94。對每例患者,該方法對惡性程度預測的準確率為75.16%。由此可見,采用影像組學高通量特征并構建隨機森林分類器,可充分利用計算機輔助診斷,有效減輕醫師負擔,降低漏檢率,從而為肺結節的臨床診斷提供可靠依據。
未來工作可研究更有效的肺結節影像學特征,以進一步提高肺結節惡性程度預測的準確率。
[1] 王慶生, 陳萬青. 癌癥防治策略的探索與分析[J]. 中國醫學前沿雜志, 2016, 8(7): 13-16.
[2] KAKINUMA R. Low-dose helical CT screening for lung cancer [J]. Jpn J Lung Cancer, 2003, 43: 1001-1005.
[3] 張利文, 方夢捷, 臧亞麗, 等. 影像組學的發展與應用[J]. 中華放射學雜志, 2017, 51(1): 75-77.
[4] WANG J, LIU X, DONG D, et al. Prediction of malignant and benign of lung tumor using a quantitative radiomic method [C]. International Conference of the IEEE Engineering in Medicine and Biology Society, 2016: 1272-1275.
[5] MCNITTGRAY M F, III S G A, MEYER C R, et al. The lung image database consortium (LIDC) data collection process for nodule detection and annotation [J]. Acad Radiol, 2007, 14(12): 1464-1474.
[6] 顧曉暉, 馬曉宇, 陳卉. LIDC中肺結節注釋信息的提取及數據庫的建立 [J]. 數理醫藥學雜志, 2009, 22(2): 203-206.
[7] MCNITTGRAY M F. Reduced lung-cancer mortality with low-dose computed tomographic screening [J]. New Engl J Med, 2011, 365(5): 395-409.
[8] 白春學. 中國肺結節診治共識制定及執行策略 [J]. 中華醫學信息導報, 2016, 31(1): 18.
[9] LEE S L, KOUZANI A Z, HU E J. Random forest based lung nodule classification aided by clustering [J]. Comput Med Imaging Graphics, 2010, 34(7): 535-542.
[10] 汪敏, 徐友平. CT結合 PET/CT顯像診斷孤立性肺結節誤診原因分析 [J]. 實用醫學雜志, 2013, 29(12): 2005-2007.
[11] 沈愛軍, 李洪江, 夏淦林, 等. 惡性孤立性肺結節CT影像特征 [J]. 中華實用診斷與治療雜志, 2013, 27(12): 1209-1211.
[12] 秦衛, 張愛平. 孤立性肺結節的良惡性鑒別診斷進展[J]. 中國胸心血管外科臨床雜志, 2011, 18(2): 153-156.
Prediction of pulmonary nodule malignancy based on radiomics
YANG Chunran, GUO Yi, WANG Yuanyuan
(Department of Electronic Engineering, Fudan University, Shanghai 200433, China)
WANG Yuanyuan E-mail: yywang@fudan.edu.cn
Objective:To investigate the method of malignancy prediction of pulmonary nodules based on radiomics.Methods:A total of 2 803 computed tomography (CT) images containing pulmonary nodules were extracted from 604 scans in the publicly available dataset of The Lung Image Database Consortium (LIDC)-Image Database Resource Initiative (IDRI). Each contour of nodules was labelled by the clinical doctor. Totally 96 high throughput features including gray level features, shape features and texture features were extracted according to the pulmonary nodule diagnosis criteria and put into the multi-class classif i er based on the random forest to predict the malignancy. The degree of malignancy was classif i ed into 1 to 5 levels. Among all images, 1 000 of them were randomly chosen as the training set and the rest were used as the testing set. The experiment was repeated 10 times.Results:For a single nodule, the average prediction accuracy of five levels was 77.85%. The area under curve (AUC) of each category reached over 0.94. For each patient, the malignancy prediction accuracy of pulmonary nodules was 75.16%.Conclusion:The method of malignancy prediction of pulmonary nodules based on radiomics has a good performance. The results can provide a reliable basis for clinical diagnosis and help to detect the disease in the early stage.
Pulmonary nodule; CT image; Random forest; Radiomics
R445.3
A
1008-617X(2017)02-0097-05
2017-04-01)
汪源源 E-mail:yywang@fudan.edu.cn