蔡亞潔 李暢 杜悅 張文龍 白羽 黃道斌



摘要:膀胱癌的發病呈現增高的趨勢,對放射科醫生來說,檢測和分類膀胱惡性腫瘤是一項耗時較大的工作。近年來,計算機輔助診斷系統的進步以及深度學習(Deep learning)的發展,使其成為醫學圖像處理的有力工具。文章提出一種基于深度卷積神經網絡的膀胱癌MRI圖像的優化模型,得到適合膀胱腫瘤MRI圖像分級和分期預測的算法,取得較好的預測診斷效果,膀胱腫瘤分級預測準確率93.75%,膀胱腫瘤分期預測準確率98.96%,為膀胱腫瘤的無創預測提供了新的手段。
關鍵詞:膀胱癌;MRI;計算機輔助診斷;深度學習;卷積神經網絡
中圖分類號: TP183? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)01-0029-03
Abstract: The incidence of bladder cancer is increasing. For radiologists, detecting and classifying bladder malignant tumors is a time-consuming task. In recent years, the progress of computer-aided diagnosis system and the development of Deep learning have made it a powerful tool for medical image processing. In this paper, based on the depth of the convolution of bladder cancer MRI images of neural network optimization model, suitable for bladder tumor MRI image classification and staged prediction algorithm, make better effect on predictive diagnostics, bladder tumor classification prediction accuracy 93.75%, forecast accurate staging rate 98.96%, provides a new noninvasive prediction of bladder tumor.
Key words: bladder cancer; MRI; computer aided diagnosis; deep learning; convolutional neural networks
膀胱癌作為一種世界流行的癌癥[1],在全球癌癥診斷中排名第九,在我國,膀胱癌作為一種泌尿系統常見的惡性腫瘤,可發生于包括兒童在內的任何年齡段的人群,且發病率隨年齡增長而增加,高發年齡為50~70歲,男性的發病率比女性更高,為女性的3~4倍[2]。近幾年來,由于吸煙人群增多、人口老齡化加劇、生態環境污染加重以及職業防護不完善,我國膀胱癌發病率呈現逐年增長趨勢[3]。
因為膀胱形狀的變化,尿液中強烈的強度不均勻性和人群特異性,以及腫瘤的外觀變化,都會為后續處理工作帶來困難。目前膀胱癌術前分期及病理分級主要依賴于膀胱鏡活檢,局部病理活檢易導致過低分期,無法觀察到腫瘤對膀胱壁外的侵犯情況[4],且其為有創檢查,對患者造成再次損傷,因此術前進行全面而準確的影像學分級和分期預測評估尤為重要。人類對于圖像的解釋是有限的,傳統的人工手動分級分期方法耗時長且準確度不高。與其他醫學影像檢查相比,MRI具有較高的組織對比度和軟組織分辨率,可進行多參數、多方位成像,并且具有多種掃描參數可選擇,在膀胱癌術前診斷分期、病灶分級及臨床療效監測等方面具有很大的優勢[5],準確鑒別腫瘤的分期和分級對于患者的治療和預后具有極其重要的臨床意義。
1 方法
1.1深度學習
深度學習的概念由 Hinton 等人于2006年首次提出[6],作為機器學習算法中的一個新興技術,其動機在于建立,模擬人腦進行分析學習的神經網絡,其本質是對觀察數據進行分層特征表示,實現將低級特征進一步抽象成高級特征表示。隨著人工智能和計算機視覺等相關領域的快速發展,深度學習也被運用于醫學圖像分類檢測,并取得了顯著的效果[7],深度學習正在成為通用成像和計算機視覺領域的領先機器學習工具,并且由于其對機器視覺及自然語言處理領域的探索與應用帶來革命性的突破以及在補充圖像解釋,增強圖像表示和分類等方面的潛力,使其能在醫學圖像處理領域也能得到廣泛應用[8]。特別是卷積神經網絡(Convolutional Neural Network, CNN),采用局部連接和權值共享的方式將圖像直接作為網絡的輸入,避免傳統識別算法中煩瑣的特征提取和數據重建的過程[9, 10],增強了其遷移能力,使其在醫學圖像的處理過程中有很大的優勢[11]。
1.2 VGGNet
牛津大學視覺幾何組(Visual Geometry Group)提出的VGGNet深度卷積網絡,取得ILSVRC-2014中定位任務第一名和分類任務第二名的成績,其突出貢獻在于證明使用通過很小的卷積(3*3),增加網絡深度能有效提升模型的訓練效果。
VGGNet-16在整體上可以劃分為8段,前5段為卷積網絡,后3段為全連網絡。每層卷積層中包含2~4個卷積操作,卷積核的大小是3*3,卷積步長是1,池化核是2*2,步長為2,將卷積層的深度提升到了16-19層[12, 13],VGGNet最明顯的改進就是降低了卷積核的尺寸,增加了卷積的層數,且對其他數據集也具有良好的泛化能力[14],隨著深度的增加,分類性能也逐漸提高,被廣泛運用于醫學圖像處理工作。但由于深度的增加,使用更多參數,將會耗費更多的計算資源,給實驗帶來困難,必須在其基礎上,利用VGGNet的優勢,通過改進的方式,使其更好地適用于目標圖像的處理工作。
2 實驗
2.1數據采集和預處理
訓練數據的數量與質量水平,對于深度學習中網絡模型有著很大的影響。實驗所采用的數據集來源于2019年中國大學生計算機設計大賽人工智能組挑戰賽,數據集包含480張512*512的膀胱掃描MRI 圖像,兩類已標注的標簽信息包括膀胱腫瘤的分級與分期情況。一個成功的神經網絡需要大量參數,使得這些參數得以正確工作則需要大量數據,由于本數據集圖片數量不大,可以通過數據增強來增加訓練樣本的多樣性,提高模型的魯棒性和泛化能力,避免過擬合。
為了提高模型性能,對原始數據集進行以下預處理:
1.針對數據集較小的情況,為了防止過擬合,我們對于原始圖像進行旋轉、翻轉、隨機裁剪和灰度值變換來擴充增強數據集;
2.調節圖像的對比度,增強磁共振組織邊緣的差異;
3.將數據集劃分為兩個互斥的集合,作為訓練集和測試集。在訓練集得出最優模型后,使用測試集進行模型預測,用來衡量該最優模型的性能和分類能力,作為對泛化誤差的估計。本數據集可按照二分類任務進行劃分,數據增強后我們采取5/1分樣,對其進行劃分,為了避免因數據劃分過程引入額外的偏差而對最終結果產生影響,劃分過程會盡可能地保持數據分布的一致性,在分類任務中為保持樣本的類別比例相似,采用了保留類別比例的采樣方式,即分層采集(stratified sampling)。
2.2訓練
所有實驗都是在Ubuntu16.04操作系統上,使用Nvidia GeForce 970 GPU計算卡進行。在Keras深度學習框架上構建CNN模型使用隨機初始化權重進行訓練,采用Adam優化器,學習率設置為1e-5,衰減指數為1e-5,使用交叉熵(binary crossentropy)損失函數,采用accuracy計算預測值上的正確率。
3 結果
在膀胱MRI 圖像數據集上進行膀胱腫瘤分級和分期模型訓練操作,在訓練過程中,若學習率設置過小,則收斂過程緩慢;若學習率過大,會導致梯度在最小值附近來回震蕩,難以進行收斂。根據多次實驗觀察以及調試經驗,將學習率Ir設為0.00001較合適。模型最后得到膀胱腫瘤分級預測準確率為93.75%,膀胱腫瘤分期預測準確率為98.9583333333%。在目標任務的完成中兩者準確率都達到90%以上,表現較為出色,相較于膀胱腫瘤分級的準確情況,神經網絡在分期中表現更好,準確率達到98.958%。
目前的研究成果尚有不足和提升空間,如小樣本易導致過擬合;圖像的采集和特征提取存在個體差異;僅對腹部MRI圖像提取出的PNG圖像進行了實驗,未對MRI原始圖像(數字影像和通訊DICOM)進行處理;MRI成像中存在噪聲,磁場非均勻性對特征計算的影響等,都會影響最終的準確率,這也是我們后期需要進一步優化和改進的地方。
4 結論
伴隨著時代的進步,醫學影像逐漸成為人工智能的熱門研究領域之一,深度學習在醫學圖像處理上取得了不俗的成績,同時計算機輔助治療也減輕了醫生的工作量。文章以膀胱腫瘤MRI圖像作為主要研究對象,從經典神經網絡模型入手,進一步找出適用于該疾病圖像分級和分期的網絡模型,實現膀胱腫瘤MRI圖像的預測診斷,未來將繼續優化和改進,彌補不足,使之能夠真正為臨床工作減輕負擔。
參考文獻:
[1] 張苗苗.磁共振成像在膀胱癌T分期中的應用[J].癌癥進展,2017,15(3):227-230.
[2] 曹利蓉,錢文燕,詹生虹.膀胱癌患者圍手術期的觀察及護理[J].中國保健營養(上旬刊),2013(12):7362-7363.
[3] 韓蘇軍,張思維,陳萬青,等.中國膀胱癌發病現狀及流行趨勢分析[J].癌癥進展,2013,11(1):89-95.
[4] 溫機靈,周祥福,高新,等.膀胱癌術前活檢分級低估現象分析[J].中華泌尿外科雜志,2006(12):833-835.
[5] 杜鵬,王煥軍,石宇強,等.基于多參數磁共振成像影像組學特征的膀胱癌復發預測[J].中國醫學裝備, 2018, 15(11): 46-50.
[6] LeCun Y,Bengio Y,Hinton G.Deep learning[J].Nature,2015,521(7553):436-444.
[7] Schmidhuber J.Deep learning in neural networks:an overview[J].Neural Networks,2015,61:85-117.
[8] Shen D G,Wu G R,Suk H I.Deep learning in medical image analysis[J].Annual Review of Biomedical Engineering,2017,19(1):221-248.
[9] Kim Y.Convolutional neural networks for sentence classification[EB/OL].2014:arXiv:1408.5882[cs.CL].https://arxiv.org/abs/1408.5882
[10] 龐絲絲,黃呈鋮.基于卷積神經網絡的圖像分類研究[J].現代計算機,2019(23):40-44.
[11] Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks[J].Communications of the ACM,2017,60(6):84-90.
[12] Shelhamer E,Long J,Darrell T.Fully convolutional networks for semantic segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(4):640-651.
[13] Zhang X Y,Zou J H,He K M,et al.Accelerating very deep convolutional networks for classification and detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2016,38(10):1943-1955.
[14] Billings S.Categorical mixture models on VGGNet activations[EB/OL].2018:arXiv:1803.02446[cs.CV].https://arxiv.org/abs/1803.02446
【通聯編輯:唐一東】