999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于小型深度學習架構的肺腫瘤識別研究

2020-01-10 12:43:46王兵銳王保平馬曉普
現代計算機 2019年34期
關鍵詞:特征

王兵銳,王保平,馬曉普

(南陽師范學院,河南省智能應急研究中心,南陽473061)

0 引言

肺腫瘤已成為人類因癌癥死亡的主要原因[1]。我國煙民眾多,遭受二手煙危害的人更是數不勝數。老齡化加快和大氣環境污染,肺腫瘤的發病率和死亡率一直呈現顯著上升趨勢。一般來說,早發現的良性肺部腫瘤,及時治療后的效果比較好。肺部惡性腫瘤如果早期發現,及時治療后的效果也是很不錯的。早期肺部腫瘤手術切除,再加上放療和化療,可以完全去除原腫瘤發病灶,以及消滅殘留的肺部腫瘤組織,可以完全徹底治愈。而中晚期肺部腫瘤,盡管治療后效果很差,嚴重縮短壽命[2]。中晚期肺腫瘤癌細胞會擴散整個身體,如果腫瘤轉移到肝臟,那么生存時間會大大降低。發生轉移后患者即使做手術效果也不好,術后如果轉移,生存期就會大幅度下降,甚至生存幾個月。及早發現肺部腫瘤和及早手術是非常關鍵的,一般預后良好。在病變早期得到診斷早期治療,才能獲得較好的療效。靠醫生的經驗來診斷是不夠的,醫生長時間連續工作容易疲憊有時容易誤診[3]。基于計算機技術采用圖像分類識別的方法可以提高診斷的效果。

用于處理圖像分類問題一般采樣支持向量機方法(Support Vector Machine,SVM)和深度學習方法。事物的分類識別問題的分界線一般不是線性的,常常是多種類別混淆在一起。例如人群中,用一條分界線區分男性女性,用一條線性直線是不能區分開的。肺腫瘤和肺部健康部分也是無法用線性直線劃分的。甚至人為觀察一個事物既屬于一個類別好像又屬于另一個類別的情況,在二維空間中難以找到答案。SVM[4]就是把一個線性不可分的問題,映射到高維空間,使該問題變為線性可分。在低維空間中線性不可分的多類事物在高維空間中一般是可分的,但取決于你映射到一個什么樣的高維空間。太低區分效果不好,太高運算量過大。這種低維轉換到高維最關鍵的步驟是找到一個事物到另一個事物的映射方法。但映射過程中,容易出現維度爆炸問題。當兩類事物由一維映射到二維時,多出三項數據。當三類事物由一維映射到二維時,多出六項數據。所以當多類事物由低維映射到高維時,維度數據呈現幾何指數級的爆炸式增加,這便是維度爆炸問題。SVM采用一個稱作核函數的運算,可以將事物特征從低維到高維映射,但具體還是在低維上進行運算,而實際的運算結果卻表現在高維上,從此解決了維度爆炸。核函數解決了非線性分類問題。然而,我們不知道什么樣的核函數是合適的,人們往往是根據經驗選取的,帶有一定的隨意性。不同的問題領域,核函數具有不同的形式和參數。目前沒有好的方法解決核函數的選取問題。但核函數的選擇對SVM的性能有著至關重要的作用。如果核函數選擇不當,會將事物映射到一個不合適的特征空間,可能導致分類效果不佳。那么應用到肺腫瘤上,合適的核函數的選取也是不容易的。

深度學習起源于神經網絡,常應用于醫療診斷中[5]。腦神經網絡會隨著生物體的慢慢生長而變得更加粗壯起來。在課堂上了解到的神經元,就好像有許多條河流匯聚到一起。把這些匯集到一起的支流叫做樹突。樹突能夠接收輸入到神經元的沖動,這種沖動被視為一種刺激,樹突感知到這種刺激,接著就會將它傳入細胞體,從而完成相應的任務。軸突和樹突的作用對應,是將之前傳入的沖動再通過神經元輸出。另外類似的計算機中也有和生物學中相應的神經元,只不過在計算機中的是一種模型,即神經元模型。它是由輸入、輸出、計算功能三部分構成的模型。計算功能和細胞的細胞核的作用比較類似,輸入和樹突有異曲同工之妙,輸出則和軸突相互切磋,共同來實現相應的功能。

1 卷積神經網絡架構

深度學習中最經典的應用是卷積神經網絡(Convo?lutional Neural Network,CNN),CNN 由多層可訓練體系結構組成。深度學習來自于人工神經網絡的相關分析[6]。有幾個隱藏層次的感知器是一個深層的學習結構。深度學習主要是通過和比較低級的特征來結合,從而更好地表達屬性類型或特征,還會利用挖掘數據的分布特征來對它們進行描述,從而構建出一種更抽象的高級方法。深度學習的好處是不僅可以代替人工來獲取特征從而進一步學習,而且通過分層特征來獲得有效的計算方法。

CNN與一般神經網絡的區別在于其包含卷積層和池化層,從而更好地抽取特征。CNN包含卷積層、激活層、池化層、全連接層等。采用的CNN架構如表1所示。表1中的size為輸入圖像的大小,為了運算方便,圖像的大小一般為size×size。

表1 CNN主要部分

CNN的卷積層由多個卷積核組成,這些單元的個數便是表 1 中 num1、num2、num3、num4,這些數值的取值一般不超過1024。每個卷積核的參數都是通過反向傳播算法,根據誤差多次更新迭代得到的,例如均方誤差函數,表達式如式(1)所示,其中yr表示真實值,y表示CNN預測值,n表示類別。卷積運算的目的是提取圖像的不同特征,卷積層1提取一些基本的特征如邊緣、角度等,更多的卷積層能從基本特征中提取更復雜更高級的特征。卷積核一般以高斯分布的形式初始化,大小通常為3×3。同一個層中,對不同的輸入圖片可以權值共享。共享權值也就是共享卷積核可以減少網絡各層之間的連接,減少運算量。卷積核這種局部連接保證了學習后的過濾器能夠對于局部的輸入特征有最強的響應。卷積核太小僅與輸入圖像的某一塊區域運算連接,能夠對局部的輸入圖像特征有較好的感應。

激活層,也稱作非線性層。一般用三種函數ReLU(Rectified Linear Units layer)、Sigmoid函數、Tanh函數。此處選用ReLU函數。某些情況下采用Tanh函數可以得到不錯效果。激活函數是實現數據輸入和輸出之間非線性化功能,這個方面類似SVM的映射問題。激活函數Sigmoid的表達式為:

池化層是為了特征網絡的參數來減小計算量且在一定程度上控制過擬合。池化層可以壓縮數據處理量,通常在卷積層的后面會加池化層。但在每個卷積層后面加池化層導致信息丟失量太大且頻繁使用。為了保證數據特征的信息量,權衡利弊,每兩個卷積層加池化層。池化操作對每個4×4數據會縮小為2×2。相對于卷積層的卷積運算,池化層進行的運算一般有以下幾種,最大池化取2階矩陣的最大值最常用。均值池化取2階矩陣的均值。高斯池化類似高斯模糊不常用。可訓練池化訓練函數使得接受2階矩陣為輸入輸出一個數據。池化層也被稱作下采樣層。這里采用最大池化,池化大小為2×2。如果不能恰好吻合輸入數據,還要邊緣補零。在輸入數據周圍補零來改變輸入數據大小從而控制輸出數據的維度大小。

降維層把高維數組進行降維處理,返回一個一維數組,也可以認為是鋪開操作。num5的數值等于(size/4)*(size/4)*num4。維數發生改變,但元素個數不會改變,前后一致。全連接層和卷積層可以相互轉換,對于一個卷積層把它變成全連接層,只需要把卷積核變成一個適當大小的矩陣,卷積核的大部分都是0,此時卷積層可以當做全連接層處理。全連接層輸入數據比較多,但輸出一般為分類的個數是個較小值。之前的各層進入到全連接層,輸入數據量要大于輸出數據量相當于降維操作。降維層把多維變為一維數據可以稱作數據預處理。

2 實驗測試

CT掃描是應對肺腫瘤的主要方法。用CT掃描做肺腫瘤分析,肺結節檢測是重要的一步。肺部結節有大有小性質多種多樣,有良性也有惡性。肺部結節是發生在肺部的類圓形,邊界清楚直徑小于或等于3cm,周圍被氣肺組織包繞的病變,可單發或多發。直徑小于3cm的軟組織病灶才稱為肺結節。結節的大小與其良惡性有一定相關性,肺部病變類圓形、直徑大于3cm稱為肺部腫瘤,惡性腫瘤較多,如圖1所示。而小于2cm的結節稱為小結節。

圖1 肺腫瘤CT圖

肺部結節有些屬于良性,根據CT影像能快速判定,有些判別起來就比較困難需要多次重復復查檢測。采用的是公開數據集LIDC/IDRI(Lung Image Data?base Consortium and Infectious Disease Research Insti?tute)。采用小型CNN架構和輕量數據集,選用包含結節的圖片1200張,健康圖片5000張,圖片大小為50×50,也就是對應表1,size的值為50。小型CNN具體架構為,對應表1中數據num1為32,num2為32,num3為 64,num4 為 64,num5 為(size/4)*(size/4)*num4,計算得到9216。num6為128,有時可選取256,512。cc為輸出類別個數,這里分肺腫瘤和健康兩類,所以cc為2。訓練迭代周期選為20,得到訓練的精度損失曲線,如圖2所示,其中橫軸為訓練周期,縱軸為精度損失的具體數值。

圖2 測試曲線

3 結語

肺腫瘤是所有癌癥中致死率最高的一種。采用深度學習的卷積神經網絡進行早期診斷識別,該網絡架構一共采用4層,卷積核個數最大為64,是一種輕量小型CNN,針對小型數據集,可以快速的得出結果。這種架構非常適合隨身攜帶的筆記本,筆記本的性能相比臺式機服務器相差很多,能在筆記本上快速運行也便于調試和演示。基于該架構,對肺腫瘤數據進行訓練學習,拆分為訓練集和測試集。迭代20次后得出測試曲線,圖2中,train_acc訓練精度和val_acc測試精度基本重合,兩條損失曲線也較好的纏繞在一起,說明過擬合控制的較好,沒有太大的過擬合產生。在小數據集下,測試迭代之后,訓練精度可達92.2%,測試精度可達91.8%。采用CNN輔助肺腫瘤的探測識別具有一定意義。

猜你喜歡
特征
抓住特征巧觀察
離散型隨機變量的分布列與數字特征
具有兩個P’維非線性不可約特征標的非可解群
月震特征及與地震的對比
如何表達“特征”
被k(2≤k≤16)整除的正整數的特征
中等數學(2019年8期)2019-11-25 01:38:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
詈語的文化蘊含與現代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 国产成人精品一区二区秒拍1o| 午夜国产大片免费观看| 2020极品精品国产| 亚洲国产中文综合专区在| 欧美天堂久久| 欧美一区二区三区欧美日韩亚洲 | 99草精品视频| 久久精品嫩草研究院| 国产精品亚洲五月天高清| 成人亚洲天堂| 毛片在线看网站| 久久99热这里只有精品免费看| аⅴ资源中文在线天堂| 欧美一级视频免费| 欧美日韩一区二区在线免费观看| 日韩毛片在线视频| 久久不卡国产精品无码| 亚洲人成影院在线观看| 伊人无码视屏| 久久久久88色偷偷| 精品国产自| 国产精品jizz在线观看软件| 国产精品乱偷免费视频| 好久久免费视频高清| 日韩天堂在线观看| 先锋资源久久| 亚洲人成网址| 欧美啪啪一区| 久久精品国产91久久综合麻豆自制| 国产JIZzJIzz视频全部免费| 国产一线在线| 欧美日韩一区二区在线播放| 波多野结衣无码视频在线观看| 日韩中文字幕免费在线观看| 毛片基地美国正在播放亚洲| 在线观看无码a∨| 国产人前露出系列视频| 国产精品第5页| 人人看人人鲁狠狠高清| 久久国产拍爱| jizz国产视频| 国内精品视频| 日韩国产黄色网站| 国产精品美女自慰喷水| 欧美国产在线一区| 99伊人精品| 3344在线观看无码| 亚洲视频三级| 日韩欧美成人高清在线观看| 99视频在线精品免费观看6| jizz在线观看| 免费国产无遮挡又黄又爽| 在线观看国产精美视频| 国产精品任我爽爆在线播放6080| 97青草最新免费精品视频| 蜜芽国产尤物av尤物在线看| 色婷婷丁香| 欧美激情成人网| 精品色综合| 亚洲中文字幕av无码区| 亚洲精品无码抽插日韩| 亚洲欧美日韩成人高清在线一区| 全裸无码专区| 国产精品性| jizz国产在线| 最新日韩AV网址在线观看| 九九九国产| 精品视频福利| 国产特一级毛片| AV在线天堂进入| 福利在线一区| 欧美日韩专区| 国产成人久久综合一区| 国产精品女同一区三区五区| 久久国产精品国产自线拍| 国产在线98福利播放视频免费| lhav亚洲精品| 内射人妻无码色AV天堂| 国产在线98福利播放视频免费| 国产成人超碰无码| 久久精品国产免费观看频道 | 精品伊人久久大香线蕉网站|