999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

結合降維與LBP特征的癌細胞識別研究

2019-04-25 07:34:48馬尚洋王勁松王金玉杜凱尹韶云
關鍵詞:特征方法

馬尚洋,王勁松,王金玉,杜凱,尹韶云

(1.長春理工大學 光電工程學院,長春 130022;2.中國科學院重慶綠色智能技術研究院 集成光電技術研究中心,重慶 400714)

20世紀初的數字X光乳房檢查系統,開啟了近代計算機輔助醫療系統[1,3]的大門。受益于計算機技術的飛速發展,基于細胞形態學特征的計算機輔助醫療圖像分析技術成為了可能。就目前而言,細胞形態學識別技術[2]的基本方法仍然是利用染色試劑對活檢組織細胞進行著色,然后采用光學顯微鏡對其進行成像,最后交由有經驗的病理學醫師對活檢組織進行判斷,得到相應的診斷結果。該技術具有較多困難:(1)對切片進行分析十分枯燥乏味;(2)是否患癌的判斷是由醫師給出,難免會對判斷引入人為認識誤差,而且也會存在人員間的認知誤差,主觀性強;(3)培養一名合格的病理醫師,需要投入大量的人力與物力資源。故發展計算機輔助判讀對改善細胞形態學識別具有重要意義。

現有的基于形態學[3]的計算機輔助醫療系統主要是利用8-鏈碼技術獲得相關細胞的周長、面積、致密度、矩形度等特征進行相關的判讀,這種方法很是依賴前期的圖像分割技術,分割技術的好壞直接影響后期的判斷結果,并且算法的實現也是相當復雜。2001年,南京大學陸新泉等人[4]利用癌細胞的形態、顏色特征采用神經網絡進行了肺癌細胞的分割與識別,并達到了90%的識別率。2012年,S.Issac Niwas團隊[5]通過對染色組織進行分割,利用HSV顏色特征和Log-Gabor小波變換特征并將這些特征輸入到SVM中進行分類識別,取得了93.2%的識別率。2017年,Sertan Kaymak等人[6]采用Harr變換重構乳腺癌細胞圖像,然后分別采用BP神經網絡和徑向基神經網絡對重構圖像進行識別,準確率分別為59.0%和70.4%。目前,基于深度學習的癌細胞識別方法[7-8],無需獲取細胞的顯式特征,就能夠獲得很高的識別率。但是,深度學習高識別率的前提是龐大的數據量(幾萬甚至幾十萬),通常醫學圖像很難滿足這樣大的數據要求。

本文采用LBP(Local Binary Patterns)描述圖像紋理得到其特征向量,避免了繁瑣的特征提取過程;然后采用MDS、PCA、LLE等算法分別對特征向量進行降維[9]減少計算量;最后采用BP神經網絡算法,對不同降維算法得到的結果進行分類識別,實驗結果表明數據規模為5×252,方法為LBP-LLE-BP時,準確率可達89.61%。

1 基本原理

1.1 LBP特征

LBP(Local Binary Patterns)特征即局部二值模式特征[10-11],獲取的是圖像的局部紋理特征,具有旋轉不變性和灰度不變性等一系列顯著的特征,最早是由 T.Ojala,M.Pietikaiunen和 D.Harwood在1994年提出,由于LBP特征提取方法簡單、描述效果良好,因此在機器視覺的諸多領域得到了廣泛地應用,其中最為著名的應用是人臉識別[12]和目標檢測。原始的LBP算子定義在像素3×3的鄰域以內,以鄰域中心像素為閾值,相鄰的8個像素的灰度值與鄰域中心的像素值進行比較,若周圍的像素大于中心像素值,則該像素點的位置被標記為1,否則為0。這樣,3×3鄰域內的8個點經過比較可產生8位二進制數,將這8位二進制數依次排列形成一個二進制數字,這個二進制數字就是中心像素的LBP值,LBP值共有28種可能,因此LBP值有256種。中心像素的LBP值反映了該像素周圍區域的紋理信息。

上面描述的過程用數學函數可以表示為:

式中,中心像素坐標(xc,yc)的灰度值為ic;ip表示為3×3鄰域內除中心像素外的其它像素點處的灰度值;S為公式2所示的函數關系:

圖1 LBP特征描述示意圖

基本的LBP算子最大的缺陷在于它僅能覆蓋一個固定半徑范圍內的小區域,這顯然不能夠滿足不同尺寸和頻率紋理的需要。為了適應多尺度的紋理特征以及實現灰度不變性的要求,Ojala等[10]對LBP算子進行了改進,將其稱為“圓形LBP算子”。該種算子將3×3鄰域擴展到了任意鄰域,并用圓形鄰域替代了原有的正方形鄰域,使得改進后的LBP算子實現了在半徑為R的圓形鄰域內有任意多個像素點,從而實現了圖2為例的含有P個采樣點的LBP算子,圖2中字母上標表示半徑,下標表示采樣點。本次研究所采用的即是圓形LBP算子。

圖2 三種典型的圓形LBP算子

1.2 降維算法

通過前文的分析得知,LBP特征的獲取必須基于灰度圖像,這在一定程度上降低了計算的復雜程度,但是數據量仍舊十分龐大。因此,在盡量保留圖像特征的基礎上,需要對數據進行降維處理,從而實現更加快速有效的計算。這一部分將會就目前研究中較為典型的高維數據降維算法[13-15]展開研究,并以此為基礎進行數據降維工作,為神經網絡輸入層提供數據。

1.2.1 局部線性嵌入算法

LLE(Locally Linear Embedding)算法,即局部線性嵌入算法,是由S.T.Roweis等人于2000年提出的一種針對非線性數據的無監督降維算法,是一種用局部線性的非線性實現維數約簡的方法,該算法在一定程度上擴大了對維數約簡的認識。LLE算法認為每一個數據點都可以由其近鄰點的線性加權組合構造得到。

LLE算法主要分為三步:第一步,求K近鄰,該過程采用的是與KNN算法一樣的最近鄰方法;第二步,求其在鄰域里的K個近鄰的線性關系,得到線性關系的權重系數;第三步,利用權重系數重構樣本數據。

1.2.2 多維尺度分析算法

MDS(Multidimensional Scaling)是非常傳統的降維算法,其以距離為標準,將高維坐標中的點投影到低維坐標中,保持彼此之間的相對距離變化最小。假定原始的高維數據樣本距離矩陣為D,在低維下的距離矩陣定義為Z,采用優化算法選取初始點,用梯度下降方法求出最佳逼近,使得‖D-Z‖最小,同時也可以采用內積法來求低維映射。前者在樣本較多時容易陷入局部最優,后者較穩定,但是樣本不多時,效果比前者要差。

1.2.3 Isomap算法

Isomap算法是在MDS算法的基礎上衍生出來的一種算法,MDS算法是保持降維后的樣本間距離不變,而Isomap算法則引入了鄰域圖,樣本只與其相鄰的樣本鏈接,二者之間的距離可以直接計算,較遠的點可以通過最小路徑計算距離,在此基礎上進行降維保距。

1.2.4 主成分分析算法

主成分分析算法PCA(Principal Components Analysis)是一種較為常用的降維技術,其主要思想是將N維特征映射到K維上,這K維是重新構造出的正交特征,將這K維特征稱為主元。在PCA中,數據從原來的坐標系轉換到新的坐標系下,新的坐標系的選擇與數據本身是密切相關的。其中,第一個新坐標軸選擇的是原始數據中方差最大的方向,第二個新坐標軸選擇的是與第一個新坐標軸正交且具有最大方差方向,依次類推,得到K個坐標軸,以此為依據形成特征向量。

1.2.5 SNE算法

SNE算法基本思想為:在高維空間內相似的數據點,映射到低維空間距離也是相似的。SNE算法通常是將歐氏距離轉換為一種條件概率來表示這種相似性的。主要有兩個步驟:

(1)構造一個高維對象之間的概率分布,使得相似的對象有更高的概率被選擇,而不相似的對象有較低的概率被選擇。

(2)在低維空間中重新構建這些點的概率分布,使得兩個概率分布之間盡可能的相似。

1.2.6 t-SNE算法

t-SNE(t-distributed-stochastic neighbor embedding)是由Laurens van der Matten 和Geoffrey Hinton于2008年提出來的一種非線性降維算法。t-SNE是由SNE算法優化來的,主要的不同在于:首先使用對稱型SNE簡化梯度公式;其次在低維空間中,使用T分布代替高斯分布去表達兩點之間的相似性。t-SNE這樣做的優勢在于,對于不相似的點,用一個較小的距離會產生較大的梯度讓這些點排斥開來,但是又不會使得排斥距離太大。

2 實驗及分析

本文實驗所用的乳腺圖片均來自威斯康辛大學多年收集標記的數據集[16],選取其中正常乳腺圖片115例,患乳腺癌圖片149例,總共選擇264幅圖片,用作是否患癌的二分類判別,其中每幅圖片的尺寸為1024×1024。

2.1 實驗步驟

第一步,采用LBP算子進行特征提取,特征數據規模為252×252。

第二步,將得到的LBP特征數據進行降維運算,采用的降維算法分別為MDS、PCA、LLE、MDS、SNE及t-SNE。

第三步,將降維得到的數據輸入BP神經網絡進行分類識別,數據規模如下:3×252,5×252,10×252,20×252,30×252。

第四步,將不同數據規模所得的實驗結果進行對比分析,得出結論。

圖3 算法工作流程圖

2.2 分類器設計——BP神經網絡

BP神經網絡是一種多層前饋神經網絡,該網絡的主要特點是信號向前傳遞,誤差反向傳播。在前向傳遞中,輸入信號從輸入層經隱含層逐層處理,直至輸出層。每一層的神經元狀態只影響下一層神經元狀態。如果輸出層得不到期望輸出,則轉入反向傳播,根據預測誤差調整權值和閾值,從而使BP神經網絡預測輸出不斷逼近期望輸出。

圖4 多層神經網絡拓撲結構圖

文章建立的BP神經網絡模型如圖4所示,總共有三層,分別為:輸入層、隱含層、輸出層。

(1)輸入層:本文輸入層為經過降維算法后得到的各個維度LBP特征向量,輸入向量的數目分別為:3×252,5×252,10×252,20×252,30×252。

(2)隱含層:在BP神經網絡中,隱含層數目的確定是一項非常重要和復雜的任務。目前,沒有一種標準的方法去確定隱含層節點的個數。節點數過多,網絡訓練時間增加且容易過擬合;過少,網絡則不能很好的學習,將會影響訓練結果。關于如何確定其數目可以參考公式(3)、(4)、(5)[17]:

式中,l為隱含層節點個數;n為輸入層節點數目;m為輸出層節點數;a為[1,10]之間的常數。

本文設計的神經網絡模型的輸出節點數為2,經過多次測試,最后確定隱含層的節點數目為15時可以獲得較好的實驗結果。

2.3 實驗結果以及討論

實驗過程中將選擇的264幅患癌圖像數據集隨機分為兩個部分,神經網絡訓練集包含220幅圖像,此外的44幅圖像作為測試集。將獲得的不同數據規模的LBP特征值輸入BP神經網絡,獲得的準確率如表1所示。

表1 不同降維方法的準確率(%)

從圖5中,可以看出簡單地增加數據規模(即提供更多的數據信息),并不能持續有效地提高BP神經網絡對于測試集數據的準確率。從數據規模上來看,當數據量為5×252時所有降維方法均取得了良好的識別效果,平均準確率為87.101%;從方法角度來看LLE方法在不同數據規模下表現出了很強的穩定性,平均準確率可以達到83.56%。

圖5 不同降維方法準確率對比

表2 不同降維方法的F1分數

準確率、精確率(P)、召回率(R)是評價神經網絡算法性能的三個重要參數,前文已對準確率進行了相關分析,下面將就精確率與召回率進行討論。通常,高精確率、高召回率的網絡性能更加優越,但是有時這兩個指標是相互矛盾的,因此需要綜合考慮。一般采用的方法是‘F measure’,公式表示為,其結果越接近1表示網絡性能更加優越。文章采用典型方法F1進行評價,即α=1時,,其計算結果如表2所示。從表2中不難得出,SNE方法數據規模為2×252時F1分數最高,達到了0.77,但其不同數據規模下算法穩定性低于LLE方法。綜合考慮準確率、算法穩定性以及F1分數可知,數據規模為5×252采用降維方法LLE時,BP神經網絡表現出了對于乳腺癌細胞最佳的識別結果,準確率達到了89.61%。

3 結論

計算機輔助判讀腫瘤細胞可以降低判斷過程中的主觀性,提高診斷準確率和速度。本文采用LBP特征描述乳腺癌細胞特征,以LLE算法降維到不同數據規模后,輸入BP神經網絡進行識別分類。實驗表明當數據規模降為5×252時可獲得最佳準確率89.61%。在后續的工作中將擴大數據集的規模;并且在本文的工作中BP神經網絡仍存在迭代緩慢的問題,采用附加動量算法或彈性BP算法或可改善網絡性能。

猜你喜歡
特征方法
抓住特征巧觀察
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
學習方法
抓住特征巧觀察
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 99久久国产综合精品2023| 日韩第九页| 国产一级精品毛片基地| 欧美啪啪网| 色综合日本| 亚洲AⅤ无码日韩AV无码网站| 国产精品九九视频| 中文字幕天无码久久精品视频免费 | 人妻少妇乱子伦精品无码专区毛片| 伊人激情综合网| 91丝袜乱伦| 久久久无码人妻精品无码| 国产精品美女自慰喷水| 久久国语对白| www中文字幕在线观看| 亚洲精品手机在线| 欧美国产日韩一区二区三区精品影视| 免费无码AV片在线观看国产| 欧美日韩午夜| 欧美伦理一区| 色综合天天综合中文网| 亚洲三级影院| 四虎成人免费毛片| 精品三级网站| 亚洲精品无码抽插日韩| 欧美精品三级在线| 中文字幕在线观| 人妻无码中文字幕第一区| 久久精品中文字幕少妇| 99偷拍视频精品一区二区| 伊人久久大线影院首页| 欧美视频二区| 福利在线不卡一区| 又黄又爽视频好爽视频| 国产精品网址在线观看你懂的| 99re视频在线| 国产免费怡红院视频| 国产精品污污在线观看网站| 欧美三级不卡在线观看视频| 1024你懂的国产精品| 欧美不卡在线视频| 高清视频一区| 国产精品无码制服丝袜| 久久综合五月| 少妇极品熟妇人妻专区视频| 91网红精品在线观看| 熟妇丰满人妻| 亚洲成人网在线观看| 99精品在线看| 新SSS无码手机在线观看| 久久人体视频| 日韩最新中文字幕| 精品丝袜美腿国产一区| 日韩国产欧美精品在线| 91网在线| 免费人成网站在线观看欧美| 成人精品亚洲| 一级毛片免费观看久| 亚洲欧美一区二区三区蜜芽| 国产精品专区第1页| 尤物成AV人片在线观看| 国产成人在线小视频| 国产欧美高清| 欧美精品成人一区二区在线观看| 亚洲伊人天堂| 情侣午夜国产在线一区无码| 国产免费网址| 亚洲综合激情另类专区| 精品夜恋影院亚洲欧洲| 丝袜美女被出水视频一区| 久久96热在精品国产高清| 伊人久久影视| 国产成人高清亚洲一区久久| 波多野结衣二区| 色婷婷亚洲综合五月| 国产一区二区三区日韩精品 | 色婷婷亚洲十月十月色天| a级毛片免费网站| 夜夜操天天摸| 91麻豆国产视频| 亚洲人成电影在线播放| 欧美午夜一区|