安鳳平,李曉薇,曹 翔
1.淮陰師范學院 物理與電子電氣工程學院,江蘇 淮安223300
2.北京理工大學 信息與電子學院,北京100081
隨著計算機和醫學影像領域的快速發展,電子計算機斷層掃描(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)等醫學影像能夠在非介入的情況下反映人體內部組織和器官的生理狀態,已逐漸成為醫學研究、臨床診療以及手術規劃中不可或缺的重要工具。這些新技術在為醫學理論和醫療技術帶來進步的同時,也提出了新的問題,比如需要醫生對診斷結果進行分類和處理等。圖像分類技術能夠在一定程度上對圖像內容進行自動理解,它可以對醫學圖像中的病灶區域進行有效識別,可以協助醫生進行高效診斷。但是,現實中的醫學圖像種類繁多,為了區分這些醫學圖像的類別信息,往往需要采用不同的處理和分析方法。目前,醫學圖像分類大多基于模式識別方法,然后利用分類模型對醫學圖像進行識別和區分。根據分類模型訓練方法的不同,一般可以將醫學圖像分類分為有監督分類方法和無監督分類方法。
有監督的分類方法是指提前給定樣本標簽,通過帶標簽的圖像特征訓練分類模型,分類的類別通常都是預先指定的。主要的有監督分類方法包括K近鄰算法、貝葉斯模型、邏輯回歸、神經網絡、支持向量機等。以基于神經網絡的醫學圖像分類方法效果最佳,這是因為神經網絡能夠解決圖像分類中小樣本、非線性可分等問題,并且分類精度和運算時間都具有較大優勢。Abbass提出了一種基于Pareto 差分進化算法的神經網絡用于乳腺癌WBCD(Wisconsin breast cancer database)數據集分類,獲得了比傳統的神經網絡更好的分類性能。Karabatak 等人利用關聯規則進行維度約減,將9 個特征約減為4 個特征,再用ANN(artificial neural network)進行分類,在乳腺癌WBCD 數據集上其2 折交叉驗證的準確率達到90%。但是該類方法存在無法自適應地匹配醫學圖像本身特征信息,導致分類效果在不同醫學圖像存在較大的差異性。
無監督的分類方法是在沒有預設樣本標簽的前提下,根據樣本間的相似度自動劃分出不同類別,無監督學習本質上是一個聚類過程,常用的聚類算法如-means、模糊C 均值以及主成分分析(principal components analysis,PCA)等都是典型無監督方法。比如2010 年,Juang 等人提出了利用具有均值聚類技術的顏色轉換分割算法。該方法能夠通過添加基于顏色的分割操作來解決磁共振成像(MRI)圖像中無法精確找到病變對象輪廓的問題。2004年,Zhang 等人提出了一種新的MRI 數據模糊分割算法,分割效果較好,但后面的識別準確率較低。2012 年,Singh 等人提出了一種基于PCA 的自動分類MRI 圖像和自然圖像的方法,實驗表明,分類精度達到91%。雖然該類方法實現比較簡單,在圖像識別和分類應用取得了一定的效果,但是分類效果在不同醫學圖像分類和識別中存在較大差異問題,不能根據醫學圖像本身特性進行良好的自適應分類和識別。
近年來,隨著深度學習理論的發展,基于深度學習的醫學圖像分類研究再度引起相關學者的高度關注。深度學習是有監督和無監督方法有機結合,它通常先利用無監督學習訓練深度神經網絡,然后通過有監督學習方法進行微調。在深度神經網絡發展初期,醫療圖像識別側重于無監督的預訓練,如棧式自編碼器(stacked autoencoder,SAE)和RBM(restricted Boltzmann machine)。比如,2013 年Brosch 等人利用深度信念網絡用于神經影像學的圖像分類。Plis 等人利用深度信念網絡和棧式自編碼器,基于腦磁共振成像診斷患者是否患有阿爾茨海默病。Cheng 等人利用SAE 進行乳房超聲病灶和非結節的智能識別,性能與常規方法相比有顯著的提升。Kallenberg 等人利用卷積稀疏自編碼器從無標簽的乳腺癌X 射線照片中提取特征,卷積稀疏自編碼器和經典卷積神經網絡(convolutional neural networks,CNN)之間的主要區別是使用具有稀疏自動編碼器的無監督預訓練。近期對醫療圖像分類方法的研究主要集中在卷積神經網絡方面,這是因為該類方法具有較高的自適應能力和較好的效果。同時,在實際的醫學影像中的分類任務通常指的是將醫學圖像的某個局部(先前識別的)分為兩個或多個類別。對于這類任務,往往需要結合關于病變出現的局部信息和關于病變位置的全局上下文信息以更加精確分類。此類要求通過通用深度學習架構是很難實現的。相關研究者嘗試利用多網絡分支架構解決該問題。比如,2015 年,Shen 等人通過構建三個CNN,每個都采用不同尺度的結節片作為輸入。然后將三個CNN 的輸出連接以形成最終特征向量。2016 年,Kawahara 等人嘗試利用多分支CNN 對皮膚病變進行分類,其中每個分支工作在不同的圖像分辨率上。2017 年,Esteva等人使 用129 450張臨床圖像的數據集對CNN 進行模型訓練,實驗內容為兩個二分類任務:一個是角質形成細胞癌與良性脂溢性角化病,另外一個是惡性黑素瘤與良性痣。實驗結果表明,CNN對皮膚癌的分類水平基本達到了皮膚科醫生的水平。2018年,針對乳腺癌晚期患者,Bidart等人利用全卷積神經網絡(fully convolutional neural networks,FCNN)設計了一種乳腺癌組織切片細胞核自動定位方法,并將乳腺癌組織切片的細胞核圖像分成淋巴細胞、良性上皮細胞和惡性上皮細胞三類,分類準確率達到94.6%。綜上可知,深度學習理論在醫學圖像分類中得到了廣泛的應用。但是醫療圖像與自然圖像特征不相同,比如病灶只占整個圖像的一小部分,而且病灶的發生對周圍的組織會產生影響等。如何根據這些特點構建性能更優異的CNN,獲得更高性能的醫療圖像智能分類結果,是一個需要解決的難題。同時,由于網絡深度影響了卷積神經網絡的非線性建模能力,初始化不當會導致深層網絡難以收斂,當前還沒有較好的初始化方法。鑒于此,本文首先從網絡優化角度出發,通過優化方法提高網絡的非線性建模能力,并可通過改善吸引域提高收斂后的解的泛化性能。進而提出了一種新的網絡權重初始化方法,緩解了現有深度學習的初始化理論受限于非線性單元類型的問題,使得深層網絡的結構設計可以有更多的選擇,增加了神經網絡處理不同視覺任務的潛力。同時,為了充分利用醫學圖像的特性,本文針對多列卷積神經網絡的框架進行了研究。首先,通過改變卷積神經網絡不同層次的特征圖數量和卷積核的大小,構造了不同結構的卷積神經網絡模型,以更好地適應待處理醫學圖像的醫學特性;然后,不同的卷積神經網絡模型分別在同一個數據集上進行訓練;最后,訓練得到的異構多列卷積神經網絡再通過本文提出的一種自適應的滑動窗口融合機制,共同完成醫學圖像的分類任務,實現醫學圖像的自適應、高精度分類。基于上述思想,本文提出了一種基于權重初始化-多層卷積神經網絡滑動窗口融合的醫學分類算法。
醫學圖像的分類問題本質上就是特征提取后再進行識別的問題。雖然淺層網絡能夠實現識別系統中輸入到輸出的復雜非線性變換,但需要極高計算復雜度才能達到與深層網絡相近的非線性表示能力。因此,在一定計算復雜度的條件下,增加網絡深度是解決醫學圖像分類問題的最可靠方法。然而深層網絡的優化是深度學習中的難題,尤其是初始化不當引起的梯度爆炸問題?,F有方法中,MSRA(Microsoft research lab Asia)法具有良好的收斂性和泛化性能,不足之處是受限于特定的網絡類型;高斯初始化不需要特定的網絡類型,但是其網絡收斂性和泛化能力不足。鑒于此,本章提出新的初始化方法,旨在通過優化技術來提高模型的收斂性和泛化能力。本文提出的初始化方法將會結合上述兩類方法的優點,避免其不足。本文所提初始化方法是MSRA方法的延伸和擴展,因此本章將分為MSRA 方法介紹和本文方法闡述兩部分。
對于第個卷積層,其輸出中的某個像素y可以表示為:

其中,y是一個隨機變量,w和x是相互獨立的隨機向量。偏置項b以0 進行初始化。接下來考察y方差和y方差的關系。

式中,k表示卷積核大小,c是卷積層輸入的通道數。 w和x是相互獨立的隨機變量。式(4)的成立條件是式(3)中的隨機向量w中的元素和x中的元素均是獨立同分布的。當w以0 均值初始化,那式(4)可以轉化為下式:



對于不同類型的非線性單元,式(6)會得到不同的解,不同的解對應了不同的初始化方法。對于Sigmoid 非線性,式(6)可以調整為下式:

文獻[43-46]在式(7)的基礎上假定原點附近x與y是線性關系,此時可以得到Xavier 初始化方法。對于ReLU 非線性,式(6)可以調整為下式:

He 等利用式(8)將Xavier 初始化推廣到ReLU網絡。
將式(7)代入式(5)可得到適用于Sigmoid 網絡的Xavier初始化方法,同理將式(8)代入式(5)可得到適用于ReLU 網絡的MSRA 初始化方法??梢?,初始化的解析解是x與y關系的函數。但是,如果式(6)的展開式存在高次項,式(5)將難以求解。因此,當前主流的初始化方法在理論上不適用于ReLU 和Sigmoid以外其他類型的網絡。針對這一問題,本文通過引入泰勒公式提出了一種更加通用性的初始化方法。
根據Gulcehre 等對非線性單元的定義,非線性單元是一個由實數空間到實數空間的映射,且幾乎處處可導,即:R →R,為了推導方便,定義非線性單元為下列函數:

其中,為非線性單元的輸出,為非線性單元的輸入,且滿足在∈R 內幾乎處處可導。假設∈R內存在一點,使得()=0,根據定義在處具有至少一階導數或下梯度存在,對在=處進行≥1 階泰勒展開有:

通過觀察式(5)可以發現,當式(10)中的階數為2 時,該方程難以求解。為了解決這一問題,本節利用泰勒公式對非線性單元做近似計算,取式(10)中≤1 的線性項。雖然這種方法會引入一定的誤差,但該誤差在初始化階段是可以忽略的。根據定義,若在=處連續且可導,則式(10)可以簡化為下式:

若在=處連續不可導但下梯度存在(比如ReLU),則有:

式(11)可以看作式(12)的特例,因此本文基于式(13)進行推導。
若′()=′()=0,則=(),任意∈R 。這表明非線性單元的輸出恒為常數。這將導致卷積神經網絡失去判別力,因而需排除這種情況。




式(16)描述了相鄰卷積層的輸出方差之間的關系,考慮第層的輸出方差與第1 層的輸出方差之間的關系如下:

從式(17)可以看出,Var(y)的大小與是指數上升的關系。而且,對非線性單元:R →R,如果不存在點,使得()=0,則當很大時,Var(y)也將是一個很大的數,從而導致Softmax 層的輸出溢出,網絡無法收斂。對于大部分非線性單元而言,通常設計其函數過原點,即:

不妨取=0,即在=0 處對做泰勒展開。此時的初始化值也變為0,那么式(17)可以簡化為:



將上式代入式(18)可得:

通過式(21),如果卷積層參數的方差滿足上述關系,則前向傳遞過程中輸入信號的幅值不會發散或消失,這進一步保證了后向傳遞過程中梯度流的合理。通過上述分析,得出本文提出的自適應泰勒初始化方法為:


綜上所述,Xavier 初始方法基于非線性單元在原點處是線性函數的假設,因此適用于Sigmoid 網絡;MSRA 初始化方法將Xavier 初始化理論推廣到ReLU/PReLU 網絡,但理論上不適用于其他類型的網絡。雖然LSUV(layer sequence unit variance)初始化是通用性的方法,但基于數據驅動,無法求得解析解且計算速度較慢。本文提出了自適應泰勒初始方法,緩解了現有初始化理論受限于非線性單元類型的問題,與其他方法相比,有較強的通用性且能求得解析解。
為了使卷積神經網絡更多地融合醫學圖像自身特征信息,本章從網絡結構和網絡融合兩方面對卷積神經網絡進行進一步的研究。在網絡構成上,本章主要研究卷積神經網絡的多層特性,也即通過構建不同網絡結構模型對同一醫學圖像進行差別化學習,從而提高整個網絡的泛化性能。同時,對于多層卷積神經網絡模型,本章提出了一種基于滑動窗口的多層網絡融合方法,該方法能夠對多層網絡的分類結果進行靈活的選擇,優化多層卷積神經網絡的融合過程,提高醫學圖像分類精度。
通過結構不同的多個卷積神經網絡可以組成多層卷積神經網絡,該多層卷積神經網絡的示意圖如圖1 所示。

圖1 本文所提的多層卷積神經網絡結構圖Fig.1 Structure diagram of multi-layer convolutional neural network proposed in this paper
在卷積過程中,卷積層對模型影響如下:(1)卷積核的大小決定感受野的尺度,也影響特征信息的多少;(2)卷積核的數目決定特征信息豐富程度。鑒于此,本節通過構建卷積核大小以及特征圖數目不同的多個卷積神經網絡,而后利用各個卷積神經網絡進行訓練,從而實現通過不同的網絡模型結構擬合訓練數據集的目的。最終,融合多層卷積神經網絡得到最后輸出結果,以便獲得較優分類精度。
文獻[32]提出了針對輸入圖像進行不同的預處理而帶來網絡模型的多樣性,但本文與文獻[32]的思想不同,本文多層卷積神經網絡多樣性是由于該模型中蘊含多個結構不同的卷積神經網絡。
一般的分類器融合方法主要有:最小規則(min rule)、最大規則(max rule)、平均規則(average rule)以及乘積規則(product rule)等。該類方法功能單一,局限性較大。故本文提出了一種全新的基于滑動窗口的分類器融合方法。該方法是一般分類器融合方法的普遍化拓展。它比傳統的分類器融合方法更靈活和一般化。
本文以10 層卷積神經網絡為例,對滑動窗口融合方法進行描述。該方法的基本流程如圖2 所示。

圖2 多層卷積神經網絡滑動窗口融合示意圖Fig.2 Schematic diagram of sliding window fusion of multi-layer convolutional neural network
對于一個輸入的醫學圖像,經過各層卷積神經網絡進行前向傳導之后,1 到10 為各層卷積神經網絡針對某個類別的分類概率。上述概率由低到高排序,然后一個滑動窗口被運用到經過排序后的分類概率分布中產生最終的分類結果。該過程主要完成以下工作:
(1)確定哪些網絡的分類結果會融入到后續結果當中,該功能通過窗口的起始位置和選取范圍確定。
(2)確定選定分類結果的融合方式,該功能通過參數Operation 來確定。在實際的網絡融合過程中,滑動窗口融合相比于傳統的單一融合方式更靈活。融合過程如下:
①參數說明
對于輸入層,(,)表示第列卷積神經網絡對第個類別的預測概率;表示滑動窗口的起始位置(Start);表示滑動窗口的范圍(Range);表示滑動窗口的操作(Operation,可以設置為“Sum”和“Product”)。對于輸出層,()表示滑動窗口融合后對第個類別的預測概率。
②卷積神經網絡的列數:←(,1)。
③預測的類別數:←(,2)。
④對于類別從1 到做循環處理,將多列卷積神經網絡的預測拼接成一個向量←[(1,),(2,),…,(,)],對向量中的元素進行排序t←(,1)。
⑤當==Sum,()←從t()開始往后個元素累加;==Product,()←從t()開始往后個元素累乘。
注意:對于t的索引超出時,則從t(1)開始索引。


Product 表示對所有經過滑動窗口選擇的概率相乘得到最終分類概率:



通過調整滑動窗口融合參數后,該方法會轉變為其他分類器方法,具體如表1 所示。

表1 滑動窗口融合方法的特例Table 1 Special cases of sliding window fusion method
該融合方法涉及的參數(,,)通過窮盡與訓練方式得到。窮盡方式雖然理論上可以得到最好的分類效果,但是存在以下缺點:(1)窮盡方式得到參數所采用的算法復雜度大,記為(),其中是卷積神經網絡模型的數量;(2)窮盡方式可以對已知數據測試效果較好,對未知數據測試效果較差。因此,窮盡方式不能滿足實際的測試要求。訓練方式是得到在訓練集上所有參數組合,最后找到最優參數進行相關測試。其復雜度仍為(),但是測試的復雜度降低為(1)。使用訓練的方式得到方法的相關參數,它有利于提高方法的通用性和普適性。因此,本文使用該方式得到相關參數。
基于上述內容,本章構建基于權重初始化-多層卷積神經網絡滑動窗口融合的醫學分類算法。首先建立一個較優的卷積神經網絡權重初始化方法,旨在通過優化技術來提高模型的收斂性和泛化能力。避免由于權重初始化問題導致卷積神經網絡出現梯度消失等問題;而后該權重初始化方法引入到本文第2 章縮減了的多層卷積神經網絡滑動窗口融合模型當中,從而提升多層卷積神經網絡滑動窗口融合模型的自適應能力和泛化能力;最后建立基于權重初始化-多層卷積神經網絡滑動窗口融合的醫學分類算法。所提出醫學圖像分類算法的基本流程圖如圖3所示,它的基本步驟如下:

圖3 本文所提醫學分類算法基本流程圖Fig.3 Basic flow chart of medical classification algorithm proposed in this paper
(1)首先對醫學圖像數據進行去噪等預處理。
(2)利用本文提出的自適應泰勒權重初始化方法進行卷積神經網絡權重初始化,因為本文提出的卷積神經網絡權重初始化方法能夠有效緩解現有初始化理論受限于非線性單元類型的問題,與其他方法相比,有較強的通用性且能求得解析解,從而提升卷積神經網絡模型的自適應能力和泛化能力,進而更多地獲取醫學圖像特征信息。
(3)為了改善單個卷積神經網絡無法完整獲取醫學圖像的復雜特征信息,本文通過構建不同的網絡結構對同一個醫學圖像的特征進行有差異化的學習,從而提高整個網絡的泛化性能。同時,針對多層網絡的融合,提出了一種滑動窗口融合機制,實現對多層網絡的分類結果進行靈活的選擇,優化多層卷積神經網絡的融合過程,提高醫學圖像分類精度。
(4)將步驟(2)的方法引入到步驟(3)當中,進而通過步驟(1)~(3)建立基于權重初始化-多層卷積神經網絡滑動窗口融合的醫學分類算法,利用該醫學圖像分類算法對相關實例進行分析,得到分類結果。
本實驗所用乳腺腫塊圖像數據集是由南佛羅里達大學發布的乳腺鉬靶X光圖像數據集DDSM(digital database for screening mammography)。該數據集包含了乳腺腫塊良惡性的類別標簽和像素級別精度的病變區域標注信息。具體實驗數據設置如下:數據集中的600 幅圖像(分別有300 幅良性腫塊圖像和300 幅惡性腫塊圖像)分別按照60%、40%的比例將乳腺腫塊數據劃分為訓練集和測試集。每個集合中的良性腫塊和惡性腫塊的數目相同。
為了驗證本文方法的有效性,本文選擇多次隨機劃分數據集的平均分類準確率(100 次隨機劃分的平均結果)作為實際測試結果,并與主流方法(其中文獻[48]是機器學習分類方法,文獻[49-50]均為優化CNN 方法)進行對比。具體測試結果如表2 所示。

表2 不同方法分類精度對比Table 2 Comparison of classification accuracy of different methods
表2 給出了不同分類方法的乳腺腫塊良惡性分類結果,通過表2 可知,本文所提的基于權重初始化-滑動窗口融合卷積神經網絡的醫學圖像分類方法獲得了較好的效果。本文方法比文獻[48]分類精度高2.8 個百分點,說明本文方法較傳統的機器學習方法具有明顯的優勢。本文方法比傳統CNN 精度高1.7個百分點,這說明本文方法較傳統CNN 方法具有一定的優勢。本文方法得到的分類精度比文獻[49-50]方法分別高1.5 個百分點和1.1 個百分點,這也從側面驗證了本文所提的卷積神經網絡方法要優于其他主要優化卷積神經網絡方法。為了更好地說明本文方法為何優于其他卷積神經網絡方法,下面就本文方法的理論及實際計算思路進行解釋和說明。
本文方法對乳腺腫塊圖像進行可視化處理,得到的原始乳腺腫塊圖像灰度特征、CNN 特征表示層獲得的腫塊特征和特征變換后的CNN 特征進行了特征向量可視化分布,結果如圖4 所示。圖中,(a)~(c)分別代表腫塊圖像原始灰度特征、CNN 特征表示網絡層的特征向量和經過本文方法處理后的網絡層特征的可視化結果。每幅圖中,黃色和藍色的點分別代表良性腫塊圖像樣本和惡性腫塊圖像樣本。通過比較圖中的不同層特征分布的可視化結果,可以知道,本文采用的CNN 特征和經過多層滑動轉換后的特征大幅提升原始良惡性乳腺腫塊圖像間的區分性。此外,對比網絡層代表的未經過大間隔度量學習層轉換的CNN 特征表示,可以發現大間隔度量學習層能將原始乳腺腫塊圖像CNN 特征轉換到類內分布更緊湊、類間分布更離散的新特征空間,使得不同類別腫塊在特征空間中的可區分性更強,保證具有該特性的腫塊圖像特征分布更有利于分類準確率的提升。

圖4 乳腺腫塊特征可視化分布Fig.4 Visualized distribution of breast mass features
本實驗數據源自北京大學第三醫院,它包含12名腦腫瘤患者的腦部MRI 橫斷面圖像。所有圖像都進行格式、降噪等預處理,再由神經外科和影像科醫生生動描繪出腦腫瘤真值區域,將其作為訓練樣本標簽及對比實驗參照標準。同時,由于卷積神經網絡模型訓練需要大量樣本,為了擴大訓練樣本數量和測試本文方法對不同腦腫瘤圖像進行分類的結果,實驗中通過留一法進行十折交叉驗證。對于所測試的12 幅腦腫瘤MRI 圖,每次選取11 幅圖像進行訓練,另外1 幅圖像作為測試集,每次實驗中收集的訓練樣本和測試樣本數目如表3 所示。

表3 每次實驗樣本情況Table 3 Sample situation for each experiment
實驗中,首先對本文提出的基于權重初始化-滑動窗口融合卷積神經網絡的腦腫瘤組織分類方法進行測試。為了驗證本文方法的有效性,將本文方法與傳統機器學習方法、其他深度學習方法進行比較。所有的實驗數據及實驗環境均保持一致,相關參數設置均通過尋優法獲得,腦腫瘤組織分類結果的準確率如表4 所示。

表4 腦腫瘤組織分類結果對比Table 4 Comparison of classification results of brain tumor tissues %
通過表4 可知,傳統的機器學習方法SVM 準確率僅為88.19%,這是因為SVM 屬于小樣本訓練、測試方法,相對大樣本來說,它的效果不如深度學習方法。傳統的CNN 方法平均分類準確率為91.12%,較SVM 方法提升了將近3 個百分點,這也充分說明了深度學習方法較傳統機器學習方法具有較大的優勢。文獻[51]提出的優化CNN 方法的平均分類準確率為93.67%,它不僅遠高于傳統SVM 方法,也高于傳統CNN 方法。這是因為該方法在一定程度上抑制了卷積神經網絡存在的過擬合問題,故取得了較好分類效果。本文方法得到的平均分類準確率達到95.71%,在12 例腦腫瘤患者MRI 樣本的圖像塊分類任務中,都取得最高的準確率,尤其是在分類難度較高的2 號樣本、11 號樣本和12 號樣本中體現了較為突出的優勢,它充分驗證了本文方法在大幅度提升分類準確率的同時,也具有良好的穩定性和魯棒性。這是因為本文方法能夠較好地解決卷積神經網絡存在的權重初始化和過擬合等問題,所以該模型結構能夠充分發揮深度學習方法的優勢,故分類效果最高。此外,這四類方法在運算速度上,本文方法較其他深度學習方法更優,與其他機器學習方法處于一個計算量級上。也就是說本文方法較其他深度學習方法的復雜度要低,與其他機器學習方法復雜度差異不大。
為了進一步驗證本文所提算法對醫學圖像的分類效果,本節將對兩個公開的醫學數據庫(TCIA-CT數據庫和OASIS-MRI 數據庫)進行分類測試,并與主流圖像分類算法進行對比分析。
(1)數據庫介紹及測試過程說明
TCIA-CT 數據庫是美國國家癌癥研究院和華盛頓大學聯合建立的開源數據庫。按照文獻[54]中的設置,本文獲得與DICOM 圖像類型相同的TCIA-CT數據庫,它將用于本節的實驗測試,部分圖片示例如圖5 所示。本文從數據庫中選擇604 張結腸影像圖片。而且,該TCIA-CT數據庫包含了8類結腸圖片,各自數量分別是52、45、52、86、120、98、74和85張。本文使用基于數據增強策略來完善該數據庫,獲得了988張圖像的訓練數據集和218 張圖像的測試數據集。

圖5 TCIA-CT 數據庫部分示例圖片Fig.5 Some sample pictures of TCIA-CT database
OASIS-MRI 數據庫是被OASIS 機構創立的核磁共振生物醫學圖像數據庫,該數據庫包含了416 位來自18 歲到96 歲的個體。為此,本文將其分為四個類別,每個類別分別包含了152、121、88 和68 張圖像,示例圖片如圖6 所示。這四個類別的圖像分類難度大,即使人眼觀察也存在困難,更何況使用計算機進行此數據庫的分類。針對這個數據,本文根據相同的數據選擇和數據增強方法,構成了498 張圖像的訓練集和86 張圖像的測試集。

圖6 OASIS-MRI數據庫部分示例圖片Fig.6 Some sample pictures of OASIS-MRI database
(2)分類結果與分析
使用本文提出的分類算法與其他主流圖像分類算法分別對上述兩個醫學圖像數據庫進行分析,再對分類結果進行統計,統計結果如表5 所示。

表5 不同算法在醫學圖像數據庫的分類精度Table 5 Classification accuracy of different algorithms in medical image database %
通過表5 可知,本文提出的基于權重初始化-滑動窗口融合卷積神經網絡的醫學圖像分類算法相比傳統分類算法、其他深度學習算法,分類精度具有較為明顯的優勢。同時,本文方法在兩個醫學圖像數據庫中的表現都比較穩定,分類結果也很準確。具體來看,表中前三個傳統分類算法主要是將圖像特征提取和分類分開成兩個步驟,然后組合而成用于醫學圖像的分類。而后面三個對應的深度學習算法可以將特征提取和分類過程統一到一個整體里面完成對應測試??傮w上來說,一體化的分類算法取得分類結果的魯棒性和精度都要高于組合式的傳統方法。這也是深度學習圖像分類算法整體高于傳統圖像分類方法的主要原因。
具體地,對于TCIA-CT 數據庫中的表現,只有本文算法獲得了最好的分類結果。而其他特征對應的三個算法的分類精度明顯較低。而另外兩個對比的深度模型DeepNet1 和DeepNet3 對應方法的結果還比較滿意,雖然不能取得100%的分類結果,但是相比傳統方法具有較大優勢。對于最難分類的OASISMRI 數據庫,可以發現所有的深度模型算法的效果明顯好于傳統類型的算法,這就表明了自動學習深度特征應用于醫學圖像分類任務上的精度高于人工設計的圖像特征。之前在TCIA-CT 數據庫分類中表現不錯的HOG+KNN、HOG+SVM 和LBP+SVM 算法,在OASIS-MRI 數據庫分類中得到的分類結果較差,尤其是LBP+SVM算法,只有57.5%的分類準確率。
總之,傳統分類算法在醫學圖像分類任務中存在分類精度不高和穩定性差的缺點,說明這種組合式的傳統分類方法對于生物醫學圖像分類而言效果不好,即使包含了出色人工設計特征描述子和流行的機器學習分類器。而且,深度分類算法在其中三個醫學圖像數據庫(這三個醫學圖像數據庫是醫學不同方向的成像圖像,也就是說這三個醫學圖像數據庫代表不同類型的醫學圖像,所蘊含的醫學圖像特征信息存在較大的差異性)中的分類精度明顯地優于傳統分類算法,這也從側面證明了深度學習模型所具有的優勢。此外,本文提出的基于權重初始化-滑動窗口融合卷積神經網絡的醫學圖像分類算法,相比其他提出的深度分類算法DeepNet1 和DeepNet3,可以得到最好的分類表現。這是因為本文提出的深度學習模型不但解決了模型權重初始化問題,而且還解決了深度學習模型中多層關聯的問題。
本文從網絡優化角度出發,通過優化方法提高網絡的非線性建模能力,并通過改善吸引域提高收斂后的解的泛化性能,進而提出了一種新的網絡權重初始化方法,緩解了現有深度學習的初始化理論受限于非線性單元類型的問題,使得深層網絡的結構設計可以有更多的選擇,增加了神經網絡處理不同視覺任務的潛力。同時,為了充分利用醫學圖像的特性,本文對多列卷積神經網絡的框架進行深入研究。首先,通過改變卷積神經網絡不同層次的特征圖數量和卷積核的大小,構造了不同結構的卷積神經網絡模型,以更好地適應待處理醫學圖像的醫學特性;然后,不同的卷積神經網絡模型分別在同一個數據集上進行訓練;最后,訓練得到的異構多列卷積神經網絡再通過本文提出的一種自適應的滑動窗口融合機制,共同完成醫學圖像的分類任務,實現醫學圖像的自適應、高精度分類?;谏鲜鏊枷?,本文提出了一種基于權重初始化-多層卷積神經網絡滑動窗口融合的醫學分類算法。
乳腺腫塊分類實驗結果表明,本文方法的分類精度最高,達到98.2%,這是因為采用的CNN 特征和經過多層滑動轉換后的特征大幅提升了原始良惡性乳腺腫塊圖像間的區分性,使得不同類別腫塊在特征空間中的可區分性更強,保證具有該特性的腫塊圖像特征分布更有利于分類準確率的提升。
腦腫瘤組織分類實驗結果表明,本文方法得到的平均分類準確率最高,達到95.71%,在12 例腦腫瘤患者MRI 樣本的圖像塊分類任務中,對分類難度較高的2 號樣本、11 號樣本和12 號樣本體現了較為突出的優勢,充分驗證了本文方法在大幅度提升分類準確率的同時,也具有良好的穩定性和魯棒性。
醫學數據庫分類實驗結果表明,對于TCIA-CT數據庫和最難分類的OASIS-MRI 數據庫,本文提出的分類算法都獲得了最好分類結果。它優于傳統機器學習算法,深度學習模型能夠更好地獲得醫學圖像特征信息,為后續分類奠定基礎。它優于其他主流深度學習算法,這是因為本文提出的深度學習模型不但解決了模型權重初始化問題,而且還解決了深度學習模型中多層關聯的問題。