廣東工業大學自動化學院 連偉烯
?
基于SAE的MRI圖像檢索系統
廣東工業大學自動化學院 連偉烯
【摘要】提出了一種根據醫學專有名詞作為語義對具體人體組織進行檢索的MRI圖像檢索方法。在構建圖像檢索系統的特征提取方法上,采用了稀疏自動編碼器模型,并通過多個稀疏自動編碼器的堆疊構建了深度學習網絡,最后采用BP分類器構建了整個MRI圖像檢索系統。實驗結果表明,層疊自動編碼器對于MRI圖像的高層特征具有很好的提取能力,同時避免人工選擇特征提取方法上的主觀性,具有較好的適應性。
【關鍵詞】基于語義的圖像檢索;自動編碼器;稀疏編碼;層疊自動編碼器
在當前情況下,醫院的影像科獲取到的全部MRI圖像主要是依靠人工方式進行分類保存。按照這個方式在檢索圖像時,在應用過程就會有很多困擾:(1)在一次MRI成像中,我們需要從中找到感興趣區域,這就需要從這些斷層圖像中找到包含感興趣區域的圖像,再確定圖像中感興趣區域的位置。(2)隨著MRI圖像數據的膨脹,使得對MRI圖像的管理和存儲越來越困難。
基于語義的MRI圖像檢索系統是一種直觀、便捷、靈活的工具。利用醫學名詞上的語義定義,可迅速從MRI圖像中找到所屬的感興趣區域。首先,通過檢索可從眾多MRI圖像中找到包含對應感興趣區域的MRI圖像。其次,從這些MRI圖像中標注出該感興趣區域。這些都有利于醫生在診斷工作中減少相關工作量。本文提出一種基于層疊自動編碼器(SAE,Stacked AutoEncoder)的MRI圖像檢索方法,該方法使用SAE作為圖像的特征提取工具,再結合BP分類器完成語義上的分類檢索工作,并進行相關的實驗分析工作。
本文的圖像檢索系統主要分為兩個模塊:特征提取和查詢模塊[2]。如圖1所示。該圖像檢索系統主要完成兩個方面的內容:(1)對圖像數據中包含對應語義的MRI圖像的檢索;(2)對檢索結果的MRI圖像對應語義內容的區域進行標識。其中,預處理步驟包括:(1)對不同尺寸大小的MRI圖像進行格式和尺寸大小的統一;(2)對MRI圖像進行分塊。特征提取步驟是對分塊圖像的特征提取,本文采用無監督學習的SAE方法進行特征提取并建立模型。在查詢模塊中,用戶使用指定的語義對欲查詢圖像數據進行查詢,圖像數據在建立的特征提取模型進行特征提取,并采用BP網絡對所提取的特征分類,最終返回符合語義的MRI圖像。

圖1 圖像檢索系統結構
1.1SAE特征提取方法
SAE是一種無監督學習的深度學習網絡模型。通過對若干自動編碼器(AE,AutoEncoder)的級聯構成多層神經網絡,它的輸出可看作是輸入數據經過多次降維后的特征表示[3-5]。AE是一種單隱層無監督學習神經網絡,通過對輸入信號的近似復現,從而得到輸入信號的表示,即特征。

利用線性代數中基的概念,即:

在自動編碼器的基礎上加上一些L1的Regularity限制,這時公式(1)可以寫為:

此時我們得到即為稀疏自動編碼器(Sparse AutoEncoder)。
把有m個輸入向量的稀疏編碼代價函數定義為:

其中第一項是重構輸入數據x的代價值,它迫使稀疏編碼算法能為輸入向量x提供一個高擬合度的線性表達式,第二項即“稀疏懲罰”項,S(.)是一個稀疏代價函數,由它來對遠大于零的進行“懲罰”,它使x的表達式變得“稀疏”。常量λ是一個變換量,由它來控制這兩項式子的相對重要性。在實際中,稀疏代價函數S(.)的普遍選擇是L1范式代價函數及對數代價函數。
為了使分解系數中只有少數系數遠遠大于0,而不是大部分系數都比0大。我們對基集合中的值也做了一個約束。因此,在公式(3)的基礎上,要滿足:

對于無稀疏約束時網絡的損失函數表達式如下:

其中,第一項和第二項分別為輸入輸出的均方誤差約束和權值衰減約束。m,分別表示樣本數,網絡層數和l層單元數W,b分別表示層間連接權重和l層的單元偏置。對于有稀疏約束的網絡,需要在損失函數中加入一個額外的懲罰因子,這個罰因子基于相對熵 (KLdivergence):


1.2SAE結合BP分類器的MRI圖像檢索實現
SAE作為MRI圖像的特征提取工具,本身不具備分類檢索功能,要實現該功能,需要分類器對體征提取結果進行分類[7]。本文采用了BP神經網絡實現MRI圖像檢索的分類工作。利用SAE提取圖像的底層特征作為網絡的輸入,用語義期望值作為網絡的輸出,并用BP算法來訓練該網絡。具體步驟如下:
(1)用大量無標簽原始輸入數據作為輸入,利用稀疏自動編碼器訓練出第一個隱含層結構的網絡參數,并將用訓練好的參數算出第一個隱含層的輸出。
(2)根據SAE隱含層的層數重復步驟1,即將上一個隱含層的輸出作為下一個隱含層的輸入,逐層訓練。
(3)將SAE最終的輸出作為多分類器BP網絡的輸入,然后利用原始數據標簽來訓練出BP的網絡參數。
(4)計算隱含層和BP分類器整個網絡的代價函數,以及整個網絡的對每個參數的偏導函數值。
(5)用步驟1、2和3的網絡參數作為整個網絡初始化的值,然后利用梯度下降法迭代求出代價函數最小值附近的參數值,作為整個網絡的最優參數值。
本文訓練和測試數據圖像采用十組真實病人的大腦MRI圖像。我們對MRI圖像進行分塊,并對分塊分為眼球、腦干、面聽神經、小腦、輪廓、其他這5類語義進行標注,共有35604個數據,其中3000個作為測試數據。
實驗分別構建了包含三層、四層和五層AE所級聯構成隱含層的基于SAE的MRI圖像檢索系統。其中,三層隱含層的節點數分別為1500、800、200,四層隱含層的節點數分別為1500、800、400、200,五層隱含層的節點數分別為1500、1200、800、400、200。測試的結果如表2.1所示。

表2.1
實驗結果表明,基于SAE的MRI圖像檢索系統能夠達到較好的準確率,同時也表明了準確率隨著網絡隱含層層數的增加而增加,這體現了SAE深度學習網絡可通過學習一種深層非線性網絡結構,實現復雜函數逼近,表征輸入數據分布式表示,并展現了強大的從少數樣本集中學習數據集本質特征的能力[8]。隨著層數的增加,將樣本在原空間的特征表示變換到一個新特征空間,形成更加抽象的高層表示屬性類別或特征,從而使分類或預測更加容易。
本文提出了采用基于深度學習的SAE網絡作為MRI圖像的無監督特征提取工具,并進行了相關的實驗。實驗結果表明,采用深度學習的SAE網絡能夠避免人工選取特征提取方法,從層疊的深層網絡中提取到更高層次的特征表達,由于其無監督的特性,因而具有較強的適應性,結合BP分類器,能夠達到很好的檢索效果。
參考文獻
[1]N.Kumaran,R.Bhavani.MRI Image Retrieval Using Gabor Wavelet Based Texture Features.International Journal of advanced research in Science and Technology.Volume.2, Issue 1,2013,pp40-45.
[2]馬冬梅.基于深度學習的圖像檢索研究[D].內蒙古大學,2009.
[3]G.E.Hinton,R.R.Salakhutdinov.The.Reducing the dimensionality of data with neural networks.Science 28 July 2006:454-455.
[4]杜騫.深度學習在圖像語義分類中的應用[D].華中師范大學,2014.
[5]林少飛,盛惠興,李慶武.基于堆疊稀疏自動編碼器的手寫數字分類[J].微處理機,No.1 Feb.,2015,47-51.
[6]敖道敢.無監督特征學習結合神經網絡應用于圖像識別[D].華南理工大學,2014.
[7]曲建嶺,杜辰飛,邸亞洲,高峰,郭超然.深度自動編碼器的研究與展望[J].計算機與現代化,2014,(8):128-129.