漆云亮,楊 臻,2,馬義德
(1. 蘭州大學 信息科學與工程學院,甘肅 蘭州 730000;2. 蘭州交通大學 信息工程學院,甘肅 蘭州 730070)
乳腺組織主要包含兩部分:脂肪組織和纖維腺體組織。乳腺纖維腺體組織通常又被稱為乳腺鉬靶密度或乳腺密度。高乳腺密度在乳腺癌病例中占有很高的比例,并且乳腺密度也被認為是乳腺癌變風險預測最重要的因素之一[1-3]。研究發(fā)現(xiàn),低脂肪飲食和激素治療可以降低乳腺密度[4],希望能通過該策略降低這種風險因素,從而阻止乳腺癌變的進一步發(fā)展[5]。為了監(jiān)控這種預防措施的進展,提出一種定量的、準確的乳腺密度的測量方法就顯得很必要了,這可以通過分割出乳腺鉬靶X線圖像的致密部分,再進一步檢測計算出致密區(qū)域占乳腺區(qū)域的百分比來完成。最早描述乳腺密度的方法主要是用視覺估計法把乳腺鉬靶 X線圖像分成 4個類型[6],分別是脂肪型(BIRADS-1)、纖維腺體型(BIRADS-2)、相對致密型(BIRADS-3)和致密型(BIRADS-4)。但是這種方法受觀察者主觀偏差的影響較大,因此一系列精確測量乳腺密度的方法,如手動跟蹤和測面計算法[7]被提出,但其缺點是耗時較長。近年來,一種半定量的測量技術被提出,它基于用戶指定的全局閾值將乳腺致密區(qū)域從鉬靶X線圖像中分割出來[8]。這種方法相對主觀分類法來說已經(jīng)比較定量化了,而且對手動測量法來說也是一種改進。但是它也存在很多不足,如:耗時較長、大量的用戶干預等,而且簡單的閾值化不能全面的說明乳腺鉬靶X線圖像的對比度和灰度變化。例如:乳腺鉬靶X線圖像某個區(qū)域的纖維腺體組織可能和另一個區(qū)域的脂肪組織有著相似的灰度級。放射科醫(yī)生通常認為乳腺致密區(qū)域是片狀的,呈現(xiàn)出很高的灰度值,但不包括寬度變化的血管區(qū)域。
本文首次將PCNN運用于乳腺密度區(qū)域的檢測,提出了一種基于PCNN與小波變換的乳腺鉬靶X線圖像處理算法,并能較準確的測量出乳腺密度。首先是乳腺鉬靶X線圖像預處理階段,采用最大連接域標記和區(qū)域生長的方法去除圖像的標簽和肌肉;然后利用小波變換分解出低頻信息,用高斯濾波器去除噪聲和干擾信息,進而采用頂帽變換和灰度拉伸變換函數(shù)增強乳腺致密區(qū)域;下一步利用小波重構出的圖像,進行乳腺密度自動分割;最后用PCNN進行檢測進而計算出乳腺密度。檢測算法如圖 1所示。實驗證明該處理算法有效、準確、可行。論文的剩余部分主要是對實驗數(shù)據(jù)的分析,依據(jù)統(tǒng)計學原理,得出了三類乳腺腺體的密度范圍,并分別計算了準確度。

圖1 基于PCNN的乳腺密度測量的流程圖Fig.1 Flow chart of breast density measurement based on PCNN
乳腺鉬靶X線圖像的灰度級差異較小,圖像細節(jié)比較模糊,因此在醫(yī)學診斷中帶來很大的干擾,而針對乳腺鉬靶X線圖像的預處理算法可以有效的增強圖像對比度,獲得較好的視覺效果。
本節(jié)選擇威廉康星乳腺癌數(shù)據(jù)集 MIAS[9](The Mammographic Image Analysis Society,數(shù)據(jù)集網(wǎng)址:http://peipa.essex.ac.uk/info/mias.html),該數(shù)據(jù)集包含322張乳腺鉬靶X線圖像,附帶乳腺病變的相應信息,如位置、背景組織的類型等。一般來講,乳腺鉬靶X線圖像主要由乳腺區(qū)域、胸肌區(qū)域、背景和標簽等組成。胸肌和標簽等成份會影響實驗的準確度,因此有效的去掉標簽和胸肌是預處理中必須的步驟。以乳腺癌數(shù)據(jù)集MIAS中的圖像“mdb003”作為示例,為了去除干擾信息,提高乳腺密度的檢測率,本節(jié)采用最大連接域標記和區(qū)域生長的方法[10]去除標簽和胸部肌肉,實驗結果如圖2所示。

圖2 去標簽和胸肌Fig.2 Remove the label and pectoral
小波變換具有時頻分析的優(yōu)越性,因此,針對乳腺鉬靶X線圖像細節(jié)由粗糙到細膩的特點,小波變換處理的優(yōu)勢顯得更大。
1.2.1 乳腺鉬靶X線圖像的小波分解
乳腺鉬靶X線圖像的正常組織,如纖維腺體組織和脂肪組織等經(jīng)過小波變換后將被分解到低頻信息中,而乳腺的主要細節(jié),如腺體細節(jié)等屬于高頻信息,還有鈣化點、噪聲等也主要集中在高頻信息中[11]。基于Mallat提出的小波多分辨率分析算法[12],乳腺鉬靶X線圖像經(jīng)過小波變換會被分解為四個子圖像,按照從高頻到低頻的順序,依次是對角信息Dk、垂直信息Vk、水平信息Hk、近似信息Ak,圖像的主要信息則集中在Ak頻帶中,所承載的信號能量在四個頻帶中也是最大的,而其他的三個高頻子帶的能量相對較小,主要包含乳腺的一些細節(jié)信息。在實驗中,本文采用系數(shù)為 1/2的默認低通和高通濾波器來進行乳腺鉬靶X線圖像的小波分解,根據(jù)一維離散小波分解的基礎,依次對已處理的乳腺鉬靶X圖像(已去標簽和肌肉)的矩陣的每一行和每一列進行一維離散小波分解,進而完成乳腺鉬靶X線圖像的小波分解過程,實驗結果如圖3所示。

圖3 乳腺鉬靶X線圖像的小波分解Fig.3 Wavelet decomposition of mammography target mammogram
從實驗結果圖可以看出,乳腺鉬靶X線圖像的信息主要集中在小波低頻子帶中,包含了圖像的主要能量,而其他的三個高頻子帶僅包含了腺體等細節(jié)部分,集中了信號少量的能量,這與小波理論也是相符的。
1.2.2 乳腺鉬靶X線圖像的增強
為了增大乳腺鉬靶X線圖像的對比度,增強乳腺纖維腺體區(qū)域,本節(jié)采用灰度拉伸函數(shù)來處理小波分解圖像的低頻子帶,這里采用γ函數(shù),表示為:

上式中,r是乳腺鉬靶 X線圖像經(jīng)過小波變換后的低頻子帶圖像,γ是一個常數(shù),如果0<γ<1,那么乳腺鉬靶X線圖像的較亮區(qū)域會被增強,反之,較暗區(qū)域會被增強,經(jīng)過多次實驗,我們選擇γ的值為0.6時結果較為理想。圖4(b)展示了γ變換增強后的圖像,可以看到,乳腺鉬靶X線圖像的纖維腺體等致密區(qū)域的灰度級強度相比原圖更大。
如圖4所示,(b)圖為低頻子帶經(jīng)過灰度拉伸變換增強的結果,為了平滑模糊背景區(qū)域,還需要進一步將灰度拉伸函數(shù)增強后的圖像濾波,這里本節(jié)采用高斯濾波器,基于一維低通高斯濾波器,可以得到二維高斯濾波器:

其中,D(u,v)表示到頻窗中心的距離,D0是截止頻率,濾波結果如圖4(c)所示。

圖4 乳腺X線圖像低頻子帶的處理結果Fig.4 Processing results of low-frequency subband of mammography
1.2.3 乳腺鉬靶X線圖像的小波重構
由前面內(nèi)容我們知道,經(jīng)過小波分解的乳腺鉬靶X線圖像包含四個子圖像,分別是對角信息Dk、垂直信息Vk、水平信息Hk、近似信息Ak,而三個高頻子帶包含了原圖像的細節(jié)信息,為了不丟失圖像的細節(jié)信息,還需要對分解后的圖像進行小波重構,重構后的實驗結果如圖5所示。

圖5 小波重構結果Fig.5 W avelet reconstruction results
在這一小節(jié),乳腺鉬靶X線圖像將基于提出的算法被自動處理,分割出腺體致密區(qū)域,然后用脈沖耦合神經(jīng)網(wǎng)絡進行檢測,最后計算出乳腺密度。
本節(jié)的實驗數(shù)據(jù)采用了威廉康星乳腺癌數(shù)據(jù)集MIAS的322張乳腺鉬靶X線圖像,這些圖像代表著很大范圍的X射線照相特征,包括從高脂肪型到極致密型等等。完整乳腺區(qū)域的分割可以通過Kittler和Illingworth’s的最佳閾值算法[13]來完成,這個算法是在假設閾值可以區(qū)分目標像素和背景像素的條件下完成的。在本節(jié)的實驗中,經(jīng)過預處理、小波分解等方法的增強處理,乳腺區(qū)域已經(jīng)被完整的呈現(xiàn),然后致密區(qū)域可以再進一步分割。然而,傳統(tǒng)的閾值分割方法對后期乳腺密度的評估會造成嚴重偏高,因為致密區(qū)域的分割結果很大程度的包含了一些血管和韌帶組織,這些細小的組織有著很高的灰度值,它們和纖維腺體組織的灰度值很相近,因此會很粗略的被分割到致密區(qū)域中。
為此,本節(jié)采用了 Sivaramakrishna[14]提出的修改分割算法,可以較理想的分割出乳腺纖維腺體致密區(qū)域而不包含血管和韌帶組織。基本原理可以表示為:

其中,S是鄰域的總像素數(shù),這里我們選用5×5的鄰域窗口,M表示鄰域窗口內(nèi)的像素值,M(I, J)表示鄰域窗口的中心像素值。
通過式(5)就可以將乳腺鉬靶 X線圖像變換到“V域”,在“V域”圖像中,低 V值的纖維腺體組織相比高V值的血管、韌帶組織有更大的灰度值,而這些血管、韌帶像素的強度將被弱化。“V域”變換的實驗結果如圖6所示:(a)是原圖,(b)是變換到“V域”的經(jīng)過灰度級標定的實驗結果。

圖6 乳腺鉬靶X線圖像的“V域”變換Fig.6 “V domain” transformation of mammography target mammogram
脈沖耦合神經(jīng)網(wǎng)絡(Pulse coupled neural network-簡稱PCNN)是一種不需要訓練的單層神經(jīng)網(wǎng)絡,它起源于Eckhorn神經(jīng)元模型[15],是受貓的大腦皮層視覺區(qū)神經(jīng)元的傳導特性啟發(fā)而來的。PCNN與傳統(tǒng)的人工神經(jīng)網(wǎng)絡不同,并且在很多領域中已經(jīng)被證明是一種高效的處理工具。基于其生物學背景,PCNN非常適合用于數(shù)字視覺圖像的處理[16],如文獻[17]提出的基于最大熵準則的植物細胞圖像的分割等應用。如圖7所示為構成PCNN的單個神經(jīng)元的基本模型,傳統(tǒng)神經(jīng)元算法通常不能很方便的應用到實際中,并且由于設定參數(shù)過多,算法的效率也不高。因此,在實際中,一些簡易的PCNN模型被使用。基于乳腺鉬靶X線圖像的特點,本節(jié)采用一種簡易的模型[18],其中還需要設定恰當?shù)膮?shù),在所使用的模型中涉及六個參數(shù)的設定,分別是Fα、Eα、VE、β、VL和n,在密度檢測的實驗中,基于文獻[19],

圖7 脈沖耦合神經(jīng)元模型Fig.7 Pulse coupled neuron model
本節(jié)采用半自動的參數(shù)調(diào)節(jié),由于每張乳腺鉬靶X線圖像的致密區(qū)域特點的不同,n和αE的設定需要依據(jù)經(jīng)驗值確定,如“mdb003”作為例子,本書設置αE=1,效果較好。其他參數(shù)的設定為:

其中,σ(I)為輸入圖像I的標準差;Smax為輸入圖像像素的最大灰度值,S′是基于大津法[20]的最佳直方圖閾值。密度檢測實驗的結果如圖8所示。

圖8 基于PCNN的乳腺密度檢測結果Fig.8 PCNN-based detection results of breast density
其中,(a)圖為預處理原圖,(b)圖為經(jīng)過PCNN檢測的圖像。
為了證實本節(jié)處理算法的可靠性,我們對MIAS數(shù)據(jù)集中的322張乳腺鉬靶X線圖像進行算法檢測處理和密度計算。
從乳腺腺體組織類型的角度,分析MIAS數(shù)據(jù)庫里的乳腺鉬靶X線圖像,主要分為三類:分別是F(Fatty)型(脂肪型)、D(Dense-glandular)型(致密腺體型)、G(Fatty-glandular)型(脂肪腺體型)。我們分別對脂肪型(F)乳腺、致密腺體型(D)乳腺和脂肪腺體型(G)乳腺進行了乳腺密度計算分析和統(tǒng)計。
脂肪腺體型(G)乳腺的纖維腺體成份相比致密腺體型(D)乳腺較低,相對應其乳腺密度也較小,從主觀視覺定性來看,這類腺體的亮度范圍也相對較小,因此,為便于后續(xù)PCNN腺體密度像素灰度值檢測,需要在實驗中根據(jù)實際情況調(diào)整灰度拉伸參數(shù)γ。
一般情況下,將參數(shù) γ調(diào)小就能取得較好的效果。如圖 8所示,本節(jié)以 MIAS數(shù)據(jù)集中的“mdb041”圖像為例,來說明這類乳腺鉬靶X線圖像的密度檢測實驗,基于上述對脂肪腺體型乳腺的腺體特點分析,實驗參數(shù)的選擇為γ=0.1,αe=1.15。實驗結果如圖9所示。

圖9 致密腺體型乳腺的密度檢測過程Fig.9 Density detection process of dense glandular breast
其中,(a)為原始的乳腺鉬靶 X線圖像,(b)為預處理后的圖像,(c)圖為乳腺鉬靶X線圖像的小波低頻子帶經(jīng)過灰度拉伸變換的結果,(d)圖為小波重構后的圖像,(e)圖為“V域”圖像,(f)圖為PCNN檢測“V域”圖像的結果。
為了證明該處理算法有效,在本小節(jié)中,將對MIAS數(shù)據(jù)集中的322張乳腺鉬靶X圖像進行密度測量和分析。
2.3.1 乳腺鉬靶X線圖像的密度分析
SPSS作為一款具有人機交換界面的統(tǒng)計軟件,在數(shù)據(jù)分析和處理方面有著強大的功能,特別適合用于數(shù)據(jù)的統(tǒng)計分析。本節(jié)中,將借助該軟件來處理實驗數(shù)據(jù)。
本節(jié)首先對脂肪腺體型乳腺圖像進行分析,在MIAS數(shù)據(jù)集中,共有103張脂肪腺體型(G)乳腺圖像,對其進行算法處理和檢測,基于SPSS軟件繪制出密度分布直方圖如圖10所示。

圖10 脂肪腺體型(G)乳腺密度分布直方圖Fig.10 Fat gland type (G) breast density distribution histogram
可以直觀的看出,脂肪腺體型乳腺的密度分布主要集中在5%-10%之間,基于0.95的置信水平的估計,其置信區(qū)間為6.55%-9.18%。
類似地,MIAS數(shù)據(jù)集共有113張致密腺體型(D)乳腺圖像,對其進行算法處理,運用SPSS數(shù)據(jù)分析軟件,本節(jié)繪制出了密度分布直方圖如圖11所示。
從圖11,可以直觀的看到致密腺體型乳腺的乳腺密度大致分布在>20%的范圍內(nèi),為了不違背客觀性,本節(jié)以0.95的置信水平對其做了置信區(qū)間的估計,經(jīng)過SPSS軟件的置信區(qū)間分析,致密腺體型乳腺的密度分布的置信區(qū)間為:25.63%-30.35%。

圖11 致密腺體型(D)乳腺密度分布直方圖Fig.11 Histogram of dense glandular type(D) breast density distribution
和前兩種乳腺的密度分析一樣,運用 SPSS軟件進行脂肪型(F)乳腺的密度分布直方圖分析,結果如圖12所示。可以看到,脂肪型乳腺的纖維腺體成份極少,密度分布極低,大概分布在 2%以下,通過0.95的置信水平分析,可以得到脂肪型乳腺的密度分布的置信區(qū)間為:1.07%-1.53%。

圖12 脂肪型(F)乳腺密度分布直方圖Fig.12 Histogram of density distribution of fat type (F) breast
2.3.2 乳腺密度測量的誤差分析
前面我們已經(jīng)利用乳腺鉬靶X圖像的實驗測量密度分布估計出了密度的置信區(qū)間,此外,還需要分析實驗中造成誤差的因素和誤差大小。
影響本節(jié)方法處理性能的主要誤差因素是灰度拉伸算法和PCNN的參數(shù)設定難以最佳。根據(jù)三種類型的乳腺密度分布的置信區(qū)間和分布直方圖,我們可以確定三種乳腺鉬靶X線圖像的密度范圍分別為:脂肪型(F型,<1.53%),脂肪腺體型(G型,1.53%-9.18%)和致密腺體型(D型,>9.18%)。設三種類型的乳腺的測量誤差分別為σD、σG和σF, 則它們的值為:
其中,D0為實驗測量中不在密度范圍內(nèi)的圖像計數(shù),D為該乳腺類型的總圖像數(shù)。
經(jīng)統(tǒng)計分析,113張致密腺體型乳腺密度測量中有四張是密度低于界限值的,測量情況如表 1所示。

表1 致密腺體型(D)乳腺誤測密度Tab.1 Dense glandular type (D) Mammary gland falsely measured density
于是得到致密腺體型(D)乳腺密度的測量誤差為:

同樣的方法,可以得到其他兩種乳腺的密度測量誤差為:σG= 1 2.3%和σF= 1 1.8%。
表2給出了所提算法對每一類乳腺密度的測量準確度,同時給出了文獻[21]和文獻[22]的方法的對比實驗結果。文獻[21]的乳腺密度類別為四類,為了便于分析,我們將D、G、F型乳腺分別對應于文獻[21]和文獻[22]的Ⅰ、Ⅱ和Ⅲ、Ⅳ進行對比。從表2可以看出,本文方法對D、G和F型乳腺分類性能相比文獻[21]有了明顯提高,此外,本文方法相比文獻[22]有更強的魯棒性。

表2 乳腺密度測量準確度對比Tab.2 Comparison of measurement accuracy of breast density
本節(jié)以PCNN和小波變換為基礎,對乳腺鉬靶X線圖像進行了密度測量,得到了322組乳腺密度的測量樣本,通過數(shù)據(jù)統(tǒng)計分析估計了三種乳腺腺體類型的界限值,由實驗結果可以知道,在誤差允許的范圍內(nèi),該乳腺密度的測量算法是可靠的。
目前還沒有對乳腺密度界限值的分類的系統(tǒng)的方法,因此,除了本節(jié)的分類方法之外,對致密腺體型(D型)、脂肪腺體型(G型)和脂肪型(F型)的乳腺密度分類估計還是比較主觀的。
傳統(tǒng)的乳腺鉬靶X線圖像的密度檢測大多是通過閾值分割得到腺體致密區(qū)域,進而求得面積百分比作為乳腺密度值。一般情況下,這種基于直方圖分析的閾值分割方法是要具備理想條件的,因為它只能處理像素間的閾值存在的情況,如乳腺和背景區(qū)域等。因此本節(jié)引用了Sivaramarishna的自動分割算法,避免了脂肪和血管等組織對腺體密度測量造成的干擾。本節(jié)的處理算法基于乳腺鉬靶X線圖像,運用小波變換和PCNN檢測纖維腺體區(qū)域,原始圖像首先要經(jīng)過去標簽和肌肉的預處理操作,然后通過小波變換分解出低頻信息,再用灰度拉伸操作進行纖維腺體增強,最后用高斯濾波器模糊背景后進行小波重構。然后進行密度自動分割,最后用PCNN檢測并計算。
在實驗中,需要對算法處理的結果進行區(qū)間估計分析,利用SPSS軟件,本書以0.95的置信水平估計了三種乳腺的密度分布的置信區(qū)間,并由此確定了三種腺體的密度界限值。值得一提的是,本節(jié)用PCNN檢測纖維腺體區(qū)域,與傳統(tǒng)的計算面積比例的方法不同,以檢測到的密度二值圖像像素點求得總和的方式來計算乳腺密度,因此,整體密度水平相對較低,但這并不影響PCNN檢測的準確性。在PCNN和灰度拉伸的參數(shù)調(diào)節(jié)方面,實現(xiàn)了半自動化處理,接下來我們會把工作重心轉移到全自動化方面,以及對癌變?nèi)橄俸驼H橄巽f靶X線圖像的密度分類上,然后進一步探索PCNN的高效率,高準確性檢測。
本節(jié)基于PCNN和小波變換講述了一種定量的乳腺密度測量方法,主要分為兩階段:乳腺鉬靶X線圖像的預處理和乳腺密度的檢測、計算。具體地,第一階段,乳腺圖像依次經(jīng)過去標簽和胸肌、小波變換、圖像去噪、圖像增強、小波重構處理。第二階段,預處理后的圖像依次經(jīng)過乳腺密度分割、PCNN檢測、乳腺密度的計算。實驗驗證了本節(jié)所提算法的有效性。