石海,楊凡,黃嘉海,周潔
1.南京醫科大學第一附屬醫院 放射科,江蘇 南京 210029;2.泰康仙林鼓樓醫院 放射科,江蘇 南京 210000;3.南京醫科大學附屬蘇州醫院 放射科,江蘇 蘇州 215001
肺癌是對人類生命健康威脅最大的腫瘤之一,近年來中國肺癌的發病率居全球首位且逐年遞增[1-2],如何做到肺癌早期診斷是一個挑戰。隨著人工智能的興起,基于計算機技術的醫療輔助診斷工具開始應用于肺癌鑒別,主要借助圖像分割算法提取肺癌病變區域。圖像分割是指把圖像分成各具特性的區域并提取出感興趣目標的技術和過程[3]。幾乎所有的分割算法均是針對圖像灰度的連續性或不連續性進行操作,比如傳統的閾值法、區域分割法、邊緣分割法,還有基于特定理論的聚類分析算法、模糊集理論、人工神經網絡模型、遺傳算法等。實驗表明融合特定理論的分割算法優于傳統算法的分割效果,其中聚類分析簡單易行,但易受噪聲與灰度不均影響較大,且串行處理能力有限;基于模糊集理論的分割精度較低;遺傳算法穩定性強,時間復雜度較低,但容易過早收斂,陷入局部最優解;人工神經網絡(Artificial Neural Network,ANN)是一種應用類似于大腦神經突觸聯結的結構進行信息處理的數學模型,提取圖像的紋理具有較好的并行處理和數值逼近能力,非常適用于區分目標與背景。
人工神經網絡模型已顯示出對規則病灶較高鑒別率,其中Irianto等[4]采用基于紋理特征的ANN模型,得到肺癌鑒別準確率為80%;Kohad等[5]采用蟻群優化算法從250幅CT圖像中選取顯著紋理特征輸入ANN模型,獲得98.4%的準確度和96%的敏感度。當病灶區域不規則時,紋理分析不足以表征肺癌CT圖像的特性。本研究采用基于分形特征的ANN模型提取肺癌病灶區域,并與紋理特征的分割效果比較。
本研究提出的肺癌CT圖像分割算法流程,見圖1,其中圖像預處理采用維納濾波抑制圖像噪聲,模糊增強提高圖像對比度,然后從預處理圖像中提取紋理和分形特征,最后選取顯著性的特征輸入人工神經網絡模型完成圖像分割。

圖1 肺癌CT圖像分割流程
CT圖像質量往往受噪聲污染而下降,維納濾波器是經典的線性去噪濾波器,常被用于從加性噪聲中恢復有用信號,是一種綜合退化函數和噪聲統計特征進行復原處理的濾波方法。在濾波器輸出與期望輸出之間達到最小均方誤差,維納濾波可稱作是一個最優濾波系統[6]。此外,肺部CT圖像特征由灰度、尺寸、形狀等差異構成,容易造成圖像邊界與區域模糊,傳統的圖像增強方法難以區分模糊邊界區域。本研究采用模糊增強算法處理CT圖像不精確和模糊信息,增強圖像對比度。對于尺寸N×N的圖像I,首先計算圖像各像素模糊隸屬度,將圖像從空間域變換到模糊域,然后運用模糊增強算子回歸調用修正隸屬度,最后通過模糊域反變換將模糊隸屬度轉換成新的灰度級,映射到圖像的空間域,分別由公式(1)~(3)給出,其中Fe、Fd為變換系數,pmax(i,j)圖像像素最大的灰度值,p(i,j)為圖像像素灰度值。u(i,j)表示p(i,j)的隸屬度,取值0~1。

紋理是一種反映圖像中同質現象的視覺特征,體現物體表面具有緩慢變化或者周期性變化的表面結構組織排列屬性[7]。常用統計方法灰度共生矩陣描述圖像像素灰度關于方向、相鄰間隔、變化幅度的綜合信息。由于紋理特征能提供獨特的區域像素空間多樣性信息,容易做到區分目標與背景,適用于肺癌病灶提取。本研究共提取14個紋理特征,但顯著性特征僅有3個,分別為圖像慣性、均值和熵特征,由公式(4)~(6)求得[8]。

分形特征常被用來描述復雜非規則的醫學圖像特征[9-10],其中分形維度是刻畫非線性圖像復雜程度、不規則程度和空間分布變化趨勢的一個重要參數,由差分盒維數法計算所得。主要思想為:對于一個尺寸為N×N的灰度圖像,把二維圖像視作三維空間的一個表面(i,j,p(i,j)),其中(i,j)代表像素空間位置,p(i,j)代表對應位置灰度值,則圖像灰度的變化情況將以空間立體表面的粗糙程度反映,使用不同尺度度量該立體表面,得到的維數即為圖像分形維度。
具體步驟如下:將N×N圖像分割成s×s塊,2<s<N/2,令r=N/s,每個分塊包含一列s×s×h的盒子,h為單個盒子高度。采用一個5×5窗口在圖像上滑動,移動幅度為r,假設第(i,j)個分塊中最大灰度值和最小灰度值分別落在第k和l個盒子中,則覆蓋第(i,j)個分塊所需盒子數由公式(7)計算,覆蓋整幅圖像所需盒子數由公式(8)給出,此時對應的分形維度FD由公式(9)給出。選取一組s,通過線性擬合即可求得分形維度FD。

采用公式(7)~(9)可從模糊增強圖像獲得12個肺癌病灶CT圖像分形特征ff1~ff12,其中10個分形特征具有顯著性。
被提取的紋理特征與分形特征存在冗余,需要從中選取顯著性特征作為人工神經網絡模型的輸入。人工神經網絡是由神經元相互連接組成的網絡,是一種模擬動物神經網絡行為特征,進行分布式并行數據處理的數學模型[11-12]。ANN具有自學習和自適應的能力,可以通過預先訓練樣本和預測樣本來確定兩者之間潛在的規律,利用訓練階段形成的規則對新輸入樣本數據進行推算。最常用的是后向傳播神經網絡模型,能運用輸出結果產生的誤差進行反向推敲,從而逐步優化網絡結構和網絡參數。結構如圖2所示,最左邊是輸入層,中間是隱藏層,右側是輸出層,每個節點代表一種特定的輸出函數,稱為激勵函數,每兩個節點間的連接都代表一個對于通過該連接信號的加權值。

圖2 向后傳播神經網絡模型結構
利用ANN對圖像進行分割時,將待分割圖像中的所有點聚類為目標和非目標的像素點,準確聚類后去除非目標像素點,從而得到目標圖像。具體步驟如下。
(1)設有c層神經網絡,如在輸入層上加上輸入模式P,并設第z層y單位輸入的總和為輸出為由z-1層的第j個神經元到z層的第x個神經元的結合權值為Wxy。各個神經元的輸入與輸出關系函數是f,則各變量間的關系見公式(10)~(12)。

(2)定義誤差函數E為期望輸出與實際輸出之差的平方和,見公式(13)。ANN學習過程即為求誤差函數極小值,采用非線形規劃的梯度下降法求得權值的更新量,見公式(14),ε為學習率,取值0~1。

(3)經過較為復雜的求導運算,求得修正權值,見公式(15)和(16),完成算法收斂。

ANN性能主要取決于網絡參數,包括輸入層、隱藏層、輸出層、學習速率和動量[13-14],其中低學習速率和高動量導致學習進展緩慢,相反高學習速率和地動量導致學習停止。隱藏層數量較低時,導致隱藏層不穩定,數量較高時,導致輸出不穩定。為了避免過度擬合,采用公式(17)獲取隱藏層數量上限Nh,其中Ni表示輸入層神經元數量,No輸出層神經元數量,Ns代表訓練樣本數量,α取值范圍為2~10,輸入和輸出的平均值作為隱藏層下限值。

采用平方根誤差(Mean Square Error,MSE)、敏感度(Sensitivity)、特異度(Specificity)、準確度(Accuracy)評估本研究人工神經網絡性能[15-17],見公式(18)~(21)。其中,target代表目標區域,actual代表實測區域,TN、TP、FN和FP分別代表組織真陽性、真陰性、假陽性和假陰性數量。

本研究CT圖像源自46位男性與36位女性,其中包含48例肺癌患者和34例正常患者,提取出的背景、肺癌區域和邊界數量總計1150個,圖像尺寸大小為256×256×63個體素,所有的仿真實驗均在MATLAB R2013a平臺上實現。
圖像預處理結果如圖3所示,其中維納濾波消除圖像噪聲,模糊增強后圖像對比度顯著提升。

圖3 圖像預處理結果
圖4代表CT肺部圖像紋理和分形特征的特征值,可以看出14個紋理特征中僅3個(tf1,tf2,tf3)正常肺部與肺癌特征值無重疊,12個分形特中有10個(ff11,ff12,ff21,ff22,ff41,ff42,ff51,ff52,ff61,ff62)無重疊特征值,可作為顯著性特征。圖5和圖6分別為紋理特征與分形特征肺癌分類圖像,可以看出病灶被完整地提取。

圖4 正常肺部圖像與肺癌患者的紋理和分形特征值

圖5 顯著紋理特征

圖6 分形顯著特征
本研究獲得的紋理特征與分形特征作為訓練數據,選用多種訓練函數,學習速率和動量范圍0.3~0.9,帶入公式(15),輸入神經元數目13,包括3個紋理特征,10個分形特征,隱藏層數1,輸出神經元1個,α=2,隱藏神經元數量范圍7~38,采用平方根誤差MSE評估各參數對ANN性能影響,結果顯示訓練函數為列文伯格-馬夸爾特反向傳播函數,隱藏神經元數量為20,學習速率為0.3,動量為0.9,最大數目為1000時,ANN性能最佳,供測試階段使用。
圖7表示基于ANN的肺部病灶圖像分割,表1表示基于不同特征定量分析。可以看出本研究提出的ANN算法能準確快速的提取出肺癌病灶區域。訓練階段靈敏度、特異度和準確度可達98.4%(聯合特征)、100%(分形特征)和98.6%(聯合特征),同時測試階段對應指標分別可達90.9%(聯合特征)、100%(分形特征)和95.1%(分形特征),可以看出基于分形特征和聯合特征的定量指標優于紋理特征。

圖7 CT肺部病灶提取結果

表1 紋理特征、分形特征和聯合特征分類的結果比較(%)
本研究提出一種基于人工神經網絡模型的肺癌CT圖像分割算法,其中維納濾波與模糊增強等預處理能有效地抑制圖像噪聲,提高圖像對比度;特征值不重疊法能準確選取顯著的紋理特征和分形特征,平方根誤差能預測人工神經網絡模型最佳參數,快速準確提取肺癌病灶區域,表明本研究提出的肺癌CT圖像分割算法具有可行性和實用性,可作為肺癌輔助診斷。