龐學明,張澤偉,侯愛林,孫浩然
(1.天津醫科大學總醫院放射科,天津 300052;2.天津醫科大學醫學影像學院,天津 300203)
肺癌是對當今人類健康危害最大的惡性腫瘤之一,美國癌癥協會(American Cancer Society,ACS)已指出[1],肺癌現已成為全世界范圍發病率最高的惡性腫瘤,也是目前已知的確診后死亡率最高的癌癥。早期發現和治療肺癌可以提高患者的生存率。肺癌在早期時一般表現為肺結節,其中包括磨玻璃型肺結節(ground glass opacity,GGO)。一些研究表明,GGO型肺結節發展為肺癌的概率要高于實性肺結節[2]。隨著低劑量多層螺旋CT的出現,它已經成為肺癌早期診斷的重要工具,但是醫生所需分析觀察的圖像數量也在急劇增加。為了減輕醫生的工作量,且幫助他們直觀有效地識別病灶,降低漏診和誤診的可能,計算機輔助診斷(computer aided diagnosis,CAD)技術應運而生。研究表明CAD對于提高診斷準確率、降低漏診率以及提高診斷效率能夠起到重要的作用。相比近些年國內外針對實性結節的檢測研究已日趨成熟,針對GGO型肺結節的研究卻很少;然而近些年來,GGO型肺結節的發病率在逐年上升。其中通過CAD診斷GGO型肺結節的最關鍵步驟是對GGO型肺結節進行高精確度的分割。因此我們提出了一個支持向量機和隨機游走算法相結合的分割方法。該方法與傳統方法相比較,可以實現自動化分割肺結節,避免人工選擇種子點的工作量,可以在進一步提高準確性的同時能夠提高效率。
1.1 資料 回顧性分析2016年5月-2017年3月行CT檢查發現GGO型肺結節的患者,共收集符合條件的GGO型結節200個,平均直徑為(2.2±0.5)cm,采集方法均使用64排螺旋CT(GE Light Speed)進行,掃描范圍自胸廓入口至肺底。患者一次吸氣后屏氣完成全肺掃描,螺旋掃描方式,電壓120 kV,電流 300 mA,螺距 1.375:1,層厚 5 mm,機架旋轉一周時間 0.4 s,顯示野(field of view,FOV)360 mm,圖像矩陣512×512,默認重建算法為標準算法,重建1.25 mm層厚軸位圖像。基本實現圖像體素各相同性以確保容積分割的準確性。
1.2 方法
1.2.1 支持向量機原理 支持向量機(support vector machine,SVM)是 Vapnik 等[3]在 1995 年提出的一種新的模式識別技術。具有結構簡單、全局最優、泛化能力好、計算復雜度低等優點,且具有較強的高維樣本處理能力,在圖像分類等模式識別領域得到了廣泛的應用。支持向量機是基于統計學習的VC維理論和結構風險最小原理,基本思想是構造一個最優分類超平面作為決策面[4],使得兩類標簽之間的分類間隔最大,然后通過求解二次規劃尋優的對偶問題來尋找最優分類超平面。
假設一個二分類的訓練樣本集合(χ(i),y(i),i=1,2,…,n),x∈Rm是m維的特征向量,相應的分類標記為y∈{1,-1}的分類標簽。SVM在高維特征空間中求最優間隔分類超平面為:

式中:ξi為松弛項,是在訓練線性不可分樣本時引入的。C是一個常數,稱為懲罰因子,值越大說明錯誤分類的懲罰越大,但泛化能力下降即w增加。這是一個典型的二次凸規劃問題,因此存在唯一全局最小解。應用Lagrange乘子并滿足KKT(Karush-Kuhn-Tucher)條件可得最優分類超平面的分類函數為:

式中:為Lagrange乘子,取值不為零時所對應的樣本即為支持向量,b*為分類閾值,sgn(x)為符號函數。K(xi,x)為支持向量xi和未知向量x的核函數,可通過非線性映射將在低維特征空間中的樣本映射到高維特征空間中去,可以避免在高維特征空間的復雜運算以及維數災難問題,常用的核函數有多項式核函數、高斯核函數(RBF)、拉普拉斯核函數、雙曲正割核函數等。
1.2.2 提取圖像特征 采用支持向量機進行目標點的分類的關鍵點在于圖像特征的選取[5]。選取CT圖像的圖像特征大致可分為兩組:灰度特征,采用一階統計量化區域內灰度的特性,從灰度直方圖計算而得;紋理特征,通過量化區域內灰度共生矩陣的異質差異。見表1。
1.2.3 隨機游走圖像分割方法原理 隨機游走算法是Grady等[6]在2006年提出的一種基于圖論的半自動圖像分割方法。算法首先將CT圖像看做由一定數量的節點和邊構成的加權圖,G=(V,E,W)。其中,每一個節點vi∈V對應圖像中的每個像素;每條邊ei,j∈E表示相鄰節點之間的關系;每條邊上被賦予一個權值wi,j∈W,表示種子點通過隨機游走經過這條邊的概率,依據最大概率準則完成圖像分割。
在基于圖論結構的圖像分割算法中,需要給定一個加權函數,根據圖像的結構信息、灰度、顏色或紋理信息來表示像素點與像素點之間的權重大小。加權函數有很多定義形式,通常采用高斯權重函數來定義加權函數:

式中:Ii-Ij表示相鄰結點vi和vj間灰度差。β>0為尺度因子,是該算法中唯一的自由參數。wi,j表示像素點與像素點之間的權重大小,直接影響分割效果。
在映射圖中定義聯合拉普拉斯矩陣,如下式:

其中,di稱為節點vi的度,定義為與節點vi所有相鄰邊ei,j上權值的和。在已經固定標記點的值的前提下,通過Dirichlet積分公式求解非種子點到種子點的概率值,如下式:


表1 支持向量機的圖像特征Tab 1 Image features of support vector machines
將映射圖G的所有節點分為兩類,種子點集合VM和非種子點集合VU,根據節點屬于不同集合,將拉普拉斯矩陣分解,將上式改寫成如下形式:

其中,x_U即為所要求解的隨機游走概率,通過求解Dirichlet邊界條件計算所有未標記點到各類標記點的概率值x_U:
LUxU=-BTxM
假設目標種子點標記為s=1,非目標種子點標記為s=2,各個非種子點vi到達種子點的概率值記為xsi,從而得到數組M,其對應的元素值為:

因此,可以通過下式計算得到所有非種子點到各類種子點概率值:

解得,且根據值將非種子點vi歸并到概率最大值所屬的類別中,從而實現圖像分割。
1.2.4 SVM與隨機游走相結合的方法 本文所提出的支持向量機與隨機游走相結合方法框圖如圖1所示。

圖1 本文方法框圖Fig 1 Block diagram of the method
首先對部分GGO型肺結節利用工作站進行手動分割,從已分割的肺結節圖像中選取一定數量的肺結節與肺組織的像素點。通過提取像素點及鄰域像素點的圖像特征訓練支持向量機。經過訓練后的支持向量機分類器對肺結節和肺組織區域具有良好的區分能力。選取待分割的GGO型肺結節圖像,在圖像中選取每隔N行N列的像素點以及鄰域像素點,由訓練后的支持向量機模型來判斷所選取的像素點是否屬于種子點。隨機游走從支持向量機判斷的種子點開始,通過計算非種子點與種子點之間的概率進行圖像分割。
本實驗使用了50個待分割的GGO型肺結節訓練支持向量機,使用了150個待分割的GGO型肺結節測試算法的分割性能。見圖2。
實驗環境為E5620 2.40 GHz CPU,8 GB內存的PC機上應用Matlab 2010a軟件編程實現。本文方法選用RBF函數作為SVM核函數,參數選擇為γ=1,C=1。
對每幅圖像由具有5年臨床經驗的影像診斷醫師進行手動分割作為金標準,然后利用本文算法以及3種經典分割算法進行分割,最后采用基于像素的3種評價指標,包括準確率(P)、召回率(R)以及F1值,來評價算法的分割性能,如下式:

其中,Area_real是具有5年臨床經驗的影像診斷醫師手動分割出的肺結節區域,作為金標準,Area是利用分割算法得到的肺結節區域。當參數α2=1時,就是最常見的評價指標,稱為F1值,綜合了準確率和召回率的結果。當F1較高時,說明分割方法比較理想,如下式:


圖2 GGO型肺結節圖像分割結果Fig 2 Segmentation results of GGO pulmonary nodules
根據上式計算出分割結果的平均準確率、平均召回率以及平均F1值見表2。表2中可以看出:4種分割方法的平均F1值均在85%以上,由于GGO型肺結節與肺組織的灰度差別較低,區域增長會存在很多錯分的區域,因此其平均F1值最低。本分割方法平均F1值高達96.49%,且平均準確率及平均召回率均在95%以上,說明該算法針對GGO型肺結節具有很好的分割性能。

表2 各分割方法分割性能比較Tab 2 Comparison of segmentation performance among different segmentation methods
目前國內外一些研究已經基于區域生長、聚類以及活動輪廓模型等分割算法實現了對實性肺結節分割的研究[7-9]。然而與較實性的肺結節相比,GGO型肺結節灰度的范圍較大,且形狀邊界也不規整;同時GGO型肺結節與肺組織的對比較小而顯得模糊,以上造成了計算機對GGO型肺結節識別和分割的困難。Son等[10]提出了一種基于三維空間的區域生長法對GGO型肺結節進行分割。Zhou等[11]建立了K近鄰法分類模型得到GGO型肺結節的分割結果。Zhang等[12]采用馬爾科夫隨機場模型的分割算法來分割GGO型肺結節。本文采用了基于SVM與隨機游走相結合的分割算法對GGO型肺結節進行自動分割,通過已分割的GGO型肺結節區域訓練支持向量機用于選取種子點,利用隨機游走根據所選取的種子點進行待分割的GGO型肺結節的分割,有效地結合了SVM和隨機游走分割方法的優點。與傳統方法相比,該方法具有自動分割能力,且能夠精確地分割出肺結節區域,很好地實現了肺結節區域與周圍肺組織的分離,為GGO型肺結節CAD的準確定位提供了必要的條件。該方法簡單高效,準確率高,在醫學影像圖像分割領域具有良好的應用前景。
[1]Siegel R L,Miller K D,Jemal A.Cancer statistics,2016[J].CA Cancer J Clin,2016,66(1):7
[2]韋春暉.肺癌早期診斷進展[J].臨床肺科雜志,2010,15(8):1136
[3]Cortes C,VapnikV.Support-Vector networks[J].Mach Learn,1995,20(3):273
[4]Fasshauer G E,Hickernell F J,Ye Q.Solving support vector machines in reproducing kernel Banach spaces with positive definite functions[J].Appl Comput Harmon Anal,2015,38(1):115
[5]Gillies R J,Kinahan P E,Hricak H.Radiomics.Images are more than pictures,they are data[J].Radiology,2016,278(2):563
[6]Grady L.Random walks for image segmentation[J].IEEE Trans Pattern Anal Mach Intell,2006,28(11):1768
[7]DehmeshkiJ,AminH,Valdivieso M,et al.Segmentation of pulmonary nodules in thoracic CT scans:a region growing approach[J].IEEE Trans Med Imaging,2008,27(4):467
[8]劉慧,張彩明,鄧凱,等.改進局部自適應的快速FCM肺結節分割方法[J].計算機輔助設計與圖形學學報,2014,26(10):1727
[9]Way T W,Hadjiiski L M,Sahiner B,et al.Computer-aided diagnosis of pulmonary nodules on CT scans:Segmentation and classification using 3D active contours[J].Med Phys,2006,33(7):2323
[10]Son W,Park S J,P ark C M,et al.Automated volumetric segmentation method for computerized-diagnosis of pure nodular groundglass opacity in high-resolution CT[C].Proc.SPIE 7624,Medical Imaging 2010:Computer-Aided Diagnosis,76241P
[11]Zhou J,Chang S,Metaxas D N,et al.An automatic method for ground glass opacity nodule detection and segmentation from CT studies[J].ConfProc IEEE Eng Med BiolSoc,2006,1:3062
[12]Zhang L,Fang M,Novak C L,et al.Consistent interactive segmentation of pulmonary ground glass nodules identified in CT studies[C].Proceedings of SPIE,2004,5370:1709