朱景濤, 李 陽, 劉佳男, 李陳生
(長春工業大學 計算機科學與工程學院, 吉林 長春 130012)
(d) 提取侯選ROI圖像(結節) (f) 提取侯選ROI圖像(假陽)
?
不變矩混合核支持向量機的肺結節識別
朱景濤, 李 陽*, 劉佳男, 李陳生
(長春工業大學 計算機科學與工程學院, 吉林 長春 130012)
在形態學特征、灰度特征和紋理特征的13維特征基礎上,加入7種不變矩特征來刻畫肺結節,采用混合核SVM算法對肺結節進行識別。首先,從CT圖像中提取270個包含190個假陽和80個結節的感興趣區域(ROI),計算ROI的20維特征,然后進行5折交叉驗證。最后用混合核SVM算法進行識別。結果表明,混合核SVM 算法的準確度(ACC)指標達到94.80%,敏感度(SEN)指標達到87.00%。
圖像識別; 肺結節; 混合核函數; 支持向量機; 不變矩特征
肺癌是世界上死亡率最高的癌癥,近年來已成為全球男性居民的第一死因[1]。若能對肺癌做到早期診斷與治療,5年生存率將從14%上升到49%[2]。因此,腫瘤的早期診斷與治療是提高肺癌患者生存率的關鍵。肺癌的早期在CT(Computed Tomography)上表征多為肺結節,肺結節是一種直徑介于3~30 mm之間的單發圓形或類圓形致密影,肺結節的檢測和識別是肺計算機輔助診斷系統(Computer Aided Detection, CAD)的核心模塊。肺結節主要分為孤立型結節、粘連肺壁型結節、粘連血管型結節、磨玻璃型結節及空洞型結節[3]。
現階段肺結節的識別方法主要有貝葉斯分類器、人工神經網絡(Artificial Neural Network, ANN)和支持向量機(Support Vector Machine, SVM)[3-7]等,SVM是一種基于統計學習理論的機器學習方法,在圖像以及其他很多領域應用較為廣泛[8-9]。劉露[5]等使用SVM算法對胸部CT圖像中孤立型肺結節進行識別,準確度可達71.67%。文獻[6]采用代價敏感型SVM算法,針對正負類樣本不均衡現象,對結節與非結節樣本分別采用不同的懲罰系數,使識別敏感度可達92%。張婧[7]博士提出了一種結合規則的SVM算法,并將其應用于肺結節識別。文中在形態學特征、灰度特征和紋理特征的13維特征[7]基礎上,引入7種不變矩特征,分別描述了肺結節的方向和非對稱度等信息,并用混合核SVM算法對肺結節進行識別。
肺結節檢測系統通常由肺部CT圖像數據的采集、醫學圖像預處理、肺實質分割、候選結節提取及肺結節識別等部分組成。肺結節識別是肺CAD的最后一部分,也是CAD的核心模塊。
肺CAD步驟如下:
1)肺部CT圖像數據的采集。肺部CT圖像數據的采集主要是從醫院或者標準數據庫收集CT圖像數據。
2)圖像的預處理。醫學圖像預處理主要去掉圖片的背景及文字信息。
3)肺實質分割。肺實質分割用于左右肺的分開。
4)候選結節感興趣區域( Region of Interesting, ROI)的提取。候選結節提取的目的主要是突出肺結節,抑制其他解剖部位。
5)ROI特征的選擇與提取。文中在13維特征的基礎上加入7種不變矩特征,以期提高檢測準確度。
6)肺結節的識別。肺結節識別是系統的核心部分,用于對提取的感興趣區域(ROI)進行肺結節的識別,以剔除假陽。
肺CAD處理流程對應圖片如圖1所示。

(a) 原始圖像 (b) 預處理后的圖像 (c) 肺實質分割后的圖像

(d) 提取侯選ROI圖像(結節) (f) 提取侯選ROI圖像(假陽)
圖1 肺CAD處理流程對應圖片
矩是概率與統計中的一個概念,是隨機變量的一種數字特征。不變矩是一種高度濃縮的圖像特征,具有平移、灰度、尺度以及旋轉不變性。低階矩可以與物體的質量、質心位置、方向信息、非對稱度信息、峭度信息等聯系起來[10]。肺結節本身具有非對稱度、方向等信息,因而不變矩能較好地描述肺結節的形態特征。肺結節表面的光滑程度用矩值的大小來描述,矩值越大,表面越粗糙,肺結節的置惡性越大。


其中
由二階矩和三階矩可推出7種不變矩組:
由ηpq表示的歸一化中心矩定義為
式中
其中p+q=2,3,…。
這些矩組對于平移、尺度變化、鏡像和旋轉是不變的[11]。
通過上式直接計算得到不變矩組,在完成了ROI特征提取后,需要進行肺結節識別,以去除假陽。由于高斯徑向基(RBF)核的學習能力與多項式核的推廣能力較強,故使用RBF核與多項式核構造的混合核函數支持向量機算法完成肺結節識別。混合核函數的表示式為:

m----權重系數;
C----懲罰系數;

d=2,3,…,n
式中:d----多項式核函數的階數;

式中:s----RBF核的核寬度。
實驗選用了臺灣大學林智仁實驗室的libsvm工具箱在Matlab 2013a平臺下進行仿真實驗,將含有80個結節和190個假陽的270組數據隨機分為170組訓練數據與100組測試數據,并在訓練集上進行5折交叉驗證。在13維特征的基礎上加入式(4)中的7種不變矩特征,然后將混合核SVM的肺結節識別結果與單核情況下的線性核SVM、多項式核SVM、RBF核SVM進行比較。
懲罰參數C選取在2-9到29之間,RBF核參數s選取為2-7到27之間,兩種參數以乘以2的方式遞進。多項式核函數的階數d較小時,泛化能力較強,為體現非線性特點,故將d選取為2~3的正整數。權重系數m影響基本核在混合核中所占有的分量,故選為0到1,步長細化為0.01。實驗中采用全局的一種參數搜索方法,即網格算法,在libsvm網站的SVM使用指南中提到了這種參數搜索方法[12]。
實驗指標用敏感度(SEN)和準確度(ACC)分別衡量肺結節檢出率與整體識別效果,所得結果見表1。
表1 不同核函數SVM算法的肺結節識別結果%

核函數準確度(ACC)敏感度(SEN)線性核SVM93.7086.94RBF核SVM93.7088.37多項式核SVM91.8084.50混合核SVM94.8087.00
實驗結果表明,在引入7種不變矩特征后,混合核SVM 算法的準確度指標為94.80%,比線性核SVM和RBF核SVM高1.10%,比多項式核SVM高3.00%,高于單核SVM,一定程度提高了肺結節識別的準確率;敏感度指標為87.00%,結節檢出率也較高。在準確度指標上,混合核SVM算法識別效果最好;在敏感度指標上,混合核SVM算法識別效果僅次于RBF核SVM。
使用混合核SVM算法,在形態學特征、灰度特征和紋理特征的13維特征基礎上加入7種不變矩特征對肺結節進行識別。比較了不同SVM算法對肺結節在加入7種不變矩特征后的識別結果。在引入不變矩特征后,混合核SVM 算法的準確度指標為94.80%,比其他所有的單核SVM都高,敏感度指標達到了87.00%,結節檢出率也較高。混合核SVM對肺結節的識別結果比單核SVM好。下一步將通過參數尋優,尋找更優的參數和更合適的特征,以期提高肺結節識別的結果。
[1] Greenlee R T, Murray T, Bolden S. Wingo PA:Cancer statistics[J]. CA Cancer J Clin,2000,50:7-33.
[2] Lin D T, Yan C R, Chen W T. Autonomous detection of pulmonary nodules on CT images with a neural network-based fuzzy system[J]. Computerized Medical Imaging and Graphics,2005,29(6):447-458.
[3] 李陽,史東承,王珂,等.基于圖像模式的肺結節識別[J].吉林大學學報:工學版,2013(S1):463-467.
[4] Paola Campadelli, Elena Casiraghi, Giorgio Valentini. Support vector machines for candidate nodules classification[J]. Neurocomputing,2005,68:281-288.
[5] 劉露,劉宛予,楚春雨,等.胸部CT圖像中孤立性肺結節良惡性快速分類[J].光學精密工程,2009(8):2060-2068.
[6] Yang Li, Dunwei Wen, Ke Wang, et al. Mixed kernel function SVM for lung nodule recognition[J]. Lecture Notes in Computer Science (LNCS),2013,8157(2):449-458.
[7] 張婧,李彬,田聯房,等.結合規則和SVM方法的肺結節識別[J].華南理工大學學報:自然科學版,2011,39(2):125-129,147.
[8] 唐奇,王紅瑞,許新宜,等.基于混合核函數SVM水文時序模型及其應用[J].系統工程理論與實踐,2014,34(2):521-529.
[9] 邢吉生,楊禮,尚祖飛,等.支持向量機在視頻運動目標分析中的應用[J].吉林大學學報:理學版,2013,51(1):107-110.
[10] 王云慧,馬軍山,孫軍.基于邊緣檢測的七階矩方法[J].計算機應用,2010,30:159-161.
[11] Gonzalez R C, Woods R E.數字圖像處理[M].3版.阮秋琦,阮宇智,譯.北京:電子工業出版社,2014:542-543.
[12] Lin H T, Lin C J. A study on sigmoid kernels for SVM and the training of non-PSD kernels by SMO-type methods[EB/OL]. (2013-10-29)[2016-07-17]. http://www.csie.ntu.edu.tw/-cjlin/libsvm.
Invariant moment mixed kernel SVM for Lung Nodule Recognition
ZHU Jingtao, LI Yang*, LIU Jianan, LI Chensheng
(School of Computer Science & Engineering, Changchun University of Technology, Changchun 130012, China)
Based on 13-dimensional features from morphological, gray and texture, seven invariant moments features are added to represent lung nodule, and the mixed kernel SVM algorithm is applied to recognize the nodule. First, 270 ROI (regions of interest) including 190 negative samples and 80 positive samples are extract from the CT images, then 20-dimensional features of the ROI are calculated for five-fold cross-validation. Finally, the mixed kernel SVM recognize the nodules. Results show that the accuracy (ACC) of the mixed kernel SVM is 94.80% and the sensitivity (SEN) is 87.00%.
image recognition; lung nodule; mixed kernel function; SVM; invariant moments feathers.
10.15923/j.cnki.cn22-1382/t.2017.1.12
2016-07-17
吉林省科技廳科技發展計劃項目(201201129); 吉林省教育廳科研專項項目(2014142); 長春工業大學理工科基金項目(2011LG04); 長春工業大學創新創業訓練項目(2014CXCY099)
朱景濤(1988-),男,漢族,湖北武漢人,長春工業大學碩士研究生,主要從事醫學圖像處理方向研究,E-mail:neme_sis@foxmail.com. *通訊作者:李 陽(1979-),女,漢族,吉林長春人,長春工業大學講師,博士,主要從事醫學圖像處理及模式識別方向研究,E-mail:liyangyaya1979@sina.com.
TP 391
A
1674-1374(2017)01-0062-04