李 陽,常佳樂,王宇陽
長春工業(yè)大學計算機科學與工程學院,長春 130012
肺癌被認為是一種侵入性疾病,對人類生命健康具有重大威脅,是癌癥死亡的主要原因[1-2]. 計算機斷層掃描成像(Computed tomography, CT)技術(shù)是檢測早期肺癌的重要手段. 在CT圖像上,早期肺癌表現(xiàn)為直徑小于30 mm的圓形或類圓形致密影,即肺結(jié)節(jié).因此,肺結(jié)節(jié)的早期識別可以有效地提高肺癌患者的生存率,避免錯過最佳治療機會[3].
機器學習算法被廣泛應用于醫(yī)學圖像處理中,主要分為傳統(tǒng)的機器學習算法及深度學習算法. 傳統(tǒng)機器學習算法中,包括支持向量機(Support vector machine, SVM)算法、隨機森林(Random forest,RF)算法等,其中SVM應用最為廣泛[4-6].核函數(shù)是SVM的必要理論工具,能將原始數(shù)據(jù)映射到高維特征空間,實現(xiàn)非線性變換,構(gòu)造適合給定問題的核函數(shù)可以提升分類器的性能.Shankar等[7]為解決甲狀腺疾病的健康診斷問題,采用線性核和高斯核組合形式的多核學習支持向量機(Multiple kernel learning support vector machine, MKL-SVM)算法對甲狀腺數(shù)據(jù)進行分類,多核函數(shù)較單一使用線性核函數(shù)或高斯核函數(shù)的結(jié)果更優(yōu),準確度達到97.49%. Peng等[8]提出一種線性核、多項式核和高斯核混合的MKL-SVM算法識別抑郁癥,與單核SVM、樸素貝葉斯、決策樹等方法相比錯誤率更低,可降低到16.54%. 核函數(shù)的改進在一定程度上可以提高SVM的分類性能,但SVM模型參數(shù)選擇的影響也不容忽視.群體智能優(yōu)化思想因其效率高、適應性強等特點被廣泛應用于經(jīng)典機器學習算法模型的參數(shù)尋優(yōu).常用的群體智能優(yōu)化算法包括粒子……