左亞靈

三、訓練及結果分析
本課題中選用的醫學圖像數據為乳腺X線圖像,全部示例圖像均來自MIAS圖像庫,該圖像庫中包含322張乳腺X線圖像,并分為三大類:正常、良性和惡性(異常),其中正常的208例,良性63例,惡性51例,后兩類都劃分為不正常。本課題中只分為“正?!焙汀爱惓!眱深?,良性和惡性都歸為“異?!鳖愔?。
本文采用10重交叉驗證的方法,將數據庫中的全體圖像隨機分為十份,其中一份用作測試集,另外九份用作訓練集,依次輪換,直到每份樣本都做了一次測試集,即進行了十次訓練和預測。實驗結果如右圖所示,最終平均分類精度為79.2%。本實驗中的支持向量機雖然證明了其可行性,但從結果來看,不僅準確度不夠高,實驗過程中最高精確度與最低精度相差也比較大,表明分類器的穩定性還不夠,猜測可能與隨機分類中圖片分類分組也有一定關系,在進一步研究中可對其分組分類進行記錄,來研究其中的關系。
四、結束語
基于本文中的實驗方法,還可以在此基礎上從以下方面進行改進,以提高精確度。
(1)本課題是在考慮SVM適用于小樣本訓練的前提下進行的,但如果用于大量樣本的實驗訓練,則空間復雜度和時間復雜度也會大大增加。
(2)現已有多種基于提高識別率的優化算法,但如果要進一步優化分類算法,還應考慮提高訓練速度。
此外,以上兩點的結合以及最終問題就是增量學習和在線學習。無論什么樣的算法,都不能直接保證其在任何時間地點都能進行百分之百準確的運算,但是如果用于應用中不斷學習的在線學習,則可以使準確率無限接近于百分之一百,這是比現有算法都要更加實用的小樣本分類算法。
參考文獻:
[1]田 捷,包尚聯,周明全.醫學影像處理與分析[M].北京:電子工業出版社,2003.
[2]Ma J,Theiler J,Perkins S.Accurate online support vector regression[J].Neural Computation,2003(11).
[3]汪 輝.增量型支持向量機回歸訓練算法及在控制中的應用[D].杭州:浙江大學,2006.