郭文靜 田星
摘 要 為了獲得較高的分類準確率,建立支持向量機模型,并采用遺傳算法自動選擇最優核函數參數,提出基于遺傳算法優化支持向量機的圖像識別方法。結果表明,該方法具有較優的識別率,整體性能優良。
【關鍵詞】遺傳算法 支持向量機 圖像識別
1 引言
在醫學中,獲得合格的X射線圖像的前提是獲得合適的曝光值,曝光不足或過度都會影響圖像質量。X射線成像依賴于穿透人體的部分射線,由于個體組織結構復雜性以及外在因素,導致選取合適的曝光值并不是容易的事,這樣就會影響X射線圖像的可用性。因此,準確有效地識別曝光量有問題的圖片具有一定的研究意義,并對之后進行圖像增強處理打好基礎。
2 相關概念
2.1 支持向量機
由于X射線圖像具有較強的非線性特性,維度較高,同時屬于小樣本學習問題,與傳統分類方法容易出現過學習現象相比,支持向量機在有限的樣本情況下具有很大優勢,同時能在不增加計算量程度的基礎上通過選取合適的核函數,將非線性問題反映到高維空間中,最終找到一個實現分類的最優分類超平面,得到高維線性決策函數,從而取代原函數,因此具有較強的推廣能力。
2.2 基于遺傳算法優化SVM模型參數
將遺傳算法應用到優化SVM參數是,算法過程如下:
(1)對其所輸入的圖像X射線,進行分析處理,建立測試樣本與學習樣本。
(2)定義進化最大代數MAXGEN=100,生成種群最大數量為SIZEPOP=20,SVM CV參數為10,代溝GGAP=0.9,指父代中有90%的個體被復制到子代,參數C和g的變化范圍為[0,100]。
(3)所生成的染色體即為初始種群。
(4)解碼每個染色體計算適應度值。
(5)根據適應度值選擇并復制個體進而產生新種群。
(6)進行遺傳操作。
(7)判斷結果,滿足需求則進行下一步(8);判斷結果,不滿足需求返回步驟(4)。
(8)利用優化的參數C和g建造新的SVM。
3 實驗結果
3.1 圖像預處理
消除與算法無關的信息,并把源圖像二值化,設定閾值為0.4,如圖2所示。
截取最小區域圖像,并將其轉化成16x16標準化圖像。最后把這些16×16標準化圖像排成一個列向量,讓后轉置生成100個256的訓練樣本矩陣。本文選取X射線圖像為測試樣本與訓練樣本,其中,100幅訓練樣本,分為曝光正確和曝光不正確的兩類,每類均有50幅,令另外的40幅作為測試樣本,每類分別20幅。
3.2 不同參數選擇方法的對比
本實驗預先定義“曝光正確”圖像的標簽是“1”。
“曝光不正確”圖像的標簽是“2”進行訓練和測試。
圖3、4分別為參數粗略選擇結果圖和參數精確選擇結果圖;
圖3粗略得出圖格尋優的選擇結果,C=0.082,g=0.027時對應最佳準確率,為99%;
圖4是在粗略選擇結果的基礎上將變化間隔縮小了一倍,進一步得到精確化形象化的準確率變化,得出取C=0.025,g=0.0625時對應最佳準確率,為99%。
圖5為測試集中時一個樣本的識別結果出現的偏差,將“2”預測成了“1”,測試集準確率為97.5%。原因是實際圖像預測識別中,曝光不正確的圖像曝光程度,接近于曝光正確的圖像,所以混淆了SVM的識別,導致準確率下降。
4 結束語
在網格尋優法與遺傳算法對比之后,進而提出基于遺傳算法優化支持向量機的X射線圖像識別的方法,自動的選擇SVM參數,解決了對性能有非常重要影響的核函數的參數確定問題,取得了較好效果,具有一定的實用價值。
參考文獻
[1]張建華,朱春華.基于遺傳算法和支持向量機的儲糧害蟲圖像識別[J],2010,38(17):8833-8834.
[2]VAPNIK V. The nature of statistical learning[M].New York:Springer,1995.
[3]吳琳琳.基于SVM技術的手寫數字識別的研究[D].山東師范大學,2006.
作者簡介
郭文靜(1989-),女,山西省太原市人。碩士研究生學歷。助教。主要研究方向為模式識別、超聲無損檢測。
作者單位
太原工業學院電子工程系 山西省太原市 030003