999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機的尿液細胞圖像識別分類研究

2013-09-08 10:18:40秦穎博
計算機工程與設計 2013年6期
關鍵詞:分類

秦穎博,孫 杰,陳 平

(1.天津理工大學 計算機與通信工程學院,天津300191;2.天津理工大學 電子信息工程學院 薄膜電子與通信器件天津市重點實驗室,天津300191)

0 引 言

尿液檢查以其簡便、快捷、標本易得而被臨床檢查所廣泛采用,是目前醫院臨床常規檢測項目之一。尿液成分的形態表征是對腎臟實質性變化及其他累及病變的客觀表達。因而,如何快速準確的統計出尿液中各類細胞的種類及含量成為人們的研究重點。

長期以來人們對醫學圖像的分析主要是依靠人工目測完成的,因而存在著效率低、工作強度大、易疲勞、人為誤差頻繁等缺點。本文將支持向量機 (SVM)技術應用于尿液細胞自動識別及分類[1-2],通過對不同特征參數的識別準確率、識別效率進行對比,得出采用SVM方法的細胞識別分類效果良好,達到輔助醫務人員分析和識別尿液細胞圖像的目的。本方法可給出病理檢查重要信息,對疾病診斷、治療監測及健康普查具有重要的臨床意義。

1 尿液細胞識別分類原理

細胞識別與分類研究技術是圖像處理,模式識別和人工智能技術相結合的產物,采用SVM對數字化細胞圖像進行自動處理分析和分類的主要方法是運用圖像處理分析技術提取細胞的特征信息,在這些特征信息的基礎上采用SVM對細胞進行識別分類。

SVM細胞識別與分類原理流程圖如圖1所示。

圖1 SVM識別與分類流程

2 支持向量機原理

支持向量機是近幾年出現的一種統計模式識別方法[4]。在解決小樣本非線性及高維識別中有特有的優勢,具有極強的泛化能力和其它機器學習方法不可比擬的優勢。其原理是用最優超平面作為分離訓練數據的線性函數,解決線性分類問題。所謂最優超平面是指,若訓練樣本 (xi,yi),i=1,...,l,x∈Rd,y∈ {+1,-1},可以被超平面無差錯分開,且超平面附近的向量離超平面距離最大,這樣的超平面即為最優超平面[3]。

式 (1)中w是到超平面的法向量,b是偏移量。求距離最大值等同于求w的最小值

超平面:x·w+b=0要求

式中:C——懲罰因子,ξi——松弛變量.判決結果方程如下

式中:αi——拉格朗日乘子常數,其值在優化過程中確定。sv——支持向量集合,在很多實際情況下,訓練數據集是線性不可分。例如在一維空間中,沒有任何一個線性函數能解決下述劃分問題,即圖2所示:一維空間中,實線、虛線各代表一類數據,我們無法用線性函數將這兩類數據區分開,可見線性判別函數有一定的局限性。

圖2 一維空間數據

完全可以建立一個二次判別函數

用來很好的解決上圖中線性不可分的問題。決策分類規則是:如果g(x)>0,則判定x屬于C1,如果g(x)<0,則判定x屬于C2,如果g(x)=0,則可以拒絕判定。如圖3所示。

圖3 二維空間的數據

二次判別函數g(x)= (x-a)(x-b)可以寫成如下形式

新建向量

這樣判別函數就可以寫成

于是,非線性函數就轉換成了四維空間里的線性函數。

在SVM中也是利用類似的思路解決非線性問題的,利用核函數將低維空間中的線性不可分數據映射成高維特征空間中的線性可分數據。在支持向量機中使用的核函數主要有:線性核函數、多項式核函數、RBF核函數、Sigmoid核函數四類。其中RBF核函數在實際使用中效果良好,因而本文采用RBF核函數作為SVM核函數。

3 特征參數與SVM參數

3.1 顏色特征參數

在RGB色彩坐標系統中,任意顏色都可看作是3個基本顏色——紅 (R,red),綠 (G,green)和藍 (B,blue)的不同組合。

在HSI色彩坐標系統中色調H:由角度表示,它反映了顏色最接近什么樣的光譜波長。飽和度S:表征顏色的深淺程度,飽和度越高,顏色越深。亮度I:是表示光照強度或稱為亮度。本文選擇HSI作為顏色特征。HSI在許多處理中有其獨特的優勢。首先,在HSI中,亮度分量與色度是分開的,I分量與圖像的彩色信息無關。其次,在HSI中,色調H和飽和度S的概念相互獨立并與人的視覺系統最為接近。這些特點使得HSI被優先用于彩色圖像分析算法中。

從RGB到HSI的轉換公式如下[5]

3.2 空間特征參數

細胞圖像是一種彩色物體,就單純一個像素點而言,它所包含的信息量不僅僅指的是是其顏色或色度信息,還有該像素點的空間信息,即該像素點所處的空間位置或者該像素點周圍像素的信息。因而在特征參數的選取上,僅有顏色參數是不可能表達像素的所有信息,有必要加入空間特征參數。為了提取某一像素點周圍像素的信息,我們以該像素點周圍5×5領域為研究對象,求取該像素點鄰域中所有像素點顏色特征的平均值作為空間特征。從理論上而言,這種處理更加充分地利用了細胞圖像所包含的信息。實驗結果表明,加入空間特征能夠更好地識別不同種類的細胞。

3.3 SVM參數確定

SVM的分類性能主要由兩個參數確定,即:懲罰因子c和核函數的參數[6]。懲罰因子c用于調節學習機器置信范圍和經驗風險間的比例,使學習機器的推廣能力達到最好。選取時由具體的問題而定,并取決于數據中噪聲的數量。核函數和其參數對分類性能有很大影響,這里我們使用的是RBF核函數以及其參數g。SVM的參數確定過程實質上就是一個優化的過程。目前SVM參數確定方法主要有:經驗選擇法、實驗試湊法、梯度下降法、交叉驗證法[7]、Bayesian法等。本文提出網格搜索交叉驗證法確定兩個SVM參數:懲罰因子c和RBF核函數的參數g。

10-折交叉驗證法是一種典型的SVM性能評價準則。其主要思想為:將訓練樣本集隨機分為10個互不相交的子集合,即s1,s2,…s10。對其中的9個子集作為訓練數據進行訓練,求出判決函數,即可對剩下的一個子集合進行樣本測試。記其中的錯誤分類樣本數為li,該過程重復10次,取10次過程中的測試錯誤的平均值來估計期望泛化誤差。利用網格搜索遍歷所有可能的 (c,g)對值,然后進行10-折交叉驗證,找出使交叉驗證錯誤率最小的(c0,g0)對,就為最優參數。具體步驟如下:

(1)首先根據網格法搜索法初步設定參數變化范圍,將所有不同參數組合按10-折交叉驗證求得識別率。

(2)根據前述參數范圍進一步細分網格,得到更精確的參數值,根據10-折交叉驗證平均正確率排序,選擇分類正確率最高的參數組合作為模型的最優參數。

4 實驗過程與研究結論

尿液細胞識別分類過程如下:

(1)將尿液細胞樣本圖片中每一類細胞的特征參數作為一類樣本,并以專門的格式存儲于數據庫中。

(2)讀取這些特征樣本分量作為SVM的訓練樣本進行訓練,生成支持向量機分類器。

(3)使用已生成的支持向量機分類器對待檢測的細胞圖片所有像素點進行預測分類,最終達到識別分類的目的。

以上過程操作簡單,只需使用少量樣本訓練一次,生成分類器后,就可對多種細胞同時進行識別分類。

程序軟件由C++語言編寫,同時結合SQL Server數據庫[8],設計出操作簡單,實用性強的尿液細胞識別分類程序。其中SVM部分是基于LIBSVM發展而來,LIBSVM是臺灣大學林志仁教授開發的一套快速高效的SVM模式識別與回歸的開源程序包[9]。

4.1 實驗環境

軟件環境:操作系統 Microsoft Windows XP Professional sp3,開發軟件visual studio 2010,release版本。

硬 件 環 境: 處 理 器 Pentium4,2.40GHZ, 內 存1GB RAM。

4.2 實驗步驟與程序演示

(1)利用圖像預處理對待檢測細胞圖像進行處理。

利用高斯濾波法對待檢測細胞圖像去噪[4,10],有效的過濾掉圖像中的散粒噪聲,保留了細胞圖像的細節信息,進而改善了細胞圖像質量,如圖4、圖5所示。

(2)分割細胞圖像結構,提取細胞特征參數。

在RGB顏色空間中R,G,B值作為顏色特征參數,ave_r,ave_g,ave_b作為空間特征參數。

在HSI顏色空間中H,S,I值作為顏色特征參數,ave_h,ave_s,ave_i作為空間特征參數。將以上所有特征參數儲存于SQL Server數據庫中用于后續處理。圖6為樣本特征參數的選取過程。

為了方便用戶對SQL Server數據庫進行必要的管理,我們編寫了數據庫管理界面,如圖7所示。

圖6 樣本特征選取

圖7 樣本特征參數管理界面

(3)從數據庫中讀取特征值進行SVM訓練,通過網格搜索交叉驗證法確定SVM最優參數,然后根據SVM訓練結果及參數進行細胞識別分類。分類結果如圖8所示。

圖8 RGB色彩系及HSI色彩系下識別實驗

從圖8中可以明顯地看出,圖8(b)、圖8(c)中的識別效果比圖8(a)好,而圖8(d)中的識別效果要好于圖8(b)和圖8(c)。在整幅圖中圖8(d)的識別效果最好,即HSI色彩系下加入空間特征方法的識別效果最好。

4.3 實驗結論

本實驗一共選取16張圖片,圖片大小為800×600,細胞種類為6類,共107個,分別為白細胞、紅細胞、上皮細胞、細胞管型、結晶、背景和雜質歸為一類,一共六類。我們以RGB值作為特征參數為例,經過大量的實驗測試,比較不同SVM參數下的識別效果,其中(c0,g0)為選取的最優參數對,并分別統計了各種細胞的識別率,見表1。

表1 不同SVM參數下識別結果比較 (%)

以上結果表明,當特征參數一定時,懲罰因子c和RBF核函數的參數g對SVM的性能起到決定作用,由網格搜索和交叉驗證法確定SVM最優參數得到了理想的識別分類效果。

在SVM最優參數確定后,通過對不同的方法進行訓練和測試,統計并對比所得到識別分類的結果和所消耗的時間。其中樣本訓練時間和識別時間由程序自動生成,時間單位為毫秒 (ms),結果見表2、表3。

表2 不同特征參數下識別結果比較 (%)

表3 不同特征參數下識別效率比較 (ms)

從識別的準確度來看,利用圖像綜合特征的分類方法是可行的,采用HSI顏色系作為顏色參數所取得的效果要比采用RGB顏色系要好。另外加入空間特征參數要比采用單純顏色特征的分類效果要好,這說明圖像像素點的信息,不是僅僅用該像素點的顏色就能表達的還與該像素點周圍的像素有關。

從識別的效率來看,由于HSI顏色參數是根據RGB顏色參數由轉換公式計算而來,因而計算量的增加導致樣本訓練和識別時間也會相應增加。在加入參數特征空間后,計算量也隨之相應增加。準確度與效率一直以來就是矛盾的,如果過高的追求精確度,則效率會有比較大的下降,只能從二者之間取一個平衡。從程序反饋的消耗時間來看,我們在付出較小效率的代價下,提高了識別準確度。

實驗結果表明:在利用SVM對尿液細胞進行識別分類的過程中,我們所提出的在HSI顏色空間選取顏色特征參數和空間特征參數,同網格搜索交叉驗證法選取SVM最優參數相結合的方法得到很好的驗證,取得了理想的實驗結果。

5 結束語

本文選取符合人類視覺感知的HSI顏色空間作為主要特征參數,有效避免了RGB顏色空間的弊端。加入空間特征參數后,細胞圖像信息更完整。使用具有廣泛應用前景的支持向量機為基礎的改進算法,并采用網格搜索交叉驗證法選取最佳的核函數和相關參數,最終達到理想的分類效果。還同時重點考慮算法的實用性,便利性和可擴展性。以visual c++為平臺設計軟件,使其具有良好的兼容性,方便用戶使用。使用SQL Server數據庫保存特征數據,為以后的尿液細胞識別分類的網絡化應用打下基礎。

[1]GU Yaxiang,DING Shifei. Advances of support vector machine [J].Computer Science,2011,38 (2):14-17 (in Chinese).[顧亞祥,丁世飛.支持向量機的研究進展 [J].計算機科學,2011,38 (2):14-17.]

[2]WANG Yongfeng,HUANG Siming,XU Jing.A gradient method for choosing kernel parameters for SVM [J].Mathematics In Practice and Theory,2011,41 (1):7-13 (in Chinese). [王永峰,黃思明,徐晶.一種通用的基于梯度的SVM核參數選取算法[J].北京:數學的實踐與認識,2011,41 (1):7-13.]

[3]Serafeim Moustakidis,Giorgos Mallinis,Nikos Koutsias,et al.SVM-based fuzzy decision trees for classification of high spa-tial resolution remote sensing images [J].IEEE Transactions on Geoscience and Remote Sensing,2012,50 (1):149-168.

[4]Mila Sonka,Vaclav Hlavac,Roger Boyle.Image processing,analysis and machine vision [M].CL-Engineering,2008.

[5]YE Xiaoling,LIU Yucheng,ZHANG Yingchao.Cell recognition research based on colorimetry and morphology [J].Computer Engineering and Design,2009,30 (6):1495-1498 (in Chinese).[葉小玲,劉玉成,張穎超.基于色度學與形態學相結合的細胞識別研究 [J].計算機工程與設計,2009,30(6):1495-1498.]

[6]Dheeba J,Tamilselvi.Classification of malignant and benign MICRO-calcification using SVM classifier [C]//IEEE Proceedings of Icetect,2011:686-690.

[7]FENG Heguo.Parameter optimizing for support vector machines classification [J].Computer Engineering and Applications,2011,47 (3):123-125 (in Chinese). [奉和國.SVM分類核函數及參數選擇比較 [J].計算機工程與應用,2011,47 (3):123-125.]

[8]QU Yang.Visual C++實效編程280例 [M].Beijing:Posts& Telecom Press,2009 (in Chinese). [曲揚.Visual C++實效編程280例 [M].北京:人民郵電出版社,2009.]

[9]Hsu Chih wei,Changchih chung,Lin Chih jena.Practical guide to support vector classification [EB/OL].[2012-05-05].http://www.csie.ntu.edu.tw/cjlin.

[10]WANG Zhanquan,XU Hu.Digital image processing technology and engineering case for Visual C+ + [M].Beijing:Post and Telecom Post,2009 (in Chinese).[王占全,徐慧.Visual C++數字圖像處理技術與工程案例 [M].北京:人民郵電出版社,2009.]

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數據分析中的分類討論
按需分類
教你一招:數的分類
主站蜘蛛池模板: 国产精品毛片一区视频播| 国产丰满大乳无码免费播放| 精品日韩亚洲欧美高清a| 自拍偷拍欧美| 日韩大乳视频中文字幕| 天天干伊人| 麻豆精品在线| 久久夜色精品国产嚕嚕亚洲av| 国产经典三级在线| 国产精品久久精品| 毛片基地美国正在播放亚洲| 国产精品视频公开费视频| 国产网站黄| 亚洲第一视频网| 国产成人久久777777| 国产又粗又猛又爽视频| 亚洲成av人无码综合在线观看| 18黑白丝水手服自慰喷水网站| 亚欧成人无码AV在线播放| 日韩精品专区免费无码aⅴ| 被公侵犯人妻少妇一区二区三区| 91亚洲国产视频| 免费看美女自慰的网站| 亚洲色图狠狠干| 在线免费观看a视频| 国内精品免费| 亚洲丝袜第一页| 国产亚洲精品自在线| 国产日韩精品欧美一区灰| 久操线在视频在线观看| 伊人久久青草青青综合| 亚洲国产精品人久久电影| 日韩欧美网址| 夜夜拍夜夜爽| 国产精品网曝门免费视频| 六月婷婷激情综合| 日韩欧美国产区| 欧美人与动牲交a欧美精品| 999福利激情视频| 亚洲精品午夜无码电影网| 国产白浆一区二区三区视频在线| 蜜桃视频一区| 欧美成a人片在线观看| 午夜电影在线观看国产1区| 午夜国产在线观看| 亚洲国产看片基地久久1024| 亚洲无线国产观看| 麻豆精选在线| 无码内射中文字幕岛国片| 五月婷婷激情四射| 午夜激情福利视频| 欧美在线一二区| 亚洲一级毛片免费观看| 91无码人妻精品一区| 日韩国产综合精选| 国产69精品久久久久妇女| 亚洲国产成人自拍| 欧美成人a∨视频免费观看| 99re在线免费视频| 国产三级精品三级在线观看| 蜜芽一区二区国产精品| V一区无码内射国产| 激情综合婷婷丁香五月尤物| 免费在线成人网| 国产中文一区二区苍井空| 国产午夜看片| 国产99免费视频| 青青青视频蜜桃一区二区| 日韩欧美中文在线| 97久久超碰极品视觉盛宴| 国产精品自在自线免费观看| 亚洲无线观看| 波多野结衣亚洲一区| а∨天堂一区中文字幕| 色偷偷男人的天堂亚洲av| 精品国产网站| 91精品视频在线播放| 免费可以看的无遮挡av无码| 另类欧美日韩| 青青青草国产| 色哟哟国产精品| 亚洲精品色AV无码看|