員偉康 木拉提·哈米提 嚴傳波 阿布都艾尼·庫吐魯克 艾賽提·買提木沙 姚娟 楊芳 伊力扎提·阿力甫



摘要:目的 對新疆維吾爾醫植物藥材圖像進行特征提取,并對所研究特征進行分析,探討其在維吾爾醫藥材圖像分類中的效果,找到適用于維吾爾醫藥材圖像分類的特征,為基于內容的新疆維吾爾醫藥材圖像的檢索系統奠定基礎。方法 以新疆維吾爾藥材中植物藥的花和葉為研究對象,先對圖像進行預處理,進而提取顏色和紋理特征作為原始特征,并對特征進行統計學分析,運用最大類間距法篩選得到圖像分類的主要特征,最后應用Bayes判別分析法對特征的分類能力進行評價。結果 將顏色特征和紋理特征篩選后進行分類,花類圖像的分類準確率為85%,葉類圖像的分類準確率為62%。利用篩選后的特征對花類圖像的分類效果好于利用原始特征分類的效果。結論 與原始特征分類比較,運用篩選后的特征進行分類,對于判別花類藥材的效果較好。這為進一步研究維吾爾醫藥材圖像分類和完善特征提取方法奠定了基礎。
關鍵詞:新疆維吾爾植物藥材;顏色特征;紋理特征;特征提取;判別分類
DOI:10.3969/j.issn.1005-5304.2016.01.018
中圖分類號:R29 文獻標識碼:A 文章編號:1005-5304(2016)01-0078-04
Xinjiang Uygur Medicine Image Feature Extraction and Discriminant Analysis Based on Color and Textural Features YUN Wei-kang1, Murat HAMIT1, YAN Chuan-bo1, Abdugheni KUTLUK1, Asat MATMUSA2, YAO Juan3, YANG Fang1, Elzat ALIP1 (1. College of Medical Engineering Technology, Xinjiang Medical University, Urumqi 830011, China; 2. College of Public Health, Xinjiang Medical University, Urumqi 830011, China; 3. Department of Radiology, First Affiliated Hospital of Xinjiang Medical University, Urumqi 830054, China)
Abstract: Objective To extract Xinjiang Uyghur medicine image features and analyze the features; To investigate the image classification effect of the researched features; To find the suitable features for Xinjiang Uyghur medicine image classification; To lay the foundation for content-based medical image retrieval system of Xinjiang Uyghur medicine images. Methods The flowers and leaves of Xinjiang Uyghur medicine were treated as the research objects. First, images were under preprocessing. Then color and textural features were extracted as original features and statistics method was used to analyze the features. Maximum classification distance was used to analyze the main features obtained from image classification. At last, the classification ability of features was evaluated by Bayes discriminant analysis. Results Color and textural features were selected and classified. The correct classification rate of flower images was 85% and the correct classification rate of leaf images was 62%. The classification effect of flower images used by selected features was better than classification effect of original feature. Conclusion Compared with the classification of original features, the classification accuracy of flower medicine is higher through selected features. This research can lay a certain foundation for the further researches on Xinjiang Uyghur medicine images
and the improvement of feature extraction methods.
Key words: Xinjiang Uyghur medicine; color feature; textural feature; feature extraction; discriminant classification
維吾爾醫學是我國傳統民族醫學,是新疆維吾爾自治區衛生服務體系中不可或缺的重要組成部分。新疆地域遼闊,具有獨特的地理環境,生態環境多樣,孕育著豐富的藥材資源。合理并有效地利用這些維吾爾藥材數據資源,對保護傳統民族藥材資源意義重大。
基于內容的圖像檢索(CBIR)隨著數字化時代的到來而迅速發展[1],成為當今的研究熱點。CBIR是指以1個圖像作為查詢條件,或描述圖像的內容,在提取底層特征的基礎上建立索引的方式,然后通過計算比較這些特征和查詢條件之間的相似度距離,來判斷2個圖片的相似程度。CBIR包括圖像特征提取、特征值的比對、結合語義分析等步驟,其中圖像特征提取是其關鍵步驟之一。圖像特征提取是一門交叉性的學科,它既包含在計算機視覺技術中,也包含在圖像處理中,通過計算機的分析和處理提取圖像特征,進而解決實際問題[2]。
雖然CBIR技術在各領域得到了長足發展,但針對維吾爾醫藥材的研究較少,因此,在維吾爾醫藥領域展開相關研究具有重要意義。本研究以維吾爾醫植物藥材中的花和葉為研究對象,提取藥材圖像的顏色特征和紋理特征,通過統計分析判斷特征分類能力。
1 圖像預處理
對原始圖像提取特征之前,需對維吾爾藥材圖像進行預處理。
首先,對彩色圖像進行去噪,濾除無用信息,加強原圖的細節,使圖像顏色更加鮮明、更加立體化。然后對圖像尺寸大小進行歸一化處理,使圖像的最長邊界為300像素點。處理后,圖像的質量和尺寸得到統一。為了適合圖像處理,在尺寸歸一化的基礎上,要把藥材圖像從RGB顏色空間轉化為HSV顏色空間。以藥材數據庫中的植物藥紅花和艾葉為例,預處理結果見圖1。
2 圖像特征提取
2.1 顏色直方圖特征的提取
顏色特征以圖像整體為對象,是一種全局特征,描述圖像或圖像區域所對應景物的表面顏色性質[3-4]。常見的顏色特征有顏色直方圖、顏色矩、顏色集。本研究對維吾爾藥材圖像顏色直方圖特征進行提取。
為了便于計算和檢索,先將色調(H)、飽和度(S)和亮度(V)3個分量按照色彩的不同范圍,采用以下公式的量化級別進行量化。
將HSV三維特征矢量取不同的權值轉換成一維特征矢量。在這3個矢量中,H、S和V影響人眼辨別顏色的能力呈遞減趨勢。根據H、S、V的量化級數和其頻率的不同進行組合,S和V的量化級數均為4??傻玫奖磉_式:L=16H+4S+V。
通過計算得到256柄的一維直方圖。3個三維分量H、S、V轉換成1個一維矢量。對H、S和V分別取權重為16、4和1,減小了S和V對計算和檢索結果的影響。進行檢索實驗時,能夠較好地檢索出顏色分布不同的圖像,在充分利用圖像顏色特征的同時達到了對圖像檢索的要求。得到的顏色直方圖結果見圖2。通過直方圖可以直觀看出圖像的顏色分布。
在顏色直方圖基礎上,通過計算得到一些統計量,包括均值、方差、歪斜度、峰態、能量,以此來反映圖像的特征值[5]。
2.2 紋理特征的提取
灰度共生矩陣(gray level co-occurrence matrix)是反映圖像區域微觀紋理的有力工具,它按一定的空間關系描述像素點對之間的灰度相關性[6-7]?;诨叶裙采仃囂崛〖y理特征的方法是一個經典的統計分析方法,是目前公認的紋理分析方法[8]。
經過正規化處理的灰度共生矩陣即是抽取二次統計量紋理特征系數的基礎。本研究所采用的特征統計量有以下5種:角二階矩、熵、慣性矩、相關性和逆差矩。取像素距離d=1,θ={0°,45°,90°,135°},計算各統計量,并取4個方向的均值。這樣就抑制了方向分量,得到的特征與方向無關,從而組成圖像的紋理特征。
3 結果與分析
3.1 圖像處理結果
選取圖像數據庫中2種類型圖像各100幅[9-10],采用MATLAB7.1軟件編程計算圖像的顏色特征和紋理特征,結果見表1。
3.2 結果分析
3.2.1 描述性統計分析和類間距分析 通過描述性統計分析,計算特征向量的均值和方差,描述顏色特征和紋理特征的集中、離散趨勢。
在判別分析前,為了剔除分類效果相對較差的特征,適當地選擇特征是很重要的。方差歸一化間距是衡量用1個特征區分2類能力的指標[11],故本研究采用歸一化間距來評價和選取特征。
對于某一個特征x而言,第i類和第j類類間距離(D)為: 。
其中 、 和 、 分別為第i類和第j類x特征的均值和方差。D越大,說明該特征的分類能力越強;反之,該特征的分類能力越弱。各特征的均值、方差及2種類型圖像分類的類間距見表2。
對這10個特征值取平均值,求得 =0.345 311。本研究將D> 的特征篩選出來。根據類間距的結果顯示,均值、方差、能量、角二階矩、熵、慣性矩這6個特征的類間距相對較大,對于圖像的分類能力相對較強,將這6個特征值組成篩選后的綜合特征。
3.2.2 判別分析 Bayes法是對特征分類能力的有效性進行評估的重要方式,既可用于計量資料的兩類判別,也可用于多類判別。Robin H等[12-13]在不同復雜度的模型非監督分類中使用Bayes法。因此,本研究使用Bayes法對結果進行分析。采用SPSS17.0軟件對數據進行處理,隨機取圖像數據庫中的兩類圖像各100幅,提取其特征進而判別分析。首先分別利用顏色特征和紋理特征對藥材圖像進行判別分析,再利用兩類特征的原始特征進行判別分析。為提高特征向量的分類能力,根據表2中類間距值,利用篩選出來的6個特征進行判別分析。得到線性判別函數式。
y1=-0.018x1+0.001x2+60.002x3+466.443x4+149.586x5-
44.553x6-241.524
y2=-0.008x1-0.001x2+60.864x3+468.94x4+148.718x5-
41.567x6-240.652
其中,y1、y2表示花類和葉類,x1、x2、x3、x4、x5、x6分別表示均值、方差、能量、角二階矩、熵、慣性矩。y1、y2的先驗概率同為0.5,即一張藥材圖像,被判別為花類和葉類的概率是相等的。
根據上述判別函數式和先驗概率進行判別分析,進而得到后驗概率,即每個樣品歸屬于每一類的概率,判別準則是按后驗概率的大小歸類。結果見表3。進而比較利用不同特征進行判別分析的分類效果。
根據結果可得,顏色特征對于兩類圖像的分類效果一樣;紋理特征對于花類的分類效果較好,但葉類的就比較差;與原始特征比較,利用最大類間距篩選后的特征進行判別分析使得花類的判別準確率得以提高,但降低了葉類的準確率。綜合上述結果,在最大類間距篩選特征的基礎上進行判別分類,可以在一定水平上提高花類圖像分類的準確率。但葉類藥材的效果卻相反,這可能與葉類藥材的葉片顏色差異不大有關。說明利用篩選后的綜合特征比較適合花類,這為進一步研究維吾爾藥材圖像分類和完善特征提取方法提供了依據。后續會嘗試引入其他特征(如形狀特征)進行相關研究。
4 小結
圖像特征提取是CBIR中一個重要環節。本研究以維吾爾醫植物藥材圖像為對象,提取圖像的顏色特征和紋理特征,初步構建了基于維吾爾醫植物藥材圖像特征數據庫。根據新疆維吾爾藥材中花類和葉類在顏色和紋理分布上的差異,結合藥材圖像的特點,使用顏色特征和紋理特征提取方法,并進行統計分析。實驗結果表明,使用篩選后的特征對花類圖像進行判別分類的效果相對較好。這為進一步研究基于內容的新疆維吾爾藥材圖像檢索系統研究奠定了基礎。
參考文獻:
[1] 馮伍,張俊蘭,白樹芳.基于內容的圖像檢索技術在醫學領域中的應用[J].醫療衛生裝備,2012,33(11):98.
[2] 王志瑞,閆彩良.圖像特征提取方法的綜述[J].吉首大學學報(自然科學版),2011,32(5):43-47.
[3] 王娟,孔兵,賈巧麗.基于顏色特征的圖像檢索技術[J].計算機系統應用,2011,20(7):160-164.
[4] 戴雯惠.一種基于多特征融合的彩色圖像檢索方法[J].電腦與信息技術,2011,19(5):15-17.
[5] 劉益新,郭依正.灰度直方圖特征提取的Matlab實現[J].電腦知識與技術,2009,5(32):9032-9034.
[6] 童隆正,王磊,陳海榮,等.肝纖維化圖像的灰度共生矩陣分析[J].首都醫科大學報,2003,24(3):240-242.
[7] 木拉提·哈米提,李莉,艾克熱木·阿西木,等.新疆地方性肝包蟲病CT 圖像的灰度共生矩陣分析[J].科技通報,2012,28(3):75-80.
[8] WALKER R F, JACKEAY P T, LONGSTAFF I D. Recent developments in the use of the co-occurrence matrix for texture recognition[C]// Proceedings of 13 Intenational Conference on Digital Image Processing. Santorini Greece,1997:63-65.
[9] 國家中醫藥管理局《中華本草》編委會.中華本草:維吾爾藥卷[M].上海:上??茖W技術出版社,2005:3-10.
[10] 新疆維吾爾自治區革命委員會衛生局.新疆中草藥(維吾爾文)[M].烏魯木齊:新疆人民出版社,1973.
[11] 尹劍侖,衛武迪,梁永貴.腫瘤超聲圖像灰度和紋理特征提取方法研究[J].通信技術,2009,42(9):168-170.
[12] ROBIN H, JOHN S, PETER C. Bayesian classification with correlation and inheritance[C]//Proceedings of the 12th international joint conference on artificial intelligence - Volume 2.01.1991:692-698.
[13] 丁國建,徐奎善,李天官,等.應用SPSS逐步判別分析建立晚期血吸蟲病治療分類模型的研究[J].實用預防醫學,2011,18(8):1418-1420.
(收稿日期:2015-03-23;編輯:陳靜)