(1.燕山大學(xué) 電氣工程學(xué)院, 河北 秦皇島 066004;2.河北省測試計(jì)量技術(shù)及儀器重點(diǎn)實(shí)驗(yàn)室, 河北 秦皇島 066004)
摘 要:針對(duì)統(tǒng)計(jì)模式識(shí)別和結(jié)構(gòu)模式識(shí)別方法各自的局限性,提出一種基于多維數(shù)據(jù)多元圖結(jié)構(gòu)子模式表示(包括圖形基元和特征基元表示)的模式識(shí)別方法,它體現(xiàn)了模式識(shí)別問題研究的一種新思維,具有鮮明的可視化特點(diǎn)。應(yīng)用多維數(shù)據(jù)多元圖表示原理實(shí)現(xiàn)無結(jié)構(gòu)數(shù)據(jù)的結(jié)構(gòu)化表示,提取出表征多元圖圖形的圖形基元和特征基元,將對(duì)象表達(dá)為多元圖結(jié)構(gòu)特征子模式進(jìn)行分類識(shí)別。利用UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫中的Iris數(shù)據(jù)進(jìn)行了分類實(shí)驗(yàn),實(shí)驗(yàn)對(duì)比結(jié)果顯示該方法具有較好的識(shí)別效果。
關(guān)鍵詞:模式識(shí)別;多元圖表示;圖形基元;特征基元;子模式
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):10013695(2009)02054904
Pattern recognition based on structuralsubpattern presentation of multivariate graph
GAO Haibo1,HONG Wenxue1,CUI Jianxin2,ZHAO Yong1,HAO Lianwang1
(1.College of Electrical Engineering,Yanshan University, Qinhuangdao Hebei 066004, China;2.Measurement Technology Instrumentation Key Laboratory of Hebei Province, Qinhuangdao Hebei 066004, China)
Abstract:This paper presented a novel method for pattern recognition based on graph and feature primitives presentation of multivariate graph. It showed a new thinking for the study of pattern recognition, which provided with visual method. Firstly,displayed the structural information of multivariate based on multivariate graphical presentation. Then extracted the graph primitives and feature primitives of multivariate graph and showed the object as structural subpattern of multivariate graph. Finally,classified the object based on the structural subpattern information of multivariate graph.Took some data experiments using the Iris dataset of the UCI repository of machine learning databases. The experiment results show the method for pattern recognition based on the structural subpattern information of multivariate graph is worth to expect.
Key words:pattern recognition; multivariate graphical presentation; graph primitives; feature primitives; subpattern
0 引言
模式識(shí)別是一個(gè)涉及統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、信號(hào)處理、心理學(xué)和生理學(xué)等許多領(lǐng)域的交叉學(xué)科。模式識(shí)別的研究主要集中在兩方面,即研究生物體(包括人)是如何感知對(duì)象的,以及在給定的任務(wù)下如何用計(jì)算機(jī)實(shí)現(xiàn)對(duì)象分類識(shí)別的理論和方法。從目前研究情況來看,模式識(shí)別的方法主要有兩類,即決策論方法(統(tǒng)計(jì)方法)和結(jié)構(gòu)(句法)方法[1,2]。
統(tǒng)計(jì)模式識(shí)別[3]是目前的主流方法,它利用特征進(jìn)行對(duì)象模式的絕對(duì)化描述[4],采用判別函數(shù)作為識(shí)別函數(shù),選擇分類錯(cuò)誤率作為準(zhǔn)則函數(shù)。統(tǒng)計(jì)模式識(shí)別中物體特征通過矢量空間的矢量來表示,這種特征矢量表示很容易在數(shù)學(xué)上計(jì)算和泛化(generalization),方便了模式識(shí)別過程中各類算法的實(shí)現(xiàn)。
結(jié)構(gòu)模式識(shí)別方法[2,5~7]立足于分析模式的結(jié)構(gòu)信息,至今比較成功的是句法結(jié)構(gòu)模式識(shí)別方法。句法模式識(shí)別是美籍華人傅京孫教授提出的,它將對(duì)象模式由一定的基元之間的結(jié)構(gòu)關(guān)系表征,采用規(guī)則或語法函數(shù)作為識(shí)別函數(shù),選擇接受錯(cuò)誤率作為準(zhǔn)則函數(shù)進(jìn)行模式識(shí)別。除了分類信息外,句法結(jié)構(gòu)方法還能給出模式的結(jié)構(gòu)信息。句法結(jié)構(gòu)辦法為模式識(shí)別提供了用簡單的有限模式基元和文法規(guī)則的有限集來描述一個(gè)復(fù)雜模式大(可能是無限的)集合的可能性。2006年,在中國首次舉行的國際模式識(shí)別大會(huì)上,戴汝為院士指出目前句法結(jié)構(gòu)模式識(shí)別的優(yōu)越性還未引起廣大研究者的足夠重視,相關(guān)研究還很不充分。
統(tǒng)計(jì)模式識(shí)別和結(jié)構(gòu)模式識(shí)別各自有著自己的優(yōu)點(diǎn),也存在著一定的不足。結(jié)構(gòu)模式識(shí)別在描述與分類的過程基于領(lǐng)域知識(shí),傳統(tǒng)的結(jié)構(gòu)模式識(shí)別方法應(yīng)用于新領(lǐng)域是受限的。因此關(guān)于結(jié)構(gòu)句法模式識(shí)別,目前最大的問題是沒有提取數(shù)據(jù)結(jié)構(gòu)子模式的一般化方法。在模式識(shí)別的著作中,幾乎很少提及原始數(shù)據(jù)結(jié)構(gòu)特征選擇問題,而大部分工作集中在描述特定領(lǐng)域的模式識(shí)別過程。例如,F(xiàn)riedman等人[8]的觀點(diǎn)是原始特征選擇,并基于此特征得到的模式依賴于數(shù)據(jù)的領(lǐng)域應(yīng)用;Nadler等人[9]則認(rèn)為特征一般人為提取,根據(jù)設(shè)計(jì)者的經(jīng)驗(yàn)、直覺與智慧。缺乏一般化的特征提取與描述方法,使結(jié)構(gòu)模式識(shí)別研究者陷入困境,并阻礙了結(jié)構(gòu)模式識(shí)別的進(jìn)程與發(fā)展。為克服這種限制,建立一種與領(lǐng)域知識(shí)無關(guān)的數(shù)據(jù)結(jié)構(gòu)子模式提取/表示方法勢在必行[4]。
研究對(duì)象的表示問題并不容易,因?yàn)樗c應(yīng)用或領(lǐng)域問題相關(guān)。Goldfrab認(rèn)為,傳統(tǒng)的數(shù)值表達(dá)已經(jīng)無法滿足識(shí)別的要求,全新的、結(jié)構(gòu)化的表示方法勢在必行。一個(gè)重要但很少明確提到的表示屬性是緊致性[3,10],簡單地說就是表示的約束性:真實(shí)世界中相似的物體在它們的表示中也是相似的。然而緊致性在模式識(shí)別中還沒有正式建立起來。多元數(shù)據(jù)圖表示方法是多元統(tǒng)計(jì)分析中的一種多維數(shù)據(jù)的二維可視化方法,將多元數(shù)據(jù)圖表示方法用于特征矢量,有助于對(duì)所研究的特征矢量數(shù)據(jù)的直觀了解,同時(shí)實(shí)現(xiàn)無結(jié)構(gòu)數(shù)據(jù)的結(jié)構(gòu)化表示。
可視化的根本目的是使各種抽象的數(shù)據(jù)通過圖形或圖像的方式表現(xiàn)出來,從而發(fā)現(xiàn)數(shù)據(jù)間的相互聯(lián)系。多元可視化(multivariate visualization)是科學(xué)可視化的一個(gè)重要分支[11],各種圖表示方法是多元數(shù)據(jù)可視化的核心。早在1950年Gibson在論文“The perception of the visual world”中進(jìn)行了視覺紋理感知的研究。1973年,Chernoff在“Constructing data pictures”中提出臉譜圖來表達(dá)多元數(shù)據(jù),該方法將多元數(shù)據(jù)各變量映像到卡通式臉譜的圖形特征。Tukey[12]的探索性數(shù)據(jù)分析標(biāo)志了科學(xué)數(shù)據(jù)可視化的一個(gè)新時(shí)代。探索性數(shù)據(jù)分析不僅僅作為一種工具,而且是一種思維方式。在多元數(shù)據(jù)可視化發(fā)展的第三個(gè)階段,提出了許多圖表示的概念和方法,如平行坐標(biāo)(parallel coordinates)[13]、大規(guī)模瀏覽(grand tour)[14]、超盒(hyperbox)[15]、二次分配問題(quadratic assignment problem,QAP formulation)[16]等,這些技術(shù)中的一部分試圖在同一個(gè)圖形中顯示所有維和所有變量,而另一些旨在對(duì)圖形的直接操縱,如采用鼠標(biāo)來選擇進(jìn)行顯示的子集。另外出現(xiàn)了一些多元可視化軟件,如XmdvTool[17],在一個(gè)系統(tǒng)中集成了維堆棧、散點(diǎn)圖矩陣、符號(hào)圖以及平行坐標(biāo)四種方法,并且支持增強(qiáng)的n維刷亮。最近幾年開發(fā)的可視化軟件還有XGobi、Orange、GGobi等;另外一些著名軟件,如MATLAB、SPSS、SAS、SPlus/R等也提供對(duì)多元數(shù)據(jù)可視化的支持。
基于多元數(shù)據(jù)多元圖圖形基元和特征基元表示的模式識(shí)別方法的一般過程如圖1所示。為使所進(jìn)行的問題研究具有普適性并去除量綱影響等干擾因素,在數(shù)據(jù)分析前對(duì)數(shù)據(jù)進(jìn)行預(yù)處理是必不可少的。常用的變換方法有中心化變換、標(biāo)準(zhǔn)化變換、極差標(biāo)準(zhǔn)化變換、極差正規(guī)化變換和對(duì)數(shù)變換等。基于多維數(shù)據(jù)多元圖表示原理實(shí)現(xiàn)無結(jié)構(gòu)數(shù)據(jù)的結(jié)構(gòu)化表示,即將抽象的多元數(shù)據(jù)以多元圖結(jié)構(gòu)形式表示,然后提取出表征多元圖圖形的子模式,最后基于多元數(shù)據(jù)多元圖結(jié)構(gòu)子模式信息進(jìn)行分類識(shí)別。本文以多維徑向坐標(biāo)圖的重心和面積特征子模式為例對(duì)該方法進(jìn)行介紹,并以UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫中的Iris數(shù)據(jù)進(jìn)行了分類對(duì)比實(shí)驗(yàn)。
1 多元數(shù)據(jù)多維徑向坐標(biāo)圖表示
多維徑向坐標(biāo)圖又稱做雷達(dá)圖,它的主要特點(diǎn)是直觀,可以很方便地研究各樣本點(diǎn)之間的關(guān)系并進(jìn)而對(duì)樣品進(jìn)行歸類。繪制多維數(shù)據(jù)雷達(dá)圖的具體步驟如下:
a)設(shè)要分析的數(shù)據(jù)共有n個(gè)變量,先畫一個(gè)圓,由n個(gè)點(diǎn)把圓周分成相等的n個(gè)部分。
b)將圓心和這n個(gè)點(diǎn)連接起來,就可得到n個(gè)輻射狀的半徑,這n個(gè)半徑就作為n個(gè)變量的坐標(biāo)軸。
c)為劃分刻度方便起見,在標(biāo)記坐標(biāo)軸前需要對(duì)原始數(shù)據(jù)作線性變換,使得數(shù)據(jù)落在給定區(qū)間[0,r]。根據(jù)下面公式,對(duì)于第i個(gè)多維數(shù)據(jù)中第j個(gè)分量作線性變換:
yij=(xij-xmin,j)/Rj(1)
其中:xmin, j=min1≤i≤nxij,xmin, j=max1≤i≤nxij,Rj=xmax, j-xmin, j。將n維數(shù)據(jù)的各個(gè)維規(guī)范化的數(shù)值刻在對(duì)應(yīng)的坐標(biāo)軸上,依次連接起來得到一個(gè)n邊形,即得到用平面表示的n維數(shù)據(jù)的雷達(dá)圖。
2 多元數(shù)據(jù)多維徑向坐標(biāo)圖結(jié)構(gòu)子模式表示
多元數(shù)據(jù)通過多元圖實(shí)現(xiàn)結(jié)構(gòu)化表示,具有可視化結(jié)構(gòu)的多元圖既包含多元圖形狀信息又包含豐富的圖特征信息。對(duì)于多元圖形狀信息的提取稱為多元圖圖形基元識(shí)別,對(duì)于多元圖特征信息的提取稱為多元圖特征基元識(shí)別。它們都是一個(gè)事物不同側(cè)面的表達(dá),因?yàn)椴煌瑐?cè)面也可以用來區(qū)別一個(gè)事物與其他事物,不同側(cè)面的表達(dá)就可以作為分類意義下的基元。相對(duì)于多元圖圖形基元,多元圖特征包含更豐富的多元圖結(jié)構(gòu)信息,利用基于多元圖特征提取的多元圖特征基元進(jìn)行分類可能會(huì)得到更好的分類效果。
2.1 多維徑向坐標(biāo)圖重心矢量結(jié)構(gòu)子模式表示
2001年《Science》和2006年《Nature》雜志上分別發(fā)表的研究[19,20]指出,果蠅能夠通過物體外形的重心高度、朝向等參數(shù)實(shí)現(xiàn)對(duì)不同物體的分辨識(shí)別并形成記憶,這表明圖形的重心可能是一種有利于圖形辨識(shí)的重要特征。
對(duì)于樣本數(shù)據(jù)的多維徑向坐標(biāo)圖表示,從幾何角度看,一個(gè)樣本的多維徑向坐標(biāo)圖中相鄰m個(gè)變量構(gòu)成一個(gè)m+1邊形(當(dāng)m=n時(shí)構(gòu)成m邊形)都產(chǎn)生一個(gè)重心,構(gòu)成了多元數(shù)據(jù)多維徑向坐標(biāo)圖重心特征。可知,一個(gè)n元變量樣本的多維徑向坐標(biāo)圖的m變量重心特征的維數(shù)為Cmn,n元變量樣本的多維徑向坐標(biāo)圖的重心特征總維數(shù)為C2n+C3n+…+Cnn=(2n-n-1)個(gè)。其中比較特殊的有兩種情況:a)相鄰兩變量構(gòu)成三角形,從幾何上講三角形三條中線相交于一點(diǎn),這個(gè)交點(diǎn)叫做三角形的重心,而且三角形的重心與頂點(diǎn)的距離等于它與對(duì)邊中點(diǎn)距離的兩倍,這種情況所具有的優(yōu)秀幾何特性是實(shí)際應(yīng)用中受到青睞的基礎(chǔ);b)所有變量構(gòu)成n邊形的重心,顯然全變量多維徑向坐標(biāo)圖重心特征的維數(shù)為1,它包含了樣本的全局信息。多維徑向坐標(biāo)圖重心圖特征包括重心矢量模長(原點(diǎn)到重心的幅值)和方向,下面以多維徑向坐標(biāo)變量重心矢量模長圖特征為例予以介紹。八維數(shù)據(jù)(x1,x2,x3,x4,x5,x6,x7,x8)多維徑向坐標(biāo)圖表示如圖2所示,相鄰變量x1和x2構(gòu)成三角形AOB,G表示重心,OG表示原點(diǎn)O到重心G的距離。
對(duì)多維徑向坐標(biāo)圖中的每個(gè)由相鄰變量表達(dá)的三角形計(jì)算重心,公式為
absi=(ri sin ωi/3)2+[(ri cos ωi-ri+1/2)/3+ri+1/2]2
anglei=arsin((ri/3) sin ωi/abs)+2π(i-1)/di=1,…,d (2)
其中:absi、anglei分別表示第i維變量和第i+1維變量組成的三角形重心的幅值和真實(shí)的角度;ri和ri+1表示歸一化特征樣本的第i維變量和第i+1維變量的值,一般由預(yù)處理計(jì)算得到;弧度wi= 2π/d為第i維變量和第i+1維變量間的夾角弧度, 這里認(rèn)為圓周角被樣本維數(shù)d平分。
考慮變量的不同排序,對(duì)于一個(gè)n維特征的樣本就會(huì)產(chǎn)生一個(gè)對(duì)應(yīng)的C2n維的多維徑向坐標(biāo)圖局部重心特征子模式構(gòu)成的樣本。例如對(duì)于由4維初始變量構(gòu)成的樣本數(shù)為150的Iris數(shù)據(jù)集,因?yàn)槌跏紭颖居?維特征,通過多維徑向坐標(biāo)圖局部重心矢量模長圖特征提取可形成一個(gè)150×6(C24=6)矩陣形式的多維徑向坐標(biāo)圖局部重心矢量模長圖特征子模式樣本。
從式(2)可以看出,多維徑向坐標(biāo)圖局部重心矢量模長圖特征子模式的值與ri、ri+1和角度wi有關(guān),而wi=2π/d(i=1,2,… ,d)是與d有關(guān)的一個(gè)定值。當(dāng)ri、ri+1互換位置時(shí),重心子模式absi的值不變,即滿足交換律。特殊地,當(dāng)i=d時(shí),i+1=d+1是第d+1維,由于多維徑向坐標(biāo)圖是沿著圓周排列變量,可以認(rèn)為第d+1維就是第一維。可以說是重心圖形子模式提取方法是一種無導(dǎo)師的非線性映射方法。
2.2 多維徑向坐標(biāo)圖面積結(jié)構(gòu)子模式表示
面積是評(píng)價(jià)多維徑向坐標(biāo)圖多邊形整體質(zhì)量的信息,它是各定量信息的一個(gè)多元函數(shù)。對(duì)面積的求解可采用三角形面積法和扇形面積方法,相關(guān)符號(hào)為面積S、射線ri和弧度wi。圖3為多維徑向坐標(biāo)圖面積特征提取說明圖。同樣,面積特征也會(huì)因變量的排序不同而產(chǎn)生差異,提取過程中應(yīng)考慮變量排序問題。
數(shù)學(xué)求解方法如下:
a)多維徑向坐標(biāo)圖總面積
S=ni=1Si(3)
b)相鄰變量組成的三角形面積
Si=(1/2) ri×ri+1× sin wi(4)
c)扇形面積
Si=wi×π×r2i(5)
3 數(shù)據(jù)實(shí)驗(yàn)
為了檢驗(yàn)上述基于多元數(shù)據(jù)多元圖圖形基元和特征基元表示的模式識(shí)別方法的有效性,進(jìn)行了如下模式識(shí)別對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)采用國際公認(rèn)的UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫中的Iris數(shù)據(jù)集[21],實(shí)驗(yàn)軟件平臺(tái)主要為MATLAB 7.0和PRTools4[22]工具箱。
數(shù)據(jù)實(shí)驗(yàn)過程如圖4所示。首先對(duì)Iris數(shù)據(jù)集各初始變量進(jìn)行極差正規(guī)化(歸一化)變換,去除量綱因素影響并將變量區(qū)間轉(zhuǎn)換到[0,1],以實(shí)現(xiàn)樣本數(shù)據(jù)的多維徑向坐標(biāo)圖表示。多元數(shù)據(jù)多元圖結(jié)構(gòu)子模式信息采用重心矢量方向圖特征基元子模式、重心矢量模長圖特征基元子模式、面積圖特征基元和基于多元圖重心和面積圖特征基元的綜合子模式四種形式。由于子模式包含信息維數(shù)較高,在分類前進(jìn)行有限隨機(jī)搜索算法的次優(yōu)子模式選擇。對(duì)比特征分別為原始特征、主成分特征、核主成分特征、Fisher特征和非線性Fisher特征;分類器選用傳統(tǒng)經(jīng)典的幾種,分別為線性分類器(ldc)、二次分類器(qdc)、k近鄰分類器(knnc)、parzen分類器(parzenc);采用各類留一法100次交叉檢驗(yàn)誤差估計(jì)結(jié)果作為分類結(jié)果對(duì)比評(píng)價(jià)檢驗(yàn)指標(biāo)。
通過以上分類對(duì)比實(shí)驗(yàn),得到以各類留一法100次交叉檢驗(yàn)誤差估計(jì)結(jié)果作為分類結(jié)果對(duì)比評(píng)價(jià)檢驗(yàn)指標(biāo)的實(shí)驗(yàn)結(jié)果,如表1所示。
表1 Iris數(shù)據(jù)分類實(shí)驗(yàn)誤差對(duì)比
表示方法
圖5是表2實(shí)驗(yàn)結(jié)果數(shù)據(jù)的折線散點(diǎn)圖表示。圖中對(duì)比組(包括歸一化、主成分、核主成分、Fisher和非線性Fisher特征)結(jié)果用點(diǎn)線連接;研究組(多元圖特征子模式組包括重心矢量方向、重心矢量幅值、面積和綜合圖特征子模式)結(jié)果用實(shí)線連接;各實(shí)驗(yàn)估計(jì)誤差率數(shù)據(jù)點(diǎn)用不同符號(hào)表示(圖中注釋)。由實(shí)驗(yàn)結(jié)果分析可見,總體上基于多元圖特征基元的子模式分類相對(duì)于傳統(tǒng)經(jīng)典的對(duì)比組特征提取分類方法具有較低的誤差率:采用四種分類器進(jìn)行實(shí)驗(yàn)得到的平均估計(jì)分類誤差率多元圖綜合圖特征子模式最小;對(duì)比組平均估計(jì)分類誤差率為0.037 5,研究組平均估計(jì)分類誤差率為0.032 6,研究組較小;使用經(jīng)典線性分類器表現(xiàn)尤為突出,其中研究組中三個(gè)子模式(共四個(gè))獲得最小估計(jì)分類誤差率,對(duì)比組平均估計(jì)分類誤差率為0.022,研究組平均估計(jì)分類誤差率為0.014 1。但并不是研究組中的每種多元圖特征子模式都能取得較好的分類效果,如基于多元圖重心矢量方向圖特征基元子模式的分類結(jié)果明顯比大多數(shù)傳統(tǒng)經(jīng)典特征提取方法要差,這說明基于多元圖基元子模式的模式分類方法還需要更細(xì)致的分析。研究組中綜合圖特征子模式的結(jié)果明顯要好于其他三種,這說明利用更多的多元圖結(jié)構(gòu)子模式信息有利于模式分類。
4 結(jié)束語
從數(shù)學(xué)角度看,基于多元數(shù)據(jù)多元圖結(jié)構(gòu)特征子模式表示就是對(duì)于初始數(shù)據(jù)的線性/非線性映射表示,這與傳統(tǒng)的特征提取沒有區(qū)別。但以上研究表明,基于多元數(shù)據(jù)多元圖圖形基元和特征基元子模式表示的模式識(shí)別方法不失為一種具有潛力的研究方法,它體現(xiàn)了模式識(shí)別問題研究的一種新思維,提出了一種與領(lǐng)域知識(shí)無關(guān)的數(shù)據(jù)結(jié)構(gòu)子模式提取(即表示)方法。通過數(shù)據(jù)實(shí)驗(yàn)表明,基于多元圖結(jié)構(gòu)特征基元子模式的模式分類相對(duì)于傳統(tǒng)經(jīng)典的對(duì)比組特征提取分類方法具有較好的分類結(jié)果;同時(shí),它所具有的可視化特點(diǎn),通過數(shù)據(jù)可視化、過程可視化和結(jié)果可視化途徑有利于模式識(shí)別研究過程中的人機(jī)交互和研究問題理解。
由實(shí)驗(yàn)研究也可發(fā)現(xiàn),各種多元圖結(jié)構(gòu)特征子模式取得的分類效果并不一致,甚至效果相差較大,這說明基于多元圖結(jié)構(gòu)特征子模式的模式分類還需要更為細(xì)致和具體深入的研究;每一種表示方法對(duì)應(yīng)于各種分類器得到的分類結(jié)果有較大差異(對(duì)于傳統(tǒng)經(jīng)典特征提取方法也存在該問題),這也是值得進(jìn)一步研究的重要問題。雖然經(jīng)典Iris數(shù)據(jù)集的可靠性能夠從實(shí)驗(yàn)結(jié)果中得到一些結(jié)論,但對(duì)更多的數(shù)據(jù)集,應(yīng)用更多的分類器對(duì)該方法進(jìn)行規(guī)模實(shí)驗(yàn)研究是必要的。
參考文獻(xiàn):
[1]
楊光正,吳岷,張曉莉.模式識(shí)別[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2001:729.
[2]傅京孫.模式識(shí)別及其應(yīng)用[M].戴汝為,胡啟恒,譯.北京:科學(xué)出版社,1983: 123.
[3]邊肇祺,張學(xué)工.模式識(shí)別[M].2版.北京:清華大學(xué)出版社,2000: 116.
[4]PERLALSKA E,DUIN R P W,PACLIK P.Prototype selection for dissimilaritybased classifiers [J].Pattern Recognition,2006,39(2): 189208.
[5]帕夫利迪斯T.結(jié)構(gòu)模式識(shí)別[M].張壽萱,徐立明,譯.上海:上海科學(xué)技術(shù)文獻(xiàn)出版社,1981:812.
[6]CAELLI T.Structural,syntactic and statistical pattern recognition [M]. Berlin:Springer,2002:115.
[7]GONZALEZ R C,THOMASON M G.句法模式識(shí)別[M].濮群,徐鳳家,徐光佑,譯.北京:清華大學(xué)出版社,1984:14.
[8]FRIEDMAN M,KANDEL A.Introduction to pattern recognition:statistical,structural,neural,and fuzzy logic approaches[M].Singapore:World Scientific,1999:2123.
[9]NADLER M,SMITH E P.Pattern recognition engineering[M]. New York:Wiley,1993:6264.
[10]DUIN R P W,PERLALSKA E.The science of pattern recognition,achievements and perspectives[J].Studies in Computational Intelligence (SCI),2007,63(3):221259.
[11]DEMSER J,BLAZZUPAN G L.An intelligent multivariate visualization approach to explorative analysis of biomedical data [J].Journal of Biomedical Informatics,2007,40(6):661671.
[12]TUKEY J W.Exploratory data analysis[M].New York:AddisonWesley, 1977:1127.
[13]ZHOU Jianlong,XIAO Chun,WANG Zhiyuan,et al.A concept of volume rendering guided search process to analyze medical data set[J].Computerized Medical Imaging and Graphics,2008,32(2): 140149.
[14]HENNIG C,CHRISTLIEB N.Validating visual clusters in large datasets: fixed point clusters of spectral features[J].Computational Statistics Data Analysis,2002,40(4): 723739.
[15]QUTEISHAT A,LIM C P.A modified fuzzy minmax neural network with rule extraction and its application to fault detection and classification [J].Applied Soft Computing,2008,8(2):985995.
[16]JACKSON A,GOLDEN R,WASIL E,et al.A divideandconquer local search heuristic for data visualization [J].Computers and Operations Research,2006,33(11): 30703087.
[17]WARD M.A publicdomain software package for the interactive visual exploration of multivariate data sets: XmdvTool [EB/OL].(19970322)[20080202].http://davis.wpi.edu/~xmdv/.
[18]XU Yonghong,HONG Wenxue,LI Xin,et al.Parallel dual visualization of multidimensional multivariate data[C]//Proc of IEEE International Conference on Integration Technology.2007:12181224.
[19]TANG Shiming,GUO Aike.Choice behavior of Drosophila facing contradictory visual cues [J].Science,2001,294(5546):15431547.
[20]LIU Gang,HOLGER S,WEN Ai,et al.Distinct memory traces for two visual features in the Drosophila brain[J].Nature,2006,439(7076):551556.
[21]FISHER R A.The UC irvine machine learning repository [EB/OL].(19880701)[20080102].http://www.ics.uci.edu/~mlearn/MLRepository.html.
[22]DUIN R P W,JUSZCZAK P,PACLIK P,et al.PRTools4:a MATLAB toolbox for pattern recognition[M].Delft:Delft University of Technology Press, 2004:156.