熊澤本
(荊楚理工學院數理學院,湖北荊門 448000)
生物特征識別技術主要是通過辨別人類的生理特征如手形、指紋、臉形、虹膜、視網膜等,或者是行為特征如字跡、聲音等進行身份鑒別認證技術.其特征識別技術主要涉及到計算機視覺技術、圖像和語音處理技術、可視化模擬、傳感器和智能機器人探測系統等.顱骨在人體的內部,特征穩定,并且不易被破壞,所以它不易偽裝,相對于指紋和人臉識別系統來說,有更高的穩定性,而且每個人的顱骨特征也不相同,至今為止,還沒有發現兩個人有完全相同的顱骨,而且只要人成年后,顱骨特征一般就不會發生改變了,基于顱骨特征的眾多優點,基于顱骨的生物特征識別技術是當前國內外學者研究的熱點.
在進行顱骨特征識別前,先要對醫學掃描圖像進行預處理,包括要對圖像進行除噪、插值、分割處理,預處理完成后就要對圖像進行三維重建,在這里采用的是基于等值面提取的表面重建算法,獲得顱骨的三維模型,文中獲取的是顱骨的三維網格信息,利用的是Marching Cubes算法,在VC軟件開發平臺上編程實現,三維網格信息中既包括顱骨的三維幾何信息,同時還有三維模型的網絡拓撲信息,基于本文的目的就是想對顱骨的幾何信息進行研究,所以又對得到的三維信息進行處理,利用Matlab編程提取出顱骨的三維幾何信息,獲取信息后就要進行識別的關鍵處理,也即物體的特征提取.
三維模型數據壓縮算法有很多種,根據三維模型的表達式,一般都用網格結構對它進行描述,一個三維網格模型是由幾何數據、拓撲數據和屬性數據組成的[1].有的時候圖像中可能沒有屬性數據,只有幾何和屬性數據兩種.幾何數據,它描述的是頂點的位置坐標.拓撲數據描述的是面與面、頂點與頂點的一種連接關系,屬性數據描述的是各個頂點的顏色值和它的紋理特征.文中是想通過顱骨的坐標值來對其進行識別,所以在對圖像模型進行處理時,只是針對圖像的幾何數據進行壓縮,因為它描述的是頂點的坐標值.
首先利用MATLAB編程PLY格式的數據轉換為三維網格數據.編程代碼為:

然后再利用編程把三維網格中的幾何坐標提取出來

這樣就把三維網格模型的幾何數據讀取了出來,也就是把模型的頂點坐標讀取了出來,接下來的目的就是要對這些坐標值進行壓縮處理,進而選取出重要的特征點進行識別.實際上就涉及到一個多行三列的矩陣問題.進而就把問題轉化到了二維空間,這時所得的數據量就相當于一幅二維的圖像.接下來就要利用模式識別的知識對圖像數據進行處理,提取里面的重要特征.實驗結果如下圖1所示:

圖1 顱骨重建
在收集信息的過程中,總是希望能夠從眾多信息中把我們感興趣的那部分信息提取出來.這樣在進行模型識別時就可以提高速度,節省時間.而且維數大的模式空間在處理時可能會導致系統癱瘓,還有就是維數太多也會影響數據的分類.而且并不是每一個特征對事物的描述都有相同意義.特征選擇和提取的基本任務就是如何從許多特征中找出那些最有效的特征.把特征提取出來后,目的就是為了后邊的分類識別使用.在對物體進行分類識別時,必須使提取出特征的錯誤概率最小.
在對圖像進行處理時,用到的特征一般有[2]:
(1)直觀性特征.不用經過處理,一看就知道的特征,這種也是最簡單的特征識別.它包括圖像的邊緣、紋理、幾何形狀等等,直觀性特征具有速度快,識別率高的特點.
(2)統計特征,如直方圖特征,主分量特征等,將圖像看作一種二維隨機過程,可以引入統計上的各階矩作為特征來描述和分析圖像,它們能夠在保留主要分類信息的基礎上大大降低特征的維數.
(3)變換系數特征,對圖像進行各種數學變換,可以將變換的系數作為圖像的一種特征,如Fourier變換、極半徑均差Legender變換等在圖像特征提取中均有廣泛的應用.
特征提取的步驟可以分為特征形成和特征提取.特征形成就是被識別對象所產生的一組基本特征,它可以是計算出來的,也可以是用傳感器,智能儀表檢測出來的信號.特征提取就是從圖像中形成的原始特征向量值非常大,如果直接把這些值送入分類器,就會給分類器造成很大的壓力.不僅數據的識別速度會很慢,而且重要的是還會給數據處理的軟件系統造成很大的壓力,導致系統癱瘓或者使數據識別的錯誤概率變大.而特征提取正好解決了這個的問題,它的目的就是從眾多特征中找出我們最需要的特征,把它們作為信息特征提取的特征向量,這可以看成是一種降維的過程,人體顱骨特征作為一種新的生物識別方式,它的提取一般分為兩類:
(1)二維信息特征提取.如邊緣、輪廓等.
(2)三維信息特征提取.主要就是顱骨的三維幾何信息.
主成分分析[3](Principal Component Analysis,PCA)也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標,是一種掌握事物主要矛盾的統計分析方法,它可以從多元事物中解析出主要影響因素,揭示事物的本質,簡化復雜的問題.對于多元統計分析中,若有n個變量的m個觀察值,形成一個nm的數據矩陣,n通常比較大.在實證問題研究中,為了全面、系統地分析問題,人們希望可以抓住體現事物主要特征的幾個主要變量,在具體分析時,只需要將這幾個變量分離出來.但是,在一般情況下,并不能直接找出這樣的關鍵變量.這時我們可以把給定的一組相關變量通過線性變換轉成另一組不相關的變量,用原有變量的線性組合來表示事物的主要方面,這就是PCA.
PCA分析也即主分量分析方法,用在顱骨特征提取方面它的具體步驟是:首先初始化我們的圖像訓練庫,計算出特征向量,輸入要識別的顱骨圖像數據,和庫里的數據進行比較,通過檢查圖像與特征空間的距離來進行判斷,看看的圖像是否是數據庫中的一個,從而進行識別.
對于前面獲得的顱骨的幾何數據,在此用f(x,y)表示矩陣的行列信息[4],這時實際上就相當于在二維空間對圖像進行處理,而對于任意的點x、y.f正比于圖像在該點的灰度值,如果把顱骨的數據集設為{Ri|i=1,…,M},M這為圖像的總個數,則這M個顱骨的平均向量為

每個顱骨圖像與顱骨平均向量的差值向量是

該訓練集的總體散步矩陣為

或者是

如果直接計算一個M2×M2的矩陣,那計算量是非常大的,所以要想辦法減小它,在這可以構造一個矩陣,

這是個M×M的較小的矩陣,和原數據量相比,減少了很多,接著計算矩陣的特征值和特征向量,特征向量是正交歸一的.這個正交歸一的特征向量就是顱骨圖像的特征向量.
假設X代表了一個m維的列向量,而這里的二維數據矩陣是一個隨機的n×m矩陣,這時就可以通過有一個線性轉換,把圖像信息投影到X軸上,于是得出:

通過投影計算,就可以得出一個n×1維的向量,這個向量就是二維數據矩陣的一個特征投影向量.那么一個好的投影矩陣就顯得尤為重要,實際上,可以通過計算投影向量的協方差矩陣來表示數據信息樣本的總的分散量.通過分析可以獲得下列的判別規則

公式中的Tx代表了數據樣本集的投影特征向量的協方差矩陣,通過上式可以看出,這個判別準則最重要的一點就是找到一個合適的投影方向軸,使所有數據信息投影到這個軸上的時候,所得樣本總的離散度是最大的,經過分析可得,Tx可以表示為

則

如果我們設定一個矩陣Rt,
則Rt就是數據矩陣的一個離散度矩陣,而且從上式可以看出來,Rt是一個行數和列數相同的方陣,這樣就可以利用數據訓練樣本來直接估計Rt.
假設現在一共獲取了M個人的顱骨數據信息,把這些數據做為訓練樣本,如果第i個人的數據樣本被表示成為一個m×n的矩陣,暫且把這個矩陣記為A,總的數據信息的平均向量是A1,則Rt可以表示為:

則判決規則就可以表示為:

式中的X是一個一元的特征向量,把上式這個標準看成是總的離散度準則,其中X就是我們的最優化的投影軸,換一句話說就是當準確的選擇好矩陣X軸的投影以后,就能夠使總樣本的離散度最大化,這樣就很好的壓縮了樣本的數據信息.但是在實際應用的過程中,只有一個最優化的軸是不夠的,大多數情況下,需要選擇一系列的軸,X1,X2,…,Xn,這一系列的X所對應的判別準則就是

則最優的特征軸就是Rt的正交向量所對應的前n個最大的特征值.
前面已經介紹過了,X1,X2,…,Xn就是數據樣本一系列最優的特征向量,進行圖像數據的特征提取,利用的也是這幾個最優特征向量.
在采用主分量分析進行特征提取之前,首先要找出樣本集的一系列投影軸,這些軸可以使總樣本級的離散度最大化,找出這一系列的投影軸后,就可以獲得投影向量,它們分別是X1,X2,…,Xn,它們被叫做圖像的主成分向量,獲得的向量經常用于形成一個m×n維的矩陣,這個矩陣就叫做特征矩陣.
基于二維主成分分析的優點,速度快、簡單,而且也可以較大程度的保留原始圖像的數據信息,因此本文在對二維數據進行處理上,采用的是二維主成分分析算法.
4.3.1 數據分析
首先利用二維主成分分析方法對二維數據進行處理,體現在程序上采用的是MATLAB工具箱進行的,通過分析可以看出,選取投影向量時,只需要選擇樣本集的前n個最優特征向量就好了,而且選取的圖像數據越多,所得圖像就越清晰,同時恢復后的圖像也越來越接近于原始圖像.
4.3.2 利用主成分分析的具體實現
一般來說,采用兩種方法來提取特征,一維主成分分析和二維主成分分析,為了比較,這里對兩種方法都進行了比較計算,具體過程實現的流程圖如圖2所示.
對圖像數據進行處理后,計算所有圖像數據的投影軸,進行求取識別的特征向量,對于特征向量的求取方法,前面已經詳細的介紹過了,這里不在做討論.
為了分析比較,在此采用了一維和二維兩種主成分分析的方法,當分類方法相同時,兩種方法的識別率相差很大,并且二維主成分分析的識別率明顯高于一維主成分分析,如表1所示.

圖2 流程圖

表1 識別率
4.3.3 分類器的選擇
在完成了特征的選擇和提取后,接下來的目的就是對這些特征進行處理,對它們進行識別,識別的方法很多,但是不管是哪種方法,它們的本質是一樣的,目的都是為了采用某種判別準則把特征向量進行分類,進而把物體區分開來.
一般情況下都是根據給定的特征把物體進行分類,來確定識別的物體到底屬于哪個,但是現實中,因為所得的樣本之間總是存在很大的相似性,所以在進行分類識別的時候,不可避免的會出現一些分類錯誤,在分類的過程中,不可能完全的消除它們,只能是進最大努力,使錯誤達到最小化,因此判斷一個分類準則到底好不好的標準就是看看利用這種方法進行識別時,出現的錯誤率是不是最小的,這個標準是模式識別中研究的關鍵性的問題.因此要根據自己實際的要求選擇合適的識別方法.
在進行分類識別時,可以采用的分類方法很多[6],有最近鄰法、K近鄰法、神經網絡法,還有貝葉斯算法,現在有些研究機構也可以研究把兩種方法融合在一起,組成多類混合法.本文中采用的是最常用的分類識別方法.
最近鄰法[5]進行分類的根據是:首先假設一共有w個類別,它們分別為d1,d2,…,dw,在每個表明的類別中,又有m個樣本,標準規定了某類的判別函數為測試的樣本與其最近的樣本之間的距離值.

其中k值代表了m類樣本中的第k個樣本.
文中采用的是最近鄰法,距離的度量值在此選取的是余弦[7].當然也可以選擇歐式距離來識別.
設Ttest為需要進行識別的圖像數據信息的特征向量,Ttrain為參與訓練的已知樣本的特征向量值,則根據最近鄰的規則,它們之間的余弦可以定義為

于是,對于最近鄰法則來說,基于余弦的最近鄰距離為

4.3.4 實驗結果與分析
整個識別過程中,由于條件的限制,文中一共采用了18個人的顱骨切片數據信息,在這18個人中,每個人都只采集了1次,為了表格分析,這里只列出了10個人的特征識別結果,在識別過程中,每個人都進行了10次比對,通過MATLAB軟件編程仿真和分析,可以看出選取的特征樣本具有很好的可聚類性能,通過二維主成分分析得到的特征向量也很好的反映了數據的細節信息,識別時,能夠快速的對個體做出識別,識別率也很可觀,見表2所示.

表2 識別結果分析表
文章主要介紹了圖像的特征提取的定義,介紹了兩種特征提取的算法,一種是一維主分量分析,一種是二維主分量分析,并分析了兩者的優缺點,因為所得圖像都是二維的,所以在利用二維主分量分析的時候就不用經過一個降維的處理,這樣可以很好的提高識別效率,節省識別時間,所以本文中在對圖像進行壓縮特征提取時,采用的是二維主分量分析的方法.識別過程中,采用的是最常用的最近鄰比較算法,文中是以數據的余弦作為距離的度量值,通過實驗結果和分析可以看出來,利用二維主成分分析對數據進行識別有很好的識別效果,識別率達到了98.6%.
[1]邊祺.模式識別[M].北京:清華大學出版社,1998.
[2]周杰,盧春雨,張長水,等.人臉自動識別方法綜述[J].電子學報,2000,28(4):102-106.
[3]張翠平,蘇光大.人臉識別技術綜述[J].中國圖像圖形學報,2000,5A(11):885-894.
[4]徐之海,馮華君,李奇,等.基于K-L變換的人臉識別研究[J].光電工程,2001,28(6):48-51.
[5]胡廣書.現代信號處理教程[M].北京:清華大學出版社,2005.
[6]Yang Jian,Zhang David,Yang Jingru.Two-Dimensional PCA:A new approach to appearance-based face reprentation and recognition[J].IEEE Trans.On Pattern Analysis Machine Intelligence,2004,26(1):131-133.
[7]段曉東,王存睿,劉向東,等.人臉的民族特征抽取及其識別[J].計算機科學,2010,37(8):276-301.