王志秦
WANG Zhi-qin
(唐山學院 信息工程系,唐山 063000)
隨著科學技術的進步和發展,生物特征識別,如指紋識別、虹膜識別等,已經廣泛應用于身份鑒別場合,但是目前的生物特征識別系統對應用環境的要求還較為苛刻,還不能做到高效、非打擾、高識別率等效果。人耳識別是以人耳圖像作為研究對象,是一種新的生物特征識別方法。研究表明人耳特征是長期保持不變的,與其他生物特征一樣具有不變性和唯一性。人耳位于頭部兩側,在位置和角度上比其他生物特征更為有優勢,有利于實現高效、非打擾的識別方式[1]。本文采用數字信號處理器構建了人耳圖像識別系統,利用攝像機采集人耳圖像,利用高速數字信號處理器完成圖像信息預處理和特征提取識別,并通過以太網與上位計算機數據庫交換信息。
人耳圖像識別系統首先需要對人耳圖像進行采集,通過算法對人耳圖像進行定位,之后對整幅圖像進行裁剪,將裁剪后的人耳圖像進行歸一化和灰度增強變換處理,然后利用人耳識別算法進行特征提取,提取后的特征送分類器分類并與人耳特征數據庫中的數據進行模式匹配,最后將識別結果顯示出來。整體設計方案如圖1所示:

圖1 人耳圖像識別系統整理方案圖
1.1 人耳圖像的定位算法
對于人耳圖像的定位方法有很多種,如膚色分割方法、模板覆蓋查詢方法,閾值分割方法等。本文采用閾值分割法。首先將采集的圖像轉化為灰度圖像,根據直方圖的灰度閾值,將灰度圖像中的像素點與該閾值進行比較,灰度值大于閾值的為一部分,灰度值小于和等于閾值的為另一部分,將圖像中不同的區域劃分開并進行二值化,達到閾值分割的目的。其中灰度閾值的選取具有決定劃分結構優劣的作用。通過觀察發現多數人的耳部上邊緣與頭發相接,而人耳與側面的皮膚與頭發具有明顯的不同,所以用閾值分割法就可以容易的將人耳圖像分割出來。
分割出來的人耳圖像,以左耳圖像為例,左耳的輪廓邊緣位于圖像的右上側,利用圖像的右上區域部分進行灰度掃描,從上向下逐行掃描,當遇到第一個灰度為255的點停止,該點被認為是耳廓的上部頂點。再由右向左逐列掃描,得到耳廓的右側頂點。由此即可定位人耳圖像在整幅圖像中的所在位置坐標。
1.2 人耳圖像的預處理
在得到了人耳圖像在整幅圖像中的位置坐標后,根據統計經驗,人耳頂點大約在人耳中軸線位置,耳廓的右端點到耳廓上部的距離大約占耳長的1/3左右。由此可以確定對圖片裁剪的坐標和尺寸。
由于是對人耳圖像的采集是動態捕捉,采集圖像的角度、位置和距離有可能不同,因此需要對人耳圖像進行歸一化處理,將裁剪好的原始圖像通過縮放調整到相同的尺寸和位置,來消除人耳相對于攝像機的平移、距離和旋轉對圖像的影響。本文中每幅圖像分別歸一化為197×100像素的灰度圖像。
為了消除現場不同光照對人耳圖像的影響,采用對圖像進行灰度增強的方法,根據灰度圖像直方圖中灰度值聚集區域,適當加大對比度。
經過以上圖像預處理的步驟后所得到的人耳圖像即可作為后續識別算法的原始圖像。
目前人耳識別算法主要有主元分析方法、線性判別分析方法、幾何學方法、神經網絡方法等,其中基于整體特征提取的線性判別分析方法應用較廣泛。基于線性判別分析(LDA,Linear Discriminate Analysis)的特征提取方法是模式識別中常用的一種特征提取方法,該方法生成的特征向量子空間使樣本間離散度和類內離散度的比值達到最大,具有較主成分分析方法更好的識別效果。Hua Yu和Jie Yang在2001年提出了直接線性判別分析(DLDA)方法,解決了LDA方法的小樣本問題[2],提高了線性判別分析在實際應用中的特征提取效果。本設計采用采用了LBP算法與DLDA算法相結合的特征提取方法。傳統的人耳特征提取方法通過采集人耳圖像并進行灰度調整和歸一化處理,再采用主成分分析方法或線性判別分析方法對圖像的特征向量進行分析,篩選出能夠達到最佳識別效果的特征向量,用于分類識別。局部二元模式(Local Binary Pattern,LBP)[3]通過比較圖像中每個像素與其周圍像素灰度值大小,并利用二進制模式表示比較結果,可以對灰度圖像中鄰近區域的紋理信息進行有效提取。LBP特征的優點是對灰度變化不敏感且計算簡單。采用LBP算法變換后,加入了中心像素點與周圍像素點的相關性,減小了光照變化和角度變化對特征提取的影響。
將多尺度的概念引入到基于LBP的人耳特征識別領域,將LBP算法的特征引入多尺度因素,在不同尺度上對圖像進行分析,可以提高識別率。基于LBP和小波變換的特征提取方法首先采用離散小波變換的方法對圖像進行兩次分解,并在此基礎上提取人耳圖像的多尺度LBP特征;通過匹配多尺度LBP特征信息來實現人耳的分類識別。
隨著數字信號處理技術的發展,DSP以高性能的系統核心,強大的信息處理能力得到了廣泛應用。由數字信號處理器構成的嵌入式信息處理系統,能夠實時地對大量數據進行處理,能夠實現復雜的數字信號處理算法,在影音和圖像處理領域具有廣闊的應用前景。本文設計的基于DSP的人耳圖像識別系統以數字信號處理器(DSP)為核心,對采集的圖像進行算法處理[4]。系統硬件結構由以下幾部分組成,系統的結構如圖2所示:

圖2 人耳識別系統硬件組成結構
通過CCD攝像機采集的視頻數據流經視頻解碼芯片解碼后送到視頻端口,存入FIFO存儲器中,當數據滿時產生直接訪問存儲器中斷,將數據搬移到SDRAM中,系統可直接從SDRAM中取出圖像數據進行處理。處理結果經視頻編碼芯片送至顯示器進行實時顯示。系統程序和已有人耳特征庫信息存儲在Flash ROM中。數字信號處理器通過自身具有的以太網接口與上位PC機進行信息交換。
3.1 數字信號處理器
本設計采用的數字信號處理器為TI 公司的TMS320DM642,是一款針對視頻和圖像處理領域應用的高性能定點處理器芯片,最高時鐘頻率為720MHz,最大運算速度 5760MIPS。該芯片具有三個可配置的視頻接口,同時支持三路視頻輸入或者輸出;一個 10/100M 的以太網接口;64位的外部存儲單元接口(EMIF),支持連接同步或異步存儲單元;是實現實時視頻圖像處理系統的優秀平臺[5]。
外部存儲器采用兩片 32 位數據寬度的SDRAM,總容量為32 兆字節,用來作為 DM642片內存儲器的擴展,主要存放視頻處理時的視頻圖像數據。采用兩片共 32兆字節的 Flash 存儲器存放圖像處理的程序和實現人耳識別時所需的數據庫。
3.2 視頻解碼芯片
視頻解碼芯片的作用是對輸入的模擬視頻信號進行采樣并數字化。本系統中使用 Philips 的SAA7113視頻解碼芯片來采集模擬視頻信號并將其轉換為數字信號送給 DSP 處理。SAA7113支持PAL、NTSC制式,支持隔行掃描和多種數據輸出格式,可自動監測 50Hz、60Hz 的場頻信號,并可在PAL 制式和 NTSC 制式下自動轉換,能夠在輸入的復合視頻信號 CVBS 或分離視頻信號S-VIDEO中選擇一路視頻信號,將YUV三個分量分離并通過A/D 轉換以及對亮度、對比度和飽和度進行控制后產生標準的 BT656 YUV4:2:2 格式的 8 位視頻數據。
3.3 視頻編碼芯片
視頻編碼芯片能夠將處理后產生的數字信號轉換為模擬視頻信號輸出并顯示在電視機等監視設備上,以便對算法的效果進行驗證。本系統使用Philips公司的SAA7121視頻編碼芯片進行 D/A 轉換來產生模擬視頻信號,通過 VP0 端口傳輸給電視顯示。SAA7121 支持 PAL 與 NTSC 格式的視頻編碼能把 8 比特或 16 比特的 BT656格式數字視頻信號轉換成 PAL或 NTSC 標準的模擬電視基帶信號。
系統軟件設計采用了DSP/BIOS實時多任務操作系統,利用DSP/BIOS來實現任務的實時調度、中斷管理、網絡通信和實時監測。DSP/BIOS占用極少的 CPU 資源,提供了底層的應用函數接口。在使用 DSP/BIOS 編寫代碼后,CCS 可以提供多種分析和評估代碼工具,如圖形化顯示各個線程占用的 CPU 時間、代碼執行時間統計、顯示輸出信息等,可以直觀地了解代碼各個部分的開銷情況。通過DSP/BIOS 工具可以更加好地控制 DSP的硬件資源,更加靈活地協調各個軟件模塊的執行,從而大大加快軟件的開發和調試進度。
本系統的軟件流程圖如圖3所示,在圖像采集和圖像顯示兩大模塊中間加入人耳檢測模塊,如果監測到人耳則進行圖像采集、分割、預處理和識別,并顯示識別結果;如果沒有檢測到人耳圖像,則顯示直接采集到的圖像。

圖3 人耳圖像識別系統流程圖
本設計對6名實驗人員的人耳圖像進行采集和實驗,每人采集不同角度和位置的左側人耳圖像12幅,并將采集的圖像特征信息預先存儲。實驗時再次分別采集實驗人員的左側頭部圖像,通過實驗系統對人耳圖像進行定位、圖像裁剪、圖像預處理、特征提取和分類識別并將識別結構顯示在顯示器下方。當人耳特征提取算法的提取的特征數為40時,人耳定位和識別時間約為5.5秒,平均正確識別率為83.3%,達到了良好的識別效果。
本文針對生物特征識別系統中的人耳識別,應用數字信號處理器構建人耳圖像識別系統,利用攝像機和高速數字信號處理技術,完成人耳圖像采集和特征識別,實現了基于DSP的人耳圖像識別系統。該系統具有自動采集識別、快速準確、識別率高等特點,可用于機場、銀行等需要身份鑒別的安保環境和需要自動采集數據的場合,具有很高的實際應用價值。
[1]張海軍,穆志純,危克.人耳識別技術研究進展綜述[J].計算機工程與應用,2004,33:2-5.
[2]孫寧,冀貞海,等.基于局部二元模式算子的人臉性別分類方法[J].華中科技人學學報(自然科學版),2007,35:177-181.
[3]苑瑋琦,劉暢.人臉人耳圖像采集裝置設計[J].微計算機信息,2010,22:9-12.