蓋杉
(南昌航空大學信息工程學院,江西 南昌 330063)
隨著人們對流通紙幣質量要求的提高以及自動取款機和出納機的迅速普及,銀行對于自動化紙幣清分技術的需求日趨強烈。紙幣清分系統是一種光機電一體化的復雜產品,其主要功能是對紙幣圖像進行分析與處理,并根據處理結果實現對紙幣圖像自動分類與檢測。鑒于紙幣的重要性,銀行對其分類的準確性要求極高。因此,紙幣特征提取是紙幣清分系統最為關鍵的環節,區分性好的特征將有利于后續識別性能的提升。
由于不同幣值的人民幣和意大利幣幾何尺寸具有差異性,Kato等[1]將紙幣圖像的長度、寬度等幾何特征作為識別的重要依據。Takeda等[2]運用隨機函數在特定區間內產生與輸入特征向量維數相當的隨機掩模,通過計算未被遮掩的像素個數得到特征向量,簡稱掩模特征方法即簡記為 MASK(mask feature)方法。類haar特征[3-4]主要采用積分圖像描述原始紙幣圖像,然后使用基于Ada-Boosting(adaptive boosting)的學習算法對原始特征向量進行選擇,得到更為有效的級聯分類器。劉家鋒等[5]將整幅紙幣圖像按一定大小劃分為互不重疊的矩形區域,將每個矩形區域的灰度均值作為原始特征,運用 K-L(Karhunen-Loeve)變換等方法提取更為有效的紙幣圖像特征,簡稱網格特征方法即簡記為GRID方法。Choi等[6]利用離散小波變換(DWT,discrete wavelet transform)獲取描述紙幣圖像邊緣紋理信息的高頻分量,將通過預先設定的閾值提取紙幣圖像的高頻分解系數作為特征向量。蓋杉等[7]采用 contourlet變換獲取紙幣圖像不同方向與尺度上的頻域信息,在此基礎上引入模糊邏輯獲取紙幣圖像識別特征(CFFE,contourlet-fuzzy feature extraction)。
上述方法雖然在紙幣識別中取得了一定的效果,但是仍然存在一些不足。當紙幣圖像出現傾斜、折角等情況,幾何特征的有效性將會下降,進而影響到最終的識別性能。掩模特征雖然能夠克服紙幣特征的不穩定性,但是最優掩蓋集如何選取仍然是個技術難點。多尺度變換特征缺乏對紙幣圖像相位信息的有效描述。類haar特征計算復雜度較高,難以滿足紙幣實時性要求。網格特征提取的難點是如何確定方向塊的大小及位置。因此如何找到一種有效的圖像分析方法是提取模式有效特征、提高識別率的重要途徑。四元矩陣[8-10]是一種基于頻域的新圖像表述方式,從解析信號組成的角度來看,四元矩陣理論是在四元代數與 Hilbert變換理論的基礎上發展而來的。四元矩陣能夠有效地描述圖像結構紋理特征信息和局部位移信息,并且比幅值含有更多的含熵信息。
本文通過引入四元矩陣將紙幣圖像的結構紋理信息與相位信息作為整體直接進行分析處理,提出一種基于四元矩陣理論共空間模式紙幣圖像特征提取算法(QCSP, quaternion-common spatial pattern),并采用BP(back propagation)神經網絡作為分類器完成識別。實驗結果表明本文提出的算法能夠取得較高的識別率,提取的紙幣特征具有較好的可分性,并且能夠滿足實際紙幣清分系統的實時性要求。
作為復數的推廣,四元數是實數域基向量{1,i,j,k}的線性組合,即由一個實部和 3個虛部構成,采用式(1)定義為

其中,qr,qi,qj和qk為實數,3個正交單位向量i、j、k 滿足


四元數乘方運算能夠描述單位向量的統計信息,利用四元數具有的自反特性給出其定義,則有

根據式(4),給出四元向量的定義如下

其中,I表示單位矩陣,qR表示四元數對應的實系數向量,ψ表示由實數域到四元數域的轉換矩陣。令η ∈ {i,j,k},式(4)可簡化為qη=-ηq η,然后采用協方差矩陣與 3個厄米特協方差矩陣來描述四元數的實部與虛部之間具有的相關性與二階統計特性。為了進一步解決四元矩陣的因式分解項,本文引入如下定理[11]。
定理1 設Q為四元酉矩陣,Λx為實非負對角矩陣,則對任意的四元矩陣X,其因式分解表示為
四元矩陣能夠對紙幣圖像實現四元線性時變系統的稀疏描述,可以利用等價的復伴隨矩陣對其進行快速求解。四元矩陣分解具有的3個相位信息能夠描述紙幣圖像結構具有的互為正交方向上的強度變化。另外,四元矩陣分解具有的幅值信息能夠揭示紙幣圖像的能量分布情況。
受復數共空間模式構造原理啟發,本文首次將復數共空間模式推廣到四元數域。令xγ(γ = 1 ,2,… ,n)表示屬于某類別γ的紙幣樣本向量,則空間協方差矩陣定義如式(6)所示。

其中, E [·]表示數學期望算子。對屬于類別γ的所有紙幣樣本空間協方差矩陣求平均值,即得到Cγ。為了能夠同時對這些協方差矩陣進行對角化,給出復合協方差矩陣即,采用式(7)對該協方差矩陣進行對角化,即

其中,Cc是厄米特矩陣,U表示四元酉矩陣,Σ表示對角矩陣,H表示厄米特共軛轉置算子。采用白化矩陣對復合協方差矩陣C進行白化,即
c


結合式(8)與式(9),采用式(10)計算四元矩陣空間濾波器,則有

因此,紙幣樣本xγ經過四元矩陣空間濾波器作用后,得到矩陣yγ=Γxγ。對于四元數q=qr+qη(η = i ,j,k),根據 STU-CCSP(strong uncorrelating transform complex common spatial pattern)算法[12]的思路,采用等價的復數描述四元數固定系數對之間的內在聯系。受此啟發,本文采用上述定義的厄米特協方差矩陣Cqη(η =i,j,k)來挖掘矩陣yγ分解系數之間具有的內在聯系。接下來,采用式(11)對厄米特協方差矩陣Cqη(η =i,j,k)進行擴展,則有

其中,厄米特協方差矩陣可以分解為如式(2)所示。

其中,Qη為四元酉矩陣,Λη為實對角矩陣。結合式(11)與式(12),Λη定義為

如上所述,對于紙幣樣本xγ,經過四元濾波器作用后得到四元分解矩陣yγ,采用四元數實部與虛部的方差作為紙幣圖像分類識別的特征向量,即

采用式(14)~式(17)計算得到屬于某一類別的紙幣樣本特征向量

綜上所述,基于四元共空間模式特征提取算法的具體步驟如下:
步驟1定義所有類別的空間協方差矩陣Cγ;
步驟2計算復合協方差矩陣Cc,并對Cc進行對角化;
步驟3計算白化矩陣M與白化數據vγ=Mxγ,并對Cc進行白化操作;
步驟4對矩陣Gγ進行對角化,并計算得到特征向量W;
步驟 5計算厄米特協方差矩陣
步驟 6構造復合厄米特協方差矩陣Ccη=并對Ccη進行對角化
步驟 7計算標準四元矩陣濾波器和復合四元矩陣濾波器
步驟8根據yγ=Γcx與yηγ=Γηx,計算紙幣樣本的特征向量
本文提出的QCSP特征提取算法不僅具有較高的穩定性,同時還具有較低的時間計算復雜度。首先,從數學分析的角度證明本文特征提取算法的穩定性。對于在高速采集過程中受噪聲干擾的紙幣樣本向量定義如式(19)所示。其中,xγ′是原始紙幣樣本,Τψ是四元矩陣變換,μ是紙幣特征區域上的噪聲信號。通過引入條件理論中的變換條件數作為特征穩定性的度量,基于變換集合Θ,給出類條件數定義,則有


式(20)存在下界,即

其中,X表示四元矩陣, σmax(X)是四元矩陣的最大奇異值。因此,當XTX的奇異值足夠大時,QCSP算法能夠獲得足夠穩定的特征向量。另外,采用式(5)計算得到四元向量的增廣向量q? =ψqR,其具有的增廣協方差矩陣定義為


經上述推導,并結合式(22)與式(23),可以得出QCSP特征提取算法的時間復雜度是基于復數共空間模式特征提取算法的四分之一。因此,基于QCSP紙幣特征提取算法能夠滿足實際紙幣清分系統對實時性的要求。
本文自行設計清分系統的圖像模塊采用基于“接觸式傳感器(CIS)-FPGA-DSP”的結構模式。將對實時性要求較高的邏輯運算放在FPGA中完成,將紙幣圖像預處理、特征提取與識別放在DSP中完成。為了驗證本文提出算法的有效性,從自行設計的紙幣清分系統中分別采集人民幣、美元與歐元構建3個紙幣圖像數據庫。
紙幣圖像樣本是通過接觸式圖像傳感器得到,具體構建的3個實驗數據庫描述如下:1) 數據庫1(D1, database 1)由20 000張人民幣樣本圖像組成,具有100元、50元、20元、10元、5元等5個主幣,每個幣值有4個面向,共有20種圖像;2) 數據庫2 (D2, database 2)由18 000張美元樣本圖像組成,具有100美元、50美元、20美元、10美元、2美元、1美元6種主幣,每個幣值有4個面向,共有24種圖像;3) 數據庫3 (D3, database 3)由15 000張歐元樣本圖像組成,具有500歐元、200歐元、100歐元、50歐元、20歐元、10歐元、5歐元7種主幣,每個幣值有4個面向,共有28種圖像。其中,全新的紙幣樣本有32 860張,占比62%;各種污損紙幣樣本為15 105張,占比28.5%;扭曲變形和噪聲紙幣樣本為5 035張,占比9.5%。
本文中所處理的紙幣圖像樣本來自于高速掃描裝置,紙幣在一個機械通道中高速運行,由圖像傳感器對其進行掃描,獲得圖像信息。由于紙幣在通道中高速連續運行,這樣就不可避免地造成紙幣圖像發生傾斜、側移等現象。因此在進行紙幣圖像特征提取之前需要經過一個預處理過程,首先利用錢幣圖像邊緣為直線的特點,采用在圖像上等間隔位置檢測邊緣的方法,在每一條邊上檢測出一個邊緣點序列,然后對邊緣點序列采用最小二乘擬合得到錢幣圖像的邊緣。
為了驗證本文提出算法的有效性,將QCSP算法應用于紙幣識別中,并將QCSP算法與一些經典的紙幣特征提取算法如DWT[6]算法、MASK[2]算法、GRID[5]算法和 CFFE[7]算法進行比較。另外,鑒于BP神經網絡能夠自適應地發現紙幣樣本數據之間的規律性,而且具有較強的自學與自組織能力,本文將BP神經網絡作為紙幣識別階段的分類器。使用BP神經網絡結構的輸入層節點個數為提取紙幣圖像的特征維數,輸出層節點個數為各幣種具有的面值與面向,2個隱含層節點個數分別為18與32,訓練權系數更新步長為0.1,最小誤差為10-8,最大迭代次數為9×104次。數據庫D1~D3中測試樣本的平均識別率如圖3~圖5所示,實驗結果表明采用本文提出的QCSP算法所獲得的平識別率明顯高于其他 4種算法,3個數據庫的識別率分別提高到98.86%, 99.18%與93.68%。

圖1 人民幣數據庫D1平均識別率

圖2 美元數據庫D2平均識別率
為了進一步驗證本文提取紙幣特征的抗干擾性,對其中15 105張具有不同污損程度的紙幣樣本進行實驗。采用 DWT算法、MASK算法、GRID算法、CFFE算法和QCSP算法的紙幣識別率分別為82.31%,88.54%,92.57%,96.89%和98.24%,這本文提出的QCSP算法紙幣特征提取算法相比于其他算法能夠更有效地克服污損對紙幣圖像特征造成的影響。另外,在采集大量紙幣樣本的過程中,不可避免地會出現樣本圖像殘缺不全、受噪聲干擾導致紙幣圖像定位不準確以及紙幣圖像傾斜過大等情況,針對上述情況,本文在紙幣識別階段引入拒識類的策略,有效地增加了算法的穩定性。表1~表3顯示了采用本文提出的QCSP算法與DWT算法、MASK算法、GRID算法、CFFE算法所得到的實測識別率與拒識率。實驗結果表明采用本文提出的QCSP算法較其他4種方法取得了更高的識別率和較低的拒識率。

圖3 歐元數據庫D3平均識別率
在Intel Core I7 2.4 GHz CPU和8 GB RAM的平臺上給出紙幣特征提取與識別的運行時間如表 4所示。實驗結果表明本文算法較其他算法具有更低的時間復雜度。另外,紙幣清分系統是一種高速運行的裝置,考慮到紙幣圖像掃描裝置與控制裝置的動作時間,本文提出的算法較其他算法更能夠滿足紙幣清分系統的實時性要求。
針對紙幣圖像具有豐富的相位結構特征信息,結合四元矩陣自身的特性,本文提出一種基于四元共空間模式的紙幣圖像特征提取算法。該算法能夠有效地克服掩模特征的不穩定性以及網格特征較難區分風格相近紙幣圖像的難題。另外,本文提出的算法還能夠彌補小波變換與 contourlet變換缺乏對紙幣圖像相位信息描述的缺陷。為了驗證提出算法的有效性,本文將其應用到紙幣識別系統中,實驗結果表明本文提出的算法不僅能夠取得較高的識別率,而且對于污損、扭曲變形和受噪聲干擾的紙幣圖像也具有良好的可分性。為了進一步提高紙幣識別的穩定性和準確性,本文在紙幣識別階段引入拒識類的策略。本文提出的算法已成功應用在一個資源約束的嵌入式清分系統中,并且能夠滿足系統實時性的要求。

表1 數據庫D1實際測試數據(識別率/拒識率)

表2 數據庫D2實際測試數據(識別率/拒識率)

表3 數據庫D3實際測試數據(識別率/拒識率)

表4 紙幣識別時間/ms