基于數字圖像處理的字跡識別技術

2019-10-11 01:38:20陳錦玉

電子制作 2019年18期

陳錦玉

（北京市第四中學，北京，100043）

0 引言

字跡識別是對人通過落筆形成的字跡進行鑒別和分析的活動，也叫筆跡鑒定[1]。不論年齡大小，在一定時間內，人的書寫習慣都會具有一定的特征性和穩定性，并反映在字跡中。通過對筆跡的觀察和分析，可以分辨出文件中的字跡來自于幾個人，是否是本人所寫，利用筆跡進行一個人身份的認定，查證文件的真偽。在一般鑒定中，要先了解案件的大致情況，明確鑒定的要求；再觀察分析筆跡有無異樣，有無偽裝或因為其他原因而導致的字跡問題；然后要選擇能反映出本人書寫的穩定的習慣的特征；最后，將選材中的特征和樣本中提取出的特征進行比較，找出相同點和問題點并制做鑒定書，提出問題點形成原因的綜合評斷并提出意見[2]。

字跡識別作為人們的另一種身份證明，應用廣泛，每年約幾萬個案件涉及字跡識別技術，在生活中也常用到[3]。但相對于人臉識別、指紋識別等，字跡識別技術的發展和應用并沒有受到太多重視[4]，無論是在刑事案件上還是民事訴訟上，一旦需要字跡鑒定都只能到司法機關鑒定，且需要一年的時間才能出鑒定結果。過程之長增加了很多問題的復雜度。本文將利用計算機代替人工鑒定，使字跡識別過程更快更準確。

因為現階段大部分字跡識別還仍靠字跡專家觀察鑒定，于是就存在字跡識別的主觀臆斷、人才短缺、酬金過高、申請流程復雜、分析時間過長等問題。專家鑒定這種人為觀察判斷很容易受主觀心理的影響而使分析結果有一定的偏差，而現階段國內字跡專家人數相對較少，不能保證技術的全覆蓋和便利性，這一點對民眾來說也是極大的困擾。如，很多人因為借款方不承認欠條上的簽名是自己簽的而拿不回應得的借款，若他們拿欠條去做鑒定，更是需要長達一年的時間才能得到結果，很多人因此放棄打官司，使不法分子逍遙法外，而為了保證質量，人工鑒別必須需要大量重復性工作來驗證結論。而如今隨著計算機技術的迅速發展，特別是圖像處理技術的日益成熟，為字跡識別與鑒定提供了條件良好的基礎。

結合上述問題，通過了解和研究后，本文考慮到可以用圖像處理的方式來解決這個問題，這樣就能夠極大地解決在字跡識別方面出現的很多問題。現階段對于基于圖像處理的字跡識別技術方面的研究相對較少，大多數是從整體到局部分析筆畫間的結構，用紋理分析法獲得全局特征，從特征字的比較提取局部特征的方法，把整體和局部特征進行整合綜合決策。本文也將運用圖像預處理法，結合構建大數據數據庫的方法，通過筆記采集的方式采集樣本，提供后臺的數據支持。在后續的技術完善中，我們構想將這些技術編入APP 或設備中，直接通過設備拍攝圖像，直接鑒別，做到速度更快，成本更低。

基于圖像預處理的字跡識別技術將一定程度上解決國內字跡識別主觀臆斷、專家短缺和流程復雜的問題，極大地便利了各地警方破案的效率。同時，在民事訴訟方面，如在借條、合同造假等問題的分析和解決上更是提供了捷徑，加快了法律流程的速度，使人民積極參與法律活動，更便利快捷和有效地維護自身利益。本文運用大數據分析法，通過筆記采集的方式，利用計算機更快捷有效地解決問題。在此之后，我們可以構建全國字跡大數據數據庫，錄入每個人的字跡，使之成為繼臉部識別、指紋識別后，又一個認證身份的有力證據。

1 圖像預處理

1.1 圖像拍攝與灰度化

由于獲取圖像的工具或手段的影響，最開始得到的圖像會受到多種條件的限制和不同的干擾，一般不能直接使用，必須要在視覺信息處理的早期階段對原始圖像進行灰度化處理、二值化處理等的矯正，使矯正后的圖像選擇性地體現原始圖像上的信息，濾掉影響因素，增強某些對于往后的處理中比較重要的圖像特征。因此圖像預處理就顯得尤為重要，本文也將先運用灰度化、二值化的方法對圖片進行初步處理。

灰度化處理是指，使具有色彩的圖像轉化成灰度圖像的過程。在彩色圖像中，每一個像素的色彩都取決于R、G、B 三個分量，其中，每個分量都另有255 個中值可以取到，這樣處理后，每個像素點就有255＊255＊255 種變化范圍變化色彩?；叶葓D像就是由相同的這三個分量組成的一種特殊的圖像，其中，像素點的變化范圍就有255 種。雖然灰度化后的圖像在原圖的基礎上改變了大部分的色彩，但它同樣可以反映圖像整體和局部的色度和亮度等級的分布特征。因為R、G、B 三個分量代表的是彩色值，我們需要將它們轉化成灰白圖像。這里，我們采用RGB 和HIS 的轉換，在算法中，HIS 和RGB 的轉換公式如下：

在公式（1）中采用了加權平均法進行灰度化。

灰度化處理圖片的方法有很多：①分量法（做三個灰度圖像，灰度值分別選取原圖中的三個分量的亮度，再根據需要選一幅圖像）。②最大值法（灰度值采用三個分量中亮度的最大值）。③平均值法（灰度值采用三個分量亮度的平均值）。④加權平均法（灰度值選取三個分量亮度的加權平均）。本文運用第三種平均值法，希望能快速簡易并合理地處理圖像，并結合灰度拉伸技術，使圖像的細節更加突出。

圖像二值化（Image Binarization）指將整個圖像呈現出明顯的黑白效果的過程，也就是將圖像上的像素點的灰度值設置為0 或255。經過二值化處理過后的圖像在關于字跡識別的圖像處理中同樣地位重要，經過二值化處理后，圖像中的數據量大幅度降低，因此，處理后的圖像輪廓更鮮明。

1.2 圖像的濾波去噪

對于經過灰度化和二值化處理后的圖像，為了減少圖像灰度的尖銳變化，減小噪聲，在字跡識別的圖像處理過程中，圖像的濾波去噪技術同樣是一個重要的步驟。通過圖像的濾波去噪，可以更便于觀察。如今圖像濾波去噪有很多途徑值得參考：運用均值濾波器、中值濾波器、最大值濾波器、最小值濾波器。通過對比可以發現：最大值濾波器和最小值濾波器都存在一定程度上忽略細節的問題，最大值濾波器使圖片過亮，最小值濾波器使圖像更暗，兩者都造成了很大程度上的失真，而對于均值濾波器來說更是存在邊緣模糊的問題。這些問題看似很小，但在字跡識別，一個比較注重細節的問題上卻會造成很大的影響。對比下來，用中值濾波器進行濾波去噪雖然也存在忽略細節的問題，相對于這兩種算法，中值濾波器忽略的細節會相對少一點，失真也沒有那么嚴重。同時中值濾波器在邊緣上也比均值濾波器清晰。于是，通過對比，本文將運用中值濾波器來處理字跡圖像。中值濾波器的原理就是將各個顏色點排序，在一個特定的范圍中取中值，使這個特定范圍中的顏色點都和中值顏色一樣。在中值濾波器中，有3＊3、5＊5、9＊9、15＊15、35＊35 的處理，為了減少圖像模糊的問題，我們選用3＊3 的處理方法。

1.3 圖像的歸一化

圖像歸一化，顧名思義，就是將圖像的格式統一，讓它轉換成有一固定標準形式的圖片的過程，而這種處理后的圖像就被稱作是歸一化的圖像。最開始的圖像在經過了幾步特殊的處理后就能成為副本圖像，而標準圖像就是由這些圖像經過相同參數的圖像歸一化處理后得到的。

在字跡識別方面，我們需要應用圖像歸一化來調整字跡和字跡之間的間距和行距，使字跡看起來更工整，也更方便對字跡進行特征的提取和對比。

2 字跡特征提取識別

2.1 建立字跡數據庫

為提取字跡特征，首先需要用建立數據庫對各種已知出處的筆跡進行歸納整理。本文事先采集了五十個不同出處的字跡原件，形成一個小型數據庫。為了更方便更快捷地從數據庫中找到對應的字跡，在處理時我們會先將數據庫中的字跡原件進行先一步分類，提高處理效率。

首先通過整體紋理，再通過漢字局部識別。在實驗中，選取了50 個不同的字跡，建數據庫，從中隨機選取一個作為待識別的字跡。對于字跡紋理識別，我們選用分類的方法，在處理前將收集到的字跡分成三類：左傾、右傾、豎直。經過紋理識別后可提前獲知被分配的類別以減少后續工作量。

傅立葉變換也稱傅氏變換，是一種常用的信號分析方法，它可以分析信號的成分，也可以用來合成信號，傅立葉變換選用了正弦波作為信號的成分。傅立葉變換在概率學、聲學、海洋學、密碼學、結構動力學等領域都有著廣泛的作用，甚至可以將一首曲譜用波的形式來表示。

通過傅立葉公式，將圖像信號變成頻率信號，再處理后得到p 值。它的大小及方向能體現紋理的大小與粗細，體現圖像的排列規律。在頻率域圖像分析法中，用傅立葉特征來分析圖像紋理是一種典型方法。研究者們經常用研究譜成分的方法來研究它的物理意義。具體公式如下：

經過傅立葉公式轉換后就能用二維圖像反應空間中頻率的強度。得到的圖像就是轉換完的功率譜圖像。圖像中幅值的變化方向和圖像的紋理有一定的關系。字跡紋理粗的話，幅值就會比較大。圖像的鏡像值能體現紋理的方向。由此可知，得到的值在范圍內，值的大小和鏡像的值能分出粗細與方向。

傅立葉圖像轉化后可以根據圖譜建立坐標，以坐標原點為0，粗紋在原點附近有較高的值，細紋的能量譜向周圍散開，坐標軸范圍通常為(-N/2,N/2)，顯出來即可分析紋理的粗細和方向。

通過傅立葉的方式衡量紋理，是字跡的初步識別，屬于整體分析。

2.2 字跡局部特征識別

從上文所述的50 種字跡中，本文任意挑選了一種字跡中的一個字和原來的50 個字作對比。步驟如下：

（1）調整圖像亮度、色度和飽和度，將50 幅圖像的背景統一起來。（2）調整圖像大小，統一格式，將圖像預處理。（3）將50 個字跡分成了三組：左傾、右傾、豎直。（4）將待測字體大致歸為一類或多類后，一對一的擬合。

首先通過整體紋理，再通過漢字局部識別。在實驗中，選取了50 個不同的字跡，建數據庫，從中隨機選取一個作為待識別的字跡。

對于擬合的方法我們選取了數待測字跡中端點、交叉點和拐點的個數，看已知字跡中是否有字跡的三個數據完全一樣或相差一點。但在分析端點、交叉點和拐點之前，我們還需要做字跡骨架的優化。

簡化后是端點提取。端點可以等效為交叉數，一個黑色像素點的八鄰域，當八鄰域中只有一組黑白像素交替的話，此黑點就是一個端點。我們設黑像素為（w,z）,交叉點數為x，則x 的公式如下所示：

利用這個公式來判斷，當x 為1 時為端點，x 等于3 時是交叉點。其中，nk為這個點的八個相鄰的點，nk∈{0,1}，且n9=n1。在x=1 時，（w,z）就是一個端點。

交叉點與端點提取方法類似，而因為拐點的電腦計算十分復雜，本次采用了計數法。在算出端點、拐點和交叉點后，利用如下公式，計算相似度：

最終我們發現，圖1（待測）和圖2 的相似度為百分之百，而圖1（待測）與圖3 的相似度為百分之七十。

圖3

最終我們得出結論：圖1 和圖2 是一個人寫的。

3 結論

本文通過對字跡進行預處理、圖像紋理識別、圖像局部特征識別的方法，實現了筆跡識別與判斷，可以解決字跡鑒別不夠客觀、分析時間長、操作不便利等問題，雖然在準確性上還有待優化，還無法做到百分之百的正確率，但用圖像預處理和建立數據庫的方法識別字跡能為以后智能化的字跡識別技術提供了參考的依據。希望我的努力，能為字跡識別走向智能化提供參考依據和解決辦法，更能為維護廣大人民群眾利益、提高法律實效性做出一定的貢獻。希望字跡識別不再成為法律鑒別里的一道鴻溝，而是作為無辜者建立最堅實的證據出現在法庭上，成為法網編織中不可或缺的、起指向性的重要一環。