陳京水李業勤劉 玉蔡顯圣
人工神經網絡在圖像處理中的應用
陳京水①李業勤②劉 玉③蔡顯圣④
圖像處理是包含豐富內容和具有廣闊應用領域的研究學科。近幾年來,作為具有自組織、自學習和聯想功能的人工神經網絡理論已成功地應用于圖像處理的許多方面,神經網絡應用于圖像處理的主要思路是:把原始圖像或經過適當預處理的圖像作為網絡的輸入信號,在網絡的輸出端得到處理后的圖像信號或分類結果。
圖像處理;人工神經網絡;圖像壓縮;圖像分割;邊緣檢測;圖像增強
[First-author's address]Department of Medical Equipment Management, Jinan Health School, Jinan 250023, China.
圖像是用各種觀測系統以不同形式和手段觀測客觀世界而獲得的,可以直接或間接地作用于人眼進而產生視覺的實體。圖像技術在廣義上是各種與圖像有關的技術的總稱,包括利用計算機和其它電子設備進行和完成的一系列工作。例如圖像的采集、獲取、編碼、存儲和傳輸,圖像的合成和產生,圖像水印的嵌入和輸出,圖像的變換、增強、恢復和重建,圖像的分割,目標的檢測、跟蹤、表達和描述,目標特征的提取和測量。因此,為了對各種圖像技術進行綜合研究集成應用,有必要建立一個整體框架——圖像工程。圖像工程根據抽象程度和研究方法等的不同可分為3個層次:圖像處理、圖像分析和圖像理解。
隨著科學技術,特別是信息技術的發展,圖像處理技術已經成為科學研究不可缺少的強有力工具,傳統的圖像處理方法已經無法滿足需要,研究人員開始探索新的更有效的方法,其中利用神經網絡進行圖像處理是最活躍的方向。神經網絡算法比起傳統的算法顯示了更大的優越性,主要表現在:(1)高度并行處理能力,處理的速度遠遠高于傳統的序列處理算法;(2)具有自適應功能,能夠根據學習提供的數據樣本找出和輸出數據的內在聯系;(3)非線性映射功能,圖像處理很多問題是非線性問題,神經網絡為處理這些問題提供了有用的工具;(4)具有泛化功能,能夠處理帶有噪聲的或不完全的數據。
最初,人工神經網絡是作為模式識別分類器和聚類技術在圖像處理領域中得到應用的。隨著神經網絡理論的進一步研究,神經網絡的特點得到人們充分的認識,如印刷體和手寫字符識別、語音識別、指紋、人臉識別、圖像壓縮復原等。
2.1 圖像數據壓縮
為克服存儲容量較大的圖片在存儲和傳輸過程中帶來的不便,我們常常希望通過某種變換手段,將數量巨大的圖像信息進行壓縮,以壓縮后的圖像數據信號進行存儲和傳輸,當需要提取圖像或在傳輸終端接收圖像時,按一定規則將圖像恢復,這就是圖像數據壓縮。
神經網絡圖像數據壓縮系統主要由壓縮網絡(輸入層/中間層)、傳輸通道(中間層/中間層)和再生網絡(中間層/輸出層)組成,輸入層和輸出層由相同的N個單元組成。在網絡學習過程中,輸入層的學習模式及輸出層的教師模式使用同一圖像信號。由于中間層單元數可以大大少于輸入層、輸出層的單元數,所以學習后的網絡將以較少的中間層單元有效地表示輸入圖像模式,并以此進行存儲和傳輸,在輸出層將輸入圖像模式再現出來。在這一過程中,輸入層/中間層的變換可以看作是壓縮編碼過程,中間層/輸出層的變換可以看作是解碼的過程。
2.2 圖像分割
在任何人工視覺系統中,分割是早期視覺中最重要、最困難的一步。分割時將圖像劃分為互不相交部分的過程;通過分割,將我們感興趣的部分(如物體)提取出來,將不感興趣的部分(如背景)濾除掉。目前,神經網絡在圖像分割方面也有很多應用。
Blanz和Gish使用一個三層前饋網絡進行圖像分割。輸入層神經元數取決于每個像素的輸入特征數,輸出層等于類別數,Babaguchi等使用一個多層BP網絡對圖像取閾值。網絡的輸入是圖像的直方圖,輸出是期望的閾值。學習過程采用的樣本是大量已知閾值的圖像,這些閾值經驗證能產生具有良好視覺效果的二值化圖像。最近,Ghosh等人用一個巨量連接的神經網絡在噪聲環境中提取物體。
2.3 圖像分類與識別
在前面提到的圖像分割問題中,有時也會涉及劃分屬于多個不同類別的區域,這實際上已經包含了圖像分類的任務。如果圖像中的類別不多,模式不復雜,類之間的區別明顯,當分割任務完成時,分類任務也就完成了。這里主要是指那些類別眾多,模式復雜、類之間區別細微的圖像分類問題,如手寫體字符識別、人臉識別、指紋識別、染色體識別等。
圖像分類也許是神經網絡應用最多的一個領域。具體實現時,可以用原始圖像作為輸入,用中間隱層進行特征提取。這樣做雖然簡單、直觀,但存在很大的缺陷。一是圖像的分辨率不宜太高,否則會導致網絡輸入單元劇增,計算量也隨之成倍增加,而降低圖像分辨率又導致相近模式間的差異不明顯,給識別帶來困難。二是原始圖像包含了大量冗余信息,且信息量分散,特征隱蔽較深,大大增加了模式特征提取的難度,降低了網絡的學習效率。因此,大多數情況下需要對原始圖像進行一定的預處理。如何抽取有效的特征,是圖像分類問題的關鍵。由于各類圖像的特點各不相同,相應的特征提取方法也千差萬別,專用性非常強,將提取出的特征輸入合適的網絡模型,最后得到分類結果。
J.Cao等人用一個主分量分析(PCA)神經網絡提取輸入圖像的10個主特征,再將提取出的特征輸入后一級網絡——貝葉斯增長聚類神經網絡(BICNN)。這兩個網絡是以級聯的形式串接起來的,分別以不同的學習規則訓練,其性能略優于三層BP網絡。根據傳統的誤差BP原理進行學習,有時顯得效率較低,因為中間隱層抽取特征的過程很難,未必能如我們所期望的那樣抽取有效特征。前一層網絡還未充分學習并對輸入模式形成正確的特征映射前,后一層網絡的權值調整不具有明顯效果。采取級聯形式的網絡能克服這個問題,各層網絡任務單一、目標明確,極大地提高了學習效率,并減少了陷于局部極小值的概率。
B.Lerner等人在人體染色體分類的問題中,采用染色體的中軸密度投影以及染色體長度和著絲粒指數作為特征。中軸密度投影將二維圖像用一維形式表達出來,其幅度被歸一化到-0.5~0.5區間,長度被修為64,染色體長度和著絲粒指數也被歸一到-0.5~0.5區間。采用的網絡是一個三層BP網絡,共有66個輸入單元。輸出層單元數等于類別數。中間隱含層單元數用PCA方法確定,事先規定一個閾值,若最大的n個特征值之和占所有特征值總和的百分比大于該閾值,則隱單元數就設為n。
利用多分辨率信息進行識別是近來的一個熱點。文獻提出了一個新方法,用小波變換和一個簡易的多層聚類神經網絡(MCNN)進行手寫體數字的多分辨率識別,將字符圖像與Haar小波卷積得到小波系數作為多分辨率特征向量輸入MCNN。與傳統的全連接型網絡不同,MCNN是一種局部連接型網絡。對于全連接型BP網絡來說,由于輸入層各單元與擔負特征提取任務的中間層單元實行全連接,學習模式的整體相關特征被分布記憶在網絡的各連接中。手寫體文字的特點是其模式整體相關性變化大,而各筆劃之間的相關系數較穩定,所以在網絡運行時,當遇到未學習過的輸入模式,由于整體相關性的差別造成網絡輸出模式的振蕩,降低了網絡的識別率,網絡的泛化能力不強。雖然減少連接權數量能避免振蕩,但是過少的連接權甚至對訓練集也不能精確學習。因此,有必要將輸入層單元分成若干區域,每個區域的單元僅與部分中間層單元連接,目的是使網絡對學習模式的特征分解記憶,淡化對其整體特征的記憶。MCNN的輸入層由8個聚類組成,每個聚類都與隱層中對應的聚類進行全連接,這樣構成8個子網。每個子網都從隨機的初始值開始,學習不同的特征映射。學習完后,每個子網都有不同的內部表示。而輸出層是與所有隱層單元全連接的,這樣當一個子網辨認不出某一給定輸入時,依靠其它子網仍能得到正確輸出。很多圖像識別問題要求算法具有不變性、旋轉不變性、縮放不變性等。對于特定一些問題,存在某種特征提取方法或變換,其本身就具有不變性,是較為通用的方法,Jeffrey Wood 作了一個詳盡的總結,神經網絡當然也是其中必不可少的一種方法。最簡單(但效率最低)的方法就是給網絡提供每一模式許多形態的樣本,使其充分學習。利用網絡的內插能力,能識別其它各種形態的樣本。Simard等通過修改BP算法,使得網絡經訓練后其輸出不受輸入微小變化的影響。
很多方法利用權值共享的原理實現不變性識別,其基本原理是:強迫網絡中的某些連接權具有相同權值,這樣就能對網絡輸出施加約束,例如在某些給定的集合下執行不變性輸出。這種結構化網絡自由參數的數目少于具有相同連接形式的同類網絡,因此訓練過程加快,由于這種受約束網絡在其結構中包含了先驗知識,它的推廣能力將優于未受約束的網絡。
很多學者采用高階神經網絡解決不變性識別的問題。高階神經網絡中的每個神經元不僅將它的輸入進行加權求和,還對輸入之間的組合乘積進行加權求和,也就是引入了高次項。這使計算復雜度大為增加,因此在高階神經網絡解決不變性識別問題時,通常只采用一個神經元。這樣一個單結點網絡的學習算法類似于感知機收斂算法,因而學習速成度快,容易收斂。
Fukushima提出的新認知機模型是不變性識別方面最成功的應用之一,它對于輸入樣本的位移、畸變和噪聲干擾等都有較強的抵抗能力。網絡是由若干結構相同的神經元模塊加上輸入層而構成的,由于處理的視覺信息,所以每個模塊都是由一些不同的二維陣列的神經元層所組成。各神經元層以級聯的形式組織起來,第一層(或前面幾層)能夠抽取局部特征;后面幾層通過對前一層中性平面的組合,能夠形成整體特征。經過這樣一個從局部到整體,從低級到綜合的過程,最后在輸出層得到決策,并且不受位置和畸變的影響。網絡采用自組織競爭算法進行學習,自動調節一些神經元的可變連接權,并對學習樣本集進行分類。
2.4 圖像增強
圖像增強的主要目的是使圖像處理后達到特定的效果。不同的圖像,其處理方法也各不相同,使我們很難找到一個標準的公式或函數,因此可利用神經網絡的學習特性和自組織能力幫助我們完成這一任務。此外,神經網絡在圖像恢復、目標識別、計算機視覺中的體式匹配等方面也有應用,它的引入極大豐富了圖像處理的手段。
鑒于以上提及的優勢,近些年來,人工神經網絡在圖像處理中的應用十分廣泛,領域也比較寬。在車牌識別、字符識別、紅外圖像識別、遙感圖像識別中發揮了舉足輕重的作用。不僅如此,作為人工神經網絡在醫學圖像處理中,意義也是十分重大的。舉例說明,通過對醫學影片獲取的圖像,如CT、核磁共振成像等,進行特征紋理提取,然后輸入訓練好的神經網絡,從得到的輸出判別出相應的病癥,在臨床上可作為醫師治療和診斷的輔助。
鑒于神經網絡的強大處理功能和解決問題的強大優勢,我們相信,它將在圖像處理領域發揮越來越大的作用。當然,有些問題也是需要我們去考慮,比如,哲學上的具體問題具體對待,對于什么樣的要求和目的,我們采用什么樣的模型,建立何種神經網絡,如何使學習效果最好,都需要我們進一步的去探索和追究。
人工神經網絡應用在圖像處理方面案例比比皆是,如圖像壓縮、圖像分割、邊緣檢測、圖像增強、圖像識別等。人工神經網絡具有的自組織,非線性,自學習能力使其在很多領域發揮了重要作用。相信隨著人工神經網絡理論和實踐的發展,在不遠的將來,它將在圖像處理領域發揮更大的作用。
[1]王保華,羅立民.生物醫學電子學高級教程[m].南京:東南大學出版社,2001:98-102.
[2]楊建剛.人工神經網絡實用教程[m].杭州:浙江大學出版社,2001.
[3]章毓晉.圖像工程[m].北京:清華大學出版社,2002:6-9.
[4]趙建民,朱信忠,殷建平,等.基于特征提取和BP神經網絡相結合的車牌字符識別技術[J].全國理論計算機科學學術年會,2005(8):1-4.
[5]周羽.紅外圖像人臉識別研究[D].大連理工大學,2007.
[6]劉偉.基于紋理分析和人工神經網絡的肝部CT圖像識別[D].泰山醫學院,2006.
[7]于洋.利用BP神經網絡進行齲齒診斷[D].北京師范大學,2006.
[8]Sing-Rong Li and Idongesit E. Ebong,Tunneling-Based Cellular Nonlinear Network Architectures for Image Processing[J], IEEE,2009.
[9]Edward Dunstone', James Andrew,SUPER-HIGH, SCALE INVARIANT IMAGE COMPRESSION USING A SURFACE LEARNING NEURAL NETWORK[J], International Symposium on Speech,1994.
[10]Segyeong Joo1, Woo Kyung Moon2 and Hee Chan Kim3,26th Annual International Conference of the IEEE EMBS[J], 2004.
[11]H. Saad1, A. Hussain,Classification for the Ripeness of Papayas UsingArtificial Neural Network (ANN) and Threshold Rule[J], 4th Student Conference on Research and Development, 2006.
[12]Blanz W E, et al. A connectionist classifier architecture applied to image segmentation. Proc 10th ICPR, 1990:272-277.
[13]Babaguchi N, et al. connectionist model binarization. In: Proc 10th ICPR,1990:51-56.
[14]Ghosh A, et al. Image segmentation using a neural network. Biol Cybern, 1991, 66:151-158.
[15]Cortes C, et al. A network system for image segmentation. In: Proc Intl Joint Conf on Neural Network, 1989,1: 121-125.
Application of artificial neural network in image processing
CHEN Jingshui, LI Ye-qin, LIU Yu,et al
Image processing can be seen as a large class of imaging technology, emphasizing on the transformation between the images, image processing is a subject with rich content and broad application areas. In recent years, as a selforganizing, self-study and associate function artificial neural network theory has been successfully applied to many aspects of image processing such as image compression, image segmentation, edge detection, image enhancement, image recognition and so on. In general, the main idea of neural network application in image processing is as below: put the original image or an appropriate preprocessing image as the input signal of network, the network output is the result : processed image signal or classification results.
Image processing; Artificial neural network; Image compression; Image segmentation; Edge detection; Image enhancement.
1672-8270(2010)07-0039-04
TH 774
A
陳京水,男,(1982- ),本科,現就職于山東省濟南衛生學校醫械學科,從事醫療器械維修技術專業的一線教學工作。
2010-02-29
①山東省濟南衛生學校醫療器械學科 山東 濟南 250023
②山東省日照市中醫院設備科 山東 日照 276800
③山東省平陰縣人民醫院設備科 山東 平陰 250400
④山東省聊城市人民醫院設備科 山東 聊城 252000
China Medical Equipment,2010,7(7):39-42.