摘 要:提出了一種圖像特征融合新方法,應用于分析和挖掘圖像中蘊含的豐富信息.基于神經網絡學習功能構建圖像特征與內涵之間的映射關系,達到挖掘圖像內涵的目的.研究以文物圖像為研究對象,選擇了100幅古建筑圖像,提取圖像特征信息及其蘊含的語義信息,構建神經網絡學習樣本庫,訓練神經網絡學習.實驗選取了6幅測試樣本,神經網絡學習結果驗證了本文方法的可行性和實用性.
關鍵詞:圖像語義;特征提取;融合算法;神經網絡
中圖分類號: TP18 文獻標識碼:A
A New Method of Image Character Fuse
Based on Neural Network Learning
CHANG Bing-guo
(College of Information Science and Engineering, Hunan Univ, Changsha, Hunan 410082, China)
Abstract:A new method of image character fuse was used to analyze and mine a mass of information of image. The mapping between the image character and its meaning was established by using neural network learning to mine the meaning of image. The image of cultural heritage was taken as the object of this study, and the images of 100 ancient buildings were selected. Their image characters and semantic information were extracted, and learning base of neural network was established. The 6 test images were selected and validated the validity and practicability of this method.
Key words: image semantic; character extraction; fuse algorithmic; neural network
博物館文物數字化研究已如火如荼地展開,隨著以圖像為主要類型的多媒體數據的大規模運用和人工智能理論的發展,人們已不滿足停留在觀賞文物的色澤、紋飾和形狀等外部特征這些基本要素上,而是希望借助于人工智能技術,感知文物的深刻內涵,達到透過文物外部現象欣賞內在本質的目的.誠然,計算機通過底層特征匹配得出的圖像和人們對圖像信息的內在含義理解還存在一定的語義偏差,一個語義往往對應著多種特征,反之亦然.因此,建立對文物的視覺內容和信息內涵之間的映射關聯關系,是加強對文物的深入理解,提高文物鑒賞水平,使文物為更多的普通公眾理解的重要研究課題.
近年來,研究領域展開有關圖像分割、特征提取及圖像復原工作.人們借助于應用數學理論,對圖像分割問題進行了深入研究,其中商空間理論、高維空間變換理論、仿生模式識別理論、多權值神經網絡理論等在圖像分割特征提取領域得到廣泛應用[1],并取得了顯著成就.這些工作基本上都是對圖像進行聚類分析,建立圖像區域聚類和圖像高層語義之間的概率分布密度.本文運用分層圖像分割理論提取文物圖像中蘊含的有意義的特征信息,包括圖像灰度值、圖像輪廓、圖像色澤、反射特征和紋理信息,構造多維特征空間樣本庫.基于多權值神經網絡學習建立文物外部特征與內在含義之間的映射關系,以使公眾基于文物圖像特征即可解讀和理解文物內涵.
1 語義映射體系結構
文物圖像外部特征信息和語義信息之間存在著必然的內在關聯關系.近年來,以連接主義思想的神經網絡理論為基礎的人工智能實現技術得到廣泛應用[2].本文在有關學者研究的基礎上,提出構建文物外部特征信息和內在語義信息之間關聯關系的體系結構模型,如圖1所示.
圖1中,文物圖像特征信息包括顏色特征信息、形狀特征信息和紋理特征信息.多權值神經網絡完成對特征空間的模糊處理并建立映射關系.
1.1 圖像特征提取
神經生理學家Olshausen 和Field的研究成果表明[3],視覺皮層的接收場特性使得人類的視覺系統只用最少的視覺神經元就能夠捕獲自然場景中的關鍵信息.圖像特征提取就是將圖像中的關鍵特征捕獲出來,再進一步細化得到圖像較完整的外部特征信息.本文沿用文獻[4]提出的采用塔型方向濾波器組預處理和各向異性期望轉移的自適應分割方法獲得文物圖像的結構信息特征序列,為構造多維空間模型提供數據支持.塔型方向濾波器組是一種多分辨率的圖像濾波器,能夠對圖像由粗到細地進行多尺度分解,在邊緣信息上能充分保持方向性.
圖像分割是將圖像劃分成若干互不相交的區域,從中提取有意義的特征,如像素的灰度值、物體輪廓、顏色、反射特征和紋理等,用集合理論描述為:設S為圖像像素集合,將圖像劃分為若干子集S1,S2,…,Sn.圖像分割后的每個區域都有獨特的屬性特征,同一區域中的像素具有一致性.圖像分割的實質是像素集合的一次有效劃分,如邊緣圖像的梯度和紋理圖像的方向性作為區域一致性準則,圖像分割時圖像粒度由粗到細的過程.由于數字成像技術的發展,本文重點分析彩色圖像和紋理圖像特征提取問題.物體顏色感受是人們對電磁輻射中可見光部分里不同頻率的感知,灰度圖像分割不能很好地提取彩色特征信息,本采用特征空間變換分割算法提取圖像的色彩特征信息.
1.2 圖像特征空間變換
對于彩色圖像的每個像素都是一個三維矢量.彩色圖像中,色調多是以片狀區域變化的,在一個小范圍內的色調近似不變,且色調的動態范圍較窄.通常,用紅、綠、藍三色分量描述圖像的色彩.本文采用模糊理論,將圖像色彩信息、圖像紋理信息和圖像材質信息進行模糊化處理,構建圖像色彩模糊空間.
1.2.1 彩色圖像邊緣特征提取
根據重力場理論,若給定一個函數f(x,y),坐標(x,y)上的梯度可以定義為一個矢量
第4步:循環運行上述步驟,直至圖像特征點的分割完成,并融合到所設定的區域內.
數值符號轉換是把神經網絡學習結果和經驗數值基于知識描述方法轉化為人們易于理解的符號表示,以達到描述圖像語義特征的目的[5].語義概念合成是把多個描述不同視角的圖像特征語義進行合成[6],對圖像整體特征進行深入識別,從多角度挖掘圖像蘊含的深刻內涵,為圖像語義識別提供基礎.
2 圖像特征語義學習神經網絡
語義網是基于有向圖描述事物、概念、屬性、動作、狀態及其之間的關聯關系的知識表示模式[7].在上文中獲得的目標圖像特征,用語義網理論加以描述,分析目標圖像特征信息與其內容之間的內在關聯關系,建立目標圖像知識表示模式,為神經網絡學習圖像語義提供支持.
神經網絡信息存儲分布在連接權值上,使網絡局部輸入信息的不準確并不會影響網絡輸出的正確性,具有較高的容錯性和魯棒性[8].每個神經元根據接收輸入信息獨立運算,輸入下層處理,具有并行處理信息能力.神經網絡將信息處理和信息存儲分離,反映了網絡對信息的記憶聯想能力.徑向基函數(RBF)神經元的數學模型可表示為:
Y=f∑ni=1(wi-xi)2-θ2 (12)
式(12)中,Y為神經元輸出,f為神經元非線性激勵函數,X=(x1,x2,…,xn)為神經元輸入,W=(w1,w2,…,wn)為神經元權值,θ為神經元激活閾值.RBF神經網絡體現為輸入向量和權向量之間的距離.多權值神經網絡模型描述輸入向量和多個權向量之間的關聯,運用多個權向量表達輸入和輸出之間的復雜關聯關系,其描述模型為:
Y=f∑ni=1(wi,w'i,…,xi)-θ (13)
式(13)中,Y為神經元輸出,f為神經元非線性激勵函數,X=(x1,x2,…,xn)為神經元輸入,W=(w1,w2,…,wn),W′=(w′1,w′2,…,w′n)為多個權值,θ為神經元激活閾值.
3 實驗分析
紋理是圖像的重要特征,圖像紋理的粗細度和方向性特征是區分不同紋理的最佳特征.本文實驗選擇了100幅青銅器數字圖像,基于上述方法提取了圖像紋理內容和色彩特征信息,并詳細闡述了圖像蘊含的高層語義,構建神經網絡學習樣本庫,訓練神經網絡.選擇了6幅古建筑圖像作為測試樣本,驗證了該方法的有效性和可用性.具體的樣本庫描述如下.
圖像色彩紋理特征輸入矩陣為:
Ccolor=c11c12…c1m
c21c22…c2m
cn1cn2…cnm,
Vtexture=v11v12…v1mv21v22…v2mvn1vn2…vnm
對100張古建筑測試樣本進行語義標注,網絡學習圖像語義分析輸出特征為Y=[y1,y2,…,ym]T.采用徑向基函數訓練神經網絡,實驗給出了6組測試結果列于表1.
從表1中可以看出,基于上述研究方法提取圖像特征,多權值神經網絡得到的圖像語義學習結果與實際測試結果基本吻合,驗證了研究方法的有效性和可行性.
4 結論及展望
語義對象的圖像理解還處于快速發展和不斷完善過程中,該項研究涉及認知科學、人工智能、模式識別、圖像處理等眾多科學分支.研究行之有效的圖像綜合特征提取方法是圖像語義理解的基礎.神經網絡研究成果為智能語義學習提供了強大基礎.本文將多學科研究成果交叉應用,利用科學融合思想設計技術路線,解決復雜的古建筑保護識別問題,實驗結果表明了該方法行之有效.
參考文獻
[1] MOU CHEN, SHUZHI S G, BERNARD Voon Ee How.Robust adaptive neural network control for a class of uncertain MIMO nonlinear systems with input nonliearities[J]. IEEE Transactions on Neural Networks, 2010,20(5):796-812.
[2] HE Q L,MA G F,XIE L H.Robust and adaptive variable structure output feedback control of uncertain systems with input nonlinearity [J]. Automatica, 2008,44(2):552-559.
[3] 王守覺,孫華,莫華毅.彩色圖像特征空間變換的新算法及應用[J].電子學報,2007,35(2):193-196.
WANG Shou-jue,SUN Hua,MO Hua-yi. A novel algorithmic and application on the colour image space transform[J].Acta Electronical Sinica, 2007,35(2):193-196.(In Chinese)
[4] HAYAKAWA T, HADDAD W M, HOVAKIMYAN N. Neural network adaptive control for a class of nonlinear uncertain dynamical systems with asymptotic stability guarantees [J]. IEEE Transactions on Neural Networks,2008,19(1):80-89.
[5] 王向陽,盧婷婷.一種魯棒的多特征彩色圖像檢索新方法[J].中國圖像圖形學報,2007,12(10):1757-1760.
WANG Xiang-yang,LU Ting-ting. A novel method of robust on the multi-character of the colour image [J]. Journal of Image and Graphics,2007,12(10):1757-1760. (In Chinese)
[6] 王祥宗.劉志,劉增良,等,基于規則的業務構件組裝規約[J].計算機集成制造系統,2008,14(9):1774-1780.
WANG Xiang-zong,LIU Zhi,LIU Zeng-liang,et al. Assembly specifications for business-components based on rules[J].Computer Integrated Manufacturing Systems,2008,14(9):1774-1780. (In Chinese)
[7] 陳久軍,肖剛,盛頌恩,等.XML驅動的圖像語義檢索研究[J].中國圖像圖形學報,2007,12(10):1769-1773.
CHEN Jiu-jun,XIAO Gang,SHENG Song-en,et al. Study on image semantic query of XML driving[J]. Journal of Image and Graphics,2007,12(10):1769-1773. (In Chinese)
[8] 王文廣,劉喜春,王維平,等,面向服務的高層體系結構研究進展[J]. 計算機集成制造系統,2008,14(9):1665-1675.
WANG Wen-guang,LIU Xi-chun,WANG Wei-ping,et al. Evolution of service-oriented high level architecture[J].Computer Integrated Manufacturing Systems,2008,14(9):1665-1675. (In Chinese)