999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種新穎的低層視覺特征到高層語義的映射方法

2007-01-01 00:00:00莫浩瀾石躍祥
計算機應用研究 2007年6期

摘 要:通過在低層視覺特征上提取圖像的局部顏色和紋理特征,再利用模糊神經網絡建立低層視覺特征和高層語義特征之間的映射,實現了圖像屬性信息的有效傳遞和可靠檢索。最后,為了提高檢索效率,把相關反饋引進到圖像檢索系統中。實驗證明,該方法取得了較好的檢索查全率和準確率。

關鍵詞:語義圖像檢索;局部顏色和紋理特征;模糊神經網絡;相關反饋

中圖分類號:TP391文獻標志碼:A

文章編號:1001-3695(2007)06-0173-03

如何跨越低層視覺特征和高層語義特征的鴻溝是語義圖像檢索中一個難點。許多學者為此做了不少的研究和貢獻[1-15]。其中Chang等人[7]提出語義模板的概念用于建立低層視覺特征與高層語義之間的聯系。Zhao等人[8]提出LSI(Latent Semantics Indexing)用于建立低層視覺特征與高層語義之間的聯系。鮑永生等人[13]提出語義網絡用于建立低層視覺特征與高層語義之間的聯系。孫志杰等人[15]提出支持向量機(Support Vector Machine)用于建立低層視覺特征與高層語義之間的聯系。該方法把一幅圖像歸于一類語義圖像。但當一幅圖像歸類不是很明顯,如一幅包括山、水、藍天的圖像分別以某種隸屬度歸入幾類語義圖像。為解決這一問題,文中引入模糊神經網絡用于建立低層視覺特征與高層語義之間的聯系。

1 相關知識

1965年,Zadeh提出了著名的模糊集理論[16]。它是對傳統集合理論的推廣。在模糊集中,每一個元素均是以一定的程度屬于某個集合,也可以同時以不同的程度屬于幾個集合。將模糊理論與人工神經網絡相結合就產生了模糊神經網絡。

神經網絡的模型由網絡拓撲結構、神經元特性函數和學習規則三要素組成。而模糊理論中一個最重要最基本的概念是隸屬度。隸屬度可以將人腦中的模糊概念比較合理地量化給計算機,架起了人腦與計算機的橋梁。1974年,S.C.Lee和E.T.Lee在Cybernetics雜志上發表了“Fuzzy sets and neural networks”一文,首次把模糊集與神經網絡聯系在一起; 1992年開始,J.J.Backley發表了多篇關于模糊神經網絡的文章,反映了人們近年來的興趣點。模糊神經網絡擯棄傳統神經網絡0、1二值邏輯,代之以隸屬度,可以實現從一個模糊集合到另一個模糊集合的映射[17]。根據確定集可以看做模糊集的特例,文中利用模糊神經網絡建立低層視覺特征與高層語義之間的聯系,把一幅圖像以某種隸屬度歸于一類或幾類語義圖像。

2 底層視覺特征到高層語義的映射

2.1 圖像底層特征的提取

圖像底層特征的提取是圖像檢索的主要問題之一,而語義檢索是基于人感知的,帶有人的主觀性,所以選取的圖像特征本身要具有較為直觀的視覺意義,即較強的視覺表達能力。文中采用提取圖像局部特征,將一幅圖像分成五個區域,在五個區域上分別提取顏色和紋理特征。

2.1.1 顏色特征的提取

顏色是彩色圖像最顯著的特征,相對于其他特征顏色特征具有相當的穩定性,對于旋轉、平移、尺度變化均不敏感,表現出很強的魯棒性。在圖像分析和識別領域應用最多的是HSV和HIS顏色空間,因為該空間使用顏色的三個特性(色調、飽和度和亮度)作為定義顏色的組成部分,接近于人類解釋和觀察顏色的方法。因此首先需要將RGB顏色空間轉換到HSV顏色空間,然后再分別計算H、S、V顏色直方圖。

2.1.2 紋理特征的提取

圖像紋理反映的是圖像的一種局部結構化特征,具體表現為圖像像素點某鄰域內像素點灰度級或者顏色的某種變化。本文使用Gabor小波變換[3]提取紋理特征。一個2D的Gabor函數可定義為

2.2 底層視覺特征到高層語義的映射

文中將圖像分成五個區域,每個區域將提取到RGB和HSV模型下的三階顏色矩特征向量和紋理特征向量。再采用模糊隸屬度函數對特征向量進行模糊化形成模糊神經網絡的輸入特征向量。本文采用的模糊神經網絡模型結構如圖1所示。

模糊神經網絡的學習算法采用改進的BP學習算法——加入動量項,詳細內容見文獻[19]。文中為了提高檢索效率,把相關反饋[3]引進到圖像檢索系統中。相關反饋的主要特點是由用戶來引導搜索,因而反饋的結果會朝有利于用戶要求的方向發展。大部分相關反饋的研究集中在兩個方向上,即移動查詢點和再加權/調整權重。前者改進對理想查詢點的估計,具體是將該查詢點移向好的范例點而遠離壞的范例點。實現這種調整的一個典型迭代公式為

3 實驗分析

文中采用的圖像庫大約為800幅圖像,分成日落、青山、綠水、樹木、花卉等六類語義圖像類。在每一類語義圖像類中選出40幅圖像作為訓練樣本訓練網絡。每一幅圖像分成五個大小相同的區域,如圖2所示。

每個區域將提取到RGB和HSV模型下的三階顏色矩特征向量18維和紋理特征向量16維;再采用模糊隸屬度函數對特征向量進行模糊化形成模糊神經網絡的輸入特征向量。隱含層節點個數為五。其中三個節點與輸入層的顏色特征向量相連;兩個節點與輸入層的紋理特征向量相連。輸出層為六個節點,分別對應圖像庫中的六類語義。

在訓練好的網絡中對每一幅圖像進行語義分類,并根據式(9)、(10)所得結果對每一幅圖像進行語義標注。如圖3所示,一幅圖像分別以隸屬度屬于兩類語義圖像。

對語義日落類檢索結果如圖4所示。

實驗方法日落青山綠水樹木花卉藍天

SVM方法80.5%66.2%67.4%70.5%83.8%81.3%

本文方法87.8%72.5%76.2%80.6%90.4%88.6%

實驗結果分析:模糊神經分類需要大量的訓練樣本才能達到較好的分類效果和很好的泛化能力。本文為了解決訓練樣本不足,采用了留一法[16]來訓練網絡。并在訓練時將訓練與測試交替進行來獲得好的網絡泛化能力。但該方法將花費大量的網絡訓練時間。

4 結束語

文中建立了一個語義圖像檢索模型,利用模糊神經網絡完成圖像的局部低層視覺特征與高層語義特征之間的映射并對圖像進行語義標注。實驗證明,該方法在小型的圖像庫中實驗取得了較好的效果。下一步工作將研究在大型圖像庫上進行語義檢索并提高檢索性能,并希望在低層視覺特征上提取上能結合圖像的形狀特征便于擴充圖像語義的類別數,從而使該語義圖像檢索系統更完善。

本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。

主站蜘蛛池模板: 日韩av无码DVD| 激情综合婷婷丁香五月尤物| 91精品久久久无码中文字幕vr| 免费无码一区二区| 久久人搡人人玩人妻精品| 激情综合婷婷丁香五月尤物 | 在线免费不卡视频| 永久免费无码成人网站| 国产在线专区| 亚洲中文久久精品无玛| 中文字幕在线观| 九色视频一区| 国产打屁股免费区网站| 五月激情综合网| 热这里只有精品国产热门精品| 欧美中文字幕在线视频| 亚洲欧美精品日韩欧美| 久久国产香蕉| 视频一本大道香蕉久在线播放| 中文字幕在线日韩91| 国产精品无码AⅤ在线观看播放| 国产精品美女免费视频大全| 好紧好深好大乳无码中文字幕| 成人午夜久久| 9cao视频精品| 无码免费的亚洲视频| 欧美日韩中文字幕二区三区| 97国产精品视频自在拍| 日韩中文精品亚洲第三区| 噜噜噜综合亚洲| 亚洲欧美自拍中文| 国产农村精品一级毛片视频| 91在线播放免费不卡无毒| 毛片免费在线视频| 波多野吉衣一区二区三区av| 少妇精品在线| 国产AV无码专区亚洲A∨毛片| 无码精品一区二区久久久| 爱做久久久久久| 亚洲国模精品一区| 久久成人18免费| 日本不卡在线| 高h视频在线| 日韩免费毛片视频| 67194亚洲无码| 久久一色本道亚洲| 91精品小视频| 国产精品私拍在线爆乳| 成人福利视频网| 中国黄色一级视频| 久久久久久久97| 国产成人综合欧美精品久久| 久久亚洲欧美综合| 色综合久久无码网| 国产在线自揄拍揄视频网站| 男人天堂伊人网| 国产成人午夜福利免费无码r| 欧美成人午夜在线全部免费| av免费在线观看美女叉开腿| 精品国产免费观看一区| 在线观看网站国产| 看国产一级毛片| 福利在线不卡一区| 国产人人乐人人爱| 久久久噜噜噜| 日韩免费成人| 91丝袜乱伦| 日本午夜精品一本在线观看| 精品伊人久久大香线蕉网站| 亚洲乱码视频| 国产亚洲精品97AA片在线播放| 亚洲国产成人麻豆精品| 久久午夜夜伦鲁鲁片不卡| 伊人天堂网| 最新日本中文字幕| 久久亚洲日本不卡一区二区| 免费观看无遮挡www的小视频| 精品成人一区二区| 91青青在线视频| 视频二区欧美| 久久香蕉欧美精品| 青青草久久伊人|