999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于誤差加權哈希的圖像檢索方法

2016-04-24 09:05:10宋馥莉
河南科技 2016年17期
關鍵詞:實驗

魯 明 宋馥莉

(河南廣播電視大學,河南 鄭州 450008)

基于誤差加權哈希的圖像檢索方法

魯 明 宋馥莉

(河南廣播電視大學,河南 鄭州 450008)

圖像檢索技術旨在大規模圖像庫中準確、快速地檢索與查詢圖像相似的圖像?;诖耍瑢φ`差加權哈希Error Weighted Hashing(EWH)快速近似最近鄰搜索算法進行分析,并將其與Locality Sensitive Hashing(LSH)局部敏感哈希、Multi-Index Hashing(MIH)多索引哈希進行分析比較,然后基于誤差加權哈希(EWH)算法構建圖像檢索系統,設計分段哈希索引的結構以及該系統所需要實現的功能模塊。

圖像檢索;算法設計;誤差加權哈希

隨著網絡的快速發展與多媒體技術的廣泛應用,互聯網上的圖像數量達到了上千億級并仍在不斷快速增長。圖像是人們廣泛使用的信息載體,因此,如何在大規模的圖像庫中對圖像建立有效檢索機制,實現精確、快速的相似圖像檢索,成為多媒體領域亟待解決的問題。本文設計實現了一種基于誤差加權的哈希圖像檢索方法。

1 誤差加權哈希算法

LSH(Locality Sensitive Hashing)局部敏感哈希算法在最近鄰搜索中是非常杰出的算法,現存的許多方法都是基于LSH算法而提出的[1]。但是,LSH算法存在的問題是,由于對查詢向量的子串在索引表中進行的是精確查找,所以一旦沒有找到與查詢向量子串完全相同的向量,那么該算法就無法將真正的最近鄰列入候選集中。

因為LSH的這一缺陷,Mani Malek Esmaeili等[2]在局部敏感哈希的基礎上提出了誤差加權哈希(Error Weight?ed Hashing,EWH)算法,通過考慮有誤差不完全相同的哈希向量,并且利用這些向量生成更為精確的候選集。與LSH和MIH相似,EWH同樣也需要一個預處理步驟,這一步驟要求先從二進制特征庫中生成索引表,而EWH算法的新穎之處在于其從索引表中檢索候選的方式。

1.1 預處理

為了提高檢索過程的時間效率,首先從二進制向量特征庫中生成一張索引表。該索引表有M行和n列,通過給每一列分配一個隨機秘鑰(共n個)而初始化索引表。每一個隨機秘鑰決定了一個二進制向量中的m個比特位的位置,從而形成了n個子向量中的一個。每一個子向量確定一個完整二進制向量在索引表中的存儲位置,如果二進制向量對應的子向量相同,將存儲在索引表的同一項中。每一列有M個哈希桶,理想情況下,M=2m,但是當m很大時,桶的數量將會很多。這種情況下,需要一個比較符合實際的M值和一個映射函數,將m比特子向量映射為1到M之間的整數。這個整數即為二進制向量的ID需要存放的桶號。

1.2 誤差加權哈希算法

EWH的核心算法的基本思想是:通過把離查詢向量的子串更近的向量賦以更高的分數,最后選取達到一定閾值的向量作為候選集向量。下面具體介紹了該核心算法的過程,如表1所示。

表1 誤差加權哈希(EWH)

對于一個查詢q,該算法初始化給特征庫中所有特征分配相似性分數0。從第一個秘鑰k1開始,從查詢向量q中產生子向量qk1,然后計算整數哈希值h0[=H(qk1)]并分配給第1列,第h0行桶中所有特征相似性分數a0。然后該算法產生m個與qk1相差1比特位的向量,并計算整數哈希值{h1},分配給第1列,第{h1}行m個桶中的所有特征相似性分數a1。該算法繼續產生與qk1相差2比特位的向量,提取哈希值{h2},分配給第1列,第{h2}行的桶中所有特征相似性分數a2。這個過程重復e次,最終每一個特征被賦予一個權重,該權重基于其子向量與查詢特征子向量之間的海明距離的大小。

上述過程對所有查詢向量的子向量分別在索引表中的每一列里重復一遍。每一次產生的哈希值{hr}(0≤r≤e)所指向的索引表中的桶里的所有特征的分數都增加了ar。因此,該算法產生了一個分數列表,每個分數代表了查詢向量與特征庫中向量之間的相似性水平。EWH然后選擇具有較高分數(大于s0)的特征作為候選。然后計算這些候選對應的完整向量與查詢向量之間的海明距離,最后返回查詢的最近鄰。

2 實驗部分

本研究所述方法的實驗使用大小不同的圖像數據集,對誤差加權哈希(EWH)和多索引哈希(MIH)進行對比,來比較2種索引技術的查詢性能實驗。本實驗采用256維的二進制向量,將所有圖像分成不同大小的數據集,分別為10、100、1000、10 000幅和100 000幅圖像,然后對每一個數據集分別進行特征提取,在本實驗中提取的是圖像的ORB特征,每幅圖像提取的特征數最多為100,相當于最終形成一個二進制向量的集合。查詢集是執行查詢時使用的向量,本實驗在每一個數據集中分別選擇圖像組成每個數據集對應的查詢集,然后對每幅查詢圖像提取其圖像的ORB特征,也就是對二進制向量在二進制向量的數據集合中進行檢索。每次實驗的結果相似,從這些實驗數據來驗證分析所提出的方法的有效性,這里由于篇幅有限,下面只給出其中一次的實驗結果。

實驗采用的是64位Windows,實驗的運行環境是In?tel i3-3240(3.40GHZ)、2GB內存。在此對本文采用的誤差加權哈希算法(EWH)而構建的圖像檢索系統和基于多索引哈希(MIH)的圖像檢索系統的性能進行比較,為每一組數據建立索引結構,設置查詢的最近鄰數量為100,然后計算查詢精度和速度,比較二者的精度和查詢速度。

2.1 EWH和MIH的精度比較

精度是判斷索引優劣的一個重要準則。本實驗以精確的線性查詢作為基準來衡量算法的精度,結果如圖1所示,對從10、102、103、104和105的不同規模的數據集分別進行實驗分析,比較誤差加權哈希(EWH)和多索引哈希(MIH)的精度。

結果表明,在e取值為5的前提下,誤差加權哈希(EWH)的檢索精度在10、102、103、104、105的不同規模的圖像數據集下比多索引哈希(MIH)的檢索精度都略高。

圖1 不同數據集下EWH和MIH精度比較

2.2 EWH和MIH的速度比較

運行時間是判斷索引優劣的關鍵。下面將進行誤差加權哈希算法(EWH)和多索引哈希算法(MIH)的查詢時間的實驗比較,在圖像數據集為10、102、103、104、105幅圖像時分別進行實驗。

實驗結果如圖2所示,由此可以看出隨著數據集的增大,查詢時間都在增加,但是誤差加權哈希算法(EWH)的查詢時間增加更快;在數據集為10、102、103時,誤差加權哈希算法(EWH)和多索引哈希算法(MIH)對一幅圖像進行查詢的運行時間非常接近;但是,在數據集為104、105幅圖像時,誤差加權哈希算法(EWH)對一幅圖像進行查詢的時間要明顯長于多索引哈希算法(MIH)的查詢時間。

圖2 不同數據集下EWH和MIH查詢時間比較

2.3 結果分析

由上述實驗結果可以看出,當e取值為5時,誤差加權哈希(EWH)能夠實現精度更高的最近鄰查詢。但是,在數據集很大時,誤差加權哈希(EWH)對一幅圖像的查詢時間更長。誤差加權哈希(EWH)和多索引哈希(MIH)在本質上都是通過不斷增加海明距離來進行最近鄰查詢的,但是誤差加權哈希(EWH)增加了根據海明距離大小賦值分數的過程,對所有特征的分數遍歷來篩選分數大于某一閾值的候選集的過程。

3 結論

本文介紹的是基于誤差加權哈希索引技術的圖像檢索系統的相關算法,可以應用于生物認證、內容檢索和數字版權管理相關領域。同時,影響大規模圖像檢索技術的關鍵是高效索引結構的選取,索引結構的優劣直接影響在線圖像檢索的實時性。

對圖像檢索的研究已在不斷發展,但當前的索引技術仍面臨著兩大問題,即高維數據引起的查詢性能下降和大規模數據導致的內存空間資源不足[3,4]。目前,已有的研究還無法有效地解決這兩大問題。因此,如何組織大規模數據并進行準確快速的相似性查詢,是當前信息內容安全領域研究的熱點與難點。

[1]梁俊杰.大規模圖像庫的高維索引技術研究[D].武漢:華中科技大學,2007.

[2]盧佳音.基于圖像哈希檢索的圖像重排方法研究[D].大連:大連理工大學,2013.

[3]Zhou W,Lu Y,Li H,et al.Spatial coding for large scale partial-duplicate web image search[A]//International Conference on Multimedea,2010:511-520.

[4]Xie H,Gao K,Zhang Y,et al.Efficient Feature Detection and Effective Post-Verification for Large Scale Near-Duplicate Im?age Search[J].IEEE Transactions on Multimedia,2011(6):1319-1332.

Image Retrieval Method Based on Error Weighted Hash

Lu Ming Song Fuli
(Henan Radio and Television University,Zhengzhou Henan 450008)

The goal of image retrieval technology is to find accurately and quickly the similar images in massive im?age database.Based on this,fast approximate nearest neighbor search algorithm for Weighted Hashing Error(EWH) was analyzed,and compared it with Locality Sensitive Hashing(LSH)and Multi-Index Hashing(MIH)algorithm, then the image retrieval system was constructed based on Error Weighted Hashing(EWH),the structure of the block hash index and the function modules that the system needs to implement were designed.

image retrieval;algorithm design;EWH

TP311

A

1003-5168(2016)09-0056-03

2016-08-11

河南省教育廳科學技術研究重點項目(14A520084);河南省科技廳科技攻關課題(152102310325);河南省教育廳人文社科研究重點項目(2017-ZZJH-112)。

魯明(1977-),男,碩士,講師,研究方向:計算機應用技術和教育信息化研究。

猜你喜歡
實驗
我做了一項小實驗
記住“三個字”,寫好小實驗
我做了一項小實驗
我做了一項小實驗
記一次有趣的實驗
有趣的實驗
小主人報(2022年4期)2022-08-09 08:52:06
微型實驗里看“燃燒”
做個怪怪長實驗
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
主站蜘蛛池模板: 影音先锋丝袜制服| 暴力调教一区二区三区| 国产亚洲欧美日韩在线一区二区三区| 亚洲欧美成人影院| 亚洲精品无码人妻无码| 成人国产一区二区三区| 精品少妇人妻av无码久久| 国产电话自拍伊人| 成年人视频一区二区| 另类综合视频| 久久国产黑丝袜视频| 亚洲无码不卡网| 日本不卡视频在线| 免费观看欧美性一级| 无码久看视频| 久久超级碰| 在线永久免费观看的毛片| 91免费国产高清观看| 国产午夜精品鲁丝片| 漂亮人妻被中出中文字幕久久| 亚洲三级片在线看| 日本成人不卡视频| 久久青草免费91线频观看不卡| 狼友视频国产精品首页| 一级毛片在线免费视频| 中文字幕无线码一区| 欧美亚洲欧美| 国产精女同一区二区三区久| 四虎影视国产精品| 国产丝袜无码精品| 亚洲精品无码AV电影在线播放| 国产欧美视频综合二区| 国产精品无码AV中文| 精品伊人久久久大香线蕉欧美| 97se亚洲| 久草视频精品| 日韩AV无码免费一二三区 | 2019年国产精品自拍不卡| 欧美综合成人| 在线欧美日韩国产| 国产精品手机在线播放| 亚洲精品无码专区在线观看| 国产第二十一页| 久久亚洲黄色视频| 国产成人免费| 精品久久久久久成人AV| 成人噜噜噜视频在线观看| 亚洲AV无码一二区三区在线播放| 成人日韩欧美| 啪啪国产视频| 国产精品综合色区在线观看| 国产精品无码翘臀在线看纯欲| 97人人模人人爽人人喊小说| 久久亚洲高清国产| 日韩高清无码免费| 91亚瑟视频| 中文字幕久久亚洲一区 | 高潮爽到爆的喷水女主播视频| 谁有在线观看日韩亚洲最新视频 | 91久久偷偷做嫩草影院电| 欧美性色综合网| 精品亚洲麻豆1区2区3区| 精品综合久久久久久97超人| 日韩欧美国产成人| 九色视频最新网址 | 国内精品视频| 中文字幕第4页| 日韩精品高清自在线| 成人午夜久久| 国产精品成人观看视频国产| 精品第一国产综合精品Aⅴ| 日韩av高清无码一区二区三区| 免费中文字幕在在线不卡| 天天激情综合| 亚洲第一页在线观看| 久久www视频| 久久99热这里只有精品免费看| 人妻精品久久无码区| 亚洲第一天堂无码专区| 久久99热这里只有精品免费看| 亚洲国产成熟视频在线多多| 91小视频在线观看|