999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

位置敏感哈希函數數據結構的概率分析

2016-11-19 06:10:36陸可鏡王洪亞
智能計算機與應用 2016年5期
關鍵詞:用戶研究

陸可鏡 王洪亞

摘要:對于高維空間的近鄰查找問題,位置敏感哈希 (LSH)在查詢代價和磁盤空間利用上有著出色表現。在傳統分析模型下,LSH被視作隨機算法,唯一不確定因素就是哈希函數的選擇。研究中將這種模型下得到的碰撞概率稱為基于哈希函數的碰撞概率。在本文中,我們用不同的分析模型對LSH作了理論分析。此工作的出發點有2個:(1)在現有的分析模型下,用戶為了達到理論的效果,必須對每個查詢點產生隨機的數據結構,這在實際應用中是不現實的。(2)用戶所關心的性能指標是隨機查詢點在一個數據結構上的期望碰撞概率?;诖?,在本篇論文中推導了在漢明距離下,隨機點對在任意單個哈希函數上的碰撞概率。研究將此模型下推導出的碰撞概率稱為基于隨機查詢的碰撞概率。同時也一并證明了在漢明空間中,2種碰撞概率完全相同。

關鍵字:位置敏感哈希函數,碰撞率,算法的概率分析

中圖分類號:TP391. 文獻標識碼:A

The probabilistic analysis of Locality Sensitive Hashing data structures

LU Kejing, WANG Hongya

(College of Computer and Technology, Donghua University, Shanghai 201620, China)

Abstract: Locality Sensitive Hashing (LSH) owns nice asymptotic performance bounds on query cost and space consumption for similarity search problem in high-dimensional spaces. In traditional analysis model, LSH is regarded as a randomized algorithm, where the only source of uncertainty is the random choice of hash functions. The research calls the probability of collision obtained under this model the hash-function-based collision probability. The paper conducts the theoretical analysis of LSH using a different model. The motivations are that (1) in the existing analysis model , for the purpose of achieving the ideal performance ,one has to generate a random data structure for each query, which is obviously unaffordable in practice; (2) the performance metric that practitioners are interested in is the expected success probability of a random query over a single randomly generated data structure. To this end, the paper analytically derives the probability of collision that random pairs of data points collide over any single hash function for hamming distance. So the research calls the probability of collision derived following this model the random-input-based collision probability. Also, the paper proves that these two kinds of collision probabilities are exactly equivalent.

Key word: Locality Sensitive Hashing; the probability of collision; the probabilistic analysis of algorithms Algorithms

0 引言

作為在高維空間中質精效優的近鄰搜索方法,位置敏感哈希(LSH)在許多領域都有著廣泛的應用,包括網絡聚類,計算機視覺,生物計算等等[1-2]。LSH的原理思想就是在不同的度量空間中設計哈希函數,使得距離近的點對的碰撞概率大于距離遠的點對。目前針對多種不同的相似度,已經推出多種哈希函數族,諸如漢明距離, 距離( ),Jaccard相似度,以及Arccos相似度等等。

研究可知,基于LSH的算法一般情況下都會具有穩定的錯誤概率,以及出色的實用性能[3-6],但是全部LSH算法都將依據如下事實為依據:給定一個距離為r的點對,而這一點對在隨機選取的哈希函數上的碰撞概率(記作 )必將隨著r的減小而降低。由此即將 稱為基于哈希函數的碰撞概率。另據研究可知,對于點q的近似近鄰查找,LSH算法可以保證其成功率至少為P。然而由現有的文獻[4,7-9]表明, 的推導中可歸為不確定的唯一因素就是哈希函數的選擇。至此,可給出精確的表述為:給定一個查詢點q,找到q近似最近鄰的概率(隨機選出足夠多的LSH數據結構,數量記為n)將隨著n的趨于無窮大而漸近達到于P。換句話說,如果要獲得理論上的最佳效果,用戶就必須對所有查詢點生成大量的獨立隨機LSH數據結構,而這卻顯然不具備現實可行性。

在實際應用中,基于LSH的算法通常按照如下方式運行展開。首先獨立隨機地產生一組哈希函數,然后利用這組哈希函數,將數據點映射到對應的哈希桶中形成數據結構。對于每一個查詢點,數據結構均將獲得訪問,而后將返回近似近鄰。但是多數情況下,用戶關注的卻是隨機查詢點在單個數據結構上的碰撞概率期望[3,5-6,10],也就是說與上文提及的傳統釋義解析出現了一定不同。在數據庫應用中,哈希函數隨機產生之后,數據結構隨之確定,而數據點的分布對于這個固定的數據結構卻在不斷變化[11]。

綜合上述研究可知,亟需對LSH數據結構演繹另一種概率分析。在這種分析模型下,當隨機選出了哈希函數之后,LSH即可視作一個確定的數據結構。在本篇論文中,針對漢明空間,研究得到了隨機點對在單個哈希函數上碰撞概率(記作 ),同時證明了該結果和傳統模型下得到的 完全相同。

猜你喜歡
用戶研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
主站蜘蛛池模板: 国产在线专区| 亚洲第一区欧美国产综合| 久久综合结合久久狠狠狠97色| 久久精品免费看一| 在线观看国产精品第一区免费| 精品亚洲麻豆1区2区3区| 中文字幕色在线| 国产福利观看| 久久精品亚洲专区| 中文字幕欧美日韩高清| 欧美成人精品一级在线观看| 看看一级毛片| 国产爽妇精品| аv天堂最新中文在线| 综合网久久| 国产中文在线亚洲精品官网| 大陆国产精品视频| 国产精品专区第一页在线观看| 伊人久久大香线蕉成人综合网| 国产乱人免费视频| 日韩久久精品无码aV| 99伊人精品| 青草精品视频| 午夜性刺激在线观看免费| 欧美福利在线| 欧美精品成人一区二区在线观看| 97视频在线精品国自产拍| 伊人大杳蕉中文无码| 国产欧美中文字幕| 国产黄网站在线观看| 自拍亚洲欧美精品| 伊人网址在线| 精品视频一区在线观看| yy6080理论大片一级久久| 久久精品娱乐亚洲领先| 欧洲av毛片| 日日拍夜夜操| 99激情网| 毛片久久网站小视频| 波多野结衣一区二区三区四区 | 99在线观看精品视频| 谁有在线观看日韩亚洲最新视频 | 粉嫩国产白浆在线观看| 99九九成人免费视频精品| 午夜毛片免费观看视频 | 亚洲天堂视频网站| 亚洲精品福利网站| 亚洲一欧洲中文字幕在线| 亚洲精品不卡午夜精品| 成年人久久黄色网站| 久久精品中文字幕免费| 日韩欧美中文字幕一本| 欧美福利在线观看| 欧美福利在线| 真实国产乱子伦视频| 国模粉嫩小泬视频在线观看| 亚洲欧洲日产无码AV| 波多野吉衣一区二区三区av| 福利姬国产精品一区在线| 日韩在线2020专区| 亚洲精品成人片在线观看| 青青草原国产av福利网站| 久草视频中文| 亚洲精品桃花岛av在线| 91麻豆精品视频| 国产精品欧美日本韩免费一区二区三区不卡 | 国产成人精品男人的天堂| 久久综合亚洲鲁鲁九月天| 强乱中文字幕在线播放不卡| 国内精品久久人妻无码大片高| 成人看片欧美一区二区| 国产成人精品一区二区秒拍1o| 99热这里都是国产精品| 欧美成人综合视频| 一本色道久久88亚洲综合| 亚洲Aⅴ无码专区在线观看q| 亚洲人在线| 国产精品视频公开费视频| 99精品这里只有精品高清视频| 久久国产精品77777| 国国产a国产片免费麻豆| 免费国产不卡午夜福在线观看|