999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于PowerBuilder環境字符串相似度算法

2017-05-17 12:56:47劉永海
數字技術與應用 2017年3期

劉永海

摘要:最小編輯距離能直接反映兩個字符串的相似程度,而字符串的相似度比較在數據挖掘和數據查詢方面多有應用。通過相似度比對,可更自動化地整理、規范文本,提高信息模糊查詢的命中率。本文詳細介紹了“LD”算法的原理,并完成了PowerBuilder環境下的具體編碼。

關鍵詞:LD算法;字符串相似度;PowerBuilder;源碼

中圖分類號:TP311.52 文獻標識碼:A 文章編號:1007-9416(2017)03-0140-02

引言

在數據挖掘中,經常需要分類整理相似字符串;在模糊檢索、文本智能糾錯等方面也要進行字符串相似度比對。常見的算法包括編輯距離、最長公共子串、RKR-GST等算法。本文介紹了最小編輯距離算法(下稱LD算法)在PowerBuilder環境中的實現。

1 算法分析

最小編輯距離算法最早是由俄羅斯科學家Levenshtein提出,因此也稱“LD”算法。該算法是計算兩個字符串之間,將一個字符串通過替換、插入、刪除等方式轉變為另一個字符串所需要的最少步驟數。如將“青島市衛計委”轉變為“青島衛生局”的編輯距離是3。本文中,字符串S、T的最小編輯距離用表示。(見表1)

編輯距離與最大字符串長度的比值同字符串的相似度成負相關。字符串的相似度定義為。

字符串S,T相似度越高,LD就越小,當完全相同時值最小:,相似度為100%;當完全不同時值最大,

,相似度為0%。因此,。

根據LD的原理,存在如下公式:

公式1:當一個字符串為空時,LD等于不為空字符串的長度,即;

公式2:兩個字符串位置對調不影響LD的值,即

公式3:同時在兩個字符串的“頭”或“尾”部連接相同的字符串,其LD不變,即

設S由組成,T由組成,長度分別為n和m。……

登錄APP查看全文

主站蜘蛛池模板: 国产成+人+综合+亚洲欧美| 亚洲人成网站观看在线观看| 国产九九精品视频| 亚洲伦理一区二区| 亚洲综合片| 亚洲成人网在线观看| 伊人五月丁香综合AⅤ| 亚洲日韩AV无码一区二区三区人 | 日韩久草视频| 久久人人97超碰人人澡爱香蕉| 日韩毛片免费观看| 国产丝袜啪啪| 精品福利视频网| 午夜视频在线观看免费网站 | 最新精品久久精品| 国产精品播放| 亚洲国产成人在线| 日韩在线观看网站| 91系列在线观看| 国产精品无码久久久久久| 亚洲精品无码不卡在线播放| 一级在线毛片| 原味小视频在线www国产| 免费又爽又刺激高潮网址| 99在线观看免费视频| 欧美激情二区三区| 国产精品分类视频分类一区| 国产成人高清在线精品| 亚洲中文字幕精品| 日本AⅤ精品一区二区三区日| 精品免费在线视频| 国产成人91精品| 伊人五月丁香综合AⅤ| 国产欧美另类| 在线观看国产精品第一区免费 | 沈阳少妇高潮在线| 2021最新国产精品网站| 国产不卡国语在线| 亚洲欧美综合另类图片小说区| 色综合天天操| 亚洲精品在线观看91| 人妻中文字幕无码久久一区| 99久久国产综合精品2020| 国产精品所毛片视频| 欧洲精品视频在线观看| 99爱视频精品免视看| 欧美日本在线| 久久精品只有这里有| 国产亚洲欧美日韩在线一区二区三区 | 亚洲国产综合精品一区| 国产美女精品在线| 欧美精品成人一区二区视频一| 全午夜免费一级毛片| 国产乱子伦精品视频| 婷婷色中文| 国产91精品调教在线播放| 高h视频在线| 在线亚洲精品自拍| 伊人久久影视| 国产区网址| 欧美日韩一区二区三| 国产精品污视频| 中文字幕无线码一区| 直接黄91麻豆网站| 国产性生交xxxxx免费| 亚洲第一黄片大全| 国产亚洲精品97在线观看| 91久久大香线蕉| 乱人伦99久久| 又爽又大又黄a级毛片在线视频| 日韩天堂视频| 国产一级视频久久| 无码aaa视频| 91毛片网| 亚洲欧美一区二区三区蜜芽| 美女潮喷出白浆在线观看视频| 日本午夜视频在线观看| 国产亚洲欧美日韩在线一区二区三区| 国内熟女少妇一线天| 又黄又湿又爽的视频| 亚洲av无码人妻| 国产流白浆视频|