摘要:為了提高Deep web查詢接口匹配的效率和準(zhǔn)確率,在現(xiàn)有雙重相關(guān)性挖掘方法(DCM)的基礎(chǔ)上提出了一種用關(guān)聯(lián)挖掘和語義聚類來匹配的方法。在關(guān)聯(lián)挖掘成組屬性時(shí),引入一種基于互信息的屬性相關(guān)度標(biāo)準(zhǔn),并采用矩陣來實(shí)現(xiàn)以解決效率不高問題;在生成同義屬性時(shí),提出利用語義網(wǎng)來計(jì)算語義相似度,并對屬性進(jìn)行聚類,以生成同義屬性。通過在四個領(lǐng)域200多個查詢接口上實(shí)驗(yàn),說明改進(jìn)的方法在效率和準(zhǔn)確率方面都比DCM方法有很大提高。
關(guān)鍵詞:Deep web;矩陣關(guān)聯(lián)挖掘;語義聚類;復(fù)雜匹配;語義網(wǎng)
中圖分類號:TP311 文獻(xiàn)標(biāo)志碼:A 文章編號:1001-3695(2009)12-4613-04