999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于貝葉斯網(wǎng)絡(luò)的綜合語義檢索模型

2018-09-26 10:14:36白彥霞
價值工程 2018年25期
關(guān)鍵詞:語義用戶模型

白彥霞

摘要:通過關(guān)鍵詞匹配返回的檢索結(jié)果無法滿足用戶需求。為了解決該問題,提出一種基于貝葉斯網(wǎng)絡(luò)的語義檢索模型,該檢索能夠從語義層面上獲得較高的查準(zhǔn)率,為用戶提供更滿意的檢索結(jié)果。

Abstract: The retrieval results can be returned by keyword matching, which makes the retrieval results can't satisfy user's demand. In order to solve this problem, a semantic retrieval model based on Bayesian network is proposed, which can get high precision from the semantic level,and provide users with more satisfactory retrieval results.

關(guān)鍵詞:貝葉斯網(wǎng)絡(luò);關(guān)鍵詞;語義檢索

Key words: Bayesian network;keyword;semantic retrieval

中圖分類號:TP391.3 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-4311(2018)25-0141-02

0 引言

隨著信息技術(shù)的蓬勃發(fā)展,網(wǎng)絡(luò)資源成指數(shù)級增長,人們已經(jīng)越來越習(xí)慣于在網(wǎng)絡(luò)上檢索自己所需要的各類文檔資源。對于文檔的瀏覽和檢索,傳統(tǒng)的信息檢索技術(shù)只是以關(guān)鍵詞的簡單匹配作為主要手段,語義層面的具體分析無法實現(xiàn)。同時,檢索的文檔信息形式比較單一,未考慮文檔之外的信息關(guān)系,使得檢索效率低下。如果將檢索術(shù)語的同義詞、近義詞、高度相關(guān)詞等考慮進(jìn)來,必然提高查全率和查準(zhǔn)率,因為包含這些詞語的文檔在一定程度上也與用戶的查詢意圖有關(guān)。特別是對于剛剛進(jìn)入某個研究領(lǐng)域的人員,由于知識有限,對相關(guān)知識的認(rèn)識不夠全面,總是希望能從一篇本領(lǐng)域的文檔中找到與之類似的文檔,這些文檔間的近似關(guān)系、關(guān)聯(lián)關(guān)系等就需要在檢索的過程中被考慮進(jìn)來,引導(dǎo)用戶沿著感興趣的文檔找到相似或相關(guān)的文檔,從而幫助用戶快速檢索到目標(biāo)文檔。

貝葉斯網(wǎng)絡(luò)也被稱為信度網(wǎng)絡(luò),具有非常靈活的拓?fù)浣Y(jié)構(gòu),通過節(jié)點來表示術(shù)語之間的條件關(guān)系和語義關(guān)系,為實現(xiàn)語義檢索奠定了基礎(chǔ)。本文以貝葉斯網(wǎng)為基礎(chǔ),結(jié)合簡單貝葉斯網(wǎng)絡(luò)檢索模型關(guān)鍵詞精確匹配的優(yōu)點和兩層節(jié)點的貝葉斯網(wǎng)絡(luò)檢索模型語義擴展的優(yōu)點,提出了一個基于貝葉斯網(wǎng)絡(luò)的綜合語義檢索模型,該模型實現(xiàn)了語義檢索,使信息檢索趨于智能化。

1 模型拓?fù)浣Y(jié)構(gòu)

圖1為基于貝葉斯網(wǎng)絡(luò)的綜合語義檢索模型的拓?fù)浣Y(jié)構(gòu),整個網(wǎng)絡(luò)分為左右兩部分。右側(cè)實線框內(nèi)為簡單貝葉斯網(wǎng)絡(luò)檢索模型,由兩個子網(wǎng)組成:術(shù)語子網(wǎng)和文檔子網(wǎng)。文檔子網(wǎng)由N個文檔節(jié)點構(gòu)成,DSj表示文檔,也表示與其相關(guān)的變量和節(jié)點。左側(cè)虛線框內(nèi)為兩層節(jié)點的貝葉斯網(wǎng)絡(luò)檢索模型,該網(wǎng)絡(luò)是對簡單貝葉斯網(wǎng)絡(luò)檢索模型的擴展,也包括兩個子網(wǎng),其中文檔子網(wǎng)與右側(cè)網(wǎng)絡(luò)中的文檔子網(wǎng)完全一樣,只是文檔用DEj表示,DEj也表示與其相關(guān)的變量和節(jié)點。DSj和DEj是同一個文檔Dj的不同表示。左右兩部分網(wǎng)絡(luò)最大的區(qū)別在于術(shù)語子網(wǎng),在兩層術(shù)語節(jié)點的貝葉斯網(wǎng)絡(luò)中,復(fù)制原始術(shù)語層T中的每個術(shù)語節(jié)點Ti得到術(shù)語節(jié)點T′i,形成一個新術(shù)語層T′,因此兩層節(jié)點的貝葉斯網(wǎng)絡(luò)檢索模型的變量集合 。T′中的術(shù)語變量T′i也是二進(jìn)制的隨機變量,取值集合為 , 和 分別表示“術(shù)語T′i不相關(guān)”、“術(shù)語T′i相關(guān)”。 是N篇文檔組成的集合。

連接兩個術(shù)語層的有向弧的指向:①任意術(shù)語T′i與其本身Ti之間存在由T′i指向Ti的弧;②若術(shù)語Ti與Tj互為同義詞,則存在由T′i指向Tj的弧和由T′j指向Ti的弧。因此,術(shù)語節(jié)點Ti∈T的父節(jié)點集Pa(Ti)合由術(shù)語節(jié)點T′i及Ti的同義詞節(jié)點T′j組成。利用同義詞擴展術(shù)語子網(wǎng),加入模擬術(shù)語節(jié)點間直接關(guān)系的弧,這樣就可以檢索到那些與查詢術(shù)語語義相同或相似的文檔,以此提高檢索性能。

新模型的最下面一層是復(fù)合的文檔層,其中任何一個文檔節(jié)點Dj的父節(jié)點都是由DEj和DSj組成,也就是說通過最終的文檔層將整個網(wǎng)絡(luò)左右兩部分進(jìn)行歸并,進(jìn)一步提高檢索性能。

2 概率分布

在兩層術(shù)語節(jié)點的貝葉斯網(wǎng)絡(luò)檢索中,對于任意根術(shù)語節(jié)點T′i的相關(guān)邊緣概率[1] 定義為 (M表示測試集合中的術(shù)語總數(shù)),不相關(guān)的概率[1]則可以表示為 。已知Ti為任意非根術(shù)語節(jié)點,Pa(Ti)中每個術(shù)語變量取值(相關(guān)或不相關(guān))后的一個組合表示為pa(Ti),則利用一般正則模型的概率函數(shù)[2]可以得到如下表達(dá)式:

其中,vij為權(quán)重,用來反應(yīng)查詢術(shù)語 對術(shù)語Ti的影響力度, 表示只將Pa(Ti)中取值為相關(guān)的術(shù)語的權(quán)重加起來。術(shù)語Ti如果有多個父節(jié)點,權(quán)重vij的定義如(2)式所示:

Ti如果只有一個父節(jié)點T′i,權(quán)重vij=0。公式(2)中 為Ti的父節(jié)點個數(shù),?茁為調(diào)節(jié)權(quán)重影響力度的參數(shù)。該定義可以很好的區(qū)分不同同義詞對查詢術(shù)語的影響力度。

文檔層D中的文檔節(jié)點DSj和DEj的條件概率 和 的計算與簡單貝葉斯網(wǎng)絡(luò)檢索模型中概率計算相同。

3 推理和檢索機制

查詢Q是由用戶所提供的初始查詢,對于簡單貝葉斯網(wǎng)絡(luò)檢索模型,最終計算出每篇文檔DSj與查詢Q的相關(guān)度 [2];對于兩層節(jié)點的貝葉斯網(wǎng)絡(luò)檢索模型,最終計算出每篇文檔DEj與查詢Q 的相關(guān)度 。基于新模型的檢索過程,最終要計算出每篇文檔Dj與查詢Q的相關(guān)度, 由 和 共同決定,即新模型的檢索結(jié)果是對兩層節(jié)點的貝葉斯網(wǎng)絡(luò)檢索模型和簡單貝葉斯網(wǎng)絡(luò)檢索模型的檢索結(jié)果的歸并。

在簡單貝葉斯網(wǎng)絡(luò)檢索模型中,不包含查詢術(shù)語Q的文檔,即使?jié)M足用戶的檢索需求,但是其相關(guān)度 的值一般都非常小,所以這類文檔一般不會提供給用戶;與之相反,包含查詢術(shù)語Q中的部分或全部術(shù)語的文檔,其相關(guān)度 的值一般都比較大,從理論上講一般可以滿足用戶的檢索需求。此外,如果文檔中包含查詢Q的同義詞、近義詞或相關(guān)詞,這類文檔與用戶的檢索需要也具有一定的關(guān)聯(lián)。所以要按照 和 綜合之后的相關(guān)度對文檔排序,將相關(guān)度大于某個值的文檔進(jìn)行遞減排序,最終呈現(xiàn)給用戶。

用戶把查詢Q提交給檢索系統(tǒng)時,檢索過程開始,檢索過程的執(zhí)行過程主要是歸并簡單模型的檢索過程和兩層術(shù)語節(jié)點模型的檢索過程。其相應(yīng)的檢索推理過程如下:

①利用一般正則模型的概率函數(shù)[1]估計兩層術(shù)語節(jié)點的貝葉斯網(wǎng)絡(luò)中術(shù)語層T中任意術(shù)語Ti的后驗概率 :

因為術(shù)語層中的術(shù)語相互邊緣獨立,所以 時,則(3)式中的 ,否則 。注意,對于只有一個父節(jié)點 的術(shù)語Ti而言 ,若 ,由(3)式可得 ,否則 。若術(shù)語Ti有多個父節(jié)點,vij用公式(2)代替,則 為:

公式(4)考慮了Ti的所有父節(jié)點對其產(chǎn)生的影響。

②計算文檔DEj的最終后驗概率 :

③基于以上推理并利用一般正則模型的概率函數(shù)[1]對文檔Dj的最終后驗概率 估計如下:

其中,usj和uEj為衡量文檔DSj和DEj分別在查詢Q作用下對Dj相關(guān)度影響程度的權(quán)重,定義為

④按照文檔相關(guān)度進(jìn)行排序,將相關(guān)度大于某個值的文檔提交給用戶,完成檢索過程。

4 結(jié)束語

語義檢索是未來信息檢索領(lǐng)域的一個發(fā)展趨勢。本文將貝葉斯網(wǎng)絡(luò)和語義相結(jié)合,提出基于貝葉斯網(wǎng)絡(luò)的語義檢索模型,該模型能夠根據(jù)詞語的含義檢索到與用戶需求相關(guān)的文檔,擴大了檢索的范圍,且查全率和查準(zhǔn)率方面都得到了提高,實現(xiàn)了智能語義檢索,檢索性能更加優(yōu)越。

參考文獻(xiàn):

[1]LUIS M. DE CAMPOS, JUAN M. FERNANDEZ-LUNA, JUAN F. HUETE. The BNR model: foundations and performance of a Bayesian network-based retrieval model [J]. International Journal of Approximate Reasoning. 2003, 34(2-3): 265-285.

[2]SILVIA ACID, LUIS M. DE CAMPOS, JUAN M. FERNANDEZ-LUNA, et al. An information retrieval model based on simple Bayesian networks [J]. International Journal of Intelligent Systems. 2003, 18(2): 251-265.

猜你喜歡
語義用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
語言與語義
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
認(rèn)知范疇模糊與語義模糊
主站蜘蛛池模板: 精品欧美日韩国产日漫一区不卡| 亚洲一道AV无码午夜福利| 国产精品美女在线| 日韩欧美国产三级| 免费国产高清精品一区在线| 国产在线麻豆波多野结衣| yjizz视频最新网站在线| 国产微拍一区二区三区四区| 狼友视频国产精品首页| 国产欧美在线观看精品一区污| 久青草国产高清在线视频| 欧美日韩综合网| 国产在线精彩视频二区| 国产一级毛片yw| 看你懂的巨臀中文字幕一区二区| 91综合色区亚洲熟妇p| 国产在线视频欧美亚综合| 中文字幕在线视频免费| 久久国产亚洲偷自| 免费高清毛片| 欧美日韩导航| 国产精品999在线| 亚洲区视频在线观看| 国产区免费| 欧美精品不卡| 精品亚洲国产成人AV| 欧美国产菊爆免费观看| 男女精品视频| 伊人久久大香线蕉综合影视| 在线看免费无码av天堂的| 欧美一级高清片欧美国产欧美| 欧美精品伊人久久| 午夜不卡福利| 国产成人AV综合久久| 91视频精品| 国产在线无码av完整版在线观看| 国产浮力第一页永久地址 | 日韩午夜福利在线观看| 一区二区自拍| 91精品日韩人妻无码久久| 日本在线国产| 五月婷婷丁香综合| 亚洲男女天堂| 波多野结衣的av一区二区三区| 无码视频国产精品一区二区| 国产第二十一页| 日本午夜精品一本在线观看 | 欧美福利在线观看| 国产精品久久久久久久久久98 | 人妻丝袜无码视频| 亚洲黄色片免费看| 欧美日韩国产在线观看一区二区三区| 久无码久无码av无码| 欧洲一区二区三区无码| 91麻豆国产在线| 国产成人免费观看在线视频| 亚洲三级电影在线播放| 国产精品一区二区在线播放| 国产精品无码AV片在线观看播放| 伊人久久久久久久| 女人一级毛片| 国产成人高清精品免费软件| 久久网欧美| 色妞www精品视频一级下载| 亚洲va精品中文字幕| 92精品国产自产在线观看| 青青草91视频| 国产精品亚洲五月天高清| 亚洲国产成人综合精品2020| 天堂va亚洲va欧美va国产| 亚洲国产精品久久久久秋霞影院| 毛片基地视频| 91免费国产在线观看尤物| 在线欧美一区| 亚洲女同欧美在线| 国产乱人伦精品一区二区| 超清无码熟妇人妻AV在线绿巨人| 日韩精品一区二区三区免费| 亚洲 日韩 激情 无码 中出| 欧美午夜视频在线| 美女被狂躁www在线观看| 日韩久草视频|