999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種知識網(wǎng)絡個性化檢索方法

2023-11-14 13:46:26賈金娜JIAJinna
價值工程 2023年30期
關鍵詞:關聯(lián)規(guī)則文本

賈金娜 JIA Jin-na

(西安工商學院,西安 710032)

0 引言

當前隨著信息化手段的普及和運用,高校在教學過程中不斷產(chǎn)出海量的數(shù)據(jù)和信息,已經(jīng)形成規(guī)?;闹R網(wǎng)絡。網(wǎng)絡中擁有海量的傳統(tǒng)數(shù)據(jù)庫、報表、文檔、多媒體等資源,但普遍存在數(shù)據(jù)分散管理、知識挖掘不足等問題,教職員工和學生針對性檢索能力還比較弱。因此,需要一種針對個性化檢索需求的方法,解決當前檢索效率低下問題。

1 知識網(wǎng)絡中資源之間關系及知識地圖建模

在分析典型高校知識網(wǎng)絡現(xiàn)狀基礎上,系統(tǒng)分析各類知識資源節(jié)點屬性,將其主要關系歸納為組合、聚合、繼承、依賴、屬性關聯(lián)、類別關聯(lián)、推理關聯(lián)、關鍵詞關聯(lián)、目錄關聯(lián)、行為關聯(lián)、自關聯(lián)等,如圖1。例如,組合關系是指知識整體和部分之間的關系,整體和部分不可分割,如學生整體成績與其單科成績之間的關系;行為關聯(lián)關系是指用戶特定行為所涉及的知識資源之間的關聯(lián)關系,如學生搜索“Python 工具”時,往往同時檢索“*.py”,這兩種知識之間存在行為關聯(lián)關系。這些關系是知識網(wǎng)絡中的邊集合(關系集合)ESet={e1,e2,…,em}的具體取值。同時,使用XML Schema 作為中間層,可構建出知識的層次化地圖模型(如圖2),在此模型中:

圖1 知識資源間的主要關系

圖2 層次化知識地圖模型

①資源層,即各種實體,例如各種DB 二維表,doc、mp4 等不同后綴的文件;

②表現(xiàn)層,即基于上述關系的可導航的地圖模型,其中資源即節(jié)點,連接即關系;

③描述層,即實體為數(shù)據(jù)(Data)文件,以XML 描述形成業(yè)務(Business)文件。

2 基于Schema 的知識網(wǎng)絡結構樹建模

將知識網(wǎng)絡形成的結構樹以XML Schema 進行規(guī)范,形成其描述文件KRP-t,后續(xù)檢索可以通過XML 文件中的各類Tag 進行。相關Tag 之間構成具體檢索路徑K-p:①K-p 為: KN1/KN2/…/KNi/KN(i+1)/…/KNn;②KN1、KN2、…、KN(n-1)∈KNSetE(節(jié)點集合),KNn∈KNSetE(邊集合)∪KNSetA(屬性集合),使得KNi 是KN(i+1)的父節(jié)點,則稱KNn 是KN1 的上級,KN1 是KNn 的下級;③將這些點依次連接,即可構成一條從KN1 到KNn 的路徑KR_Path(KN1, KNn)。若KRP-t 中存在一個節(jié)點序列{KR_TSeq:KRN1, KRN2,…, KRNi, KRN(i+1),…, KRNn},使得KRNi是KRN(i+1)的上級,則稱該節(jié)點序列是從KRN1 到KRNn 的標簽序列,記為KR_TS∈KRP-t?;谏鲜龆x,可基于Schema 對其進行檢索,如圖3。

圖3 XML 描述文件解析算法

3 知識地圖層次化檢索建模

將知識檢索按照一般檢索、復雜檢索進行分類。一般檢索類:

①對于簡單檢索項集合SW(S1, S2, …,Sm),如“Title = *.py”、“Subject = python 代碼;管理系統(tǒng)”等,利用Boolean 運算實現(xiàn)。

②對于復雜檢索項,借鑒前期同類研究成果,形成知識網(wǎng)絡中基于知識地圖的層次化檢索模型如圖4 所示。檢索的主要流程包括:

圖4 知識地圖層次化檢索過程

1)對檢索項匯總形成想要集合SW,匯總相應資源形成集合KR_Set;

2)查找到具體的實體資源文件所關聯(lián)的業(yè)務項的描述文件,即可找到其對應的XML Meta-data 文檔,按照簡單檢索模式查找其對應的資源;

3)基于KRP_t_P&R 算法解析XML 文檔,通過遍歷各標簽生成對應XML 文件的標簽樹KR_Tag_Tree,獲取Tage 對之內(nèi)的字符串,構建生成待檢索的文本集合,按照文本匹配等簡單檢索方式對其內(nèi)容進行查找定位;

4)在檢索完所有XML 文件后,形成一個檢索的結構矩陣;

5)對比所有檢索結果之間對應的不同關聯(lián)關系,即可獲得一個按照特定關系形式組合的文件資源對之間的網(wǎng)絡,最后以集合形式進行存儲即完成所有工作。如圖5 所示。

圖5 XML 描述文件中關鍵詞搜索算法

4 基于關聯(lián)規(guī)則的知識排序推薦模型

用戶的直接需求(如以檢索詞、訂閱關鍵詞等形式)和間接需求(來源于知識節(jié)點的潛在關系)決定了知識推薦的表現(xiàn)形式。筆者所提出的知識推薦方法是“以檢索詞檢索+以規(guī)則關聯(lián)”。在不同的檢索需求下,可基于用戶個性化檢索詞進行知識推薦形成知識資源集合,對比整個知識網(wǎng)絡,篩選出相應的知識子網(wǎng)絡?;緦崿F(xiàn)過程為“文件預處理→基于向量空間進行表征→基于改進N-Gram 進行分詞→基于多屬性融合方法選取特征→基于改進Apriori 算法分析關聯(lián)規(guī)則→進行推薦給出結果”。這里重點對其中的文本分詞、特征選擇和關聯(lián)規(guī)則等關鍵步驟進行分析和設計:

①基于預切分改進設計N-Gram 方法。針對Gram 方法中Gram 數(shù)量偏大、部分無實際意義等問題,使用預切分方式對其進行改進,具體步驟是:

1)用StopWordsList 切分文本,形成由不同長度的字串組成的集合U0,將每個詞的詞頻記入詞頻表集合W;

2)將U0按長度2、3、…、k-1 進行分類,形成集合U1、U2、…、U(k-1);

3)對U2中的每個字串直接切分為兩個長度為2 的字串,并將結果合并到集合U1,同時更新相關字串的詞頻;

4)對U3、…、U(k-1)繼續(xù)切分,形成相應的集合并將每個字串的詞頻記入W;

5)將U1、U2、…、U(k-1)取并集得到U,歸并U 中相同字串,更新W 中詞頻;

6)應用“長詞優(yōu)先”的原則對U 中的冗余字串進行消減(即一個短詞含在一個長詞之中,則將其減去),并更新W 中字串的詞頻。

7)輸出特征項集合U 和W。

②基于多屬性融合的文本特征選擇方法。按照相關文獻提出的文檔頻、特征項詞頻、特征項詞性、特征項在文本中位置等多種屬性,按照W(f)=a×Wdf+b×WF+c×WP進行文本特征的選擇。其中:

1)W(f)表示特征項f 的綜合權重。a、b、c 分別表示三個屬性值的權重系數(shù),其取值范圍為(0,1),且滿足a+b+c=1。

2)Wdf為特征項文檔頻屬性值,其值是集合里具有某特征項的文本數(shù)量與總數(shù)n 之比,Wdf∈(0,1)。

3)WF為特征項詞頻屬性值,分詞過程中進行特征項頻率統(tǒng)計,可獲取到不同特征項詞頻,令其取值為Nd,具體特征項的WF=TotalNd/TotalNdmax。

4)WP為特征項詞性屬性值,對文檔中其關鍵作用的名詞、動詞、形容詞、副詞外的其他進行剔除,如某文檔集合中名詞所占比例數(shù)值為Pmax,且在四類詞中占比最高,設P 為某特征詞所屬詞性占比值,則WP=P/Pmax。

③基于改進Apriori 算法的文本關聯(lián)規(guī)則提取方法。將上述集合存儲到關系數(shù)據(jù)庫(或表格文件)之后,對其進行關聯(lián)規(guī)則分析和提取。關聯(lián)規(guī)則的提取主要步驟如下:

1)找出事務庫中所有大于等于最小支持度的頻繁項集。

2)利用頻繁項集生成所有的關聯(lián)規(guī)則,根據(jù)預先設定的最小置信度進行關聯(lián)規(guī)則的取舍,最終得到強關聯(lián)規(guī)則。

④檢索結果推薦按照上述關聯(lián)關系,將指定范圍內(nèi)“item→item”形式的關聯(lián)規(guī)則所對應的文檔進行關聯(lián),自動關聯(lián)到相應類別中,并可由相關用戶需求修訂該類別,為形成知識網(wǎng)絡提供輸入。上述規(guī)則中,按照置信度和最小支持度進行選取,截取長度為N 的序列,形成Top-N 知識規(guī)則,即可直接訪問到這些規(guī)則中后項所對應的知識資源。

5 結語

本文通過對知識網(wǎng)絡中的節(jié)點關系進行分析,構建了包含資源層、表現(xiàn)層和描述層的層次化知識地圖模型,設計了基于XML Schema 的知識結構樹模型及其檢索方法,基于關聯(lián)規(guī)則設計了一種個性化的知識資源網(wǎng)絡檢索方法,為知識網(wǎng)絡信息個性化檢索和推薦奠定了方法基礎。

猜你喜歡
關聯(lián)規(guī)則文本
撐竿跳規(guī)則的制定
“苦”的關聯(lián)
當代陜西(2021年17期)2021-11-06 03:21:36
數(shù)獨的規(guī)則和演變
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
奇趣搭配
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規(guī)則對我國的啟示
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 欧美日韩激情在线| 国产成人资源| 亚洲男人在线天堂| 欧美午夜理伦三级在线观看 | 亚洲一道AV无码午夜福利| 亚洲精品卡2卡3卡4卡5卡区| a毛片免费在线观看| 激情视频综合网| 福利国产在线| 久久久久国色AV免费观看性色| 9966国产精品视频| 亚洲天堂在线视频| av在线人妻熟妇| 波多野结衣一区二区三区AV| 国产精品永久不卡免费视频| 国产成人你懂的在线观看| 国产成人91精品| 福利在线一区| 在线色综合| 天堂中文在线资源| 国产伦片中文免费观看| 午夜欧美在线| 69国产精品视频免费| 国产免费怡红院视频| 欧美成人精品高清在线下载| 少妇被粗大的猛烈进出免费视频| 美女被操黄色视频网站| 欧美精品v| 国产精品三级专区| 91精品啪在线观看国产| 伊人久综合| 欧洲亚洲欧美国产日本高清| 丁香婷婷激情网| 99视频在线免费| 亚洲综合婷婷激情| 高清久久精品亚洲日韩Av| 久久96热在精品国产高清| 国产色伊人| 97视频精品全国免费观看| 国产免费羞羞视频| 极品国产一区二区三区| 九九九国产| 欧美亚洲国产精品第一页| 综合网天天| 精品久久久久久中文字幕女| 欧美日韩动态图| www.亚洲国产| 亚洲精选无码久久久| 久久五月天综合| 国产精品第5页| 欧美a在线看| 亚洲精品777| 国产簧片免费在线播放| 中国一级毛片免费观看| 好紧太爽了视频免费无码| 一本色道久久88| 国产精彩视频在线观看| 国产一区二区三区在线无码| 99热这里只有精品5| 国产日韩欧美在线视频免费观看| 成人综合在线观看| 亚洲综合久久一本伊一区| 99精品国产自在现线观看| 在线精品欧美日韩| 久操线在视频在线观看| 美女视频黄频a免费高清不卡| 久久男人资源站| 色一情一乱一伦一区二区三区小说 | 四虎成人免费毛片| 久久国产成人精品国产成人亚洲| 亚洲欧洲日本在线| 欧美亚洲欧美| 福利片91| 99热这里只有成人精品国产| 亚洲欧洲一区二区三区| 国产jizz| 国产在线小视频| 91成人免费观看在线观看| 国产精品视频久| 日韩a级毛片| 久久这里只有精品66| 国产99精品视频|