999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

構(gòu)建基于文獻(xiàn)信息網(wǎng)絡(luò)的知識(shí)發(fā)現(xiàn)系統(tǒng)應(yīng)用模型的設(shè)想

2016-03-22 05:40:34,,,,
關(guān)鍵詞:關(guān)聯(lián)語(yǔ)義

,,,,

文獻(xiàn)的海量增長(zhǎng)使知識(shí)發(fā)現(xiàn)和有效利用愈發(fā)困難,基于文獻(xiàn)進(jìn)行知識(shí)發(fā)現(xiàn),是未來(lái)文獻(xiàn)服務(wù)的重要方向。傳統(tǒng)的文獻(xiàn)檢索平臺(tái)能夠幫助用戶(hù)快速查找與定位目標(biāo)文獻(xiàn),但檢索到的候選文獻(xiàn)數(shù)量依然龐大。要從大量的候選文獻(xiàn)集中獲得有效的知識(shí),仍然需要經(jīng)過(guò)人工的閱讀分析,費(fèi)時(shí)費(fèi)力甚至難以實(shí)現(xiàn)。文獻(xiàn)蘊(yùn)含的知識(shí)并不是孤立存在的,它們之間存在千絲萬(wàn)縷的聯(lián)系,既包括人們可利用數(shù)據(jù)庫(kù)檢索到的顯性聯(lián)系,如文獻(xiàn)直接報(bào)道的生物分子關(guān)系[1]、互相引用的文獻(xiàn)之間主題內(nèi)容上的相關(guān)性[2],也包括常規(guī)的數(shù)據(jù)庫(kù)檢索不出的隱性聯(lián)系,如很多文獻(xiàn)雖互不引用但卻存在對(duì)相同問(wèn)題的闡述。這種文獻(xiàn)中的隱性關(guān)聯(lián)的挖掘比信息本身的增長(zhǎng)更有意義。

基于文獻(xiàn)的知識(shí)發(fā)現(xiàn)研究是通過(guò)潛在的關(guān)聯(lián)挖掘來(lái)推斷出新的科學(xué)假設(shè)[3]。本文主要探討關(guān)聯(lián)知識(shí)的圖結(jié)構(gòu)組織對(duì)文獻(xiàn)知識(shí)發(fā)現(xiàn)的作用,并建立文獻(xiàn)信息網(wǎng)絡(luò)的知識(shí)發(fā)現(xiàn)系統(tǒng)應(yīng)用模型。

1 基于復(fù)雜網(wǎng)絡(luò)的文獻(xiàn)知識(shí)發(fā)現(xiàn)

基于文獻(xiàn)的知識(shí)發(fā)現(xiàn)理論(Literature-based Discovery,LBD)是由Swanson教授最早提出的。其基本原理是如果有兩類(lèi)文獻(xiàn)集As和Cs,其中As主要討論了概念A(yù)和概念集B之間的關(guān)系,而Cs則討論了概念C和概念集B之間的關(guān)系,但是沒(méi)有任何文獻(xiàn)直接討論概念A(yù)和概念C的關(guān)系,那么A與C之間通過(guò)共同的橋梁B,隱含地存在某種關(guān)系,這是一個(gè)新的科學(xué)發(fā)現(xiàn)[4]。在Swanson關(guān)于雷諾氏病和食用魚(yú)油的假設(shè)中,A代表食用魚(yú)油,B代表血液和循環(huán)系統(tǒng)的一系列變化,即血液粘稠的降低、血小板聚集的降低及血管收縮的減少,C代表雷諾氏病,未知的外部循環(huán)混亂。由已知文獻(xiàn)可得出兩個(gè)結(jié)論:一是食用魚(yú)油可以引起特定的血管變化,即A引起B(yǎng)(A,B);二是同樣的血管變化可改善雷諾氏病,即B引起C(B,C),由ABC模式得出假設(shè):A引起C,即雷諾氏病與魚(yú)油之間有一定聯(lián)系,食用魚(yú)油可能對(duì)雷諾氏病有治療作用[5]。

大量文獻(xiàn)集聚會(huì)使研究?jī)?nèi)容的相關(guān)性呈現(xiàn)出一個(gè)關(guān)聯(lián)知識(shí)網(wǎng)絡(luò),如果將文獻(xiàn)集轉(zhuǎn)化為基于網(wǎng)絡(luò)模型存儲(chǔ)管理的結(jié)構(gòu)化知識(shí)庫(kù),可以進(jìn)一步通過(guò)知識(shí)網(wǎng)絡(luò)進(jìn)行關(guān)聯(lián)挖掘,提高知識(shí)發(fā)現(xiàn)的效率。如通過(guò)對(duì)文獻(xiàn)中關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)的研究,可以幫助我們總結(jié)出當(dāng)前的研究熱點(diǎn)、分析科研結(jié)構(gòu)、發(fā)現(xiàn)研究?jī)?nèi)容的相關(guān)性等[6-7]。還有一些工作開(kāi)始從系統(tǒng)層面上考察信息間的整合分析,通過(guò)多領(lǐng)域多數(shù)據(jù)源交叉融合,發(fā)現(xiàn)間接的隱含聯(lián)系[8]。此外,文獻(xiàn)[9]報(bào)道了利用文獻(xiàn)衍生的生物醫(yī)學(xué)實(shí)體關(guān)聯(lián)網(wǎng)絡(luò)進(jìn)行科學(xué)研究結(jié)構(gòu)與相關(guān)性的挖掘分析,研究主題和研究?jī)?nèi)容之間關(guān)聯(lián)的緊密程度非常高。在同一個(gè)大的研究領(lǐng)域中,從一個(gè)研究對(duì)象可以很快轉(zhuǎn)移到另外一個(gè)研究對(duì)象,兩者結(jié)合很容易形成新的研究?jī)?nèi)容,從而促使不同領(lǐng)域研究對(duì)象之間可以相互借鑒,使科研人員獲得好的科研思路,這也從網(wǎng)絡(luò)的角度驗(yàn)證了基于文獻(xiàn)的知識(shí)發(fā)現(xiàn)的思想。

早期基于文獻(xiàn)的知識(shí)發(fā)現(xiàn)方法涉及大量的人工對(duì)文本的統(tǒng)計(jì)分析操作,文本分析的數(shù)據(jù)集多控制在文獻(xiàn)的標(biāo)題。隨著文本挖掘技術(shù)的快速發(fā)展,基于文本挖掘方法的文獻(xiàn)知識(shí)發(fā)現(xiàn)研究在科學(xué)發(fā)現(xiàn)中得到了越來(lái)越廣泛的應(yīng)用。然而,基于文獻(xiàn)的知識(shí)發(fā)現(xiàn)過(guò)程實(shí)際上是一個(gè)啟發(fā)式的過(guò)程,獲得的潛在關(guān)聯(lián)知識(shí)需要進(jìn)一步確證的假設(shè),不同種類(lèi)、不同相關(guān)程度的關(guān)聯(lián)都可能是激發(fā)新假設(shè)的有用知識(shí),于是對(duì)文獻(xiàn)蘊(yùn)含的各種關(guān)聯(lián)知識(shí)的便捷導(dǎo)航訪(fǎng)問(wèn)便顯得至關(guān)重要。因此,基于復(fù)雜網(wǎng)絡(luò)模型整合大量文獻(xiàn)數(shù)據(jù),將文獻(xiàn)集轉(zhuǎn)化為基于網(wǎng)絡(luò)模型存儲(chǔ)管理的結(jié)構(gòu)化知識(shí)庫(kù),對(duì)獲取新的知識(shí)具有重要意義。這不僅是一種可行的方法,而且具有更強(qiáng)的操作性。

2 文獻(xiàn)的信息網(wǎng)絡(luò)建模

2.1 文本處理

非結(jié)構(gòu)化的文獻(xiàn)必須利用自然語(yǔ)言處理技術(shù)對(duì)其進(jìn)行文本處理,將非結(jié)構(gòu)化的文本轉(zhuǎn)化為結(jié)構(gòu)化的數(shù)據(jù)集,以便后續(xù)進(jìn)行深入的數(shù)據(jù)挖掘。結(jié)構(gòu)化處理的核心是提取文獻(xiàn)中能用于關(guān)聯(lián)發(fā)現(xiàn)的知識(shí)單元,在自然語(yǔ)言文本中最有用的莫過(guò)于有意義的名詞或名詞短語(yǔ)。一般來(lái)說(shuō),生物醫(yī)學(xué)文獻(xiàn)中最有價(jià)值的是各種描述生物醫(yī)學(xué)領(lǐng)域的專(zhuān)業(yè)術(shù)語(yǔ),即生物概念或?qū)嶓w。因此,在生物醫(yī)學(xué)文獻(xiàn)挖掘領(lǐng)域,絕大多數(shù)文獻(xiàn)挖掘工作的一個(gè)必不可少的步驟就是從文獻(xiàn)中識(shí)別出感興趣的命名概念或?qū)嶓w,即從文獻(xiàn)中獲得生物醫(yī)學(xué)工作者所感興趣的專(zhuān)業(yè)實(shí)例和術(shù)語(yǔ),包括基因、蛋白質(zhì)、細(xì)胞、化合物和藥物等。文本處理的基本過(guò)程主要包括分詞、詞性標(biāo)注、短語(yǔ)識(shí)別、停用詞去除、詞干提取和命名實(shí)體識(shí)別等(圖1)。

圖1 文本處理的基本步驟

分詞:將句子還原為單詞序列。其目的是識(shí)別文本數(shù)據(jù)中的句子和單詞邊界,為詞性標(biāo)注和實(shí)體識(shí)別提供統(tǒng)一的輸入數(shù)據(jù)。

詞性標(biāo)注:將文本分成單詞之后,需要再對(duì)單詞的特征進(jìn)行分析,確定每個(gè)單詞的詞性。詞性用來(lái)描述一個(gè)詞在上下文中的作用,例如描述概念的名詞、下文中引用名詞的代詞等。詞性標(biāo)注就是為給定句子中的每個(gè)詞賦予正確的詞性標(biāo)記。

短語(yǔ)識(shí)別:識(shí)別出句子中多個(gè)單詞組成的有意義的短語(yǔ)單元。短語(yǔ)識(shí)別可以借助于自然語(yǔ)言處理中的句法分析技術(shù),也可以借助于概率統(tǒng)計(jì)的方法。如兩個(gè)單詞經(jīng)常共同出現(xiàn),兩者很可能是一個(gè)短語(yǔ)。

停用詞去除:停用詞是指在文檔中出現(xiàn)次數(shù)很多而本身沒(méi)有實(shí)際意義的詞, 例如英文中的大部分介詞、冠詞等。通常需要針對(duì)特定領(lǐng)域文獻(xiàn)集的特點(diǎn),制定一部分相應(yīng)的規(guī)則,人工建立一個(gè)停用詞表對(duì)候選詞進(jìn)行過(guò)濾。

詞干提取:是去除詞綴得到詞根的過(guò)程,包括詞干化與詞形還原兩種方法。前者是通過(guò)一定的規(guī)則提取詞干,后者是通過(guò)完全的形態(tài)分析并借助詞典得到詞的精確詞形。

命名實(shí)體識(shí)別:命名實(shí)體是一種標(biāo)識(shí)了某個(gè)概念或?qū)嶓w的短語(yǔ),如專(zhuān)有名詞、人名、地名等。命名實(shí)體識(shí)別主要是提取短語(yǔ)并識(shí)別后得到名稱(chēng)短語(yǔ)。

直接利用自然語(yǔ)言處理的方法,從文獻(xiàn)中提取以名詞短語(yǔ)為基礎(chǔ)的概念實(shí)體,不針對(duì)特定的生物醫(yī)學(xué)實(shí)體,不但能提取到文獻(xiàn)關(guān)鍵詞,而且可以盡可能地收集到文獻(xiàn)中出現(xiàn)的實(shí)體,以滿(mǎn)足通用性和覆蓋率的要求。

2.2 信息網(wǎng)絡(luò)構(gòu)建

通常一個(gè)簡(jiǎn)單的無(wú)向無(wú)權(quán)網(wǎng)絡(luò),可記為G=(V,E),其中集合 V 稱(chēng)為節(jié)點(diǎn)集,V={v1,v2,…,vn},集合E稱(chēng)為邊集,E={e1,e2,…,em},任意一條邊對(duì)應(yīng)一個(gè)節(jié)點(diǎn)的二元組:ex=(vi,vj),E是V ×V的一個(gè)子集。對(duì)于用節(jié)點(diǎn)和邊描述的圖,可以用節(jié)點(diǎn)的度、連通性與路徑等幾個(gè)定量指標(biāo)來(lái)描述圖的性質(zhì)。

節(jié)點(diǎn)的度:節(jié)點(diǎn)V在圖G的度是指圖G中與節(jié)點(diǎn)V連接的邊數(shù),記為d(v)或k(v)。節(jié)點(diǎn)的度主要用于描述節(jié)點(diǎn)的連通性。

連通性:若G中每對(duì)不同節(jié)點(diǎn)u,v之間都至少存在一條通路,則稱(chēng)G是連通的,即G為連通圖。

路徑:圖的路徑是指連接兩個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)與邊交替出現(xiàn)的序列,且所有節(jié)點(diǎn)與邊都不相同。路徑長(zhǎng)度是連接兩個(gè)節(jié)點(diǎn)之間的邊的數(shù)量,網(wǎng)絡(luò)距離可以通過(guò)路徑長(zhǎng)度來(lái)描述,通常用最短路徑作為連接兩個(gè)節(jié)點(diǎn)的路徑。

信息網(wǎng)絡(luò)是將文獻(xiàn)集中的內(nèi)容相關(guān)性轉(zhuǎn)化為基于關(guān)聯(lián)信息存在的圖結(jié)構(gòu)數(shù)據(jù)模型,根據(jù)文獻(xiàn)中的語(yǔ)義單元即概念實(shí)體及其關(guān)聯(lián)信息,對(duì)文獻(xiàn)中所蘊(yùn)含的知識(shí)進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)化。信息網(wǎng)絡(luò)的構(gòu)建分概念實(shí)體及其關(guān)聯(lián)的抽取和實(shí)體、關(guān)聯(lián)及內(nèi)容鏈接的結(jié)構(gòu)化管理兩個(gè)步驟。在文獻(xiàn)信息網(wǎng)絡(luò)G=(V,G)中,節(jié)點(diǎn)集V是各種從生物醫(yī)學(xué)文獻(xiàn)中提取出的實(shí)體的集合,如基因、蛋白質(zhì)、化合物或疾病等;邊集E 是實(shí)體之間的關(guān)聯(lián)集合,且邊是無(wú)向加權(quán)的,邊的權(quán)值對(duì)應(yīng)于兩實(shí)體共現(xiàn)的次數(shù)。

2.2.1 關(guān)聯(lián)信息的提取

目前已有多種實(shí)體及其關(guān)系提取的方法。在生物醫(yī)學(xué)文獻(xiàn)挖掘研究中,常用共現(xiàn)的方法來(lái)提取實(shí)體的關(guān)聯(lián),認(rèn)為當(dāng)兩個(gè)詞語(yǔ)共現(xiàn)于一定的語(yǔ)境中時(shí),詞語(yǔ)之間可能存在一定的語(yǔ)義相關(guān)性[10]。通過(guò)關(guān)系抽取技術(shù),從非結(jié)構(gòu)化的自然語(yǔ)言文本中抽取出格式統(tǒng)一的關(guān)系數(shù)據(jù),能夠建立多個(gè)實(shí)體之間廣泛的信息關(guān)聯(lián)。以基于句子共現(xiàn)的實(shí)體關(guān)聯(lián)提取為例,其基本步驟如下:根據(jù)基于自然語(yǔ)言的方法識(shí)別出句子的實(shí)體NP及其位置。如果在同一個(gè)句子中得到的實(shí)體按其在句子中的順序依次為NP1、NP2、NP3,則得到關(guān)聯(lián):(NP1,NP2),(NP1,NP3),(NP2,NP3)。

例如,文獻(xiàn)標(biāo)題(PMID:20856896):β1-syntrophin modulation by miR-222 in mdx mice,提取得到實(shí)體及其位置的列表為[(β1-syntrophin modulation,1)、(miR-222, 4),(mdx mouse,6)],進(jìn)一步得到關(guān)聯(lián):(β1-syntrophin modulation,miR-222)、(β1-syntrophin modulation,mdx mouse)、(miR-222,mdx mouse)。

2.2.2 實(shí)體、關(guān)聯(lián)及內(nèi)容鏈接的圖結(jié)構(gòu)管理

圖G中每個(gè)節(jié)點(diǎn)包含有屬性,數(shù)據(jù)記錄在節(jié)點(diǎn)都包括的屬性里面,由節(jié)點(diǎn)組成的關(guān)系可以擁有自己的屬性,關(guān)系相關(guān)的數(shù)據(jù)記錄在其包括的屬性里面。如圖2所示,針對(duì)建立起的關(guān)聯(lián)信息網(wǎng)絡(luò),可以利用遍歷算法對(duì)圖進(jìn)行導(dǎo)航訪(fǎng)問(wèn),遍歷節(jié)點(diǎn)與關(guān)系,每一次遍歷操作通過(guò)具體的路徑識(shí)別算法實(shí)現(xiàn),根據(jù)路徑有序地排列節(jié)點(diǎn)。同時(shí),可以分別為節(jié)點(diǎn)、關(guān)系與屬性分別建立映射,分配獨(dú)立的索引標(biāo)識(shí),并基于屬性快速查詢(xún)節(jié)點(diǎn)與關(guān)系,快速獲取節(jié)點(diǎn)與關(guān)系的屬性中記錄的數(shù)據(jù),然后將文獻(xiàn)集轉(zhuǎn)化為句子集,每個(gè)關(guān)聯(lián)能夠鏈接到句子,句子又能夠鏈接到摘要或原文,便于回溯文獻(xiàn)并加以分析,進(jìn)一步確定關(guān)聯(lián)的語(yǔ)義信息。

圖2 信息網(wǎng)絡(luò)的存儲(chǔ)結(jié)構(gòu)

3 基于信息網(wǎng)絡(luò)的知識(shí)發(fā)現(xiàn)的應(yīng)用

3.1 特異性關(guān)聯(lián)的發(fā)現(xiàn)

特異性關(guān)聯(lián)的發(fā)現(xiàn)是指通過(guò)對(duì)語(yǔ)義相關(guān)性的計(jì)算去搜索與置優(yōu)特異性關(guān)聯(lián),以便更好地獲得用戶(hù)感興趣并能激發(fā)科學(xué)假設(shè)的關(guān)聯(lián)。特異性關(guān)聯(lián)主要包括強(qiáng)關(guān)聯(lián)與弱關(guān)聯(lián),強(qiáng)關(guān)聯(lián)是指頻繁共現(xiàn)的關(guān)聯(lián),弱關(guān)聯(lián)是指共現(xiàn)次數(shù)很少的關(guān)聯(lián)。傳統(tǒng)文獻(xiàn)檢索強(qiáng)調(diào)獲得強(qiáng)相關(guān)的內(nèi)容,容易忽略那些可激發(fā)新科學(xué)假設(shè)的弱關(guān)聯(lián),而從這些弱關(guān)聯(lián)中可能更容易獲得新知識(shí)。信息網(wǎng)絡(luò)中節(jié)點(diǎn)與節(jié)點(diǎn)之間的關(guān)聯(lián)都給定了相應(yīng)權(quán)重W,特異性關(guān)聯(lián)的核心任務(wù)是如何快速獲取給定節(jié)點(diǎn)的關(guān)聯(lián)。如圖3所示,給定X,可以方便地提取其關(guān)聯(lián)的節(jié)點(diǎn)Y;通過(guò)對(duì)候選關(guān)聯(lián)集按權(quán)重Wi(1≦i≦n)排序,可以根據(jù)不同需求去篩選強(qiáng)弱關(guān)聯(lián)。

圖3 特異性關(guān)聯(lián)的發(fā)現(xiàn)

3.2 間接關(guān)聯(lián)的推斷

基于文獻(xiàn)的知識(shí)發(fā)現(xiàn)的核心是通過(guò)ABC模型來(lái)挖掘概念間的間接關(guān)系,即當(dāng)不相關(guān)的實(shí)體A與C同時(shí)與實(shí)體B相關(guān)時(shí),A與C也可能通過(guò)實(shí)體B形成間接關(guān)系,三者構(gòu)成一條A-B-C關(guān)系鏈。因此,必須明確A、B、C三個(gè)元素才可以獲得一條有用的關(guān)聯(lián)知識(shí)發(fā)現(xiàn)鏈。B的出現(xiàn)為科研人員提供有益的啟發(fā)和關(guān)鍵性的引導(dǎo),顯著增強(qiáng)了目的性和方向性,幫助專(zhuān)業(yè)研究人員認(rèn)識(shí)和發(fā)現(xiàn)潛在有用的知識(shí)片斷間的關(guān)聯(lián),進(jìn)一步證實(shí)科學(xué)假設(shè)的可行性。如圖4所示,給定任意節(jié)點(diǎn)B,以B為支點(diǎn)或起點(diǎn),可以獲取間接關(guān)聯(lián)A-B-C與B-C-D,即AC之間與BD之間都可能形成新的科學(xué)假設(shè)。

圖4 間接關(guān)聯(lián)的推斷

3.3 通路知識(shí)的抽取

關(guān)聯(lián)網(wǎng)絡(luò)把文獻(xiàn)庫(kù)中的知識(shí)以網(wǎng)絡(luò)形式表示,既顯示出知識(shí)之間的聯(lián)系,也過(guò)濾了冗余知識(shí)而以最簡(jiǎn)化的形式表示,這就方便研究人員發(fā)現(xiàn)未直接報(bào)道的對(duì)象間的隱含關(guān)系。建立關(guān)聯(lián)網(wǎng)絡(luò)中任意兩個(gè)節(jié)點(diǎn)間的關(guān)聯(lián),能夠計(jì)算兩個(gè)節(jié)點(diǎn)之間的語(yǔ)義相關(guān)性,從而輔助科研人員篩選出有用的通路知識(shí),即應(yīng)該按照怎樣的路徑建立它們之間的關(guān)聯(lián)。實(shí)際上是哪些語(yǔ)義關(guān)系可以發(fā)生關(guān)聯(lián),即哪些語(yǔ)義關(guān)系可以進(jìn)行運(yùn)算(圖5)。

圖5 通路知識(shí)的抽取

通路知識(shí)的抽取是指在實(shí)體關(guān)聯(lián)網(wǎng)絡(luò)中指定概念實(shí)體A與C,提取連接它們的一系列關(guān)鍵詞構(gòu)成的最短路徑。最短路徑是衡量連貫性和凝聚力的重要指標(biāo), 兩個(gè)對(duì)象節(jié)點(diǎn)距離越短, 對(duì)象之間的聯(lián)系越密切, 存在語(yǔ)義關(guān)聯(lián)并可能形成科學(xué)假設(shè)的可能性越大。因此,我們將兩個(gè)概念實(shí)體A與C之間的通路知識(shí)發(fā)現(xiàn)的問(wèn)題等價(jià)于在關(guān)聯(lián)網(wǎng)絡(luò)中的最短路徑搜索問(wèn)題。如圖5所示,給定任意A和C,提取它們之間的最短路徑A-(B1…Bn)-C,計(jì)算每條路徑的語(yǔ)義相關(guān)性,對(duì)結(jié)果集進(jìn)行排序。顯然,當(dāng)A與C之間的距離為2時(shí),即等價(jià)于間接關(guān)系的提取,獲得ABC模型。

4 總結(jié)與討論

關(guān)聯(lián)信息是文獻(xiàn)保存的重要科學(xué)知識(shí),如一個(gè)基因相關(guān)的疾病有哪些,換句話(huà)說(shuō),就是如何找到已有文獻(xiàn)報(bào)道的與某個(gè)基因相關(guān)的疾病。本文探討了圖結(jié)構(gòu)對(duì)文獻(xiàn)知識(shí)組織的重要作用,建立了基于關(guān)聯(lián)信息網(wǎng)絡(luò)的知識(shí)發(fā)現(xiàn)的應(yīng)用模型。在網(wǎng)絡(luò)結(jié)構(gòu)的知識(shí)庫(kù)基礎(chǔ)上,可以更便捷地導(dǎo)航訪(fǎng)問(wèn)文獻(xiàn)集中蘊(yùn)含的關(guān)聯(lián)知識(shí),更快速地發(fā)現(xiàn)與篩選有效的特異性關(guān)聯(lián)。對(duì)于間接關(guān)聯(lián)的獲取,關(guān)系鏈中的中間節(jié)點(diǎn)具有極其重要的“橋”的作用,節(jié)點(diǎn)的度可直觀(guān)表示出節(jié)點(diǎn)在網(wǎng)絡(luò)中的權(quán)重,因?yàn)閮H僅從關(guān)鍵詞出現(xiàn)的頻率來(lái)判斷節(jié)點(diǎn)的重要性,往往是一些寬泛的概念,而一些頻率較小的節(jié)點(diǎn)或關(guān)聯(lián),很可能表達(dá)出重要的意義。此外,網(wǎng)絡(luò)中任意一條通路在一定程度上都可能是一個(gè)語(yǔ)義水平上的關(guān)系鏈,能揭示某種有意義的聯(lián)系,進(jìn)而為用戶(hù)提供一種科學(xué)思路。

與傳統(tǒng)的基于文獻(xiàn)的知識(shí)發(fā)現(xiàn)方法相比,基于復(fù)雜網(wǎng)絡(luò)的方法不但能夠揭示非相關(guān)文獻(xiàn)中的隱含知識(shí),更可以幫助發(fā)現(xiàn)任意文獻(xiàn)集中潛在的關(guān)聯(lián)性知識(shí),對(duì)于文獻(xiàn)中任意實(shí)體間的語(yǔ)義相關(guān)性的評(píng)估都具有非常重要的意義。整合網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)特征與統(tǒng)計(jì)信息,研究出新的語(yǔ)義相關(guān)性的計(jì)算指標(biāo),將未來(lái)文獻(xiàn)知識(shí)發(fā)現(xiàn)研究的新的重要內(nèi)容。

猜你喜歡
關(guān)聯(lián)語(yǔ)義
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
語(yǔ)言與語(yǔ)義
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
“上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
認(rèn)知范疇模糊與語(yǔ)義模糊
“深+N季”組配的認(rèn)知語(yǔ)義分析
語(yǔ)言學(xué)與修辭學(xué):關(guān)聯(lián)與互動(dòng)
主站蜘蛛池模板: 欧亚日韩Av| 国产乱肥老妇精品视频| 亚洲91精品视频| 亚洲大学生视频在线播放| 久久国产精品麻豆系列| 手机精品福利在线观看| 国产精品30p| 国产成本人片免费a∨短片| 欧美色图久久| 国产白浆一区二区三区视频在线| 98超碰在线观看| 亚洲一区二区三区在线视频| 九九九久久国产精品| 91成人精品视频| 日韩精品免费一线在线观看| 亚洲系列无码专区偷窥无码| 高清精品美女在线播放| 国产三级国产精品国产普男人 | 国产精品人成在线播放| 久久99热这里只有精品免费看| 国内精品久久久久久久久久影视| 在线观看精品国产入口| 91色爱欧美精品www| 国产视频a| 欧美福利在线| 二级毛片免费观看全程| 国产一在线| 国产亚洲精品自在线| 亚洲成a人片| 伊人久久婷婷| 中文精品久久久久国产网址 | 欧美精品在线看| 天天色天天综合| 国产不卡国语在线| 超级碰免费视频91| 亚洲综合色区在线播放2019| 日韩成人午夜| 日韩黄色在线| 国模沟沟一区二区三区| 特黄日韩免费一区二区三区| 毛片三级在线观看| 亚洲一区二区成人| 色妺妺在线视频喷水| 中国成人在线视频| 欧美综合区自拍亚洲综合天堂| 最新国语自产精品视频在| 成人在线观看一区| 久久99国产精品成人欧美| 久久久久久国产精品mv| 精品少妇三级亚洲| 天天婬欲婬香婬色婬视频播放| 18禁高潮出水呻吟娇喘蜜芽| 久久久久国产一区二区| 全部免费特黄特色大片视频| 欧美激情一区二区三区成人| 成人年鲁鲁在线观看视频| 亚洲性影院| 亚洲AV无码乱码在线观看代蜜桃| 日韩不卡免费视频| 内射人妻无套中出无码| 亚洲一区无码在线| 亚洲天堂伊人| 欧美日本在线| jizz在线观看| 免费国产高清视频| 天天综合色网| 国产精品美女自慰喷水| 黄色国产在线| 国产乱肥老妇精品视频| аⅴ资源中文在线天堂| 香蕉蕉亚亚洲aav综合| 欧美一级专区免费大片| 国产经典在线观看一区| 女人天堂av免费| 精品国产成人高清在线| 欧美一区日韩一区中文字幕页| 国产精品永久免费嫩草研究院| 国产AV无码专区亚洲精品网站| 欧美五月婷婷| 欧美一级一级做性视频| 亚洲欧美极品| 欧美成人日韩|