999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

依存信息在蛋白質(zhì)關(guān)系抽取中的作用

2011-06-28 02:18:14錢(qián)龍華周?chē)?guó)棟
中文信息學(xué)報(bào) 2011年2期
關(guān)鍵詞:特征信息方法

劉 兵,錢(qián)龍華,徐 華,周?chē)?guó)棟

(蘇州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215006;蘇州大學(xué) 自然語(yǔ)言處理實(shí)驗(yàn)室,江蘇 蘇州 215006)

1 引言

蛋白質(zhì)作為最主要的生命活動(dòng)載體和功能執(zhí)行者,其復(fù)雜多樣的結(jié)構(gòu)功能、相互作用和動(dòng)態(tài)變化能在分子、細(xì)胞和生物體等多個(gè)層次上全面揭示生命現(xiàn)象。對(duì)生命活動(dòng)過(guò)程中蛋白質(zhì)相互作用關(guān)系(PPI, Protein-Protein Interaction)的研究有助于揭示生命過(guò)程的許多本質(zhì)問(wèn)題,因而PPI抽取成為生物醫(yī)學(xué)領(lǐng)域信息抽取的重點(diǎn)研究方向,是生物醫(yī)學(xué)文本挖掘的主要任務(wù)之一,具有重要的研究意義。

目前,計(jì)算機(jī)輔助的自動(dòng)文本挖掘技術(shù)可以快速獲取醫(yī)學(xué)信息并將其構(gòu)建為計(jì)算機(jī)可操作的知識(shí)庫(kù),方便數(shù)據(jù)分析和挖掘。這些方法大致可分為三類:基于共現(xiàn)的方法、基于規(guī)則的方法和基于機(jī)器學(xué)習(xí)的方法,其中基于機(jī)器學(xué)習(xí)的方法又可分為基于特征向量的方法和基于核函數(shù)的方法。

基于共現(xiàn)的方法通過(guò)簡(jiǎn)單地統(tǒng)計(jì)兩個(gè)蛋白質(zhì)的共現(xiàn)次數(shù)來(lái)預(yù)測(cè)兩個(gè)蛋白質(zhì)之間的關(guān)系,因此它的明顯缺陷就是只能抽取一些頻繁出現(xiàn)的PPI模式,并且準(zhǔn)確率也比較有限。

基于規(guī)則的方法采用一些預(yù)先定義的詞或短語(yǔ)模式規(guī)則來(lái)匹配可能出現(xiàn)的PPI關(guān)系。然而,由于PPI關(guān)系模式的多樣性,預(yù)定義的規(guī)則不可能包含所有的PPI關(guān)系模式。并且在新的領(lǐng)域使用基于規(guī)則的方法時(shí),這些規(guī)則都需要修正。這種方法可以獲得較高的準(zhǔn)確率,但召回率非常低。

基于機(jī)器學(xué)習(xí)的方法是目前主流的PPI抽取策略,其中基于特征向量的方法近年來(lái)得到了廣泛應(yīng)用。在以往的研究中,Mitsumori等[1]抽取了蛋白質(zhì)實(shí)體附近的詞特征,探索了詞匯特征對(duì)抽取性能的影響。Sugiyama等[2]從包含PPI的句子中抽取了動(dòng)詞和名詞信息,進(jìn)一步研究了詞匯信息尤其是動(dòng)詞對(duì)PPI抽取的作用。此外,Giuliano等[3]還探討了詞性等淺層語(yǔ)言學(xué)信息。然而,上述系統(tǒng)都沒(méi)有考慮任何句法和依存信息,而研究表明這些信息在新聞?lì)I(lǐng)域的關(guān)系抽取中有很好的效果[4]。因此,Stre等[5]將句法信息、淺層依存關(guān)系信息和詞匯特征結(jié)合起來(lái)進(jìn)行PPI抽取,顯著提高了PPI抽取的性能。但是目前對(duì)于依存信息的研究并不深入,所采用的特征也不能有效捕獲依存樹(shù)中的結(jié)構(gòu)化信息,系統(tǒng)性能相對(duì)于新聞?lì)I(lǐng)域仍有很大差距。

當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的另一個(gè)熱門(mén)課題就是核函數(shù)的研究和使用。基于核函數(shù)的方法直接以結(jié)構(gòu)樹(shù)為處理對(duì)象,再使用支持核函數(shù)的分類器進(jìn)行關(guān)系抽取。然而受制于計(jì)算復(fù)雜度,該方法往往不能應(yīng)用于實(shí)際的PPI抽取系統(tǒng)中,這也促使我們考慮在基于特征向量的方法中對(duì)依存信息做進(jìn)一步探索,以期充分利用依存信息。

本文第2節(jié)介紹了基于特征向量的PPI抽取方法,分析了基準(zhǔn)系統(tǒng)所用的各種特征。第3節(jié)詳細(xì)描述了依存信息驅(qū)動(dòng)的PPI抽取系統(tǒng)所用的特征。第4節(jié)給出了數(shù)據(jù)處理方案、實(shí)驗(yàn)流程和結(jié)果分析。最后一節(jié)是本文的結(jié)論和展望。

2 基于特征向量的PPI抽取

對(duì)于基于特征向量的信息抽取方法來(lái)說(shuō),PPI抽取可以看作是一個(gè)分類問(wèn)題。首先,系統(tǒng)要將已標(biāo)注或未標(biāo)注的PPI實(shí)例構(gòu)造成一個(gè)特征集合,并映射到一個(gè)n維的特征向量空間;然后,在特征向量空間上運(yùn)用機(jī)器學(xué)習(xí)方法。這個(gè)過(guò)程可以分為兩個(gè)階段:在訓(xùn)練時(shí),分類學(xué)習(xí)算法利用標(biāo)注好的PPI實(shí)例學(xué)習(xí)得到一個(gè)分類器;測(cè)試時(shí),利用該分類器判斷待測(cè)試的關(guān)系實(shí)例所屬的關(guān)系類別,以預(yù)測(cè)PPI是否存在。

以往的信息抽取研究表明,詞匯信息和淺層句法信息在關(guān)系抽取中的作用非常明顯。因此,我們先提取詞匯、交疊特征、基本短語(yǔ)塊以及簡(jiǎn)單的句法樹(shù)信息構(gòu)建一個(gè)基準(zhǔn)系統(tǒng),作為與加入依存信息的PPI抽取系統(tǒng)的對(duì)比。基準(zhǔn)系統(tǒng)用到詞匯、交疊、基本短語(yǔ)塊和句法樹(shù)四種類型的特征。

1) 詞匯特征是最容易挖掘的語(yǔ)言學(xué)特征。本系統(tǒng)用到四種類型的詞匯信息:a)蛋白質(zhì)實(shí)體的名稱;b)兩個(gè)蛋白質(zhì)實(shí)體之間的詞;c)第一個(gè)蛋白質(zhì)實(shí)體之前的詞;d)第二個(gè)蛋白質(zhì)實(shí)體之后的詞。為避免引入噪音,我們只考慮第一個(gè)蛋白質(zhì)前和第二個(gè)蛋白質(zhì)后的兩個(gè)詞。

2) 實(shí)體的交疊特征屬于結(jié)構(gòu)化信息,可以反映實(shí)體之間的位置關(guān)系。AIMed語(yǔ)料庫(kù)中存在少量相互嵌套的PPI實(shí)例,利用交疊特征可以反映蛋白質(zhì)實(shí)體的嵌套信息。系統(tǒng)采用了以下交疊特征:

? #MB: 蛋白質(zhì)實(shí)體之間的其他蛋白質(zhì)實(shí)體數(shù)目。

? #WB: 蛋白質(zhì)實(shí)體之間的單詞數(shù)目。

? E-Flag: 判斷蛋白質(zhì)實(shí)體是否嵌套。

3) 相對(duì)于詞匯特征,基本短語(yǔ)塊包含粒度更大的局部信息。基本短語(yǔ)塊特征是用Sabine Buchholz的perl腳本*http://ilk.kub.nl/~sabine/chunklink/從完全句法樹(shù)中獲得的,而句法樹(shù)則是由Stanford Parser*http://nlp.stanford.edu/software/lex-parser.shtml生成。類似詞匯特征,我們提取了以下基本短語(yǔ)塊特征:

? CPHBNULL:實(shí)體之間沒(méi)有短語(yǔ)塊。

? CPHBFL:實(shí)體之間僅有一個(gè)短語(yǔ)塊時(shí),該短語(yǔ)塊的核心詞。

? CPHBF:實(shí)體之間至少兩個(gè)短語(yǔ)塊時(shí),除首尾短語(yǔ)塊,其余短語(yǔ)塊中第一個(gè)短語(yǔ)塊的核心詞。

? CPHBL:實(shí)體之間至少兩個(gè)短語(yǔ)塊時(shí),除首尾短語(yǔ)塊,其余短語(yǔ)塊中最后一個(gè)短語(yǔ)塊的核心詞。

? CPHBO:實(shí)體之間除首尾短語(yǔ)塊外,其他短語(yǔ)塊的核心詞。

? CPP:連接兩個(gè)實(shí)體所在短語(yǔ)塊的短語(yǔ)塊類型。

為防止以上基本短語(yǔ)塊特征過(guò)于具體而造成數(shù)據(jù)稀疏問(wèn)題,我們構(gòu)造了一系列的組合特征。這些特征是將上述基本短語(yǔ)塊特征(CPP除外)與它們對(duì)應(yīng)的短語(yǔ)塊類型結(jié)合起來(lái)得到的。

4) 句法樹(shù)作為反映句子間語(yǔ)法關(guān)系的重要結(jié)構(gòu),可以揭示實(shí)體之間較長(zhǎng)距離的語(yǔ)義關(guān)系,因此我們也抽取了句法樹(shù)特征:

? PTP:句法樹(shù)中兩個(gè)實(shí)體之間的路徑(經(jīng)過(guò)去重處理)。

3 依存信息驅(qū)動(dòng)的PPI抽取

依存樹(shù)可以揭示句子中的長(zhǎng)距離依存關(guān)系,并且能避免非結(jié)構(gòu)化特征中出現(xiàn)的噪音,可以為關(guān)系抽取提供更為有效的信息。目前,利用依存信息進(jìn)行PPI抽取的研究主要集中于基于核函數(shù)的方法,比如Airola等[6]采用全依存路徑圖核,Kim等[7]采用加權(quán)路徑子串核分別進(jìn)行了實(shí)驗(yàn),并獲得了不錯(cuò)的性能。除此之外,Stre等[5],Miyao等[8]和 Miwa等[9-10]采用復(fù)合核函數(shù)的方法將平面特征與結(jié)構(gòu)化信息結(jié)合起來(lái)進(jìn)行PPI抽取,大幅度提高了系統(tǒng)性能。雖然目前基于核函數(shù)的方法在性能方面要比基于特征向量的高,但是所有核函數(shù)方法都存在計(jì)算復(fù)雜性的瓶頸問(wèn)題,而另一方面,依存信息在基于特征向量的PPI抽取中的作用還有待深入研究。所以在本節(jié)我們將抽取一系列依存特征,考察它們?cè)赑PI抽取中的表現(xiàn)。

依存樹(shù)也是借助于Stanford Parser得到的。Stanford Parser依存分析的輸出格式是:依存類別(word1,word2),其中word1是核心詞,word2依賴于該核心詞,依存類別則由Stanford Parser預(yù)先定義。根據(jù)這些依存關(guān)系對(duì),我們可以構(gòu)建一個(gè)句子的依存樹(shù),并且抽取它的如下特征,表示為DependenecySet1:

? DP1TR:依存樹(shù)中蛋白質(zhì)PROT1到根節(jié)點(diǎn)的路徑。

? DP2TR:依存樹(shù)中蛋白質(zhì)PROT2到根節(jié)點(diǎn)的路徑。

? DP12DT:依存樹(shù)中兩個(gè)蛋白質(zhì)之間的依存關(guān)系類別。

? DP12:連接兩個(gè)蛋白質(zhì)路徑上的詞和依存類型的組合。

? DP12S:DP12中的每個(gè)單詞及其依存類型的組合。

? DPFLAG:判斷兩個(gè)蛋白質(zhì)是否具有直接依存關(guān)系。

以句子“PROT1 contains a sequence motif binds to PROT2.”為例,Stanford Parser生成的語(yǔ)法關(guān)系及構(gòu)造的依存樹(shù)如下:

雖然Erkan等[11]抽取了依存樹(shù)中蛋白質(zhì)實(shí)體之間的路徑信息,并采用基于核函數(shù)的方法獲得了較好的結(jié)果。然而這種長(zhǎng)距離的路徑信息并不適合基于特征向量的方法,原因在于路徑太過(guò)具體,導(dǎo)致嚴(yán)重的數(shù)據(jù)稀疏問(wèn)題,使得系統(tǒng)準(zhǔn)確率較高而召回率則很低。為避免這種情況,我們將路徑信息拆分成細(xì)粒度的特征,如DP12S特征。

除了上述依存特征,我們也探索了依存樹(shù)中動(dòng)詞對(duì)PPI抽取的影響。不同于新聞?lì)I(lǐng)域,在生物醫(yī)學(xué)領(lǐng)域文本的關(guān)系抽取中,動(dòng)詞扮演著更為重要的角色,這是因?yàn)橹饕獎(jiǎng)釉~的變化可以很容易導(dǎo)致PPI關(guān)系極性的改變。而以往的研究中并沒(méi)有對(duì)這一問(wèn)題給予足夠的關(guān)注,因此本文抽取了以下動(dòng)詞及其在依存樹(shù)中的位置特征,表示為DependencySet2:

? FVW:DP12特征中位于第一個(gè)蛋白質(zhì)之前的動(dòng)詞。

? LVW:DP12特征中位于第二個(gè)蛋白質(zhì)之后的動(dòng)詞。

? MVW:DP12特征中的其他動(dòng)詞。

? #FVW: FVW中動(dòng)詞的數(shù)目。

? #LVW: LVW中動(dòng)詞的數(shù)目。

? #MVW: MVW中動(dòng)詞的數(shù)目。

4 實(shí)驗(yàn)結(jié)果與分析

本節(jié)首先介紹實(shí)驗(yàn)中的語(yǔ)料預(yù)處理策略及評(píng)價(jià)標(biāo)準(zhǔn),然后報(bào)告各種特征在PPI抽取中的表現(xiàn)并從語(yǔ)言學(xué)角度作出相應(yīng)分析,最后與其他PPI抽取系統(tǒng)的性能進(jìn)行比較,并在4個(gè)常用的PPI語(yǔ)料庫(kù)上也進(jìn)行了同樣實(shí)驗(yàn),以驗(yàn)證本系統(tǒng)的泛化性能。

4.1 實(shí)驗(yàn)設(shè)置

我們采用AIMed語(yǔ)料庫(kù)作為主要實(shí)驗(yàn)數(shù)據(jù)集,AIMed是一種廣泛應(yīng)用于PPI抽取領(lǐng)域的語(yǔ)料庫(kù),它包含225篇從MEDLINE中提取的文章摘要。另外,我們也在其他四個(gè)經(jīng)常使用的PPI語(yǔ)料庫(kù)*http://mars.cs.utu.fi/PPICorpora/GraphKernel.html上進(jìn)行了實(shí)驗(yàn)。

實(shí)驗(yàn)中,我們選擇SVM作為分類器。SVM分類器本質(zhì)上是二元分類器,所以它非常適合判斷PPI是否存在的任務(wù)。在本系統(tǒng)中,我們使用了Joachims等開(kāi)發(fā)的二元分類工具SVMLight*http://svmlight.joachims.org/。

實(shí)驗(yàn)設(shè)置方面,我們采用了與Giuliano等[3]完全相同的文檔級(jí)十倍交叉驗(yàn)證策略,這樣可以最大化地利用實(shí)驗(yàn)資源,也利于與前期相關(guān)研究的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比。我們采用的評(píng)價(jià)標(biāo)準(zhǔn)是關(guān)系抽取中普遍采用的準(zhǔn)確率(P),召回率(R)和F測(cè)度(F1)。另外,AUC(area under the receiver operating characteristics curve)可以衡量數(shù)據(jù)類別在不同分布下的分類算法總體性能,已經(jīng)廣泛用于機(jī)器學(xué)習(xí)中對(duì)分類算法進(jìn)行評(píng)價(jià)。

4.2 各種特征的表現(xiàn)

表1顯示了在AIMed語(yǔ)料庫(kù)上,采用10倍交叉驗(yàn)證策略時(shí),各種特征對(duì)系統(tǒng)性能的影響。為了顯示依存樹(shù)中動(dòng)詞特征對(duì)性能的貢獻(xiàn)度, 我們將依存特征分為兩部分進(jìn)行實(shí)驗(yàn)。

表1 不同特征對(duì)PPI抽取的影響

表1顯示本系統(tǒng)在準(zhǔn)確率,召回率和F測(cè)度上分別達(dá)到63.4%,48.8%和54.7,同時(shí)也表明了以下特點(diǎn):

? 詞匯特征獲得的性能比較低,尤其是召回率只有41%左右。這表明由于詞匯稀疏問(wèn)題,單靠詞匯特征本身不能準(zhǔn)確表達(dá)PPI的關(guān)鍵信息,也說(shuō)明PPI抽取的難度較大。

? 交疊特征略微降低了系統(tǒng)性能。統(tǒng)計(jì)顯示,AIMed語(yǔ)料庫(kù)中#MB和#WB各特征的正負(fù)例比例非常接近,從而造成這些特征不具有區(qū)分能力。所以在后面的實(shí)驗(yàn)中,本系統(tǒng)排除了交疊特征。

? 相對(duì)于詞匯特征,基本短語(yǔ)塊特征將召回率提高3.9%,F(xiàn)測(cè)度提高3個(gè)單位。可以看出基本短語(yǔ)塊特征是獲取局部句法信息的重要途徑。

? 句法樹(shù)特征的作用不很明顯,它提高F測(cè)度僅0.8個(gè)單位,造成這種情況的原因之一可能是蛋白質(zhì)實(shí)體之間的路徑往往過(guò)長(zhǎng),導(dǎo)致了句法樹(shù)特征的稀疏問(wèn)題;另一方面,句法樹(shù)特征PTP有時(shí)會(huì)部分包含在基本短語(yǔ)塊特征CPP中,此時(shí)句法樹(shù)特征就沒(méi)有為系統(tǒng)提供新的可用信息。

? 依存特征DependencySet1十分有效,它將準(zhǔn)確率和召回率分別提高了1.6%和2.3%,F(xiàn)測(cè)度也隨之提高了2.5個(gè)單位。這表明依存特征可以有效捕獲PPI實(shí)例,且能避免淺層句法信息中經(jīng)常出現(xiàn)的噪音。統(tǒng)計(jì)數(shù)據(jù)顯示AIMed語(yǔ)料庫(kù)中蛋白質(zhì)實(shí)體距離大于5個(gè)詞的句子占總數(shù)的60%以上。所以,依存特征在PPI抽取中具有巨大潛力,因?yàn)樗鼈兛梢猿槿¢L(zhǎng)距離的依存信息。以圖1中的句子為例,雖然兩個(gè)蛋白質(zhì)在句子中相距較遠(yuǎn),但它們之間的依存關(guān)系卻簡(jiǎn)明而清晰地表達(dá)了其相互作用。

? 依存樹(shù)中的動(dòng)詞特征提高F測(cè)度0.8個(gè)單位,這是因?yàn)橐恍﹦?dòng)詞如interact、active和inhibit等,能強(qiáng)烈暗示兩個(gè)蛋白質(zhì)實(shí)體的關(guān)系,為檢測(cè)PPI提供了可靠的信息。

4.3 與其他系統(tǒng)的比較

表2是本系統(tǒng)與其他主要PPI抽取系統(tǒng)性能的對(duì)比, 其中僅列出了采用相同實(shí)驗(yàn)設(shè)置的系統(tǒng)。按照不同的機(jī)器學(xué)習(xí)方法,我們將所有的系統(tǒng)分為三類:基于特征向量的方法,基于核函數(shù)的方法和基于復(fù)合核函數(shù)的方法。表2顯示了Airola 等,Miwa 等和Kim等采用基于核函數(shù)的方法獲得了相對(duì)高的性能,但本系統(tǒng)獲得的54.7的F值是所有基于特征向量的方法中最好的,即使與某些基于核函數(shù)的方法相比也處于先進(jìn)水平。

表2 與其他PPI系統(tǒng)的比較

為了測(cè)試本系統(tǒng)在生物醫(yī)學(xué)語(yǔ)料庫(kù)上的泛化性能,我們也在BioInfer、HPRD50、IEPA和LLL四個(gè)PPI語(yǔ)料庫(kù)上用同樣的方法進(jìn)行了實(shí)驗(yàn)。表3顯示了相應(yīng)的F值,AUC測(cè)度及其標(biāo)準(zhǔn)差,并與Airola等[6]和Miwa等[9]的數(shù)據(jù)進(jìn)行了對(duì)比。

表3顯示我們的系統(tǒng)性能與另外兩個(gè)系統(tǒng)的趨勢(shì)基本一致,LLL語(yǔ)料庫(kù)上均獲得最好性能和最大的F值標(biāo)準(zhǔn)方差;而在AIMed的性能都是5個(gè)語(yǔ)料庫(kù)中最差的,不過(guò)其F值標(biāo)準(zhǔn)方差并不大;BioInfer語(yǔ)料庫(kù)的關(guān)系實(shí)例數(shù)最多,雖然F值和AUC值不高,但它們的標(biāo)準(zhǔn)方差往往較小。

表3 在其他PPI語(yǔ)料庫(kù)上的性能

5 結(jié)論與展望

本文以SVM為分類器,用基于統(tǒng)計(jì)學(xué)習(xí)的方法實(shí)現(xiàn)了一個(gè)有指導(dǎo)的PPI抽取系統(tǒng)并且獲得了F測(cè)度54.7的較好性能。本系統(tǒng)綜合研究了各種詞匯、基本短語(yǔ)塊、句法尤其是依存特征對(duì)PPI抽取的影響。我們發(fā)現(xiàn)依存樹(shù)特征和基本短語(yǔ)塊特征對(duì)PPI抽取的貢獻(xiàn)最大,并且依存樹(shù)中的動(dòng)詞特征還能進(jìn)一步提高系統(tǒng)性能。另外,在多個(gè)生物醫(yī)學(xué)領(lǐng)域語(yǔ)料庫(kù)上的實(shí)驗(yàn)也檢驗(yàn)了本系統(tǒng)的泛化性能。

下一步工作中,我們將在基于特征向量的PPI抽取中探索更多的句法特征,同時(shí)關(guān)注結(jié)構(gòu)化信息的有效表達(dá)方式及其與平面特征結(jié)合起來(lái)的途徑,以期進(jìn)一步提高系統(tǒng)性能。

[1] T. Mitsumori, M. Murata, Y. Fukuda, K. Doi, and H. Doi. 2006. Extracting protein-protein interaction information from biomedical text with SVM[J]. IEICE Transactions on Information and Systems, E89-D (8): 2464-2466.

[2] K.Sugiyama, K.Hatano, M.Yoshikawa, and S.Uemura. Extracting information on protein-protein interactions from biological literature based on machine learning approaches[J]. Journal of Genome Informatics.2003, (14): 699-700.

[3] C. Giuliano, A. Lavelli, and L. Romano. 2006. Exploiting Shallow Linguistic Information for Relation Extraction from Biomedical Literature[C]//Proceedings of EACL’06, Trento, Italy.2006:401-408.

[4] G.D. Zhou, J. Su, J. Zhang, and M. Zhang. Exploring various knowledge in relation extraction[C]//Proceedings of ACL’2005, Ann Arbor, Michgan, USA, 2005:427-434.

[6] A.Airola, S.Pyysalo, J. Bj?rne, T.Pahikkala, F. Ginter, and T.Salakoski. All-paths graph kernel for protein-protein interaction extraction with evaluation of cross corpus learning[J]. BMC Bioinformatics.2008,9(suppl 11):s2.

[7] S. Kim, J.Yoon, J.Yang and S.Park. Walk-weighted subsequence kernels for protein-protein interaction extraction[J]. Journal of BMC Bioinformatics, 2010, 11:107-128.

[8] Y.Miyao, R.Stre, K. Sagae, T.Matsuzaki, and J.Tsujii. Task-oriented evaluation of syntactic parsers and their representations[C]//Proceedings of ACL-08: HLT, 1008: 46-54.

[9] M. Miwa, R. Stre, Y. Miyao and J. Tsujii. 2009a. Protein-Protein Interaction Extraction by Leveraging Multiple Kernels and Parsers[J]. Journal of Medical Informatics, 2009,78: e39-e46.

[10] M.Miwa, R.Stre, Y.Miyao and J.Tsujii. A Rich Feature Vector for Protein-Protein Interaction Extraction from Multiple Corpora[C]//Proceedings of EMNLP’09, August, Singapore.2009:121-130.

[11] G. Erkan, A. Ozgur, D.R. Radev. Semi-Supervised Classification for Extracting Protein Interaction Sentences using Dependency Parsing[C]//Proceedings of EMNLP-CoNLL’2007: 228-237.

[12] A.Yakushiji, M.Yusuke, T.Ohta, Y.Tateishi, J.Tsujii. Automatic construction of predicate-argument structure patterns for biomedical information extraction[C]//Proceedings of EMNLP’06, Sydney, Australia 2006: 284-292.

[13] R. Bunescu and R. Mooney. 2005. Subsequence kernels for relation extraction[C]//Proceedings of NIPS’05, December, 2005:171-178.

猜你喜歡
特征信息方法
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
抓住特征巧觀察
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚(yú)
展會(huì)信息
線性代數(shù)的應(yīng)用特征
河南科技(2014年23期)2014-02-27 14:19:15
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: AV在线麻免费观看网站 | 久久一色本道亚洲| 久久青草视频| 天天摸天天操免费播放小视频| 国产精品3p视频| 久久伊伊香蕉综合精品| 亚洲中文字幕日产无码2021| 内射人妻无码色AV天堂| 激情六月丁香婷婷| 国产在线视频导航| 色综合天天操| 国产噜噜在线视频观看| 97精品久久久大香线焦| 国产精品女主播| 毛片网站观看| 国产精品嫩草影院av| 欧美一级在线| 欧美成人免费午夜全| 日本三级欧美三级| Jizz国产色系免费| 国产天天色| 国产精品久线在线观看| 综合五月天网| 欧美不卡视频在线观看| 午夜无码一区二区三区在线app| 国产黄在线免费观看| aⅴ免费在线观看| 色妺妺在线视频喷水| 在线一级毛片| 国产精品一区在线观看你懂的| 91精品国产91久久久久久三级| 性视频久久| 色网在线视频| 亚洲—日韩aV在线| 国语少妇高潮| 精品免费在线视频| 欧美日韩在线亚洲国产人| 无码专区在线观看| 精品国产福利在线| 麻豆国产原创视频在线播放 | 精品一区国产精品| 久久一级电影| 国产欧美一区二区三区视频在线观看| 久久国产热| 69视频国产| 久久伊人久久亚洲综合| 丰满少妇αⅴ无码区| 波多野结衣在线se| 久久香蕉国产线看观看精品蕉| 无遮挡一级毛片呦女视频| 国产精品毛片一区| 中文字幕在线免费看| 亚洲综合久久成人AV| 日韩国产一区二区三区无码| 无码日韩人妻精品久久蜜桃| 久久精品丝袜| 伊人久久久久久久| 午夜免费视频网站| 一级黄色网站在线免费看| 国产黄在线免费观看| 99国产精品国产| 亚洲国产中文欧美在线人成大黄瓜 | 国产精品欧美在线观看| 蜜芽国产尤物av尤物在线看| 日韩精品久久无码中文字幕色欲| 国产农村妇女精品一二区| 精品色综合| 免费女人18毛片a级毛片视频| 国产精品区视频中文字幕| 国产H片无码不卡在线视频 | 国产毛片不卡| 免费精品一区二区h| 国产99视频精品免费视频7| a级毛片免费网站| 99这里只有精品在线| 欧美日韩在线国产| 一区二区理伦视频| 日本午夜三级| 性网站在线观看| 嫩草国产在线| 污视频日本| 性网站在线观看|