999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多粒度信息的中醫(yī)文本關(guān)系抽取的研究

2021-11-08 13:12:09王亞文王培盧苗苗
電腦知識與技術(shù) 2021年27期
關(guān)鍵詞:深度學(xué)習(xí)

王亞文 王培 盧苗苗

摘要:中醫(yī)領(lǐng)域知識主要是以文本的形式存在,具有無規(guī)律的語言特性,中醫(yī)知識的有效挖掘?qū)Τ浞掷梦谋局刑N藏的經(jīng)驗知識具有重要作用,信息抽取任務(wù)是中醫(yī)知識管理的重要子任務(wù),而關(guān)系抽取又是信息抽取任務(wù)中的重要環(huán)節(jié)。針對單粒度信息關(guān)系抽取方法中存在的句意傳遞錯誤和文本語義丟失的問題,提出將句子中的多粒度信息應(yīng)用于中醫(yī)文本關(guān)系抽取任務(wù),構(gòu)建多粒度信息抽取模型,將詞語級信息整合到字符序列中,多種粒度的文本信息可以為模型提供更多的知識引導(dǎo),更全面的挖掘語義特征。實驗結(jié)果證明,此方法能夠更加精確的抽取中醫(yī)文本關(guān)系,使模型具有更好的魯棒性,基本不受噪聲的影響。

關(guān)鍵詞:多粒度信息;關(guān)系抽取;深度學(xué)習(xí);中醫(yī)文本

中圖分類號:TP3? ? ? ? 文獻標(biāo)識碼:A

文章編號:1009-3044(2021)27-0015-02

1引言

中醫(yī)知識包含了中華民族千百年來在和疾病斗爭中總結(jié)的豐富診療經(jīng)驗,在長期發(fā)展的過程中也形成了一種獨特的診療體系,留下了大量對現(xiàn)代疾病診斷具有重要指導(dǎo)價值的文獻資料。然而,中醫(yī)文本信息尚未得到有效利用,關(guān)系抽取[1]技術(shù)是有效利用中醫(yī)文本信息的關(guān)鍵技術(shù)之一,目的是提取中醫(yī)文本實體對之間的語義關(guān)系[2]。例如:“若兼有氣虛者,身倦乏力,少氣自汗宜加黃芪,并加以重用,以補氣行血”,這句中的“黃芪”和“氣虛”是“治療”的關(guān)系。

隨著深度學(xué)習(xí)[3]的不斷發(fā)展,以其自動提取特征的優(yōu)勢被更多地應(yīng)用在關(guān)系抽取任務(wù)中[4]。目前大多數(shù)的關(guān)系抽取模型是基于字粒度或者基于詞粒度的單一粒度進行抽取。基于字符的關(guān)系抽取將每個輸入語句視為一個字符序列。這種方法不能充分利用詞語級信息,捕獲的句子特征較少,字符、語法和語義之間的關(guān)系較為松散,無法完整的表達出句子語義,比如“羌活”這個詞如果拆成字粒度就成了“羌”和“活”,這兩個字的單獨含義明顯與它們組合起來的詞的含義大相徑庭。所以利用字粒度信息捕獲的句子特征比較少,存在“文本語義丟失”的問題,完全依賴字符進行關(guān)系抽取效果不佳?;谠~粒度的關(guān)系抽取模型,首先要進行分詞,然后推導(dǎo)出單詞序列,再將每個詞語表示為詞向量,輸入到神經(jīng)網(wǎng)絡(luò)模型中,利用詞粒度信息容易引入詞語分割錯誤帶來的“句意錯誤傳播”問題。例如給定中醫(yī)句子:“酒黃疸,心中懊或熱甚而痛,梔子大黃湯主之,蓋為實熱之邪立法也”。句中黃疸和大黃是治療關(guān)系,但是經(jīng)過分詞操作之后“梔子大黃湯主之”被分為“梔子”“大”“黃湯”和“主之”,分完詞之后沒有得到“大黃”這個詞。

因此,基于單粒度信息的抽取方法會存在“文本語義丟失”和“句意傳遞錯誤”的問題。本文結(jié)合字符粒度信息與詞粒度信息的優(yōu)點,使用多粒度信息[5]對中醫(yī)文本進行特征學(xué)習(xí),既利用了字粒度模型參數(shù)少和不依賴分詞算法的優(yōu)點,解決句意傳遞錯誤的問題,同時利用了詞語中包含的詞法、句法和語義等信息,捕獲更多的文本語義特征,解決文本語義丟失的問題。兩種粒度方法互為補充,提升了中醫(yī)文本關(guān)系抽取的效率。

2 多粒度關(guān)系抽取模型

對于基于字符級信息和詞語級信息訓(xùn)練的模型存在文本實體分割錯誤問題,不能夠充分利用句子的語義特征,限制了模型挖掘深層語義特征的能力。本文利用多種文本粒度的,為模型提供更多的知識引導(dǎo),從而獲取句子更充分地語義信息,模型具有更好的魯棒性,基本不受噪聲的影響。多粒度關(guān)系抽取模型是在基于字符的雙向長短期記憶網(wǎng)絡(luò)[6](Bidirectional long short-term memory network,Bi-LSTM)的結(jié)構(gòu)基礎(chǔ)上增加了詞粒度信息流,利用門結(jié)構(gòu)控制信息的嵌入。模型結(jié)構(gòu)如圖1所示。

基于多粒度信息的中醫(yī)文本關(guān)系抽取模型分為四層,分別是嵌入層、編碼層、注意力層和分類層。

2.1嵌入層

由于神經(jīng)網(wǎng)絡(luò)的輸入是數(shù)值類型數(shù)據(jù),所以在對文本編碼之前需要將中醫(yī)文本數(shù)據(jù)轉(zhuǎn)換為數(shù)值數(shù)據(jù)表示。本文的多粒度信息包括字粒度信息和詞粒度信息,同時利用位置信息,因此在嵌入層需要將字符、詞語和相對位置信息進行向量化表示。

(1)字詞嵌入

在通過神經(jīng)網(wǎng)絡(luò)處理之前將預(yù)處理之后的中醫(yī)文本進行向量化表示,本文采用的是word2vec技術(shù)把文本中包含的字符和詞語分別映射成具有一定維度的實值向量,很好地表達了字和詞語的語義依賴關(guān)系。嵌入層中的[l]表示字符和[w]表示詞語分別映射為字向量[dl]和詞向量[dw]。

(2)位置嵌入

關(guān)系抽取是預(yù)測句子中兩個實體存在的關(guān)系,一般距離實體對越近的字隱含表達實體對的關(guān)系的貢獻越大。句子的每個字符都有兩個位置信息,分別代表與頭實體和尾實體的相對距離,例如給定中醫(yī)句子“若兼陽分氣虛,而脈微神困,懶言多汗者,必加人參”。此句子的頭實體是“脈微”,尾實體是“人參”,字“加”與頭實體的相對距離為10,與尾實體的相對距離是0。

2.2編碼層

本文使用基于網(wǎng)格結(jié)構(gòu)的雙向長短時記憶網(wǎng)絡(luò)(Lattice BiLSTM)作為編碼器,該模型是基于字符的雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM),將字符作為直接輸入,即將每個輸入句子作為字符序列,不同點在于增加了詞粒度信息流,在字符輸入的同時嵌入詞語信息,利用句子中包含的多種粒度信息。模型編碼層中[x]表示編碼層的輸入,[h]表示正向隱藏層,[h]表示逆向隱藏層,[h]表示匯總隱藏層。隱藏層計算如下公式所示,[hci]表示第i個隱藏單元狀態(tài)。

2.3注意力層

在實際應(yīng)用場景中,句子中有些字符對預(yù)測兩個實體關(guān)系具有更加重要的地位。例如給定中醫(yī)句子“黃疸腹?jié)M,小便不利而赤,自汗出,此為表和里實,當(dāng)下之,宜大黃硝石湯”,在預(yù)測“黃疸”與“大黃”之間的關(guān)系時,字“宜”比其他字對關(guān)系預(yù)測的貢獻更大。為了使模型能夠獲得對關(guān)系抽取貢獻較大的特征,本文通過給句子中的每個字分配權(quán)重,增強句子的局部特征。

猜你喜歡
深度學(xué)習(xí)
從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
面向大數(shù)據(jù)遠(yuǎn)程開放實驗平臺構(gòu)建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學(xué)習(xí)的三級階梯
有體驗的學(xué)習(xí)才是有意義的學(xué)習(xí)
電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
利用網(wǎng)絡(luò)技術(shù)促進學(xué)生深度學(xué)習(xí)的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
主站蜘蛛池模板: 四虎综合网| 欧美日韩午夜| 九九热在线视频| 精品三级在线| 久久久久久国产精品mv| 韩日无码在线不卡| 国产喷水视频| 国产一级片网址| 狠狠久久综合伊人不卡| 三级国产在线观看| 国产91无毒不卡在线观看| 高清不卡毛片| 亚洲天堂网站在线| 午夜视频免费一区二区在线看| 国产成人91精品| 18禁高潮出水呻吟娇喘蜜芽| 精品国产自在现线看久久| 国产不卡国语在线| 亚洲AV无码乱码在线观看代蜜桃| 国产人在线成免费视频| 亚洲综合久久成人AV| 欧美视频免费一区二区三区| 亚洲国产成人精品青青草原| 波多野结衣一区二区三区四区视频 | 亚洲精品无码AⅤ片青青在线观看| 不卡视频国产| 国产网友愉拍精品视频| 激情乱人伦| 国产成人一级| 91热爆在线| 日韩高清欧美| 91黄视频在线观看| 免费福利视频网站| 国产精品九九视频| 久久久久九九精品影院| 亚洲女同欧美在线| 40岁成熟女人牲交片免费| 国产欧美精品一区二区| 成年A级毛片| 欧美福利在线播放| 国产精品制服| 国产成人综合久久| 国产99视频精品免费观看9e| 一级片免费网站| 中文字幕人妻av一区二区| 日韩黄色在线| 美女无遮挡拍拍拍免费视频| 国产一级裸网站| 国产精品美人久久久久久AV| 国产精品hd在线播放| 蜜桃臀无码内射一区二区三区 | 国产成a人片在线播放| 免费在线国产一区二区三区精品| 91丝袜乱伦| 国产精品免费电影| 欧美精品xx| 亚洲精品视频免费| a级毛片毛片免费观看久潮| 噜噜噜久久| 国产精品亚洲精品爽爽| 无遮挡国产高潮视频免费观看 | 久久这里只有精品国产99| 成人综合网址| 国产综合另类小说色区色噜噜| 啊嗯不日本网站| 永久免费无码成人网站| 欧美人在线一区二区三区| 在线免费无码视频| 国产男女免费视频| 激情成人综合网| 一本一道波多野结衣av黑人在线| 色偷偷综合网| 亚洲av日韩综合一区尤物| 精品综合久久久久久97超人| 嫩草国产在线| 免费观看成人久久网免费观看| 亚洲天堂网站在线| 呦系列视频一区二区三区| 国产精品久久久久婷婷五月| 青青草国产精品久久久久| 日本午夜视频在线观看| 朝桐光一区二区|