999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

醫(yī)學文獻中疾病誤診信息的提取

2019-07-10 02:04:32彭起馮洪海
科技視界 2019年14期
關鍵詞:文本信息

彭起 馮洪海

【摘 要】提出了從醫(yī)學文獻中提取誤診信息的算法。五千篇文獻訓練集的誤診提取正確率為85.78%,500篇測試文獻的誤診提取精度83.11%。

【關鍵字】誤診;臨床醫(yī)學;文本挖掘

中圖分類號: TP391.1文獻標識碼: A文章編號: 2095-2457(2019)14-0204-001

DOI:10.19694/j.cnki.issn2095-2457.2019.14.098

0 引言

全世界50年來平均誤診率為30%,但鑒于醫(yī)療水平的限制,誤診率一直高居不下,尤其是一些疑難雜癥。因此,從文獻中提取誤診信息供醫(yī)生和患者參考尤其必要。馮洪海[1]等統(tǒng)計和分析了現階段互聯(lián)網醫(yī)學用戶癥狀和相應的疾病分布情況,官兵[2]、張雪齊[3]等針對單獨的一種疾病或一類疾病的誤診信息做出了研究。目前還沒有文獻對醫(yī)學誤診文獻做過系統(tǒng)的分析。

在做文本數據分析之前,已從權威醫(yī)學期刊獲取了大量的醫(yī)學誤診案例文獻。通過人工讀文獻的方式,從中總結出初始的誤診關鍵字、通過對關鍵字進行分析,將關鍵字進行分類,而后分類建立模型。從文獻中獲取文本信息,從中提取出初始的疾病庫,通過編程實現誤診信息模型并通過模型將文本中的誤診信息提取出來。

1 算法設計過程

誤診信息分兩種:一種是疾病A誤診為疾病B,因此,疾病分“誤診為”的疾病B和“被誤診”的疾病A。另一種是多個疾病互相混淆而有可能誤診。在標題或正文中,多處出現疾病名稱,但未必是疾病之間誤診的信息,因此,要先由誤診關鍵字確定誤診上下文。另外,即便出現兩個疾病,兩個疾病之間誤診的信息有正反兩個方面,即有可能A誤診成B,也可能B誤診成A。

1.1 誤診關鍵字的獲取

誤診上下文分為標題和正文兩種。通過比較,針對標題的誤診關鍵字適用于正文;針對正文的誤診關鍵字不一定適用于標題。針對標題的“誤診…”、“誤診為…的…”等關鍵字。針對正文的誤診關鍵字“需與…相鑒別”、 “易與…混淆”等。

1.2 誤診信息上下文的提取

誤診信息上下文的預處理,借鑒文獻[4]中的策略。關于上下文長短的確定,文獻[4]中設定為誤診關鍵字為誤診關鍵字所在的兩個句號段落。本文將提取單元設定為含有誤診關鍵字的一個句號的句子。

1.3 識別疾病以及提取文獻中的誤診信息

2 提取結果

對于訓練集,加入更為準確的關鍵字,去除“B超-疾病”和一些沒有必要存在的提取結果,如“高血壓-高血壓”等結果,將算法進行改進,完善算法的控制邏輯。擴充疾病庫之后,錯誤率也明顯下降。經上述的完善之后,疾病提取的錯誤率降低到14.22%。

測試集中存在有當前誤診關鍵字集合之外的關鍵字,導致一些誤診規(guī)律無法被提取出來,目前召回率穩(wěn)定在99%,錯誤率穩(wěn)定在16.89%。完善疾病庫、完善關鍵字集合、完善算法的提取規(guī)則將是下一步優(yōu)化的目標。

3 結束語

不論是訓練集還是測試集,錯誤率和召回率都與誤診關鍵字列表和疾病列表的完整性有關,未來要降低錯誤率和提高召回率,需要從完善誤診關鍵字列表和研制新的疾病實體名稱識別算法方面入手,因為有些疾病名稱是俗語或簡化描述或在國際疾病標準術語中未載入。

通過在大量醫(yī)學誤診案例中總結誤診信息、提取誤診關鍵字、建立誤診模型等方式提取醫(yī)學誤診文獻中誤診信息。在后期的研究過程中,可對提取結果的精確度做更加準確的處理。從文本中分析出的誤診為的疾病可能有若干種,這些疾病之間可能也存在誤診關系;這些疾病也存在和“誤診”病不相關的情況,后續(xù)研究可對結果做統(tǒng)計分析,完善疾病庫、關鍵字集合和算法的提取規(guī)則,總結更普遍的規(guī)律,減少醫(yī)學誤診的發(fā)生。

【參考文獻】

[1]馮洪海,孫元燦,李利敏,宋舒晗,黃俊輝.基于Web醫(yī)學數據的互聯(lián)網醫(yī)學用戶研究[J].計算機時代,2014(04):41-46.

[2]官兵,張惠箴,汪亮.胃底伴血管瘤的脾組織植入誤診為胃腸間質瘤1例[B].臨床與實驗病理學雜志,1001=7399(2019)05-0618-02.

[3]張奇雪,阮宏瑩,鄭永哲,張桂敏,林鵬.鼻硬結病誤診為鼻中隔囊腫1例.臨床耳鼻咽喉頭頸外科雜志[B].1001-1781.2019.06.021.

[4]劉源,馮洪海.醫(yī)療糾紛文獻的數據挖掘[J].電子技術與軟件工程[J].R197.3;TP311.13.

猜你喜歡
文本信息
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
論《柳毅傳》對前代文本的繼承與轉化
人間(2015年20期)2016-01-04 12:47:10
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 丰满人妻久久中文字幕| 国产丝袜无码精品| 狠狠亚洲五月天| 欧美亚洲日韩不卡在线在线观看| 亚洲AⅤ永久无码精品毛片| 欧美精品亚洲精品日韩专区| 亚洲国产高清精品线久久| 91av成人日本不卡三区| 人人妻人人澡人人爽欧美一区| 成人午夜视频免费看欧美| 69国产精品视频免费| 被公侵犯人妻少妇一区二区三区| 久热这里只有精品6| 日韩欧美国产中文| 日韩欧美国产三级| 亚洲香蕉伊综合在人在线| 亚洲熟女中文字幕男人总站| 99在线视频免费观看| av一区二区三区高清久久| 69av免费视频| 国产精品开放后亚洲| 九九视频免费在线观看| 久久精品国产一区二区小说| 九色国产在线| 久久综合色视频| 精品日韩亚洲欧美高清a| 中文字幕在线观| 中文字幕久久波多野结衣| 日韩天堂视频| 久久久久亚洲av成人网人人软件| 中文成人无码国产亚洲| 国产亚洲欧美在线专区| 99青青青精品视频在线| 99精品热视频这里只有精品7 | 亚洲资源在线视频| 3344在线观看无码| 精品伊人久久大香线蕉网站| 久久久久久高潮白浆| 啪啪免费视频一区二区| 久久先锋资源| 女人18一级毛片免费观看| 欧美精品亚洲精品日韩专区va| 国产精品久久久久鬼色| 国产一级妓女av网站| 不卡国产视频第一页| 亚洲国产成人精品一二区| 老司国产精品视频| 亚洲永久视频| 亚洲精品国产综合99| 国产高清精品在线91| 国产一级毛片高清完整视频版| 国产欧美日韩一区二区视频在线| 青青操视频免费观看| 成人91在线| 国产一级片网址| 国产黑丝视频在线观看| 色综合天天娱乐综合网| 狠狠久久综合伊人不卡| 在线国产欧美| 国产极品粉嫩小泬免费看| 91精品在线视频观看| 午夜爽爽视频| 亚洲高清中文字幕在线看不卡| 成人免费午夜视频| 国产亚洲欧美在线视频| 国产视频久久久久| 亚洲成人www| 久久精品视频亚洲| 国产午夜一级毛片| 成人午夜免费视频| 三上悠亚精品二区在线观看| 国产网站免费| 永久免费无码日韩视频| 亚洲国产成人久久精品软件 | 精品国产自在在线在线观看| 亚洲无码不卡网| 亚洲天堂久久| 国产一级精品毛片基地| 强奷白丝美女在线观看| 欧美日韩成人| 国产日韩欧美在线播放| 国产高清又黄又嫩的免费视频网站|