999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

1種應用于醫學影像診斷報告的智能糾錯方法

2019-11-05 09:17:44李文杰王小冬唐武斌
影像研究與醫學應用 2019年21期
關鍵詞:單詞文本模型

李文杰,王小冬,簡 剛,唐武斌

(寧波市科技園區明天醫網科技有限公司 浙江 寧波 315000)

1 引言

隨著醫院信息化建設的發展,醫技檢查報告也在由紙張化向電子化方向過渡,但是隨之帶來了報告中拼寫錯誤檢查的問題。不同地區、醫院,報告系統中結構化模板的存在著較大差異,醫生還需要手動大量輸入檢查報告內容,對報告內容的準確性進行快速分析檢測成為了一個亟待解決的問題。

傳統用于醫學文本檢測的方法多是檢測文本中的錯別字,沒有考慮到句子中的語序和詞語搭配的錯誤。本文將深度學習領域中的RCNN(循環卷積神經網絡)文本分類模型應用到了醫學影像診斷報告的檢查中來,將文本分類模型用來判斷分句的正誤,結合恰當的糾錯策略篩選出錯誤分句中的詞語,并提示潛在可能的正確詞語。

本方法可以自動檢測影像科醫生在評估病人病情時所寫的影像所見和影像診斷報告,快速定位到報告中的拼寫錯誤、語序錯誤或詞語搭配錯誤的位置,并依據拼音和上下文詞語關聯提示可能替換的正確詞語。

深度學習火熱,各種網絡層出不窮,其中應用于文本分類的模型也有多種。2014年,Kim[1]提出了一種將CNN應用到英文文本分類中的方法,語料的最小粒度為單詞,取得了不錯的效果。2015年,Zhang[2]等提出了一種基于字母粒度級別的CNN英文文本分類模型。同年,Lai[3]等提出了一種基于單詞粒度級別的RCNN的英文文本分類模型,效果顯著。2016年,Conneau[4]等將VDNN應用到了文本分類,Zhou[5]等發表了基于注意力機制的BiLSTM應用于文本分類的模型。經過調研,本文借鑒了準確率最高的Lai[3]等提出的RCNN模型,將這種模型結構應用到了糾錯模型中,表1是幾種模型的文本分類效果測試對比。

表1 不同模型的文本分類準確度對比(%)

2 報告糾錯過程

通常報告中的錯誤包括拼寫錯誤、語序錯誤和詞語搭配錯誤,本方法對文本進行糾錯的過程如下。

首先通過導入了自定義醫學詞庫的jieba分詞方法分詞,使用詞語搜索詞庫依次對句子中的中文單詞進行拼寫檢查,如果發現了潛在錯誤單詞,標注出來。然后,將文本通過句子分隔符號(如逗號、句號、感嘆號、問號等)分隔為一個個分句,通過訓練的RCNN模型判斷每個分句的語序和詞組搭配正誤,篩選出來潛在的有問題的分句。接下來,通過詞組詞庫依次對有問題分句中相鄰的中文單詞詞組進行檢查,對有問題的詞組進行標注。最后依據拼音詞庫和詞語關聯詞庫對標注有問題的單詞給出一組替代的建議詞。

比如,對于樣本“兩肺門結構清晰,其內未見明顯腫大淋巴結影?!睉弥形姆衷~方法jieba分詞后的結果為“兩肺門結構清晰,其內未見明顯腫大淋巴結影?!睂ζ渲械拿總€中文單詞依據詞語搜索詞庫對詞語拼寫進行檢查,并標記出有拼寫錯誤的單詞。

然后,按照逗號和中文結束標點符號分隔,兩個分句分別為“兩肺門結構清晰”、“其內未見明顯腫大淋巴結影”。通過編碼詞庫編碼后送入到模型中進行檢測,如果返回結果為正確,認為兩句子的語序和詞語搭配均不存在問題。假如其中一個模型對第一個分句返回結果為錯誤,依據詞組詞庫對分句中的詞語搭配進行檢查,并標記出來有問題的詞組。對標記出來的錯誤詞語,依據拼音詞庫和詞語關聯詞庫,給出一組可替代錯誤分詞的建議詞,表2中給出了糾錯樣例,下劃線是通過模型檢測出來的錯誤。

3 模型構建和訓練

3.1 數據準備

采集網絡上的醫學詞庫,加入到jieba的自定義詞庫中,目的在于輔助對醫學上專業詞匯的分詞。

影像報告數據采集了16萬余條影像診斷報告數據。通過人工的審核,基本保證了所有數據的正確性。

3.2 詞庫和編碼詞典構建

通過導入了醫學詞典的jieba分詞將所有的影像報告數據進行分詞,構建出編碼詞庫DIC1、單詞搜索詞庫DIC2、詞組搜索詞庫DIC3、拼音詞庫DIC4和詞語關聯詞庫DIC5。DIC1是用來對分詞后詞語編碼,變成模型可以識別的格式;DIC2是用來檢測有拼寫錯誤的單詞;DIC3是用來定為問題的分句的錯誤單詞位置;DIC4和DIC5是用來對錯誤詞語進行提示的詞庫。

3.3 訓練數據構建

將jieba分詞后的影像報告,通過標點符號分隔為一個個分句。原始的分句標記為1,代表是正樣本,然后將分句中的單詞隨機打亂順序,標記為0,代表是負樣本,這樣就構建出了語序訓練集。類似的,將分句中的單詞,通過隨機替換的方式,構建出來詞語替換訓練集。

表2 糾錯樣例

3.4 模型構建

本方法中的循環卷積神經網絡RCNN是一種由RNN和CNN結合構成的人工神經網絡,模型中的RNN(Recurrent Neural Network)結構是一種層數為2層的雙向循環神經網絡,能夠最大程度的捕捉句子中的語義信息,然后引入了一個CNN中的最大池化層,捕獲文本中的關鍵字信息。通過結合循環結構和最大池化層,模型同時利用了RNN和CNN的優點。圖中展示了模型RCNN的結構,該模型能夠整合了一個單詞和它的上下文來表示這個單詞,能夠幫助我們獲得一個更精確的詞語含義,模型中使用了雙向RNN(循環神經網絡)結構用來整合上下文。從卷積神經網絡(CNN)的角度來看,我們之前描述的循環結構是屬于卷積層,當所有單詞的表示都被計算完畢,連接到一個最大池化層,最大池化層將不同長度的文本轉化到固定長度的向量,幫助我們抓取到了整段文本中的信息,最后傳入到了輸出層,關于網絡的詳細介紹見Lai[3]等的論文。

圖:循環卷積神經網絡(RCNN)結構示意圖[3],假定下角標的數字代表分詞在原始分句中的位置。

3.5 模型訓練

通過語序訓練集和詞語替換訓練集分別訓練得到語序糾錯模型Model1和詞語搭配模型Model2。測試集事先隨機抽取出了10%,剩余的用于訓練,訓練過程中采用的訓練集占和驗證集的比例分別為85%和15%。

3.6 結果

表3 訓練結果(%)

為了讓模型對錯誤更加敏感,構建的語序數據集所采用的正負樣本比例為1:4,而詞語替換數據集中所采用的正負樣本比例為1:3。表3中顯示,通過語序訓練集訓練得到的模型Model1對語序的正誤識別的準確率達到了99%以上,而通過詞語搭配訓練集訓練得到模型Model2對詞語替換句子正誤識別的準確率達到了98%以上。本訓練集、測試集和驗證集中所采用的負樣本比例較高,如果換成正負樣本比例1:1的數據集,準確率會有一定的降低。

4 結論

本文提供了一種應用于醫學影像診斷報告的智能糾錯方法,包括詞庫構建過程、模型構建過程和智能糾錯過程。本方法不僅能夠檢測常規的拼寫錯誤,另外通過使用訓練循環卷積神經網絡得到的糾錯模型,考慮了語序和詞語搭配,依據拼音詞庫和詞語關聯詞庫,給出一組可替代錯誤分詞的建議詞。

猜你喜歡
單詞文本模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
單詞連一連
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
看圖填單詞
3D打印中的模型分割與打包
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 欧美日本在线播放| 婷婷综合亚洲| 免费啪啪网址| 91精品免费久久久| 国产精品xxx| 国产一区二区精品福利| 91久久国产成人免费观看| 网友自拍视频精品区| 97视频免费看| 国产农村妇女精品一二区| 色综合久久88| 国产自产视频一区二区三区| 91成人在线观看| 亚洲视频在线网| 亚洲男人天堂网址| 女人18毛片久久| 亚洲精品少妇熟女| 永久天堂网Av| 国产高清又黄又嫩的免费视频网站| 中文字幕在线看| 日本色综合网| 狠狠色香婷婷久久亚洲精品| 麻豆精品国产自产在线| 999在线免费视频| 人妻夜夜爽天天爽| 国产91无码福利在线| 欧美在线精品怡红院| 国产免费黄| 欧美国产精品不卡在线观看| 九九九九热精品视频| 日韩精品一区二区三区视频免费看| 成人福利在线视频| 国产 在线视频无码| 性69交片免费看| 狼友视频一区二区三区| 日韩欧美中文字幕在线精品| 在线国产三级| 狠狠色综合网| 又黄又湿又爽的视频| 国产亚洲精品自在久久不卡| 91在线高清视频| 天堂成人在线| 欧美成在线视频| 国产中文一区二区苍井空| 亚洲乱伦视频| 国产精品福利在线观看无码卡| 国产精品美女在线| 国产亚洲精品资源在线26u| 真人免费一级毛片一区二区| 美女视频黄频a免费高清不卡| 99re这里只有国产中文精品国产精品 | 国产大片黄在线观看| 国产亚洲欧美在线人成aaaa| 成人免费午间影院在线观看| 小蝌蚪亚洲精品国产| 中文字幕在线观| 91青草视频| 国产黄在线观看| 一级爱做片免费观看久久| 青青青伊人色综合久久| 欧美国产日本高清不卡| 99久久精品国产精品亚洲| 国产精品自在线拍国产电影| 无码国产伊人| 97免费在线观看视频| 性欧美久久| 99热这里都是国产精品| 亚洲天堂视频网站| 蜜桃视频一区二区三区| 久久99精品国产麻豆宅宅| 伊人激情综合网| 不卡色老大久久综合网| 亚洲男女天堂| 亚洲区欧美区| 97精品国产高清久久久久蜜芽| 亚洲福利视频一区二区| 热伊人99re久久精品最新地| 91精品国产自产在线观看| 國產尤物AV尤物在線觀看| 日韩黄色大片免费看| 久久 午夜福利 张柏芝| 国产屁屁影院|