999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

語音識別在電子病歷系統的應用

2020-04-13 14:19:22李丹蓉
國際感染病學(電子版) 2020年3期
關鍵詞:文本語言模型

李丹蓉

常州市衛生信息中心,江蘇 常州 213000

1 引言

調查顯示,我國目前50%的住院醫生平均每天用于寫病歷的時間超過4小時,其中相當一部分醫生寫病歷的時間超過7小時;還有部分專家配有專門記錄員記錄醫生主訴內容,而后轉錄入電腦中,對于社區醫院,醫生信息化水平較弱,這種問題更為突出。這種錄入病歷方式的弊端在于輸入效率較低,錯誤高;然而主流通過模板復制粘貼的方式,導致千篇一律的漏洞百出的病歷。這種錄入電子病歷的模式,使得個性化病歷錄入較少,病歷數據分析變得沒有價值。

隨著語音識別系統在細化模型的設計、參數提取和優化、系統的自適應方面取得較大發展,使得這項技術與其他領域相關技術進行結合,可以提高錄入的效率。而語音識別技術正是解決電子病歷的信息采集和輸入問題的最好解決方式,從而有效提高醫生錄入效率和病歷質量安全,實現個性化錄入。

2 語音識別原理

語音識別采用模式識別,基本框架分為:數據準備、特征提取、模型訓練、測試應用這4個步驟。

2.1 模型訓練原理 首先,對輸入的語音進行信號處理和特征提取,通過分析產生特征向量,建立聲學模型,然后對模型進行不斷訓練,再根據聲學特征值計算特征向量在聲學特征上的得分。根據語音建立語言文本庫模型,對計算出的聲音信號排列對于詞組序列,在根據已建立的語音字典庫對詞組進行解碼處理,最后得出語言識別的結果。

2.2 語言模型 語言模型是用于反映字詞出現的先驗概率和詞順序是否符合語言習慣和詞的語義信息的。例如“郝”和“好”,這兩個字發音相同,“好”相對于“郝”來說,出現的概率較高,但“郝”“好”相對于“好”來說一般出現在姓氏里較頻繁。

傳統語言模型N-gram的方法是一種基于概率的判別模型,它輸入的是語音序列,輸出的語音的概率。利用公式表示:

其中,S=( w1, w2,…,wn) ,表示那個輸入語音詞組,每個單詞wi,p(s)可以表示為第一個詞出現的概率p(w1)乘以第二個詞的概率p(w2│w1),以此類推一直到第n個詞。

語言模型:反映字詞出現的先驗概率

挫——錯

出心——初心

反映詞順序是否符合語音習慣

外出參觀——參觀外出

反映詞的語義信息

烏云-雷電-雨傘=下雨

為解決參數空間過大,數據稀疏等問題,我們對它進行進一步N-階馬爾科夫假設,即一個詞的出現僅與它之前的若干個詞有關。上面表示先驗概率中的每一項都可以做下列這樣一個近似。

RNNLM語言模型是基于循環神經網絡,其特點是將上一次的輸出作為本次的輸入,可以利用上一次信息來預測下一個詞,所以我們對公式中間的每一項都采用同一種深度學習模型,就可以表達成如下結構:

2.3 聲學模型建模 通過給定了相應的文本序列之后,生成相應的語音,這是語音識別技術中最核心的也是最復雜的部分。

為了減少同音詞的數據共享問題,首先我們會將文本序列轉化成它的發音序列,我們的語音具有不定長的特性,我們說的快和說的慢的時候,語音幀的時長是不一樣的,對于這種不定長的語音建模,這個時候就需要引入HMM模型。

HMM模型每一個語音幀讓我們的每一個語音幀都對應到HMM模型中的每一個狀態,不論多長的語音都能夠表達為HMM模型的一個狀態序列。

最后將HMM模型中的序列和語音中的每一幀進行對應。再利用概率將這個對應關系表達即可。

3 語音識別系統的系統架構

需通過大量病歷、患者信息等文本的錄入,反復校驗臨床醫生使用的智能語音識別系統,從而達到通過語音查詢、調取患者病歷、影像等數據,方便醫生使用,形成高效的智能語音識別的應用系統。

3.1 系統功能 本系統采用B/S架構,語音應用服務器和語音數據庫服務器之間通過光纖交換機與機房主存儲數據庫進行交互,從而實現性能的高效穩定。

系統前端集成在HIS系統的醫生工作站中,實時的將醫生說話內容通過識別系統轉錄成文字信息,并直接錄入醫生工作站中的門診、住院病歷及檢查報告等文本輸入位置,并完成了文本插入后的修改、刪除和增加等功能模塊。

3.2 業務流程 本系統需在醫生工作站處安裝麥克風硬件采集設備;將當醫生進行語音錄入時,系統識別該段語音,首先發出語音識別請求,并進行語音端點檢測、降噪及特征提取等前端處理后,發送到后端,通過建立的聲學模型和語音模型進行解碼處理,最終識別出該語音,并輸入前端進行文本輸出。

3.3 構建語音資料包 先對海量樣本語音信號進行采樣、去除混疊濾波和其它噪音影響,然后進行語音識別基本單元的選取并提取信號特征參數,進行反復訓練,構建符合電子病歷的醫學語音資料庫,包括醫療語音模型的建立和語義理解規則的構建兩個步驟。這是整個系統的核心部分。其中,醫療語音模型是基于HMM模型對語音資料庫進行語音訓練,從而形成符合醫生經常錄入的信息語音模型;而語義理解規則是通過一定規則將海量通用文本數據與計算輸出的特征值相似度匹配,最終判斷出輸入語音的含義。

4 系統效果分析

智能語音識別功能模塊在醫生端使用后,錄入的速度,除了醫生工作站文本框選取時間外,大大縮短了醫生的錄入時間,準確率超過90%,改善了社區醫護人員使用電腦錄入效率及準確率不高的現狀,并在推廣使用過程中,不斷優化語音庫,進一步提高識別效率。

猜你喜歡
文本語言模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
讓語言描寫搖曳多姿
累積動態分析下的同聲傳譯語言壓縮
3D打印中的模型分割與打包
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 一级毛片免费播放视频| 青草精品视频| 久久午夜影院| 91久久国产综合精品女同我| 亚洲日产2021三区在线| 精品久久久久无码| 欧美在线黄| 国产成人啪视频一区二区三区| 国外欧美一区另类中文字幕| 狠狠亚洲婷婷综合色香| 99视频有精品视频免费观看| 国产自在自线午夜精品视频| 专干老肥熟女视频网站| 宅男噜噜噜66国产在线观看| 国产成人高清在线精品| 91黄视频在线观看| 日韩欧美网址| 国产无遮挡裸体免费视频| 2021国产v亚洲v天堂无码| 成人另类稀缺在线观看| 色综合天天娱乐综合网| 国产成人精品一区二区不卡| 欧洲极品无码一区二区三区| 毛片一级在线| 欧美激情第一区| 色综合手机在线| 天堂成人在线视频| 老司机精品99在线播放| 欧美色视频在线| 91精品最新国内在线播放| 欧美成人免费午夜全| 丰满少妇αⅴ无码区| 国产国产人免费视频成18| 成人自拍视频在线观看| 免费看av在线网站网址| 97精品国产高清久久久久蜜芽| 国产在线一二三区| 欧美中文字幕一区| 激情六月丁香婷婷四房播| 自偷自拍三级全三级视频| 精品国产香蕉伊思人在线| 福利在线免费视频| 亚洲熟女中文字幕男人总站| 无码区日韩专区免费系列 | 在线看免费无码av天堂的| 欧美日韩成人| 国产呦精品一区二区三区网站| 激情午夜婷婷| 亚洲综合狠狠| 毛片在线区| 久久久久久久蜜桃| 日本成人福利视频| 亚洲一级毛片在线观播放| 免费高清自慰一区二区三区| 成年A级毛片| 精品一区国产精品| 国产成人夜色91| 亚洲视频影院| 国产日本欧美在线观看| 亚洲热线99精品视频| 欧美一区福利| 青青青国产精品国产精品美女| 欧美乱妇高清无乱码免费| 亚洲av综合网| 中文字幕亚洲另类天堂| 呦系列视频一区二区三区| 国产va在线| 国产素人在线| 国产精品美人久久久久久AV| 亚洲婷婷六月| 国产日韩av在线播放| 亚洲天堂免费在线视频| 国产青青草视频| 国产91线观看| 亚洲天堂日韩在线| 国产亚洲欧美日韩在线一区二区三区| 狼友视频一区二区三区| 亚洲国产中文欧美在线人成大黄瓜 | 曰韩人妻一区二区三区| 欧美一道本| 国产高清色视频免费看的网址| 久久久久青草线综合超碰|