陸曉野 吳年利


摘要:針對醫(yī)務(wù)人員煩瑣的電子病歷錄入的問題,研究與設(shè)計基于數(shù)據(jù)挖掘方法的智能語音錄入電子病歷系統(tǒng),幫助醫(yī)務(wù)人員從煩瑣的電子病歷錄入工作中解脫出來,推動醫(yī)學的創(chuàng)新發(fā)展。通過語音識別軟件,將語音輸入的電子病歷信息轉(zhuǎn)換成文本,再基于病歷挖掘算法從文本中挖掘出關(guān)鍵的病歷信息,并對接傳輸?shù)诫娮硬v系統(tǒng)對應(yīng)的表單項目,實現(xiàn)智能匹配錄入功能,為醫(yī)務(wù)人員極大地減輕電子病歷錄入的負擔,促進醫(yī)學信息化的發(fā)展。
關(guān)鍵詞:電子病歷;語音識別技術(shù);數(shù)據(jù)挖掘;索引目錄
中圖分類號:TP302.1? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)27-0029-04
開放科學(資源服務(wù))標識碼(OSID):
1 引言
2010年2月22日發(fā)布的《電子病歷基本規(guī)范(試行)》明確指出:電子病歷是指醫(yī)務(wù)人員在醫(yī)療活動過程中,使用醫(yī)療機構(gòu)信息系統(tǒng)生成的文字、符號、圖表、圖形、數(shù)據(jù)、影像等數(shù)字化信息,并能實現(xiàn)存儲、管理、傳輸和重現(xiàn)的醫(yī)療記錄,是病歷的一種記錄形式[1]。電子病歷,亦稱為電子健康記錄,指將病患的病例等資料通過相應(yīng)的儀器設(shè)備傳輸至計算機中,并對病患的相關(guān)信息進行數(shù)據(jù)處理[2]。電子病歷作為一種電子信息載體,其主要作用在于將病患診斷信息記錄過程數(shù)字化,實現(xiàn)醫(yī)務(wù)人員對病患信息進行采集、加工、傳輸、服務(wù)等,是醫(yī)務(wù)人員為患者開展臨床診斷及治療的基本資料[3]。
目前,我國電子病歷的應(yīng)用幾乎覆蓋醫(yī)院的各個部門,包括門急診、住院、檢查、檢驗、手術(shù)、放射等各個環(huán)節(jié),涉及治療、手術(shù)、藥品等各科室醫(yī)療信息的傳遞與匯總[4]。電子病歷已成為醫(yī)院信息化建設(shè)的核心內(nèi)容,能夠減輕醫(yī)務(wù)人員的工作負擔,規(guī)范醫(yī)生的診療行為,提高工作效率,并為臨床研究、遠程醫(yī)學、全民醫(yī)療等提供服務(wù)[5]。因此,加快推動我國電子病歷應(yīng)用的相關(guān)研究,是醫(yī)學發(fā)展的需要,也是構(gòu)建新型醫(yī)療服務(wù)體系的需要。
我國大部分醫(yī)院所使用的醫(yī)院信息管理系統(tǒng)(HIS)為醫(yī)務(wù)人員提供的電子病歷編輯系統(tǒng)僅僅是一個模板化的編輯器,醫(yī)生需要花大量的時間和精力整理病人的主訴、病人家屬的輔助說明、每天的查房情況、結(jié)論和醫(yī)囑等信息,手動整理病歷信息極大消耗醫(yī)務(wù)人員寶貴的時間和精力[6]。因此,有效提高病歷信息的輸入速度,省去醫(yī)生手動輸入病歷信息的煩瑣過程,是當下亟須研究和探討的問題,將語音識別技術(shù)與數(shù)據(jù)挖掘方法相結(jié)合,探討如何實現(xiàn)智能語音錄入電子病歷系統(tǒng)的路徑。
2 語音識別技術(shù)應(yīng)用于電子病歷的研究現(xiàn)狀
將語音識別技術(shù)應(yīng)用于電子病歷系統(tǒng)正逐步成為醫(yī)療信息領(lǐng)域研究的熱點,例如計算機輔助醫(yī)學聽寫、口述病歷語音識別、電子病歷系統(tǒng)的語音檢索等。在電子病歷系統(tǒng)中,語音識別技術(shù)的應(yīng)用可以有效提高病歷文本錄入速度,省去醫(yī)生手動錄入病歷的煩瑣過程,讓醫(yī)生能將更多的精力放在為患者制定科學的治療方案上。
張瓊瑤[7]等在門診電子病歷系統(tǒng)中開展智能語音技術(shù)的深度應(yīng)用,搭建智能語音云平臺,構(gòu)建大規(guī)模醫(yī)學知識圖譜與語音服務(wù)引擎,結(jié)果顯示智能語音技術(shù)在醫(yī)療領(lǐng)域有較好的應(yīng)用前景,能夠提供便捷、實用高效的應(yīng)用服務(wù),輔助臨床醫(yī)療工作,提高診療效率。張海波[8]等探索語音識別技術(shù)在醫(yī)院臨床的應(yīng)用與發(fā)展前景,在醫(yī)院搭建科大訊飛語音識別私有云,并在醫(yī)院所有老年科計算機終端配置訊飛語音輸入客戶端,研究與分析語音識別情況,結(jié)果顯示語音識別技術(shù)在一定程度上可以提高臨床工作效率,降低工作強度。
徐璐[9]等將語音識別技術(shù)應(yīng)用于口腔科電子病歷系統(tǒng),基于海量醫(yī)學文本數(shù)據(jù)及醫(yī)學音頻數(shù)據(jù),開發(fā)多模態(tài)智能語音口腔電子病歷系統(tǒng),有效減輕醫(yī)生工作強度,提升工作效率,提高病歷書寫質(zhì)量。丁中正[10]等針對醫(yī)務(wù)人員書寫病歷文書的難點,建設(shè)醫(yī)療智能語音識別系統(tǒng),提升語音識別率,有效提升工作效率,減少醫(yī)務(wù)人員書寫病歷的時間。徐冬[11]等開展基于語音云的電子病歷研究與實踐,探索研究中文語音識別技術(shù)在臨床電子病歷整合與集成的最佳應(yīng)用實踐,實踐表明,通過語音錄入病歷,平均每百字的病歷錄入時間比原來節(jié)省50%;通過后期識別模型持續(xù)優(yōu)化,在識別率達到85%左右時,醫(yī)生錄入病歷的時間會節(jié)約60%以上。
3 數(shù)據(jù)挖掘方法應(yīng)用于電子病歷的研究現(xiàn)狀
數(shù)據(jù)挖掘,是指從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中, 挖掘出隱含在其中人們事先不知道的、但又是潛在有用的信息和知識的過程[12]。數(shù)據(jù)挖掘方法的文本識別算法是從大量非結(jié)構(gòu)化的數(shù)據(jù)中提煉出有用的信息和知識的半自動化處理過程[13]。
張海陽[12]等探討人工神經(jīng)網(wǎng)絡(luò)算法在電子病歷中的應(yīng)用,基于人工神經(jīng)網(wǎng)絡(luò)算法研究導(dǎo)致糖尿病患者過早死亡的獨立風險因素。唐海英[14]等開展基于數(shù)據(jù)挖掘技術(shù)的電子病歷的研究與設(shè)計,基于數(shù)據(jù)挖掘方法對檢查報告、病情、病人的綜合情況、藥物信息進行綜合分析和最佳匹配,幫助病人高效就醫(yī),提高醫(yī)生診斷的精準率和效率。李照東[15]等開展基于關(guān)聯(lián)規(guī)則的電子病歷數(shù)據(jù)挖掘應(yīng)用研究,以糖尿病及其并發(fā)癥相關(guān)的電子病歷數(shù)據(jù)作為研究對象,利用關(guān)聯(lián)規(guī)則算法對相關(guān)的病癥和特征進行深入的分析研究,為醫(yī)生診斷病情提供建議。
童剛[16]等開展腫瘤電子病歷數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究,研究腫瘤電子病歷的中文分詞及分類挖掘算法的選取,實驗結(jié)果表明C4.5算法更有利于輔助醫(yī)生進行腫瘤疾病診斷,提高疾病診斷的精準率。葛臻曉[17]研究電子病歷數(shù)據(jù)挖掘的急性冠脈綜合征風險評估方法,提出基于對抗網(wǎng)絡(luò)的急性冠脈綜合征患者主要不良事件預(yù)測方法,為急性冠脈綜合征風險評估的研究提供新的思路和技術(shù)手段。陳靜鋒[18]開展基于電子病歷的典型診療模式挖掘方法研究,從電子病歷數(shù)據(jù)出發(fā),針對患者入院信息,研究典型診斷模式挖掘方法,同時針對患者醫(yī)囑信息,研究典型用藥序列、典型用藥時間與融合多視角信息的典型治療模式挖掘方法,促進臨床診療業(yè)務(wù)流程的標準化。
4 電子病歷系統(tǒng)的應(yīng)用現(xiàn)狀分析
目前,我國三甲醫(yī)院的信息化水平普遍比較高,電子病歷系統(tǒng)已被應(yīng)用于臨床一線多年,運行比較穩(wěn)定和成熟,對于不同的臨床應(yīng)用場景,都有對應(yīng)的規(guī)范化病歷模板,但是每種病歷模板的表單項目繁多,如果一項一項核對錄入,既費時又費力,且容易填錯表單項目。美國醫(yī)學會(AMA)的統(tǒng)計數(shù)據(jù)表明[19],病歷及與之相關(guān)的文案書寫占據(jù)醫(yī)生所有工作時間的15%~20%,對于實習期的醫(yī)生這一數(shù)字更是高達30%。據(jù)調(diào)查,目前部分三甲醫(yī)院的電子病歷系統(tǒng)已具有語音錄入功能,但是功能比較單一,應(yīng)用層次較低,面對項目繁多的病歷表單,需要人工一項一項定位光標到相應(yīng)的項目,才能語音錄入,沒有達到智能化錄入的程度,應(yīng)用效率不高。
在當前已有的研究和應(yīng)用中,將語音識別技術(shù)應(yīng)用于電子病歷的相關(guān)研究,僅局限于將語音轉(zhuǎn)換成文本的應(yīng)用,沒有涉及從文本中挖掘關(guān)鍵病歷信息與電子病歷系統(tǒng)對接的研究。在數(shù)據(jù)挖掘方法應(yīng)用于電子病歷的研究方面,主要集中在利用數(shù)據(jù)挖掘方法在電子病歷中挖掘出有價值的信息,沒有關(guān)于在語音錄入電子病歷方面應(yīng)用數(shù)據(jù)挖掘方法的研究。因此,針對智能化水平欠缺的問題,利用數(shù)據(jù)挖掘方法的文本識別算法,研究適用于挖掘關(guān)鍵病歷信息的病歷挖掘算法,從語音錄入的文本中挖掘出關(guān)鍵病歷信息,與電子病歷系統(tǒng)對接,實現(xiàn)智能語音錄入,旨在幫助醫(yī)務(wù)人員解決煩瑣的病歷錄入問題,提高臨床的智能化水平。該研究與設(shè)計基于數(shù)據(jù)挖掘方法的智能語音錄入電子病歷系統(tǒng),具有現(xiàn)實的研究意義和研究價值,為相似領(lǐng)域的研究提供參考。
5 系統(tǒng)總體架構(gòu)
基于數(shù)據(jù)挖掘智能語音錄入電子病歷系統(tǒng)的總體架構(gòu),主要包括如下幾個模塊,各個模塊之間的關(guān)系,如圖1所示。
1)語音識別軟件。負責將醫(yī)務(wù)人員語音輸入的病歷信息轉(zhuǎn)換成文本的形式,以供病歷挖掘算法從文本中挖掘出關(guān)鍵的病歷信息。
2)索引目錄。索引目錄主要包括所有電子病歷模板的表單項目的關(guān)鍵詞,每一項表單項目都對應(yīng)有相應(yīng)的關(guān)鍵詞,關(guān)鍵詞通常是某項病人指標的名稱、簡稱、習慣用語等。在索引目錄中,可以查詢到每一個電子病歷模板的每一項表單項目的關(guān)鍵詞,索引目錄是表單項目關(guān)鍵詞的全集。
3)病歷挖掘算法。利用數(shù)據(jù)挖掘方法的文本識別算法,并結(jié)合當前電子病歷模板的表單項目的索引目錄(即:關(guān)鍵詞),有針對性地從文本形式的病歷信息中挖掘出當前電子病歷模板所需要的關(guān)鍵病歷信息。
4)電子病歷系統(tǒng)。依托附屬醫(yī)院當前正在使用的電子病歷系統(tǒng),搜集所有的電子病歷模板,了解電子病歷系統(tǒng)信息傳送和存儲的運行機制。
5)中間對接軟件。中間對接軟件在語音識別軟件、病歷挖掘算法、電子病歷系統(tǒng)之間起到中介橋梁的作用,主要負責接收并轉(zhuǎn)發(fā)信息。首先接收來自語音識別軟件的文本病歷信息,并轉(zhuǎn)發(fā)給病歷挖掘算法;然后再接收來自病歷挖掘算法的關(guān)鍵病歷信息,并轉(zhuǎn)發(fā)給電子病歷系統(tǒng)。
6)軟件集成。將索引目錄、病歷挖掘算法、語音識別軟件、中間對接軟件進行集成,構(gòu)成基于數(shù)據(jù)挖掘方法的智能語音錄入電子病歷系統(tǒng)。
6 系統(tǒng)方案設(shè)計
6.1 語音識別軟件
購買語音識別軟件的使用授權(quán),熟悉語音識別軟件包提供的軟件開發(fā)調(diào)用接口,掌握相應(yīng)的調(diào)用方法。
6.2 索引目錄
根據(jù)醫(yī)院的組織架構(gòu),構(gòu)建完善的電子病歷模板的表單項目的索引目錄。如圖2所示,整個醫(yī)院采用兩級索引目錄進行管理,醫(yī)院往下直接到各個科室,各個科室對應(yīng)一級索引目錄,而每個科室又有多種電子病歷模板,因此每個科室的各種電子病歷模板對應(yīng)二級索引目錄,使得每個電子病歷模板都有對應(yīng)的索引目錄,以實現(xiàn)索引目錄全覆蓋醫(yī)院的各種電子病歷模板,且方便管理和使用。
根據(jù)醫(yī)院電子病歷系統(tǒng)中的各種電子病歷模板,整理和匯總各種電子病歷模板所包含的病歷信息項目,即針對每個電子病歷模板,編制對應(yīng)的二級索引目錄,要求二級索引目錄包含該電子病歷模板所有的表單項目,并按照二級索引目錄進行編號。
每個二級索引目錄是一張包含兩列內(nèi)容的二維列表,一列是對應(yīng)電子病歷模板的表單項目名稱,另一列是關(guān)于描述表單項目名稱的常用關(guān)鍵詞,關(guān)鍵詞包括醫(yī)學的官方名稱、簡稱、醫(yī)務(wù)人員的習慣用語等,通過簡稱或習慣用語,也能夠使挖掘出的關(guān)鍵病歷信息與電子病歷系統(tǒng)的表單項目實現(xiàn)一一匹配,為醫(yī)務(wù)人員提供便利。關(guān)鍵詞,如:心率、心跳、血氧、血壓、體溫等詞語。
6.3 病歷挖掘算法
根據(jù)數(shù)據(jù)挖掘方法的文本識別算法,研究設(shè)計適用于挖掘關(guān)鍵病歷信息的病歷挖掘算法。該算法最大的特點在于根據(jù)關(guān)鍵詞從文本中提取有效的病歷信息,因此該算法也可稱為基于特征信息的文本提取算法,即基于關(guān)鍵詞,有針對性地從病歷信息的文本中提取關(guān)鍵病歷信息的算法。基于此,要求醫(yī)務(wù)人員語音錄入電子病歷信息的方式是先說出關(guān)鍵詞,再說出對應(yīng)的病歷信息,比如:“心率80”“血氧96”等。編制有電子病歷模板的二級索引目錄,相當于為該算法提供了電子病歷模板的表單項目的所有關(guān)鍵詞,使得該算法的設(shè)計與實現(xiàn)更具體、更有針對性。
病歷挖掘算法的工作原理和工作過程如下,醫(yī)務(wù)人員在錄入電子病歷信息時,先點擊到相應(yīng)的電子病歷模板的錄入界面,也稱為電子病歷模板的表單界面,進入到錄入界面后,病歷挖掘算法根據(jù)對應(yīng)的二級索引目錄,獲取該表單界面的所有關(guān)鍵詞;然后,病歷挖掘算法根據(jù)所獲取的關(guān)鍵詞從醫(yī)務(wù)人員語音錄入的病歷信息中提取關(guān)鍵的病歷信息;最后,把關(guān)鍵詞以及對應(yīng)的關(guān)鍵病歷信息轉(zhuǎn)發(fā)給中間對接軟件,中間對接軟件根據(jù)關(guān)鍵詞與電子病歷系統(tǒng)的表單項目進行一一匹配對接,把對應(yīng)的關(guān)鍵病歷信息傳輸?shù)较鄳?yīng)的表單項目,不需要鼠標煩瑣地一一點擊到每個對應(yīng)的表單項目,從而實現(xiàn)智能化錄入。
醫(yī)務(wù)人員在語音錄入電子病歷的同時,檢查表單項目的錄入情況,如有遺漏或者錄入錯誤的表單項目,可以再次語音錄入,以此對表單項目進行補錄或者修正。
6.4 中間對接軟件
中間對接軟件的關(guān)鍵技術(shù)是將挖掘出的關(guān)鍵病歷信息與電子病歷系統(tǒng)的表單項目進行智能匹配對接,主要通過每個電子病歷模板所對應(yīng)的二級索引目錄的關(guān)鍵詞來實現(xiàn)。根據(jù)語音識別軟件包提供的軟件開發(fā)調(diào)用接口、電子病歷系統(tǒng)接收數(shù)據(jù)的對外接口以及病歷挖掘算法的工作原理,研究設(shè)計中間對接軟件。
中間對接軟件主要負責接收數(shù)據(jù)和轉(zhuǎn)發(fā)數(shù)據(jù),起到中介橋梁的作用。首先負責接收來自語音識別軟件的文本信息,并把文本信息轉(zhuǎn)發(fā)給病歷挖掘算法;然后病歷挖掘算法從文本信息中挖掘出關(guān)鍵病歷信息并轉(zhuǎn)回給中間對接軟件;最后中間對接軟件與電子病歷系統(tǒng)對接,將挖掘出的關(guān)鍵病歷信息與電子病歷系統(tǒng)的表單項目一一匹配傳輸,實現(xiàn)病歷信息的智能語音錄入功能。
6.5 系統(tǒng)集成與部署
將語音識別軟件、病歷挖掘算法和中間對接軟件進行軟件集成,打包成插件,通過在電子病歷系統(tǒng)中安裝插件的方式,實現(xiàn)軟件的部署,構(gòu)成基于數(shù)據(jù)挖掘方法的智能語音錄入電子病歷系統(tǒng)。
6.6 病人隱私問題
該研究設(shè)計僅僅是輔助醫(yī)務(wù)人員快速、高效、智能地完成電子病歷信息的錄入,只停留在轉(zhuǎn)發(fā)病歷信息的層面,并沒有建設(shè)專門的數(shù)據(jù)庫來保存相關(guān)的病歷信息。因此,在完成智能錄入病歷信息之后,該研究設(shè)計的插件沒有保存病人的信息,不涉及病人隱私泄露的問題,較好規(guī)避病人隱私泄露的風險,因此該研究設(shè)計是安全的、可行的。
7 結(jié)束語
致力于研究與設(shè)計基于數(shù)據(jù)挖掘方法的智能語音錄入電子病歷系統(tǒng),將語音識別技術(shù)與數(shù)據(jù)挖掘方法應(yīng)用于電子病歷系統(tǒng),實現(xiàn)智能化語音錄入電子病歷的功能,提高臨床電子病歷錄入的智能化水平。其中,病歷挖掘算法依賴于電子病歷模板的二級索引目錄(即關(guān)鍵詞)來設(shè)計與實現(xiàn),使病歷挖掘算法更有針對性地挖掘關(guān)鍵的病歷信息,算法的設(shè)計與實現(xiàn)更加容易和具體,準確率更高。后續(xù)將繼續(xù)優(yōu)化與改進病歷挖掘算法,進一步提高算法的準確率和穩(wěn)定性,使得病歷挖掘算法更加適用于智能語音錄入電子病歷系統(tǒng)。
參考文獻:
[1] 朱妍昕,徐維.我國電子病歷定義定位研究[J].醫(yī)學信息學雜志,2015,36(6):2-6.
[2] 潘麗.醫(yī)院電子病歷管理系統(tǒng)的探討[J].數(shù)字技術(shù)與應(yīng)用,2019,37(3):215-216.
[3] 宋華剛.醫(yī)院電子病歷管理系統(tǒng)研究[J].電子元器件與信息技術(shù),2020,4(8):130-131,133.
[4] 毛戈,李晶,姚弘毅.基于智慧醫(yī)院的電子病歷應(yīng)用和設(shè)計[J].湖北大學學報(自然科學版),2021,43(6):706-712.
[5] Richards R J,Prybutok V R,Ryan S D.Electronic medical records:tools for competitive advantage[J].International Journal of Quality and Service Sciences,2012,4(2):120-136.
[6] 李團輝.基于語音識別的電子病歷輔助編輯系統(tǒng)設(shè)計與實現(xiàn)[D].長沙:湖南大學,2017:1-76.
[7] 張瓊瑤,王晟,陳禮團.智能語音技術(shù)在門診電子病歷中的應(yīng)用實踐[J].中國數(shù)字醫(yī)學,2021,16(8):12-16.
[8] 張海波,周民偉,劉曉輝,等.智能語音識別技術(shù)在醫(yī)院臨床的探索與應(yīng)用[J].中國衛(wèi)生信息管理雜志,2017,14(5):660-663.
[9] 徐璐,趙從樸,朱雯,等.智能語音口腔電子病歷系統(tǒng)的探索與實踐[J].中國衛(wèi)生信息管理雜志,2022,19(1):121-125.
[10] 丁中正,常翀,曹凱迪,等.醫(yī)療智能語音識別系統(tǒng)的建設(shè)與應(yīng)用[J].電子技術(shù)與軟件工程,2022(1):188-191.
[11] 徐冬,陶石,劉雨生.基于語音云的電子病歷研究與實踐[J].中國數(shù)字醫(yī)學,2012,7(3):15-18.
[12] 張海陽,毛健.BP神經(jīng)網(wǎng)絡(luò)的電子病歷數(shù)據(jù)挖掘研究[J].電腦知識與技術(shù),2018,14(21):224-225.
[13] 鄭麗青,張育嘉,彭劍橋.數(shù)據(jù)挖掘在支氣管炎電子病歷中的應(yīng)用研究[J].數(shù)字技術(shù)與應(yīng)用,2019,37(5):55-56,58.
[14] 唐海英,王體春,吳婧,等.基于數(shù)據(jù)挖掘技術(shù)的電子病歷的研究與設(shè)計[J].現(xiàn)代信息科技,2019,3(8):106-108.
[15] 李照東,吳建林.基于關(guān)聯(lián)規(guī)則的電子病歷數(shù)據(jù)挖掘應(yīng)用研究[J].江蘇科技信息,2018,35(8):56-59.
[16] 童剛,姜寧,劉煥.腫瘤電子病歷數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究[J].計算機技術(shù)與發(fā)展,2020,30(8):152-156.
[17] 葛臻曉.基于電子病歷數(shù)據(jù)挖掘的急性冠脈綜合征風險評估方法研究[D].杭州:浙江大學,2020.
[18] 陳靜鋒.基于電子病歷的典型診療模式挖掘方法研究[D].大連:大連理工大學,2019.
[19] 卞德忠.基于關(guān)鍵詞自動提取的口述病歷識別系統(tǒng)設(shè)計與實現(xiàn)[D].武漢:武漢理工大學,2016:1-90.
【通聯(lián)編輯:謝媛媛】