【摘" 要】 針對權威的循證醫學知識庫、規則引擎無法覆蓋醫院臨床實踐經驗的問題,文章提出利用人工智能技術構建醫院臨床最佳實踐庫,以優化臨床決策支持系統,使之更貼合醫院實際診療情況,提升決策支持的精準性。
【關鍵詞】 人工智能;自然語言處理;臨床決策支持;臨床最佳實踐
醫療技術不斷發展,醫療工作者遇到疑難病例的時候,難以從海量的信息中快速發現有用的知識。為此,利用大數據技術收集整理數據,并建立起邏輯關系點,關聯知識點,通過與醫院信息系統結合,采用警告、提醒、文檔管理以及相關數據表達形式,為相關的醫療工作者提供實時、權威、有效的臨床決策支持的臨床決策支持系統顯得尤為必要。
阮彤、高炬等人總結了臨床醫療大數據挖掘的核心流程。流程包括以臨床數據集成、基于知識圖譜的臨床專病庫的構建過程、電子病歷數據質量的評估方法以及以臨床療效分析與疾病預測為核心的臨床醫療大數據應用等任務,進而對流程中的每個任務提出了解決方案,給出了實驗結果。因此,利用臨床決策支持系統(Clinical Decision Support System, CDSS)挖掘以醫院電子病歷為核心的臨床數據記錄的患者的疾病、診斷和治療信息,可以輔助醫生進行臨床科研與臨床診療。
CDSS不但要有權威的循證醫學知識庫、規則引擎,還要利用大數據與人工智能技術從真實世界中挖掘出海量臨床數據,進行整合、清洗、機器學習等,通過人工智能技術(Artificial Intelligence技術,AI技術),讓機器來“讀懂”海量的病歷數據,構建醫院臨床最佳實踐庫。
臨床最佳實踐庫能夠充分地總結臨床實踐經驗,最真實地反映臨床診療行為取得的療效,以此推薦最佳診療活動。臨床最佳實踐庫應用在診療過程中,能夠充分利用病例中結構化以及非結構化數據,通過多方渠道及時以正確的干預模式向醫療工作者以及患者提供正確的診療決策支持信息。
一、自然語言處理
自然語言處理NLP(Natural Language Processing),是對自由文本進行結構化處理,最終實現計算機對人類自然語言的有效翻譯。而自然語言處理在醫學領域中又產生了醫學自然語言處理MLP(Medical Language Processing),把自然語言處理應用到醫學領域當中,從自由文本當中得到結構化數據,提取有效信息。NLP技術的發展將有效提高大數據挖掘和分析能力,這些技術對臨床智能支持、循證醫學研究,構建醫院臨床最佳實踐庫,優化臨床決策支持系統具有重大意義。
(一)樸素貝葉斯算法
針對電子病歷中日常病程記錄來說,往往記錄著住院患者的每日病情和診療情況的具體變化,主要包含當前病情記錄和診療計劃章節信息。但是在病歷中,這兩個章節的內容往往寫在一起,不容易讓機器準確地分離出這兩個章節的信息。樸素貝葉斯算法主要應用于將當前病情記錄和診療計劃這兩個章節的內容準確地從病程記錄中分離出來,然后再對每個章節的內容進行信息提取,從而形成更精準的結構化數據。
(二)改進的Jieba分詞算法
信息抽取過程中的首要工作就是對文本信息做分詞抽取工作。對醫療領域來說,其專業的醫學術語十分復雜,開源工具Jieba分詞算法直接應用于電子病歷數據并不能得到理想的結果,需要根據實際情況進行改進。首先對Jieba分詞算法中的自定義字典進行了整理,其次將專業的醫學字典加載到Jieba自定義字典中,再對模型進行訓練,得到初步改進的Jieba分詞算法。最后對Jieba分詞算法中進行了二次開發處理,加入一些醫學數據抽取規則,將未分出的醫學術語進行了二次提取,將分詞錯誤的結果進行修改操作,從而不斷提高數據準確性。
二、機器學習
(一)KNN算法
KNN(K-NearestNeighbor)分類算法是數據挖掘分類技術中最簡單的方法之一,可以計算出預測病例在歷史病例中最為相似的K個病例,統計K個病例的疾病標簽,從而計算出該病例的疾病概率。該模型適合對稀有疾病進行分類,對于類域的交叉或重疊較多的疾病分類效果與其他模型相比較好。
(二)隨機森林算法
隨機森林(Random Forest,RF)算法是Leo Breiman提出的一種利用多個樹學習器進行分類預測和回歸預測的組合算法。將現有的病例放回的隨機采樣,模擬K個醫生,每個醫生通過學習等量的不同的隨機樣本集,使用決策樹建立自己的模型,最后當決策一個新的病例時,采用投票法或平均分值法來決定。在當前的很多數據集上,相對其他算法有著很大的優勢,能夠處理很高維度的數據,并且不用做特征選擇。
(三)FM推薦算法
此算法不僅將病例中的特征進行權重學習,而且通過將病例的癥狀特征和知識庫中的疾病癥狀特征做組合特征學習。通過學習和修正特征權重計,該模型解決稀疏數據下的特征組合問題,能夠表示特征與特征之間的關聯關系。
(四)深度神經網絡
通過構建多層神經網絡,輸入層為病例特征,輸出層為標準化后的疾病,通過迭代訓練不斷更新修正隱層神經元的權重值,最后訓練出一個泛化能力較好的模型,可用于新病例的預測。與傳統的神經網絡相比,該模型神經網絡在大數據量的訓練集的多分類問題,往往擁有較高的準確率。
(五)規則引擎
規則引擎是指利用知識庫中的已知診斷規則進行診斷,將病人的癥狀、檢查檢驗異常數據等來匹配診斷規則。應用規則引擎技術,構建疾病分類處理技術平臺,有助于臨床決策支持系統的不斷完善和質量管理知識庫的積累與形成,對于不斷擴展的業務系統以及更加精細化的質量管理需求有更好的適應性。
(六)模型整合
通過比較以上幾種不同算法的優缺點,采用投票、特定模型優先、權值相加等策略整合各個模型的預測結果,以得到最準確的輸出。主要優點體現在:1. 可以避免某單個模型的局限性和不完全性;2. 不同模型的思想側重點不一樣,通過結合不同模型的結果,會降低漏診和誤診的可能性;3. 傳統算法和深度學習算法結合,相對于某單個子算法,診斷疾病準確率有所提升。
三、構建醫院臨床最佳實踐庫
(一)搭建資源中心
以梅州市人民醫院為例,醫院數據來源主要由BMJ循證醫學知識庫和臨床數據中心(CDR)構成。BMJ循證醫學最佳實踐主要為資源中心系統提供要點式、精準化標準邏輯支撐,構建循證醫學最佳實踐庫;臨床數據中心能夠實現醫院不同業務系統的有效集成與實時信息共享,包括醫院各業務系統中的歷史病例資料,利用大數據與人工智能技術從真實世界中挖掘出海量臨床數據,進行整合、清洗、機器學習等,構建醫院臨床最佳實踐庫。
(二)建立診療模型
在資源中心架構基礎上,以臨床數據倉庫、BMJ循證醫學知識庫作為數據基礎,將清洗后的病歷數據與基礎數據融合,構建臨床、循證醫學最佳實踐庫。利用KNN算法、FM推薦算法等機器學習算法訓練模型并持續優化,從而得到臨床決策支持模型,輔助臨床診療方案制訂。
(三)輔助臨床診療決策
從病例數據中提取的數據進行數學方式和計算機建模,形成結構化數據,并構建好知識圖譜。可以從病例數據庫中獲得相關的醫學規律,從而探究癥狀、體征以及疾病之間更加深層次的、不易被發現的潛在關系。
在醫生進行決策時,臨床決策在資源中心的基礎上,將療效評價模型嵌入醫院電子病歷,采集患者癥狀、主訴、病史、處方、檢查結果、檢驗指標等電子病歷數據信息,再進行真實世界數據挖掘,從不同角度計算療效,并以此為依據,然后通過智能推理,形成并自動篩選合適的推薦診斷以及精準化、個性化的治療方案等臨床決策支持知識,幫助醫生有效提高初診正確率,縮短確診時長,減少誤診誤治。
(四)全過程綜合預警提醒
在資源中心的基礎上,梅州市人民醫院將112個異常指標、19523條預警提醒規則通過可配置的方式添加到規則應用平臺并嵌入到各個信息系統,在臨床醫生錄入診斷、書寫病歷、用藥、檢驗報告、檢查報告等各環節為其提供實行的預警提醒和病情發展評估,從不同角度計算療效并自動篩選后推薦多種可供參考的治療方案。除此之外,根據事件的輕重緩急平臺將預警等級化,分為藍色預警、黃色預警、橙色預警、紅色預警,程度依次加重,醫生可根據其程度進行決策。
(五)實時統一的病歷內涵質量控制
通過數據資源中心搭建了智能化病歷內涵質控平臺,不僅輔助臨床醫生在書寫病歷環節及時發現缺陷、修改缺陷,提高病歷書寫質量,還借助病歷質量監控平臺,實現對全院病歷質量水平的監管,為病歷質控決策提供參考。
(六)知識檢索服務
由于有BMJ循證醫學知識庫強大的支撐,醫院共收錄疾病知識近4萬條,藥學知識近3萬條,輔助檢查近1萬條,文獻、指南、循證醫學證據1000多萬條數據,據此完善知識檢索語義分析,創建疾病同義詞對照16121對,層級關系24881個;藥品同義詞對照8764對,層級關系8117種;737類3萬多種癥狀體征的同義及層級關系術語集等,改變以往的數據庫低效率的搜索邏輯,醫生在使用時可根據自身業務進行分類搜索,提升檢索質量及效率。
四、預期優化效果
(一)疾病輔助診斷
模擬人類專家決策過程,從電子病歷得到的診斷要素,初步判斷疾病類型。然后獲取檢查、檢驗結果,自動匯總加入患者的病情信息,給出進一步的診斷明確推薦信息或確診建議,其優勢在于能為門診醫生提供豐富的臨床經驗,結合相關病例,輔助醫生鑒別診斷結果,有效提高醫生診斷水平。
(二)臨床預警提示
臨床預警提示貫穿于各個業務系統的診療過程當中,通過預先配置的診療服務項目互斥、用藥禁忌等相關規則,系統根據臨床數據中心規則引擎在設定預警點進行必要的預警提示,從而避免臨床出現不合理處方、不合理診療等情況,從而提升醫療質量,減少醫療事故。
(三)質控管理
系統打通患者整個診療過程的質量控制環節,提供全面的、實時的、動態的質量控制,及時預警診療過程事件,適時干預診療缺陷,實時監測病歷質量,實現精細化的質量控制閉環管理,規范診療,全方位保證患者安全,維持穩定的醫療救治水平。
五、結語
隨著信息技術的發展和醫療信息化建設的不斷深入,使用科學合理的人工智能技術對醫院臨床最佳實踐庫的數據進行挖掘和利用,在一定程度上能消除不同醫療結構之間的信息壁壘,讓海量的醫療數據得以有效互通和共享。人工智能技術的發展和應用讓數據挖掘更加快速、精準、可靠地發現更多潛在的有價值的知識,為臨床決策支持提供了必要的基礎。人工智能技術的運用,為構建更全面的醫院臨床最佳實踐庫發揮更大的作用,基于人工智能建立的醫院臨床最佳實踐庫使臨床決策更加智能化。
醫院臨床最佳實踐庫具有深度學習能力,需要全方位、多層次、動態性好的知識庫支持。人工智能技術使系統反饋處理實時診療數據更加快速,從而提供更加智能的決策支持,真正幫助一線醫療工作者解決疑難病例,減少診療失誤。
參考文獻:
[1] 阮彤,高炬,馮東雷,等. 基于電子病歷的臨床醫療大數據挖掘流程與方法[J]. 大數據,2017,3(05):83-98
[2] 李昊曼,段會龍,呂旭東,等. 醫學語言處理技術及應用[J].中國數字醫學,2008,3(11):11-13+30.
[3] 孔曉風,李瑩,李昊旻,等. 基于自然語言處理技術的消化科內窺鏡檢查報告的結構化[J]. 中國醫療器械雜志,2008,32(05):348-351.