李曉澤,孫國強,周奕,呂強,胡紅濮
隨著人們對醫療及健康的需求不斷增加,醫務人員除需確保診斷思路、治療方案質量外,還要跟進并更新醫學領域前沿知識以提高臨床決策效率,因此各類醫療及健康系統對臨床指南知識庫的需求日益凸顯[1]。臨床指南凝聚著眾多權威醫學專家診治經驗及達成的共識,包含大量推理嚴謹的臨床思維和循證醫學證據,是權威的臨床指導意見集合[2],可為臨床診斷及治療疾病提供科學依據,對于臨床決策具有重要指導意義[3];但有調查結果顯示,多數醫生由于紙質或文本形式的臨床指南查閱耗時、使用不便而并沒很好地利用臨床指南[4],因此臨床實踐過程中仍存在臨床指南利用率低等問題。
借助自然語言處理、機器學習算法、知識圖譜等新興技術將臨床指南數字化、可視化、自動化并與各業務系統模型深度融合而應用于臨床決策支持系統(clinical decision support system,CDSS)或醫療信息化工具可使臨床指南知識的獲取由醫生需要、尋求指南建議的被動查找模式轉變為數據異常時觸發提示的主動預警模式,有利于保證臨床指南切實、便捷、高效、精準地應用,具有重要現實意義和發展前景。本研究以高血壓為例,探討了知識驅動下臨床指南可視化模型的構建流程及規則,現報道如下。
1.1 臨床指南數字化的研究背景 臨床指南在醫療領域及臨床決策中的重要地位催化并衍生出了一系列臨床指南數字化模型研究,而隨著20 世紀末循證醫學的興起、發展[2]及計算機技術的高速發展,研究者嘗試將臨床指南知識進行數字化。目前,國際上已出現近二十余種臨床指南數字化模型[5-6],如歐洲的PRODIGY(Prescribing RatiOnally with Decision-support In General-practice studY)模型[7]及美國的Arden(Arden Syntax For Medical Logic Modules)模 型[8]、GEM(Guideline Elements Model)模型、GDL(Guideline Definition Language)模型、GLIF(Guideline Interchange Format)[9]、SAGE(Sharable Active Guideline Environment)模型[10]等。臨床指南數字化模型將基于文本形式的臨床指南知識表達為計算機能夠識別的語言,在一定程度上解決了臨床指南數字化問題[11],但目前國內外在臨床實踐中得到長期、廣泛應用的臨床指南數字化模型并不多,而由于臨床指南數字化模型尚存在一些局限性[12],因此臨床指南數字化模型的應用并沒有得到預期的普及效果。有研究表明,影響臨床指南數字化模型普及的一個重要原因是大多數臨床指南數字化模型采用了基于工程化的語言,而臨床醫生對工程語言較難理解,更無法直接對臨床指南知識進行數字化模型構建[11]。
SAGE 于2002 年開始作為斯坦福醫學信息學中心、梅奧診所等共同合作的研究項目,其研發目的是在繼承現有本體特征和構建醫學標準的基礎上構建基于臨床指南的決策支持系統的互操作分布式模型,最終目標是建立一個能夠在異構的CDSS 中執行臨床指南的架構。SAGE 模型是眾多臨床指南數字化模型中較為有效的一種,但也存在部分問題未能很好地解決,如臨床醫生習慣使用自然語言進行描述、無法直接利用醫學知識建模、必須通過與知識工程師協作才可完成建模,知識工程師需先與醫生溝通并理解醫學邏輯后才可建模、并需與醫生確認,建模過程時間成本較高等[13]。
1.2 臨床指南數字化模型的基礎理論與應用 本體知識表達能力強、推理性能高,可實現知識表達與計算機的統一、互操作并支持語義網絡、知識共享,因此其被廣泛用于對相關領域知識進行明確的形式化、規范化描述。本體知識是整合、組織醫學領域相關知識的一種有效方法,SAGE 模型即是將本體知識應用于醫學領域[14]。基于本體知識的數字化模型是傳統數據庫技術與人工智能技術相結合的產物[15],其作為一種新的知識表示和存儲系統,不僅包含了傳統數據庫所能處理的簡單陳述性事實知識[16],還能夠實現特定領域推理性、過程性知識的表示及存儲,是研發及完善CDSS 的基礎。
CDSS 是臨床指南數字化在現代醫學信息交叉領域的一個代表性應用,其作為輔助醫務人員形成臨床決策的系統軟件,可通過智能信息技術而有效提高醫療質量及醫療決策效率、降低醫療差錯率及醫療費用,還可通過與患者病歷相結合(作為信息輸入)而提供針對性建議,繼而指導臨床實踐、規范診療流程[17],有利于減輕醫務人員負擔。因此,CDSS 不僅是臨床指南數字化模型的實際應用,還可從根本上保證知識源的權威性及可靠性。
知識驅動下臨床指南可視化模型針對大多數臨床指南數字化模型基于工程化語言而不易被醫生理解、應用的問題,通過借鑒語義分析及本體知識理論,以知識驅動為視角,通過將文本形式的臨床指南按照適合臨床指南表達的模型進行建模而形成可視化流程、規則庫,最終使文本形式的臨床指南轉變為易于檢索及推理的知識庫。知識驅動下臨床指南可視化模型以文本形式的臨床指南為基礎,通過可視化表達、對指南規則的解讀及本體建模、邏輯寫入而形成可被計算機識別、執行及調用的核心接口模塊,當人機接口與用戶端接入并滿足預設條件時就會自動觸發推理引擎,最終形成CDSS(見圖1)。知識驅動下臨床指南可視化模型通過將臨床指南知識進行流程化、可視化而形成醫務人員可直接看懂并能有效輔助系統研發人員更好地理解臨床指南知識的模型,克服了臨床指南數字化模型需基于工程化語言的問題,是一種很有借鑒意義的醫學信息化方法,也是醫學知識轉化過程中較為優先且關鍵的一步,有利于促進醫學知識的充分利用。
理想的知識驅動下臨床指南可視化模型應支持單元化建模[13],即將臨床指南中部分復雜的醫學邏輯系統拆分為多個功能獨立的子程序,進而從整體上降低知識庫系統與子程序的耦合度,方便在臨床指南中部分知識或邏輯變動時無需進行整體修改、僅需局部調整相應子程序及規則或添加必要的子程序,或要表達同一知識內容時僅需調用同一子程序接口、避免重復定義子程序等。支持單元化建模的知識驅動下臨床指南可視化模型有利于避免臨床指南更新及系統升級而帶來的二次開發、建模重構、知識維護等,且方便了初始建模階段團隊協作、有利于降低系統工程時間成本。

圖1 知識驅動下臨床指南可視化模型的總體架構Figure 1 Overall framework of Knowledge-driven Visualization Model of Clinical Guideline
為使醫生、知識工程師及系統研發人員等角色對知識驅動下臨床指南可視化模型有一致的理解,本研究通過借鑒SAGE 模型構建方法、應用流程圖式表達模型、結合國家相關流程圖標準并多次與臨床醫生互動而初步擬定了一套規范化流程圖表達形式及表達規則(見表1):(1)某種疾病的臨床指南可能包括多種情況下的疾病診斷、治療或管理步驟,因此每個步驟應根據臨床思維復雜度定義為若干個子程序;(2)每個子程序原則上只完成某個環節(如診斷)相對獨立且單一的功能;(3)每個子程序需有一個開端框并可有多個終止框;(4)子程序默認遵循從上到下、從左到右的表達規則,并應盡量避免交叉與循環;(5)為與開端框區分,終止框邊框進行加粗處理;(6)子程序間若存在先后性邏輯關系,則需在開端框或終止框標明。

表1 知識驅動下臨床指南可視化模型規范化流程圖表達形式及表達規則Table 1 Expression forms and rules in the normalized flowchart of Knowledge-driven Visualization Model of Clinical Guideline
本研究以高血壓為例,基于《中國高血壓防治指南(2018年修訂版)》[18]及《國家基層高血壓防治管理指南》[19]中的語義關系,通過本體知識理論將文本形式的臨床指南知識構建為知識驅動下臨床指南可視化模型,現將疾病診斷環節中的關鍵步驟“高血壓人群篩查”“心血管風險分層”作為對象,說明如下。
4.1 高血壓人群篩查子程序構建流程及規則 (1)收集并錄入待測個體收縮壓(SBP)、舒張壓(DBP)、身高、體質量、腰圍等關鍵信息,并根據規則1(P1)分為血壓正常(P1=0)、正常高值血壓(P1=1)、高血壓(P1=2);(2)血壓正常且無危險因素的待測個體根據規則2(P2)被判斷為一般人群,血壓正常且伴有危險因素(P2=1)的待測個體被判斷為易患人群且P2 可返回值(P2_level=n),返回值為n 則表明命中了n 項危險因素;(3)正常高值血壓待測個體被判斷為易患人群;(4)高血壓人群根據規則3(P3)判斷為單純收縮期高血壓及高血壓1、2、3 級并進入“心血管風險水平分層”子程序。高血壓人群篩查子程序適用于年齡>18 歲的男性和女性,主要功能是篩查人群中高血壓患者并進行高血壓分級,其構建流程及規則見圖2、表2~4。

表2 高血壓人群篩查子程序構建規則1(血壓分類)Table 2 Rule 1 of subprogram of Screening for Hypertension(blood pressure classification)

表3 高血壓人群篩查子程序構建規則2(危險因素)Table 3 Rule 2 of subprogram of Screening for Hypertensio(risk factors)

表4 高血壓人群篩查子程序構建規則3(高血壓分級)Table 4 Rule 3 of subprogram of Screening for Hypertension(classification of hypertension)
4.2 心血管風險分層子程序構建流程及規則 (1)對初診為高血壓患者涉及的5 大類關鍵指標(包括危險因素、靶器官損傷、血糖情況、是否伴有并發癥、慢性腎臟病)進行導入;(2)依次通過規則4(P4)、規則5(P5)、規則6(P6)、規則7(P7)、規則(P8)對5 大類指標進行判斷,其中P4、P5 可返回值(P4/5_level=n),返回值為n 則表明命中了n 類關鍵指標;(3)最后進入綜合分析模型并進行心血管風險分層,包括低危、中危、中/高危、高危、高/很高危、很高危共6 種風險等級。心血管風險分層子程序同樣適用于年齡>18 歲的男性和女性,主要功能是對初診高血壓患者進行心血管風險分層,其構建流程及規則見圖3、表5~6。
綜上所述,臨床指南數字化對臨床診療模式、疾病照護等有明顯改善作用,但臨床指南數字化模型仍存在不足、普及效果不佳;知識驅動下臨床指南可視化模型以臨床思維為出發點,不拘泥于使用工具或技術,力求真實地還原臨床指南知識,通過與計算機流程模型相結合而有助于揭示臨床指南中存在的沖突或錯誤、減少后期維護及升級造成的工作負擔、輔助CDSS 研發者無礙地理解醫學知識,從而解決了從臨床指南到計算機模型轉化過程中遇到的主要困難,并為醫學信息化及醫生輔助診斷系統的開發提供了參考。知識驅動下的臨床指南可視化模型的構建流程及規則是醫學領域與計算機領域之間的一座“橋梁”,對當今及未來基于臨床指南知識的CDSS 研發及應用具有深遠意義。

圖2 高血壓人群篩查子程序構建流程及規則Figure 2 Construction process and rules of the subprogram of Screening for Hypertension

表5 心血管風險分層子程序構建規則4(危險因素)Table 5 Rule 4 of subprogram of Cardiovascular Risk Stratification(risk factors)

表6 心血管風險分層子程序構建規則5(靶器官損傷)Table 6 Rule 5 of subprogram of Cardiovascular Risk Stratification(target organ damage)

圖3 心血管風險分層子程序構建流程及規則Figure 3 Construction process and rules of subprogram of Cardiovascular Risk Stratification