,, ,
臨床指南系統融合了領域內權威專家的臨床指導意見,包含了基本的臨床相關理論知識及大量科學嚴謹的臨床診療建議[1]。臨床指南中包括各種各樣的臨床決策輔助的手段,如臨床路徑指導、實踐算法、邊界準則或適當標準以及實踐參數等。臨床指南的編撰過程科學嚴謹,對指定疾病的診療有著系統全面的描述,在臨床實踐中可規避醫生主觀或其他不確定因素而導致的醫療失誤,同時規范醫生的醫學操作,降低診療成本,提高醫療質量[2]。疾病管理以臨床指南為標準,針對威脅人群健康和工作生活質量的慢性病,遵照臨床防治指南可以預防或延緩疾病的發生和轉歸,甚至改善患者結局[3]。
目前臨床實踐過程中存在臨床指南使用率低、醫生依從性差等問題,推動臨床指南的發展與應用需要更有效、智能的手段。將文本形式的臨床指南轉化為計算機知識表達模型是臨床指南實踐中需要解決的關鍵問題之一,對于提高臨床指南的利用率至關重要。在臨床實踐中,構建臨床指南知識庫是解決臨床指南應用瓶頸的方法之一。知識庫可供醫生隨時查閱指南內容,也可在其需要時提供輔助性的診斷建議。構建知識庫的第一步是對文本臨床指南的合理知識表達。本文將著重分析臨床指南知識表達模型的發展現狀以及存在的問題,討論各模型的特點,以期為構建臨床指南知識庫提供理論支持。
20世紀90年代,世界著名循證醫學的創始人之一Guyatt教授提出了“循證醫學”的概念,之后臨床指南隨之誕生并迅猛發展。目前被廣泛認可的臨床指南的定義是1990年美國醫學研究所提出的。臨床指南即系統開發的多組指導意見,幫助醫生和患者針對具體的臨床問題做出恰當處理,從而選擇、決策適宜的衛生保健服務[1]。在醫生對疾病有任何疑問的時候,都可通過查閱臨床指南得到解答[4],智能的臨床指南知識庫還可在適當的時機為醫生提供科學的臨床決策建議。
臨床指南是伴隨循證醫學的蓬勃發展順勢而出的產物,也是循證醫學和臨床實踐的紐帶,主要得益于其嚴謹的開發過程,這保證了臨床指南內容的科學與準確。臨床指南出現的重要意義是臨床指南將醫學理論知識與大量專家意見相結合,同時符合嚴謹的循證醫學。醫務人員可以通過學習臨床指南提高診療水平,并在臨床實踐中靈活運用。
臨床指南的主要作用是在臨床實踐活動中為醫務人員提供理論支持和參考建議。臨床指南并未規定醫生必須按步驟操作以束縛醫生的診斷思維,阻礙醫生在診療過程中發揮主觀能動性。因此臨床指南并不能完全取代醫生的思維和臨床判斷。Berner[5]教授按照臨床知識的描述及內容的差別將文本指南中的臨床知識分為邏輯(Logic)、過程(Procedural)、網絡(Graph/Network)和組織(Structured)4層。
1.2.1 醫學邏輯
邏輯是人們用以處理問題而抽象的一種思維規則或計算方法,是人工智能領域中最常用的表達形式之一。臨床指南中的臨床知識主要是由陳述性知識(Declarative Knowledge)和程序性知識(Procedural Knowledge)組成。從信息加工處理的角度講,陳述性知識是有關事物及其關系的知識,包括事實、概念、原則和理論等;程序性知識是有關完成某項任務的行為或操作步驟的知識,包括進行信息轉換活動的所有具體程序和從事此類活動的技能。其中陳述性知識一般由命題和語句組成,命題最大的特點之一是采用“是”(True)或者“否”(Flase)的形式,如收縮壓≥140 mmHg或舒張壓≥90 mmHg可表示為:(SBP≥140 mmHg)or(DBP≥90 mmHg)
當然,臨床指南中的醫學邏輯并非都明確清晰,也存在含糊不清的語句。對于不同的醫學邏輯,在邏輯層所采用的知識表達方法也相應存在差別[6]。
1.2.2 醫學流程
醫學流程是臨床指南中臨床知識的另一部分,主要是用邏輯表達符將陳述性知識進行連接,然后進行推理得出陳述性醫學知識表示的結論。如在非同日3次血壓值的條件下,如果患者的收縮壓大于等于140 mmHg或舒張壓大于等于90 mmHg,則患有高血壓,知識表達如下:
IF(SBP≥140 mmHg)or(DBP≥90 mmHg)
THEN Hypertension is True
1.2.3 知識網絡
臨床指南中包含大量的醫學流程,如高血壓的診斷性評估主要包含“病史檢查”“體格檢查”“實驗室檢查”“血壓測量”“靶器官損害檢查”5個醫學流程,但它們并不是無序的,通過節點的形式將醫學流程連接,節點間通過有向箭頭連接為知識網絡。目前構建臨床指南中知識網絡的常見方法有決策樹、貝葉斯網絡、人工神經網絡以及語義網絡技術等。
1.2.4 知識組織
知識網絡是將含有知識的集合物加入信息價值的一種跨學科領域的文化活動,以便為用戶群提供最好的相關信息體系,即知識的序化。臨床指南中的知識組織是按照指南知識的內在邏輯聯系,運用一定的組織工具、方法和標準對知識對象進行整理、加工、表示和控制等一系列的序化活動,將領域內的醫學知識關聯成為一個整體。知識庫和臨床決策支持系統(Clinical Decision Support System,CDSS)不可能僅服務于某一疾病領域,因此對領域間的醫學知識進行規范整理、序化和表達,有利于臨床指南知識的共享和更新。如對于一個服務于社區衛生的慢病管理決策支持系統,其中需同時包含常見的慢性病,如糖尿病、高血壓、腦卒中等慢病的診斷防治指南。
對臨床指南中的知識進行分層關鍵在于對臨床指南知識表達模型進行選擇時,應針對不同指南、不同層次知識的特點,在構建知識表達模型的過程中達到與指南的高度融合。
臨床指南是由自然語言組成的文本,盡管醫生可通過使用臨床指南提高醫療服務質量,減少醫療事故,但在實際操作過程中,依然存在以下問題。
1.3.1 文本指南語義不明
書面的臨床指南由自然語言構成,經常會出現定義不明確、表達缺乏特異性的情況,尤其是臨床的不良事件等方面[7]。臨床指南中的術語定義不確切,要表達的建議經常不清楚,有時措詞含糊,從而導致閱讀與整合困難[8]。
1.3.2 醫生的積極性不足
大多數情況下,醫生的接診時間有限,無法及時查看指南上的信息輔助自己判斷。診療時醫生更需要準確理解,將患者的病情與臨床指南相結合,提出個性化治療方案,對醫生而言這些使用臨床指南產生的工作延長了工作時間,增加了負荷。臨床指南只對某種或某類疾病有指導意見,會與具有個性化特點的患者之間存在一定差異,需要醫生靈活判斷。
1.3.3 指南導向與現代診療理念不符
臨床指南是以疾病為導向的,通過收集有關特定疾病的現有證據編寫而成,具有較高的學術意義。而在日常醫療實踐中,疾病通常伴隨著其他合并癥,需多個專業醫生共同合作,利用多個臨床指南的信息對患者疾病進行準確診斷。這種不同專業的醫生對同一患者同時使用多個臨床指南的過程需監督機制以減少醫療失誤。而現代醫療的理念是以患者為中心,因此疾病為中心的指南的適用性受到了質疑和挑戰[9]。受到當前技術條件的限制,絕大多數臨床指南都無法被計算機識別、理解與分析,因而決策支持系統不能直接提取患者電子病歷中的信息并分析指南中的有關知識,在患者診療的關鍵時刻,準確有效地向醫生提供決策建議。系統也無法為醫生提供檢索學習的功能。但是通過文獻調研發現,在實際診療過程中只有少數醫生使用臨床指南,并且是在遇到棘手的疾病時才會查詢指南,因為在臨床實踐中翻看、查找、理解到需要的臨床指南將花費更多時間,導致診斷治療速度降低,甚至延誤病情。
隨著衛生信息化的迅猛發展以及各種疾病臨床指南日臻完善,國內外研究也從對文本形式臨床指南領域轉變為了數字化臨床指南方面。數字化臨床指南是將臨床指南編入計算機可識別的結構模型中,與CDSS相結合,在系統中以主動(出現異常時主動提醒)或被動(等待醫生尋求建議)的形式提供給醫生,將指南的參考與建議作用發揮到最大[10]。以下對目前國內外臨床指南知識表達模型發展現狀及各模型間的區別比較進行介紹。
臨床指南產生于20世紀末期,一些國家對于臨床指南的數字化研究已經取得了較理想的成果。隨著國內外對臨床指南數字化研究的深入,目前比較成熟的臨床指南知識表達模型有將近20項[11](圖1)。

圖1 臨床指南知識表達模型發展歷程[12]
1989年,Arden語法首次被提出,它提供了一組醫學邏輯模塊[13],每個模塊包含進行一項單獨醫學決策所需的邏輯。但Arden語法不足以表示復雜的臨床指南,如具有高級臨床決策算法或多個步驟隨時間推移[14-15]。隨后出現了更加靈活全面的表達模型,如美國的Asbru、EON、GLIF和 SAGE,歐洲的GUIDE,PRODIGY,PROforma,GASTON等。其中,SAGE和GLIF旨在實現通用的、可互換的格式,PRODIGY3重點表達某些疾病領域(如慢性病管理和預防保健程序)中的指南。
臨床指南表達方法主要分為基于自然語言處理和人工智能等技術兩類。整理標注文本指南,通過標簽的方式,人工將臨床指南加工成計算機可以理解的新文本[16],典型模型是GEM。根據指南中的診療過程,可視化表示醫學流程,通過流程圖中節點間的關系可視化表達指南的內容,典型模型是GLIF。大多數現有的臨床指南知識表達模型是獨立開發,但模型具有共同點,系統反映了建模工作的綜合觀點及其固有屬性[17]。盡管指南知識表達模型都有獨特的設計選擇,但可代表和執行各種復雜程度不一的指南;提供可視化的工具,允許非專家用戶能夠通過界面形式直接創建、修改、編譯、刪除和執行實現臨床指南的計算機算法;通過最小的、能重用的結構有效地表達指南,以最大限度地減少通用臨床指南表達的工作量。以下為幾個較為典型的臨床指南知識表達模型,支持異構的決策支持系統無縫集成,并自動化執行。
2.1.1 GLIF
GLIF(Guideline Interchange Format)是由美國哈佛大學、斯坦福大學、哥倫比亞大學和麥吉爾大學醫學信息學實驗室的合作項目——Inter Med協作實驗室開發的,其主要動機是實現用于建模和傳播臨床指南的標準化共享語言,提出一個精確、無歧義、可閱讀、機器可識別、在計算機平臺獨立的指南知識表達模型[18]。GLIF的構建目標是通過不同的軟件工具啟用查看GLIF3格式的指南,使臨床指南適應各種本地化應用。GLIF使用Protégé作為其編輯工具,其中GLIF3開發面向對象的咨詢和表達語言-GELLO編碼醫學決策規則[19],用概念層、邏輯層及應用層的三層架構對指南進行抽象。比較成熟的應用案例包括:以色列幾家初級護理門診診所中正在使用GLIF3表達糖尿病足部疾病相關的臨床指南輔助臨床決策,哥倫比亞大學以冠狀旁路移植術術后護理指南為基礎進行決策服務[20],紐約長老會醫院正在探索利用GLIF及其推理引擎與臨床信息系統的臨床事件監測相結合。
GLIF知識表達模型的特點是引入領域本體,通過本體論的方法實現了臨床指南內容的規范表達;缺點是建立過程復雜,需要跨行業研究人員的合作。醫學專家構建醫學決策和行為方面的流程圖,表述臨床指南的核心實質。在此基礎上,GLIF3信息學家編碼定義表達模型中的細節,如患者數據類型、每個醫療決策的算法和臨床建議等。從指南內容的流程圖建立到指南中概念和邏輯表達式的形式化編碼,過程較繁瑣[21]。此外,GLIF缺乏與機構信息系統集成的可靠容量,尚未被衛生信息學界廣泛認可,缺乏標準的醫療術語和通信協議,HL7等標準研究機構已在努力解決此問題。利用虛擬電子病歷(vEMR)的概念,最終可能會解決問題。然而,如何將本體模型與異質臨床信息系統整合仍然是一個挑戰。
2.1.2 Arden Syntax
Arden醫學邏輯模塊語言(Arden Syntax For Medical Logic Modules)是第一個表達模型,于1989年被提出,1999年被HL7收納。Arden Syntax是一個為了便于各醫療機構之間共享醫學知識而產生的醫學邏輯模型,主要為決策支持系統提供可使用的知識,為醫務人員提供診療的參考建議和提醒[22]。Arden語言將醫學知識編碼作為基于規則的程序,也稱為醫學邏輯模塊(Medical Logic Modules,MLM)。每個MLM都包含足以做出一個臨床決策的醫學知識,一套可以做出單一的醫學決策的邏輯。Arden Syntax并不能用于表示綜合臨床指南,為構建一個完整的臨床指南,需要構建復雜的邏輯來連接各個MLM,因此Arden開發了擴展語法來適應這種限制。如交互式MLM,指定了如何使用多個MLM作為一組來模擬指南行為,并增加了增強版決策表,實現了額外容量的計算,如概率推理。
Arden Syntax曾在美國Columbia-Presbyterian醫學中心驗證應用,醫學中心編輯了約240個MLMs,每個MLM的內容得到了 HL7 Arden 工作小組的驗證和維護[23]。Arden語言組織的醫學邏輯模塊結構清晰,分工劃分明確,同時支持可擴展標記語言XML進行編碼,這有利于與電子病歷的結合。其局限性與GLIF相同,都是將本體與異質臨床信息系統整合問題。由于不同地域的醫學數據結構,醫療術語及數據訪問方式不盡相同,本地化應用存在困難。
2.1.3 EON
EON是由斯坦福大學醫學信息學系1996-2003年開發的臨床指南知識表達模型,之后轉交SAGE項目組。其目的是創建由一組軟件組件組成的體系結構和開發人員使用的一組接口來構建強大的決策支持系統[24]。EON定義了指南知識結構,如資格標準、抽象定義、指南算法,決策模型和時間查詢等方面[25]。EON系統的研究主要集中在3個方面:利用面向時間概念的患者診療記錄建立科學的推理機制,如何利用知識表達模型向患者提供準確的決策支持,為臨床指南和協議的編碼創建知識環境。
ATHENA決策支持系統是一個基于EON模型的高血壓決策支持系統,完成了與電子病歷系統的整合,目前已在美國退伍軍人部的3個醫療中心成功實施[26]。ATHENA客戶端通過指南解釋器和數據庫服務器處理用戶的需求,并顯示建議或參考。曾有研究者對ATHENA系統進行了長達15個月的臨床評估實驗[27],初步數據表明,通過ATHENA系統醫生加強了對高血壓的治療,其中63.9%的患者在實驗時間內已經配以2種以上的抗高血壓藥物,ATHENA系統運行良好,醫務人員依從性較高。
2.1.4 SAGE
與GLIF類似,開發SAGE(Sharable Active Guideline Environment)的目的是在繼承現有本體的特征和構建醫學標準的基礎上,實現基于臨床指南的決策支持系統的互操作分布式模型。SAGE于2002年開始作為IDX公司、斯坦福醫學信息學系、梅奧診所、內布拉斯加大學、山間醫療保健組織和Apelon之間的合作項目。SAGE的最終目標是建立一個能夠在異構的臨床決策系統中執行指南的架構[28]。SAGE采用Protégé作為編輯工具,使用Kwiz作為定制插件,擴展了Protégé在SAGE中的指南建模能力,已經編碼的指南包括免疫、糖尿病和社區獲得性肺炎指南本體,計劃在梅奧診所和內布拉斯加大學醫學中心的模擬環境中使用。
SAGE模型可吸收存在的臨床指南知識表達模型的優點與特色,建立自己的表達模型,各個模塊都有其他模型部分的特色,如Activity Gragh、Decision Map、Decision Model等模塊。因此,研究SAGE模型的知識表達框架,有利于對其他臨床指南知識表達模型的兼容性研究(圖2)。

圖2 SAGE模型吸收其他模型模塊示意圖
上述4種主流臨床指南知識表達模型基本涵蓋了臨床指南表達研究的大部分領域。Peleg等人[29]利用對比分析法嘗試各種指南建模方法,通過指南計劃組成、目標表征及意圖,指南行為模型、決策模型、標準表達語言、數據解釋、醫學概念模型及患者信息模型8個維度對以上模型進行了并列比較,得出了在計劃組織、表達語言、概念醫療記錄模型等維度上發現了共識和主要差異在其目標表示、決策模型、場景的使用及結構化醫療行為方面的結論。
2.2.1 目標表示
臨床指南知識表達模型根據其如何表達指南意圖或目標分為2組。GLIF將目標指定為文本字符串,目的是將此文本呈現給用戶或用于索引和搜索臨床指南;將指南目標表示成表達式,目的是用作控制計劃執行狀態。EON等模型通過表達式,并使用結果表達式影響控制流程、生成建議或解釋。
2.2.2 決策模型
決策是大多數臨床指南的核心。4種臨床指南表達模型中使用了交換結構、論證模式、決策樹、影響圖等決策模型,還支持通過調用外部函數進行決策。
2.2.2.1 交換結構
交換結構描述了在分支確定的情況下指南控制流的互斥分支。GLIF和EON都使用特定的圖元建模這種交換結構,通過測試表達式是否匹配多個常量值中的一個,并強制執行相應地進行分支。其他格式不使用顯式結構表示交換結構,而是通過前提條件或論證規則中的互斥表達式實現類似的行為。
2.2.2.2 選擇是否使用替代品的論證規則
4種模型使用論證規則表達如何選擇替代品的非確定性決策,即當存在2種以上的患者可行的替代方案時應如何選擇。不同的選項與不同的條件-參數集相關聯,模型可用數字表示方案的支持程度(如成本/效用模式)或使用符號權重(如反對、確認和排除),二者都需使用聚合權重的方法。
2.2.3 計劃
雖然4種模型都使用術語“計劃”(Plan)來描述任務集合,但使用該術語的方式仍存在差異。計劃指的是“整體設計或目標的部分的有序排列”,而EON則是區分“管理指南”(疾病狀態圖)和“咨詢模板”(對于不屬于管理決策的行為的、數據收集或顯示的或者和病人教育有關的上下文關聯建議)。GLIF有指南和宏2種計劃,指南類似于EON的管理指南,宏是通過聲明將指南中指定程序模塊變成一組GLIF的三步驟所實現的單個構建體。下面通過不同的計劃組件對4種模型進行對比。
一是分支(Branching)。GLIF和EON在指南實施中分支步驟和同步步驟是并行的,根據非布爾選擇方法,分支步驟將流程引導到1個或多個指南步驟中。分支步驟和同步步驟一起使用,通過多個可能并行的路徑來同步控制流程。當分支步驟上的選擇方法是并行時,同步步驟進一步沿著分支步驟的每個可能路徑進行,以便在可以訪問準則中的附加步驟之前重新同步控制流程。
二是行為(Action)。臨床指南行為是用于表示臨床指南描述的實際任務的建模原語(如藥物處方)。雖然所有的指南表達模型都可以指定醫療行為,但并不是所有的模型都是通過專業的結構化概念實現的。GLIF和EON中的醫療行為包含用于將其實例映射為指定詞匯表的槽。在GLIF中,指南編碼器通過HL7參考信息模型的數據模型定義患者數據項的屬性的方式指定醫療行為。
三是場景(Scenario)。EON中的情景或GLIF中的患者狀態是一個定義患者具體情況的計劃組件。其特征在于患者狀況、治療情況等[30],方案作為臨床指南的切入點。在EON中,咨詢模型與用于描述場景的特定操作相關聯。
總之,4種模型各有特點。EON的側重點在于研究支撐臨床指南知識表達模型開發和應用的臨床決策支持架構的研究,GLIF和Arden Syntax在臨床指南知識表達模型的標準化研究工作上有獨到見解,SAGE模型在之前指南表達模型研究的基礎上集成了這些指南表達模型的優點。
大多數情況下,組成臨床決策的臨床知識是需要多專業合作的,因此臨床指南表達模型必須是可共享和互操作的,而知識的共享必然做到知識標準化。目前,在數字化臨床指南領域進行知識標準化的相關工作條件并不成熟,知識表達標準中應該包含哪些組成部分仍然存在爭議,從組件的標準到形成完整的計算機可執行的臨床指南標準的過程尚不清楚[31]。
構建一個不受機構、國家與地區限制的、可共享、可執行的知識是臨床指南知識表達模型研究者和開發機構的終極目標[20]。由于表達模型的多樣性和不同地區臨床指南本土化需求的不同,共享模型變得困難。DeGel教授和Open Clinical等組織正在為促進臨床指南表達模型的共享而努力,致力于構建一個計算機可理解、可執行的指南模型庫和組件,目前已開發出執行不同臨床指南模型的引擎[32-33]。
上述臨床指南表達模型雖涵蓋了模型研究工作的大部分領域,但其中的不確定性知識的效果有限,支持力度不足。因為不是所有醫學指標都能精確量化,在臨床指南中經常出現“輕度”“少許”等不確定性詞匯,需要醫生結合實際情況和個人經驗去主觀判斷。由于目前醫學發展水平的限制,臨床指南很難準確而全面地描述所有疾病的成因、診斷與治療方案。而不確定性醫學知識的表達研究對于提高臨床決策支持系統給出的診療建議的正確性有較大的幫助[6]。