—— 張寅升 李昊旻 段會龍
循證醫學是指臨床決策中對當前最佳科學證據的“嚴謹、明確和審慎”的使用[1]。其有力地推動了臨床醫學從傳統的經驗科學到以科學證據為主要參考的實證科學的轉變。雖然循證醫學的理念在醫學界取得了廣泛認同,但其在臨床實踐中的貫徹和實施仍面臨著諸多障礙。2003年,McGlynn等發表在《新英格蘭醫學雜志》上的調查顯示,在美國約一半的患者接受的治療并非推薦的循證治療方案[2]。目前,該問題依然存在。2014年,蘇格蘭的一項調研表明,雖已有充分臨床證據證明他汀類藥物可以有效降低糖尿病患者罹患冠心病風險,但約1/3的患者仍未應用他汀類藥物[3]。2015年的一項研究指出,雖然臨床指南規定青蒿素聯合療法(ACT)是單純性瘧疾的一線治療方案,但研究人員對喀麥隆和尼日利亞兩個國家的醫療數據進行分析后發現,很多病例并未接受ACT治療[4]。類似以上案例在文獻中被廣泛記載。這表明知識與實踐之間存在著鴻溝。如何將基于最佳臨床證據的醫學知識及時有效地轉化為臨床實踐已成為醫學界面臨的一個嚴峻挑戰。隨著醫學信息學的發展,人們發現臨床決策支持系統(Clinical Decision Support System,CDSS)能夠提高醫護人員對臨床指南等循證知識的遵從度,具備縮小知識和實踐之間鴻溝的潛力[5-7],由此產生了“循證臨床決策支持系統”這一概念。本研究將對這一概念的產生和發展進行論述。
自1946年ENIAC作為人類文明史上第一臺功能完善的電子計算機問世之后,科學家們就開始探索如何將計算機應用到醫學診斷和治療等領域,從此拉開了CDSS的序幕。根據需求和技術的不同,CDSS可以細分成多個研究分支,主要包括:
知識檢索是一項基本的決策支持需求。相關工作包括:(1)數字圖書館和醫學知識庫的建設。如1964年美國國家醫學圖書館(NLM)開發的醫學文獻分析和檢索系統(Medical Literature Analysis and Retrieval System,MedLARS)[8]及后繼者MEDLINE。(2)分類主題詞和醫學概念本體。其相比于純粹的字符串檢索具有更高的召回率,因此在知識檢索中得到了廣泛應用。相關工作包括醫學主題詞表(Medical Subject Headings,MeSH)以及一體化醫學語言系統(Unified Medical Language System,UMLS)的超級敘詞表(Metathesaurus)。(3)上下文相關的知識檢索。代表技術為infobutton[9],用以實現與特定情景相關的信息的自動推送,目前已被眾多的權威知識源(如BMJ Best Practices、MedlinePlus、Merck Manual、Micromedex等)所支持,為醫療機構集成和使用公共知識源提供了便捷。
邏輯條件評判是應用最廣的一種決策支持形式。邏輯條件的表達形式包括決策表、邏輯表達式、多值邏輯和模糊邏輯等。其中,邏輯表達式應用最為普遍,包括產生式規則(Production Rule),以及“事件-條件-動作”規則(Event-Condition-Action Rule,ECA Rule)。基于邏輯條件評判的提醒提示在早期電子病歷系統中已有使用,如HELP[10]、RMRS[11]和BICS[12]。1990年,HELP項目衍生出Arden醫學規則語言[13],并被納入HL7規范。
此類研究以數據為基礎,通過機器學習及統計分析的方法構建數學模型或分類器。在醫學領域,樸素貝葉斯分類器、貝葉斯信念網絡、決策樹、人工神經網絡和邏輯回歸模型是使用較多的模型。1959年,Ledley和Lusted在論文中首先論述了利用貝葉斯公式進行疾病診斷[14],為計算機輔助診斷奠定了基礎;此后,貝葉斯信念網絡在20世紀70年代被提出,并在80年代應用到醫學研究中。1958年,Rosenblatt提出感知機(單層ANN)[15],20世紀70年代ANN后向傳播算法的雛形出現,到了80年代,ANN開始在醫學研究中大量出現。1958年,Cox提出了邏輯回歸分析[16],隨后被廣泛應用于醫學預測模型。在大數據背景下,基于數據的分類或預測在研究領域得到了日益廣泛的關注,特別是近些年以深度學習為代表的機器學習研究得到了迅猛發展[17-19]。然而,臨床實際應用的CDSS大多數仍然基于規則。主要原因有三[20]:一是大量數據以自由文本或影像圖片的非結構化形式存在;二是從數據中學習得到的模式和知識不能及時有效地被科學驗證;三是數據方法的解釋性和接受度仍不如規則。
啟發式專家系統是指模擬專家決策行為的一套簡單而有效的規則。在早期的以專家系統為主的CDSS中,啟發式是知識庫的主要組成部分。啟發式專家系統類型分兩類:(1)基于規則的系統。這類系統使用產生式規則或ECA規則來模擬專家推理和決策。早期專家系統(如1976年Shortliffe等研制的用于診斷細菌感染及抗生素用藥選擇的MYCIN)大多采用基于規則的知識表達和推理方法。1985年,美國宇航局(NASA)開發了用于構建專家系統的CLIPS[21],把規則引擎分離成一個獨立的模塊。(2)基于框架的(Frame-Based)推理系統。1974年,Minsky[22]提出了框架概念。框架是由節點和相互關系組成的網絡,描述了目標領域中的典型情景,以及與此情景相關的各種信息,例如形勢發展預期和應對方案等。基于框架的知識表達在INTERNIST系統[23]及其后繼者QMR[23]中得到了應用。用于鑒別診斷的Isabel系統[24]也采用了基于框架的推理,Isabel根據用戶輸入的患者特征與知識庫中的疾病框架進行匹配,從而給出鑒別診斷意見。
從20世紀90年代中后期開始,醫學信息學領域涌現出一大批學者,致力于臨床指南和臨床路徑的建模工作,即計算機可解釋的指南(Computer-Interpretable Guideline,CIGs)[25]。其中,流程表達和執行是CIGs最主要的一類方法,相關工作包括EON[26]、GLIF[27]、PRODIGY[28]、PROforma[29]和SAGE[30]等。基于流程表達和執行的CDSS包括:基于Petri-Net的GUIDE[31]系統和基于EON的ATHENA[32]等。

圖1 CDSS及相關技術的發展歷史(圖中列出了其中的代表性工作)
1966年,Weizenbaum基于簡單的模式匹配研制了模擬精神心理學家的聊天工具ELIZA[33]。1968年-1970年,Winograd開發了SHRDLU[34],在一個虛擬的積木世界中實現了計算機對本體、狀態和動作的“理解”,是自然語言處理(Natural Language Processing,NLP)發展的里程碑之一。1968年,Zellig Harris闡述了子語言理論(Sublanguage Theory)[35],并提出了面向特定子領域的自然語言處理思想。此后,面向醫學領域的NLP項目相繼出現[36]。20世紀80年代是NLP發展的一個分水嶺,此前的方法大多基于語言學的語法規則,此后則較多采用機器學習方法。20世紀90年代以來,生物醫學領域陸續出現了一批具有影響力的基礎性工具和系統,如MetaMap[37]、cTAKES[38]和MedLEE[39]。
以上介紹了CDSS領域的主要幾類研究方向,除此之外,CDSS的其他分支研究領域還包括生物醫學信號處理、醫學圖像處理、數據可視化等。
圖 1按照時間先后順序對CDSS發展過程中的代表性工作進行了可視化呈現,結合前面的綜述可知,CDSS在各個歷史階段的主題呈現出明顯的時代烙印。20世紀六七十年代,CDSS以專家系統的形式關注如何將專家知識轉移到計算機,以實現對專家智能的模擬。到了80年代,人們發現傳統的專家系統并不能完全達到人類專家的智能水平,理想中的“看病機”難以實現,因此專家系統的研究一度停滯不前,取而代之的是機器學習方法的興起。到了90年代后期,面向臨床指南的建模工作大量出現,研究人員開始關注如何將指南中的知識有效轉化為計算機可處理的形式,為構建循證決策支持系統奠定了基礎。
新世紀伊始,美國醫學研究院(IOM)發布報告《人非圣賢,孰能無過》(To Err is Human)[40],引起了整個醫療領域的廣泛關注。該報告對美國醫療質量進行了分析,并得出關于醫療過失的驚人統計數字:每年約44 000至98 000名美國人因可避免的醫療過失而喪生。報告指出,臨床決策支持系統通過提供及時的、現場的診療決策支持,可以有效影響臨床行為,是減少醫療過失的重要手段。2000年,美國醫學
信息學協會(AMIA)召開春季會議,并開辟臨床證據與決策支持專場,討論如何使用CDSS來促進循證醫學。2001年,Sim等[41]進一步提出了循證CDSS(Evidence-Adaptive CDSS),并總結了構建循證CDSS的5大關鍵要素,首當其沖的是“收集臨床證據并整理為計算機可解釋的格式”。2007年,美國醫學信息學協會制定了臨床決策支持路線圖(CDSS Roadmap)[42],將對知識的訪問和應用列為臨床決策支持系統發展的3大支柱之一。
由上可知,隨著時間的推移和研究的深入,CDSS已經從原始的專家系統擴展到更為廣闊的應用場景中。特別是2000年以后,人們更加關注CDSS在應用循證醫學知識促進知識向實踐的轉化、減少醫療過失提高醫療質量方面的實際作用(表 1)。臨床決策支持系統在發展軌跡上與循證醫學的交集日漸明顯,促進循證醫學成為臨床決策支持系統的重要發展方向之一。
從概念上劃分,并非所有的CDSS都可以服務于循證醫學。符合條件者首先是一類“基于知識的臨床決策支持系統”[43],它可以將臨床指南等文獻中的醫學知識有效轉化為規則、框架、流程等計算機可處理的形式,為臨床工作者提供決策依據。在系統架構上,這類系統(圖 2)主要包含3個模塊:(1)知識表達。它將臨床診療知識表示為計算機可處理的形式,決定了計算機化知識的結構和計算機系統對這種結構的相應處理方式(推理)。(2)知識獲取。它將蘊含在文獻中的知識及醫療機構本地化后的知識轉化成符合知識表達的計算機化內容。(3)知識推理。基于計算機化的知識內容提供循證決策支持,促進臨床工作者不斷改進臨床實踐。從知識來源和應用目標看,循證CDSS更加強調以醫學文獻作為知識來源,其目標是將文獻中蘊含的基于最佳臨床證據的各類診療知識快速且有效地應用到臨床實踐中。
表1 CDSS發展過程中的目標演變

階段相關工作主題或目標1960-1970年代早期專家系統,如MYCIN對專家知識的表達和推理;人工智能1980年代專家系統研究陷入低谷,機器學習興起-1990年代后期臨床指南建模;計算機可解釋的指南(CIGs)臨床指南的知識表達,為構建“循證”的決策支持奠定基礎2000年IOM發布報告《人非圣賢,孰能無過》減少醫療過失,保障患者安全,提高醫療質量2000年美國醫學信息學協會組織召開春季會議,開辟臨床證據與決策支持專場促進循證醫學2001年Sim等提出循證CDSS概念促進循證醫學2007年美國醫學信息學協會制定臨床決策支持路線圖促進知識在臨床中的應用

圖2 循證臨床決策支持系統的體系架構
從體系結構上看,循證CDSS的核心是一個計算機化的循證醫學知識庫。這個知識庫不同于PubMed等文獻庫,它是一種高度結構化、可供CDSS高效推理的知識庫。構建這樣的知識庫,涉及兩個方面的研究:(1)醫學知識的有效表達。醫學是一個包含多種不同類型知識的復雜領域,醫學中常用的知識表達方法包括規則、框架(Frames)、邏輯回歸模型、樸素貝葉斯模型、貝葉斯信念網絡、人工神經網絡和模糊集等。知識表達是連接人可讀知識與計算機可處理知識之間的橋梁,也為知識庫的模式(Schema)設計提供了概念模型。如何設計和研究知識表達方法,使之能夠有效、全面、無偏差地傳達蘊含在醫學文獻中的各類知識將是一個重要的研究內容。從CDSS的發展過程來看,早期的CDSS多基于規則,受老派人工智能(Good Old-Fashioned AI)的“符號主義”影響較大。符號主義主張知識由表征現實世界的符號以及這些符號間的關系所構成,通過適當地操作這些符號和關系實現智能。直到今天,基于規則的CDSS仍被大量應用,它能夠簡單且明確地表征臨床場景中的多數診療知識。然而,對于復雜的醫學評判邏輯,特別是涉及到大量異構數據或影像資料時,以規則為主的知識表達方式往往難以有效處理。針對這一問題,近些年涌現出的深度神經網絡(Deep Neural Network,DNN)在若干高度復雜的醫學領域開始取得比傳統方法更優的結果[17-18,44-45],彌補了傳統知識表達和推理方法的不足。DNN起源于經典的淺層ANN,它作為“聯接主義”的新興典范,克服了以往機器學習模型表達能力弱的缺點,但同時也帶來了模型解釋度低的“黑盒”問題。尋求模型的復雜度和可解釋度之間的平衡將是知識表達的研究方向之一。(2)醫學知識的快速獲取。據統計,生物醫學領域每天有75項實驗結果和11篇綜述被發表[46]。知名的生物醫學文獻檢索引擎PubMed每年新增100萬篇文獻[47]。如何將這些快速增長的醫學文獻及時轉化為計算機可處理的數據結構,將極大地影響CDSS知識庫的時效性和循證性。針對這一要求,面向醫學文獻的自然語言處理技術有望在一定程度上實現從文獻提取結構化知識內容的自動化過程,這也是CDSS領域的持續研究熱點。IBM Waston系統是NLP技術的一個典型應用案例。2015年,Watson系統收錄了腫瘤學研究領域的42種醫學期刊、臨床試驗的60多萬條醫療證據和200萬頁文本資料。基于對海量醫學文獻的處理,Watson實現了對腫瘤的計算機輔助診療,每個決策建議都有相應的科學依據支持。2016年,Waston自動化處理了2 000萬份醫學文獻,并依據提取到的結構化知識,完成了對一名罕見白血病患者的精確診斷。以Waston為代表的NLP技術將進一步推動海量醫學文獻向循證知識庫的快速轉化。
與循證臨床決策支持系統相關的一個值得探討的問題是循證醫學與個性化醫療的矛盾。以臨床指南等文獻為載體的循證醫學知識通常只能覆蓋臨床中約80%的情況,剩余的少數案例只能個性化處理。針對這一問題,研究者認為,循證醫學與個性化醫療并非對立。“個性化”同樣需要遵循科學的證據和嚴謹的論證,本質上也是“循證”的。兩者僅存在知識粒度(Granularity)的差異,可以形象地理解為主干與分支的差別。筆者曾參與過電子化臨床路徑的研發,臨床路徑在原則上不能被設計成固定的“套餐”或“菜譜”,而應提供情景相關(Context-Aware)的分支路徑和可選項目,以滿足路徑變異和個性化治療的需要,這正是循證醫學和個性化醫療有機結合的一個典型案例。隨著分子和組學研究的開展和高通量檢驗技術的普及,CDSS在個性化診治方面具備了更多的科學依據,將這類精準醫學的知識納入CDSS知識庫有望實現個性化醫療與循證醫學兩者的進一步融合。
循證臨床決策支持系統還面臨著一個嚴峻挑戰,即知識的快速更新問題。據統計,半數的臨床指南會在5.8年后過時,10%被統計指南的有效期僅為3.6年[48]。2002年的一項研究統計了1945年-1999年之間發表的474項臨床研究,結果發現,285項(60%)研究結論是正確的,而98項(21%)是錯誤的,91項(19%)是過時的[49]。循證醫學知識的這種快速迭代對CDSS知識庫的時效性提出了很高的要求。這一問題可以通過自然語言處理來解決,其中的技術難點是如何設計有效的統計模型,對新舊文獻及不同來源的研究中相互矛盾的結論進行取舍和整合。
相比其他領域,醫學是一個嚴重依賴統計學證據的領域,其對象是千差萬別的復雜人類個體。這為循證CDSS帶來了巨大的挑戰。現階段的智能化系統與人類專家相比仍存在局限性,除了醫學文獻中的循證知識,人類專家在決策中還會綜合運用來自個體經驗的隱性知識及從其他活動中遷移學習而獲得的策略。而這是當前大多數CDSS所不具備的。因此,短期內CDSS的角色依然是輔助決策,為醫護工作者提供基于最佳科學證據的決策建議。