孫海英
(佳木斯大學圖書館,黑龍江 佳木斯 154007)
循證醫學(evidence-based medicine,EBM)是20世紀末產生的臨床醫學新興交叉學科,一經問世,在國際、國內臨床醫學領域內得到了迅速發展。其核心思想是:任何醫療決策都應建立在新近最佳臨床研究證據(current best evidence)的基礎上,即遵循證據的臨床醫學。目的是為了臨床醫療決策的科學化。進入網絡時代,信息和證據的檢索日趨完善,計算機和決策支持以及臨床實踐指南不斷更新,使臨床證據的獲得更為快速和便捷。但是我國與發達國家比較還有很大差距,在傳統經驗醫學向循證醫學轉變過程中,還需要下大力氣向廣大臨床醫學工作者普及循證醫學理論和方法,指導循證醫學臨床研究與實踐。因此建立中文循證醫學證據知識庫對于循證醫學的普及和發展具有重要作用。
知識庫又稱智能數據庫或人工智能數據庫,正是由于人工智能(AI)與數據庫(DB)這兩項計算機技術相結合才促使知識庫及其系統的產生和發展。作為一種開發工具與環境,知識庫為用戶開發基于知識的系統提供支撐。知識庫系統的核心組成部分是知識庫和推理機構。知識庫是以一致的形式存貯知識的機構,推理機構則是為了使用知識庫藏內的知識執行推理的控制機構。
知識庫系統具有下列特點:
①具有支持數據庫的全部功能,包括對大批量數據的高效存取以及數據共享、數據的安全性、并發控制、故障恢復等功能。
②具有存取知識、管理知識的功能。
③知識庫系統的核心部分是一個推理機構,它完成對知識的處理。
④一般以關系數據庫管理系統為基礎,外加一個規則庫與推理層,組成一個知識庫系統。
⑤一個知識庫系統一般應能存儲與管理適量的事實與規則。
循證醫學(EBM)的產生與隨機對照試驗(RCT)的問世和方法學發展密切相關。網絡技術的發展起著巨大推動作用。1948年英國醫學研究委員會領導開展了世界第一個臨床隨機對照試驗,1976年美國心理學家Glass首次提出Mata-分析(Mata-analysis)一詞及其統計學分析方法。1982年,英國Chalmers提出了累積性Mata-分析概念,從而為完成針對某一干預措施所有高質量RCT的系統評價提供了方法學支持,為循證醫學的產生提供了最好的證據。20世紀70年代,英國醫師Archie Cochrane及其同事率先進行了探索性研究,其成果RCT和系統評價的真正里程碑,1992年加拿大Mcmaster大學循證醫學工作組正式在JAMA上發表文章,首次提出循證醫學的概念和術語。加拿大Mcmaster大學Sackett領導的課題小組將循證醫學(EBM)定義為“慎重、準確和明智地應用當前所獲得的最好的研究證據,同時結合臨床醫生的個人專業技能和多年臨床經驗,考慮病人的價值和愿望,將三者完善地結合制定出病人的治療措施”。循證醫學與傳統醫學的最大區別在于前者將醫學研究證據放在了臨床決策的首要位置,這就使得實踐EBM要解決的核心問題是:如何在浩如煙海的信息、文獻中篩選出最恰當和最優的證據。
網絡技術的發展推動著醫學領域信息資源的數字化,1976年美國斯坦福大學的醫學專家系統MYCIN被認為是醫療專家系統最成功的實例之一。MYCIN的成功研制,激發和鼓舞了把專家系統技術應用于醫學領域的努力,特別是對醫學專家系統的核心部分——醫學知識庫的廣泛研究已經成為人工智能研究中最活躍的一個分支,推動了循證醫學的迅速興起和發展。
1993年底,英國Iain Chamers博士創建Cochrane協作網,隨后由Sackett領導Cochrane協作網生產Cochrane系統評價,建立臨床研究數據庫的工作,標志循證醫學證據獲取走上了人工智能化道路。
隨著信息高速公路和循證醫學的迅速發展,數字化的信息資源成為查找醫學證據的主要來源,EBM信息資源日趨豐富。目前,按不同的標準可對網上EBM信息資源進行不同的分類,有人按其內容分為:系統評價、臨床實踐指南、衛生技術評估、臨床試驗;也有人按其類型分為:EBM電子期刊、網上循證醫學資源中心、EBM醫學數據庫、EBM元搜索引擎、臨床實踐指南等等。雖然目前EBM信息資源種類和數量日趨增多,但都處于一種分散的狀態,不便于醫學工作者的集中使用,這也正是建立中文循證醫學證據知識庫的原因之一。
佳木斯大學圖書館作為黑龍江省東部地區規模最大、設備最優、現代化水平最高的高校圖書館,在數字化圖書館建設中已經建立了自己的特色化道路,建設了一系列特色數據庫,中文循證醫學證據知識庫的建立,無疑將成為數字圖書館館藏的重要組成部分。與圖書館機構知識庫一起,構成圖書館知識庫體系。
知識服務是指向用戶提供經過智能化處理的符合用戶需求的知識產品。中文循證醫學證據知識庫所提供的循證醫學知識信息、知識手段及問題解決方案,是以解決用戶問題方案為直接目標的,是面對本校臨床醫學院師生的。中文循證醫學證據知識庫不僅為循證醫學教學提供比較全面、系統的循證醫學知識,而且為學生臨床實習和教師指導實習提供科學的臨床證據,促進師生實現最佳教學效果和臨床實踐成果。
佳大三所附屬醫院的臨床醫生以及黑龍江省東部地區醫院的醫生都可以通過網絡或光盤的形式享受循證醫學證據知識庫的知識服務,從而為普及循證醫學和推動循證醫學發展做出貢獻。
循證醫學是運用流行病學的科學方法論解決醫學各種問題而發生的一場醫學實踐的革命。循證醫學則認為:經驗遠不如科學研究的知識快速和可靠,從科研中學習是第一位的,經驗僅可以彌補科研知識的不足。循證醫學依賴于計算機、網絡通訊、互聯網等技術,而循證醫學臨床證據知識庫則是其核心。關鍵是臨床研究證據質量及其知識體系。
循證醫學知識庫的知識體系可分為3個層面:
第一層面:循證醫學知識的主要方面(一級架構)包括:“基礎”知識、循證方法、實用知識、支持體系和其他知識。
第二層面:循證醫學基本知識的架構(循證方法、二級架構)包含循證實踐操作流程和各步驟的展開。構成循證醫學的基本知識和核心知識——循證方法。
第三層面:循證醫學實用知識的架構(三級架構)是循證流程與病癥的描述和處理流程的融合。包括病癥表現的循證、流行情況的循證、病因的循證、危險因素的循證、診斷的循證、治療的循證、預防的循證和預后的循證等。
為有利于對知識庫使用者提供準確快捷的臨床研究證據,知識庫的證據可以根據不同需要分類:
3.2.1 按研究方法分類。①原始研究證據(primary research evidence);②二次研究證據(secondary research evidence)。
3.2.2 按研究問題分類。①病因臨床研究證據;②診斷臨床研究證據;③預防臨床研究證據;④治療臨床研究證據;⑤預后臨床研究證據。
3.2.3 按用戶需要分類。①系統評價;②臨床實踐指南;③臨床決策分析;④臨床證據手冊;⑤衛生技術評估;⑥健康教育資料。
3.2.4 按獲取渠道分類:①公開發表的臨床研究證據;②網上信息;③已完成,但未公開發表的臨床研究證據;④在研的臨床研究信息。
由于中文循證醫學證據知識庫都是中文臨床研究證據信息,因此知識庫臨床研究證據的來源也必然都是中文數據庫、網絡、雜志、會議文獻以及在研和未發表的臨床試驗等。
目前,數據庫資源中書目數據庫有“中國生物醫學文獻數據庫”、“中國生物醫學文獻數據庫”。臨床研究證據專用數據庫有中文循證醫學圖書館(中文光盤版),由中國循證醫學/(cochrane)中心和當地軟件公司共同開發制作。收錄了系統評價數據庫、臨床對照試驗數據庫、循證醫學方法數據庫、衛生技術評估數據庫等循證醫學一些相關知識與信息等數據庫信息。網站有中國衛生部、中國疾病預防控制中心、中華醫學會網站、中國循證醫學中心網站等網站。此外有《中國循證醫學雜志》、《循證醫學》等醫學雜志,還可以從國家科技圖書文獻中心、中國醫學學術會議論文數據庫等獲取會議文獻信息。
研究證據的采集從兩方面獲取。一是由雜志、會議文獻等紙質臨床研究證據經過掃描、識別、標引、引入證據知識庫,完成采集工作;二是直接從網絡現有的數據庫中檢索出自己所需要的臨床研究證據,經過工具軟件轉換后進行標引,引入證據知識庫。
4.1.1 雜志文集采集流程。①書頁掃描,即利用掃描儀對所需文獻進行掃描;②圖像處理,是指傾斜校正、去噪、剪裁、粘貼、亮度對比度調整、除裝訂線、內容居中等處理,目的是為了提高OCR識別率及美觀整齊度;然后把一篇文章經掃描處理后的書頁合并起來,存為PDF或TIF文件,生成與印本文獻對應的數字對象文件。
4.1.2 網絡數據庫的采集流程。①手工采集:可以采用搜索引擎技術實現對網絡中特色信息資源的采集。按照預先制定的檢索詞、檢索策略,利用通用搜索引擎如Google、Yahoo、Baidu等進行檢索并不斷調整檢索策略,直到得出較為滿意的檢索結果,手動將所需信息進行下載、格式轉換、標引、加入知識庫。②自動采集:面對數量大、更新快的網絡信息資源,手工采集、組織信息的方法顯然不能勝任工作,通常的解決方法是利用計算機技術實現網絡信息資源的自動采集與組織。自動采集軟件對網頁進行精確分析后,將信息的標題、來源、內容、發布時間等項目存入知識庫。③具有訪問權限的網絡信息資源的采集:現有的數據庫,特別是使用價值較高的數據庫,大多提供網絡服務方式,采用密碼口令或IP地址控制的方法實現用戶對這些數據庫或其鏡像站的訪問。主要采用手工采集、轉換格式和標引的方法。
4.2.1 Internet發布。WWW是一種建立在Internet上的全球性、多平臺、分布式、多媒體的動態信息系統。同TELNET、GOPHER、FTP、WAIS等相似,它也是建立在Internet上的一種網絡服務。WWW是Internet上發展最快、應用最廣泛也最實用的超文本信息發布系統,它將復雜的網絡操作通過超文本技術和簡單的協議變成了簡單的“點擊”,用戶不需要網絡知識和約定便可以容易地訪問任意地點的計算機資源。為了滿足用戶使用的交互性,需要通過專門的手段將數據庫與WWW連接起來,這些手段主要有CGI技術、專用API技術、JAVA/JDBC技術等。通過這些手段建立起數據庫的WWW服務器,用戶通過Internet登錄到服務器上,執行瀏覽、檢索等操作。通過Internet發布:一是用戶不需要專門設備,只需要一臺計算機、一根網線就可以使用數據;二是實時數據,服務器更新后,用戶不用升級直接可以得到最新信息。
4.2.2 光盤發布。由于技術的發展,無論是服務器還是個人計算機都帶有光盤驅動器,可以對光盤進行讀取,這使得用光盤作為媒介發行臨床研究證據成為可能。一是存儲量大,一張VCD光盤的容量為700MB,而DVD則達到4.7GB;二是成本低,無論是VCD還是DVD,每張盤片的價格均不高;三是保存時間長,便于攜帶。我們所選用的知識庫建設平臺里都有信息發布系統,我們可以通過知識庫建設平臺對所建的知識庫進行發布,為用戶提供服務。
[1] 李幼平.循證醫學[M].北京:高等教育出版社,2003.
[2] 王吉耀.循證醫學與臨床實踐[M].北京:科技出版社,2006.
[3] 李玨.循證醫學電子停息資源整合的探討[J].循證醫學,2007(2).