袁芳
摘要:本文分析了知識服務的內涵,論述了現階段國內外各類醫學知識服務系統的特點和發展趨勢。包括循證醫學數據庫、基于補充計量學的知識服務系統,基于本體和語義網的知識服務系統、基于大數據分析的知識服務系統。
關鍵詞:知識服務;知識服務系統;醫學知識;語義網;大數據;補充計量
中圖分類號:G25
Development Trend of Medical Knowledge Service System
YUAN Fang
(Nanchang University Library,Nanchang 330031,Jiangxi,China)
Abstract:This paper analyzes the characteristics of knowledge service, and discusses the characteristics and development trend of the domestic and foreign medical knowledge service system. Knowledge service system based on ontology and semantic web, which is based on ontology and semantic web
Key words:Knowledge service;Knowledge service system;Medical knowledge;Semantic web;Altmetrics
1 前言
在知識醫學時代,知識成為疾病的主要敵人,醫學知識正以驚人的速度增長[1],全球每年有超過17000種生物醫學圖書面世,現有生物醫學期刊超過30000種,且以每年7%的速度遞增。臨床醫生要在本領域跟上發展,平均每天需要閱讀19篇原始文獻[2]。從工作環境方面看,醫務人員不同于一般的科研人員,尤其是在三甲醫院,醫務人員除了承擔繁重的臨床工作外,大部分還進行醫學教育及科研工作。材料顯示,我國醫生在科研中用于獲取專業信息的時間比美國等國家少得多,美日等國為30%~50%,而我國僅為15%~30%[3],知識無限膨脹和有限使用的矛盾,促使我們尋找更好的方法來縮短從研究到實踐的距離。
2 知識服務
知識服務是以信息知識的搜尋、組織、分析、重組為基礎, 向用戶提供知識信息、知識挖掘手段及問題解決方案的服務。它有下面幾個特點。
2.1知識服務是用戶目標驅動的。傳統信息服務的基點、重點和終點是信息資源的獲取和傳遞,而知識服務的評價是"是否能夠解決問題"。
2.2知識服務面向特定用戶,是定制式,必須重視用戶問題和問題環境。在服務過程中,強調專業人員和用戶的共同參與,關注的重點是服務的全過程。
2.3知識服務的核心是知識創新。知識服務是在顯性知識的加工中融入了對隱形知識的挖掘和共享,將顯、隱性知識集成,形成新的知識產品。
2.4知識服務必須依靠集成的現代化手段。知識服務技術分為三大類,即基礎網絡技術(Internet),知識挖掘技術(數據挖掘與人工智能)和知識存儲與傳播技術(數據庫和搜索引擎)。近年來,KDD(Knowledge discovery database)的出現為人們提供了一種解決"數據豐富而知識貧乏"困境的有效途徑。
就醫學知識體而言,可劃分為疾病信息,藥品信息,輔助檢查信息,手術信息,醫學基礎知識,與醫學相關的靜態和動態信息等;就醫學知識需求而言,用戶群體分為臨床、教學、研究、藥學和患者等類型。每個群體所需的相關知識有所不同,但這些知識相互關聯,不可分割[4]。在傳統的信息服務中,這些知識體分散在不同的文獻載體,用戶檢索得到的只是孤立的知識點。在以數字化、網絡化為特征的現代社會信息環境下,這些知識單元按照一定的結構被整合成有序的,相互關聯的、完整的網絡知識體,這種網絡知識體就是醫學知識服務系統的核心,進入21世紀以來得到了迅猛發展。
3 醫學知識服務系統的發展趨勢
3.1循證醫學數據庫 循證醫學(Evidence-based medicine,縮寫為EBM),又稱實證醫學,其核心思想是醫療決策(即患者的處理,治療指南和醫療政策的制定等)應在現有的最好的臨床研究依據基礎上作出,同時也重視結合個人的臨床經驗。作為代表當前醫學實踐的主流方法學, 循證醫學不僅對臨床思維模式、臨床實踐產生了重要影響, 而且對臨床研究、預防醫學、藥學、護理學以及輔助臨床科室的發展也產生了不容忽視的影響。現代社會計算機技術、信息通訊技術以及互聯網技術的不斷進步,為循證醫學及其實踐提供了強大的技術支撐,面向循證醫學的知識服務系統也得到了迅速的發展Clinical Evidence、DynaMed、Essential Evidence Plus、MD Consult、UpToDate等已經成為歐美各大醫療機構必備的知識服務平臺,向全球的廣大醫師提供實時、可靠的知識服務,為循證醫學的實現奠定了信息和知識的基礎[5]。這些平臺一般具有以下4 個特點:權威性;最佳臨床證據的精煉概況;定期更新;易于查詢和閱讀。它們能有效滿足醫學工作者對醫學證據和知識的需求,協助他們迅速解決臨床問題,做出準確的臨床決策[6]。
3.2基于補充計量的知識服務系統 自2010年Preim提出 "Altmetrics"這個術語以后,有關補充計量的研究在全球方興未艾。傳統的以引文為評價工具的計量方法因其滯后嚴重而為人詬病。據統計,一篇物理學論文一般需要在發表5年以后才能獲得一半的引文參考信息。伴隨著社交網絡的發展,當前學術交流環境正在發生巨大變化,越來越多的科研工作者通過Twitter和Facebook與同行探討,利用Mendeley、CiteULike管理工作流程。補充計量學利用工具收割文獻管理系統和社交網絡中涉及某一成果的相關信息(下載量、引用次數、瀏覽次數、評論、轉發等),對這些數據進行分類聚合計算,進而評價這些研究成果。常用的補充計量工具有Altmetric.com、Impactstory、Plum Analytics、PlosALMs等。Altmetric.com具有挑選新文章( Pick new article)的功能,用戶可按照文章提到的時間、關鍵詞、期刊、標簽、出版商、處理前綴、MEDLINE 主題詞、匹配PubMed 的提問、基金等條件快速地挑選所需的文章,并可按照Altmentric.com 打分的高低排序。還可通過MEDLINE 主題詞、匹配PubMed 提問等條件進行設置。生物醫學文獻數據庫的文獻可通過社交媒體快速傳播到用戶,醫學研究人員可通過替代計量工具揭示生物醫學領域的技術熱點、發現新的研究內容,為用戶提供個性化的信息推送服務[7]。
3.3基于本體和語義網的知識服務系統
3.3.1本體和語義網 本體最初是一個表示真實世界的結構和性質的哲學概念。近年來,本體越來越多地出現在知識工程等研究領域。而在計算機科學中,本體是一種特殊的信息對象或計算組件。目前,由于本體能夠表示知識的結構和模型,本體在知識建模與表示領域具有重要的地位,本體能夠用于定義某一領域的概念、屬性及其關系,并幫助進行隱含知識的發現和推理。
語義網被視為互聯網的擴展和發展方向,旨在對互聯網內容的含義進行智能搜索、整合與推理,方便人們進行知識共享。為了實現上述目標,僅使用機器可讀的語言來存儲數據是不夠的,還需要賦予數據形式化的、明確的語義信息。因此語義網的開發可以看做是一種把知識建模與表示和自動推理融入互聯網的方法。語義網體系結構主要包括數據資源層、XML/XMLSchema層、RDF/RDFSchema層、本體層。
3.3.2領域建模與知識表示 領域建模的研究和應用在人工智能和知識工程及其相關領域有著悠久的歷史。在過去幾十年里,領域建模已經成為自然語言處理、信息檢索和人工智能等研究領域中一個有用的工具。目前,領域建模已經處于各種目的和需求在各種各樣的研究中逐漸發展起來。因此,許多術語都用于代指領域建模或領域模型的概念。包括:本體、語義網、概念圖、概念圖表、分類和術語關聯圖等。雖然這些術語表達的概念不盡相同,但他們在用法方面相互重疊,都被用來代指一個類似的概念或結構,也就是領域建模或領域模型。由于網絡上存在的海量醫學信息資源大多是非結構化或半結構化的,使得自動化的概念和關系的抽取以及知識建模的自動化方法呈現出復雜性和多樣性,因此,如何用一種較為通用的方法或框架對異構數據源中的信息進行處理是研究人員迫切需要解決的問題。
3.3.3基于本體的中醫藥知識服務平臺 章太炎先生曾經指出:"中醫之成績,醫案最著。欲求前人之經驗心得,醫案最有線索可尋。循此鉆研,事半功倍。"中醫醫案是中醫文獻的重要組成部分,是一代又一代醫家通過不斷的臨床實踐,逐步總結出來的寶貴經驗。近代以來,醫案分析研究層出不窮,是中醫理論不斷發展的搖籃。中國工程院和浙江大學計算機學院聯合打造的《中醫藥知識服務系統》就是將中醫醫案中非結構化或者半結構化的資源分拆并整合,綜合應用語義網、網絡、搜索和數據挖掘等信息技術,通過關聯分析和主體分析挖掘其中隱含的知識和關系,根據挖掘結果分析推理,為用戶提供知識服務。
3.4基于大數據分析的知識服務系統 以基因數據為代表的現代生物醫療信息的不斷創新,正不斷產生海量的生物研究數據。作為現代醫學研究的核心和基礎,海量的數據在帶來新的研究價值的同時,從另一方面也不斷產生困擾。如何從如此海量的數據中發掘出最有研究和利用價值的生物醫學數據正成為現代生物信息學的下一個關注重點。解放軍第307醫院細胞與基因治療中心開發的《疾病遺傳變異關系數據庫》聚焦于基因變異和疾病的相關性,以及疾病和針對性藥物的相關性,以患者基因信息為基礎,為現代醫療的診斷提供了最有價值的針對性數據。該數據庫一方面收集整理了國內外最新的基因變異和疾病治療數據,從科研的角度為醫療專家提供國內外最新的疾病相關數據和治療方法;另一方面該數據庫對臨床疾病和治療進行實時地跟蹤和檢測,通過最新的生物信息處理方式,對過往的研究數據進行實際補充和持續更新。因此以患者基因信息為中心,該數據庫發掘整理了過往歷史研究數據,融合更新了實時檢測病例數據,從而能更好地診斷相關疾病并提供最佳治療方案,而且能預測潛在的疾病威脅。
該系統存儲兩類信息。一類信息為個性化癌癥診斷和與之相匹配治療方案提供臨床數據支持,另一類為基于全基因組測序的高端健康風險評估提供信息支持。所采集的數據都得到過醫學和臨床試驗的驗證,并最終由專家審定收錄,并對數據庫不斷更新。目前該數據庫涵蓋我國發病率前30 名癌癥及其他100 種疾病。
4 結語
縱觀國內外醫學知識服務系統的建設和發展,我們不難看到,為緩解海量醫學信息資源和醫務人員接收能力之間的矛盾,醫學知識服務系統的研究備受關注。隨著我國數字圖書館知識組織與知識服務研究理念的不斷深入,如何借鑒國外經驗,推動我國高水平的醫學知識服務系統建設是下一步急需解決的問題。
參考文獻:
[1]Bartels EM. How to keep up with medical literature[J].Best Pract Res ClinRheumatol,2009, 23 (2):81-90.
[2]陳敏.王全林.王飛.循證醫學與知識轉化[J].華西醫學.2014,29(1):179-180
[3]李彬,倪榮麗,張曉苗,等.臨床醫生信息負擔調查研究[J].醫學信息學雜志,2011,32(5):49-53.
[4]張文舉.李娜.基于知識服務的醫學知識服務系統研究[J].中華醫學圖書情報雜志,2007,16(5):1-3.
[5]AlperBS.Practical evidence-based internet resources[J].Family practice management,2003,10(7):49-52.
[6]于彤張.竹綠.賈李蓉.面向循證醫學的知識服務平臺概述[J].中國中醫藥圖書情報雜志,2014,38(4):55-56.
[7]黃芳.補充計量學及其在生物醫學領域的應用[J].中華醫學圖書情報雜志,2014,23(7):16-18.
編輯/金昊天