崔蒙,李海燕,楊碩,高博,胡雪琴,朱玲.中國中醫科學院中醫藥信息研究所,北京 00700;.浙江中醫藥大學,浙江 杭州 30053
?
中醫藥信息學工程技術領域研究進展
崔蒙1,李海燕1,楊碩1,高博1,胡雪琴2,朱玲1
1.中國中醫科學院中醫藥信息研究所,北京 100700;2.浙江中醫藥大學,浙江 杭州 310053
摘要:工程技術在中醫藥信息學發展過程中發揮著重要的作用,不僅是在解決現實問題方面,而且對學科理論的發展也有著重要的促進作用。中醫藥信息學在工程技術領域中的研究主要體現在3個方面:中醫藥科學數據建設工程、中醫藥信息標準建設工程和中醫藥知識服務工程。中醫藥信息學工程技術領域的發展支撐著整個學科在應用領域中的發展。
關鍵詞:中醫藥信息學;工程技術;中醫藥信息標準;中醫藥科學數據;中醫藥知識服務
中圖分類號:R-058;R2-05
文獻標識碼:A
文章編號:2095-5707(2016)01-0009-06
【引文格式】崔蒙,李海燕,楊碩,等.中醫藥信息學工程技術領域研究進展[J].中國中醫藥圖書情報雜志,2016,40(1):9-14. DOI: 10.3969/j.issn.2095-5707.2016.01.002
第一作者:崔蒙,研究員,研究方向為中醫藥信息學。E-mail: cm@mail.cintcm.ac.cn
白春禮院士在談到創新驅動發展時指出,“應積極促進技術、工程與經濟社會緊密結合,發揮技術創新在支撐當前經濟轉型和持續發展中的核心作用……加強產學研合作,推動科研院所、大學與企業共建技術研發平臺、創新聯盟,打通創新鏈與產業鏈,集中力量突破關鍵核心技術……要采取多種切實有效的舉措,綜合施策,努力通過技術創新支撐當前經濟轉型增效,通過創新驅動打造經濟升級版”[1]。中醫藥信息技術、信息工程研究與中醫藥臨床實踐、新藥研發緊密結合,在支撐中醫藥創新驅動發展中具有重要的作用。中醫藥信息學在工程技術領域中的研究主要體現在3個方面:中醫藥科學數據建設工程、中醫藥信息標準建設工程和中醫藥知識服務工程。
中醫藥科學數據建設是一項浩大的工程,對中醫藥學的發展具有深遠影響,主要體現在當科學數據成為一種資源,支撐著科學研究的第四范式——數據科學時,對中醫藥學科學研究的推動作用將與理論研究和實驗研究發揮同樣重要的作用。
中醫藥科學數據建設工程起源于20世紀80年代初,以文摘數據庫建設為起點。由于吳蘭成研究員的遠見,在數據庫建設之初就與美國國立醫學圖書館的MEDLINE數據庫采用了相同的建設模式,即運用主題標引的方法加強數據庫的查全率與查準率。為了貫徹這一思想,首先必須建設與《醫學主題詞表》(MeSH)相配套的中醫藥學主題詞表,才能夠實現主題檢索。中醫藥學主題詞表采用了與MeSH詞表相一致的結構,把其未收錄的、而在中醫藥科學文獻中又頻繁出現的概念編制成中醫藥學主題詞表,用于中國中醫藥期刊文獻數據庫的標引。經過主題詞標引的中國中醫藥期刊文獻數據庫具有更為精確的查準率和更為全面的查全率,成為當時國內外主要應用的中醫藥文獻數據庫。在數據庫建設初期,收錄了國外多語種期刊發表的與中醫藥相關的文獻;后來由于經費和人員等原因,不再收錄中文以外的文獻,文摘量也逐漸減少。進入21世紀后,受清華同方、萬方數據等全文數據庫的影響,中國中醫藥期刊文獻數據庫的建設受到了很大的沖擊,用戶量逐漸減少。但隨著信息爆炸,無效文獻越來越多,單憑關鍵詞檢索越來越無法滿足用戶的需求,主題詞檢索又引起了用戶的注意。因此,到目前為止,文摘型的中國中醫藥期刊文獻數據庫憑借著其特有的主題詞標引,依然吸引著一批用戶。
進入20世紀90年代后,隨著對數據需求的不斷增加,國家在科學研究基礎條件建設方面逐漸加大投入,對中醫藥科學數據建設經費的投入也不斷加大,此時產生了一大批單表型數據庫,如中國中藥數據庫、中國方劑數據庫、疾病診療數據庫等。這批數據庫的建設主要是為了滿足臨床和科研人員對某一方面數據的需求。在此基礎上,中醫藥數據庫群逐漸形成,中醫藥科學數據平臺初見雛形。
20世紀90年代末期至21世紀初期,是中醫藥科學數據建設工程最為活躍的時期。由于多學科的介入,中醫藥科學數據建設與清華大學、浙江大學、中國科學院計算技術研究所、中國科學院軟件研究所等一批具有強大計算機研究實力的單位形成合作關系,開展中醫藥科學數據建設研究。與此同時,由于國家經費支持力度不斷加大,對中醫藥科學數據建設的要求不斷提升,加之中醫藥科學數據建設單位的規模均偏小,因此,中醫藥科學數據建設虛擬研究院應運而生。
在此期間,中醫藥科學數據建設轉向了結構型數據庫,試圖通過數據拆分、數據清洗、數據關聯實現數據間關聯關系的發現。通過不斷的磨合,最終中國中醫科學院中醫藥信息研究所與浙江大學計算機科學與技術學院建立了長久、穩定的合作關系,共同開發與建設中醫藥科學數據平臺,這項合作至今已經持續了17年。在此平臺上,我們建立了中藥基礎數據庫,實現了中藥數據間的關聯檢索與統計功能,能在數秒內完成所有中藥的歸經、性、味統計,化學成分與中藥關聯檢索,中藥與功效關聯檢索等;中藥藥理數據倉庫基于8個軸,實現了中藥材、化學成分的藥理作用頻次、藥理實驗頻次排序及相關文獻關聯;中國中藥化學成分數據庫實現了化學成分與實驗條件的關聯;還有一大批疾病數據庫,實現了各種疾病證候、癥狀、方劑、中藥、西藥的統計,以及診斷標準的關聯等。在中醫藥科學數據平臺上建設了42個結構型數據庫,并實現免費共享。
中醫藥信息研究單位規模都相對較小,人員結構不盡合理,僅依靠1~2個中醫藥信息研究單位難以承擔如此浩大的工程。為此,建立了中醫藥科學數據工程虛擬研究院(以下簡稱虛擬研究院)。虛擬研究院相對穩定,但也在不斷的變化之中,成員最多時有37個中醫藥大學、學院、研究院所及西醫相關單位和計算機研究相關單位參與建設。虛擬研究院之所以能夠相對穩定,并一直持續到現在,主要是其組成結構、運作模型及操作平臺相對合理。虛擬研究院的組成結構是縱橫支撐,橫向為各組成單位是穩定的事業單位組織,保證了組織機構的穩定性,縱向是各數據庫形成的課題組,保證了參加人員的穩定性。其運行機制主要是依托課題項目,按課題項目的運行機制,同時實行協調管理,即人力集成虛擬化、組織結構柔性化、知識產權模糊化、并行作業分布化。虛擬研究院的操作平臺是面向Internet的中醫藥異地、遠程、同步數據共建平臺,在這個平臺上部署了3級審校程序、3級權限管理程序,實現了全國范圍內的中醫藥科學數據共建。
目前,中醫藥科學數據建設工程正在向提高數據質量、服務臨床與科學研究需求方向努力。同時,隨著大數據理念及數據科學理念的逐步發展,數據應用理念也在逐漸發生變化,正在探索通過Hadoop平臺上的MapReduce,在計算機上從全文本數據中自動抽取所需要數據,實現數據的半自動結構化和半自動關聯,并逐漸回歸中醫藥數據的本體,不再追求從所有數據中發現中醫藥的一般規律,而是基于1個醫生、1個科室、1個醫院、1個流派的全數據發現具有個體化特征的經驗性規律。隨著國家科技立法的進程不斷推進,中醫藥科研數據匯交最終能夠實現,為中醫藥科學數據建設工程奠定更為堅實的基礎。而中醫藥科學數據建設工程的持續推進,最終也將為中醫藥學的發展做出應有貢獻。
中醫藥信息標準建設工程也是一個長時間持續推進的工程。中醫藥信息標準的研制最早起源于20世紀80年代初期開始建設的中醫藥學主題詞表,該詞表規范了中醫藥文獻檢索的主題詞,開創了中醫藥信息標準研制的先河。20世紀90年代開始,陸續開展了中醫藥名詞術語標準的研究,并發布了一批國家標準和全國科學技術名詞審定委員會標準。除了這些標準外,為了協調全國的數據庫建設工作,研制了一批必須的標準表,放置在共建平臺上供建庫使用。這批標準表雖然不是公開的標準,但在中醫藥科學數據庫建設中發揮了極其重要的作用??萍疾俊笆晃濉敝斡媱潯爸嗅t疾病分類代碼等基礎標準示范研究”中設立了16個中醫藥信息標準課題,這些課題的設立和完成極大地推進了中醫藥信息標準的研制工作,并為此后的中醫藥信息國際標準的研制奠定了良好的基礎。
2.1 國際標準化組織
進入21世紀后,中醫藥信息國際標準的研制獲得了長足的發展。最先開展的國際標準化組織(ISO)中醫藥信息標準研制是從健康信息技術委員會(TC215)開始的。在此之前,中醫藥信息標準從未進入過國際標準化組織的視野,而我國中醫藥信息學領域的研究人員也從未參與到國際標準化組織的標準研制工作中。中國中醫科學院中醫藥信息研究所具有開展中醫藥主題詞表、中醫藥學語言系統、中醫臨床術語系統的研制工作基礎,所以崔蒙、李海燕等[2]主要在ISO/TC215的語義工作組(WG3)進行標準研究工作。當時ISO/TC215的與會專家認為醫學信息學的語義標準已經完全能夠涵蓋中醫藥信息學的需求,認為中醫藥沒有獨立的信息模型。為此,崔蒙、李海燕及其研究團隊做了大量的研究工作,說明中醫藥信息學不僅在內容上與醫學信息學有所區別,而且在信息模型上也有所區別,最終得到了國際醫學信息學專家的認可。標準的最基本要求是專家共識,國際標準的最基本要求是專家共識基礎上的國家實體的認同,因而,獲得國際醫學信息學專家的認同,為此后中醫藥信息國際標準研制工作的順利開展奠定了良好的基礎。與此同時,在TC215中說服國際醫學信息學的專家認同不存在東亞、東洋、東方等以地區命名的傳統醫學的概念,認同中醫藥學已經是一個國際通用性的醫學,研制中醫藥信息標準是具有國際意義的。
2009年,ISO成立了中醫藥技術委員會(TC249),其中第五工作組為名詞術語和信息工作組。由于該工作組的工作范圍與TC215有所交叉,經ISO/TC215與ISO/TC249協調建立了聯合工作組(JWG),即TC249的JWG1(信息學聯合工作組)和TC215的JWG1(中醫藥信息學聯合工作組),負責協調需要由2個技術委員會共同完成的中醫藥信息標準的研制工作。TC249的建立進一步推動了中醫藥國際信息標準研制工作的開展。
到目前為止,ISO已經發布了3項中醫藥信息標準,均由我國主導研制。⑴“ISO TS 17938:2014中醫藥學語言系統語義網絡框架”于2014年發布,由崔蒙研究員作為負責人,該項標準規定了中醫藥學語言系統的語義類型、語義概念及語義關系,并對其進行了詳細定義。該標準的提出不僅規范和支持了中醫藥學語言系統的建設,還為中醫藥學術語系統和本體創建提供了語義標準,為中醫藥學語言系統和統一的醫學語言系統映射提供了支持,對中醫藥學術語信息的交換具有重要意義。⑵“ISO TS 17948:2014中醫藥文獻元數據標準”于2014年發布,由崔蒙研究員作為負責人,該項標準規定了中醫藥文獻元數據標準化的基本原則和方法,覆蓋中醫藥學領域具有共性的全部元數據內容,為中醫藥學文獻資源提供了一套通用的描述元素。它能規范、科學、合理地描述中醫藥學文獻,提供有關中醫學文獻的標識、內容、分發、質量、限制和維護信息,以支持中醫藥文獻的收集、存儲、檢索和使用,促進中醫藥文獻資源的交流與共享,對中醫藥文獻資源的系統保護和深度利用具有重要意義。2014年發布的這2項標準是迄今為止ISO首次發布的中醫藥信息標準,對中醫藥術語信息系統和文獻信息系統的建設起到重要的支撐作用。⑶“ISO/TS 18790-1:2015中醫藥信息標準體系框架與分類”標準于2015年發布,由李海燕研究員作為負責人,該項標準是ISO/TC215與ISO/TC249的首個聯合工作項目,實現了中醫藥信息標準體系的頂層設計,有助于中醫藥行業內部共識及其與大健康信息標準之間的銜接,對于中醫藥信息標準體系建設、信息標準制修訂、規劃計劃制定等具有深遠意義。世界衛生組織(WHO)開展的疾病分類代碼11版(ICD11)的研制工作,首次將傳統醫學納入其中,專門開辟了ICTM一章。ICD11采用了與以往各版都不同的形式,將本體的概念引入了ICD11的修訂中,以醫學臨床術語系統(SNOMED CT)為其術語池,解決精確診斷的問題。因此ICTM也必須采用傳統醫學術語系統作為其本體支撐。目前,中醫藥臨床術語系統是最佳選擇,但由于未能與日、韓達成統一意見,術語池的構建工作處于被擱置狀態。無論如何,ICTM出現在ICD11中,是中醫藥信息標準國際化的一大進展。
2.2 衛生信息交換標準
衛生信息交換標準(Health Level 7,HL7)是主要應用領域為醫院信息系統(HIS)/影像信息系統(RIS)的標準體系,規范HIS/RIS系統及其設備之間的通信,它涉及到病房和患者信息管理、化驗系統、藥房系統、放射系統、收費系統等各個方面。HL7的宗旨是開發和研制醫院數據信息傳輸協議和標準,規范臨床醫學和管理信息格式,降低醫院信息系統互連的成本,提高醫院信息系統之間數據信息共享的程度。近年來,中醫藥衛生信息交換標準的加入也獲得了“HL7 中國”委員會的認可。由于中醫臨床處方用藥的特殊性,處方部分被西醫認為是制藥的范疇,未能納入該體系。但HL7希望其標準模型能夠涵蓋所有醫學的電子病歷數據交換。因此,在“HL7中國”委員會的建議下,同意并積極支持把中醫臨床信息模型納入其范圍。
2.3 臨床數據交換標準協會
臨床數據交換標準協會(CDISC)是一個開放的、包括各種學科的非盈利性機構。協會致力于開發行業標準,為醫學和生物制藥產品的開發提供臨床實驗數據和元數據的取得、交換、提交以及存檔的電子手段。如果完全按照西醫、西藥的思維模式指導中醫藥臨床實驗標準的研制工作,不重視中醫藥學整體性的特點,而是將其碎片化,這對中醫臨床實驗標準的研制工作會造成一定的困擾。近年來,CDISC注意到中醫藥臨床實驗數據交換的特殊性,正在積極開展相關研究,中醫藥CDISC標準的研制工作還在不斷地推進中。
2.4 醫學臨床術語的系統化命名
醫學臨床術語的系統化命名(SNOMED-CT)是目前國際上應用較為廣泛的醫學臨床術語系統,其與美國國立醫學圖書館和世界衛生組織均達成了一定程度的協議,因此在統一的醫學語言系統(UMLS)和ICD11中均使用了其術語。SNOMEDCT是以國家合作的方式允許其術語系統的應用,到目前為止,其尚未與中國政府達成協議,因此該術語系統還無法在中國應用。這對中醫藥臨床術語系統的使用造成了很大的困擾。中國的中醫醫院絕大部分都是中西醫結合,其病歷記錄中使用了大量的西醫術語,如果沒有西醫術語系統的支撐,基于規范術語的電子病歷交換是無法實現的。目前,我們正在努力改變這一局面。一是適應中醫藥術語系統概念間關聯關系多為非線性的,因而不再采用SNOMED-CT的連接詞,而是使用語義關聯,完成概念間的復雜關聯;二是在中醫臨床術語系統的框架下,加入中醫醫院使用的西醫術語,以適應中醫醫院電子病歷交換的需求,同時避免知識產權糾紛。由此可以看出,中醫藥信息標準的研制是一個浩大的工程,涉及中醫藥信息的方方面面,是開展中醫藥信息研究的基礎性工作,必須有一支專業的隊伍,有一批持之以恒不斷努力工作、不斷拓展創新的工作人員,才能夠將此事業發展下去。
知識服務和知識工程都是很大的概念,真正要完成這樣的工程需要很長的時間和很多的人力。目前所開展的中醫藥知識服務工程的建設工作是從較窄的點面做起的,也是從較基礎的工作做起的。在此方面主要做了2項研究工作,一是構建中醫藥學語義網絡,從根本上來說,是希望構建起中醫藥知識體系,至少構建起中醫藥概念體系,中醫藥學語言系統就是為了實現這一目標而構建起來的。二是開展中醫藥數據挖掘研究,從根本上來說,是為了實現知識發現,支撐中醫藥學領域的計算機臨床決策和計算機新藥輔助開發。
3.1 構建中醫藥學語義網絡
語義網絡是自然語言理解及認知科學領域研究中的一個概念,20世紀70年代初美國科學家西蒙(Simon)發展與完善了語義網絡的概念和方法,把它作為知識表示(knowledge representation)的一種通用手段,語義網絡是一種采用網絡形式表示人類知識的方法。一個語義網絡是一個帶標示的有向圖。其中,帶有標識的結點表示問題領域中的物體、概念、時間、動作或者態勢。在語義網絡知識表示中,結點一般劃分為實例節點和類節點2種類型。結點之間帶有標識的有向弧標識結點之間的語義聯系,從而形成一個由節點和弧組成的語義網絡描述圖,是語義網絡組織知識的關鍵。同樣,用語義網絡方法也可以表達中醫藥學的知識,而這種知識表達的方法有可能構建起中醫藥的知識體系。圍繞構建中醫藥學語義網絡這一主題,中國中醫科學院中醫藥信息研究所和浙江大學計算機科學與技術學院多名博士、碩士研究生和博士后工作人員開展了專題研究,如中國中醫科學院中醫藥信息研究所賈李蓉的碩士論文“中醫藥學語言系統語義關系初探”、楊陽的碩士論文“中醫臨床術語集語義關系的示范研究”、姚媛媛的碩士論文“針灸概念語義網絡的構建研究”、謝琪的博士論文“基于本體方法構建中醫藥概念信息模型的方法學示范研究”、王靜的博士論文“基于本體的中醫文獻診療信息的智能檢索示范研究”、楊陽的博士論文“中藥提取工藝文獻知識組織方法研究”、高博的博士后出站論文“用邏輯方法構建五行子系統概念模型的探索性研究”、胡雪琴的博士后出站論文“中醫藥語言系統中的語義網絡研究”、李彥文的博士后出站論文“中醫藥信息研究所知識地圖的構建研究”、楊繼紅的博士后出站論文“中醫藥隱性知識轉化的探索研究”、于琦的博士后出站論文“基于文獻與概念模型的中醫溫病理論繼承與發展研究”、于彤的博士后出站論文“面向中醫藥知識密集型數據的知識發現研究”、朱玲的博士后出站論文“中醫古籍語言系統構建的探索性研究”、楊云松的進修報告“基于本體的《蘭室秘藏》語義網構建研究”等;浙江大學計算機科學與技術學院張小剛的碩士論文“基于中醫藥本體的語義關系發現及驗證方法”、方青的碩士論文“基于本體論的中醫藥一體化語言系統”、陶金火的碩士論文“基于語義的中醫藥數據采集工程及應用平臺”、盛浩的碩士論文“基于超鏈數據的中醫藥語義查詢系統”、楊克特的碩士論文“面向中醫藥的多元語義搜索引擎”、湯萌芽的碩士論文“中醫藥本體工程及相關應用”、吳振宇的碩士論文“基于語義標注的中醫藥數據加工平臺”、范寬的碩士論文“基于語義本體的中醫藥科學數據共建工程”、宓金華的碩士論文“中醫藥知識工程應用”、吳毅挺的碩士論文“DartSpora數據挖掘平臺的構建”、封毅的博士論文“中醫藥知識發現可靠性研究”、于彤的博士論文“知識服務:語義Web在中醫藥領域的應用研究”等。這些研究使中醫藥學語義網絡的構建工作獲得了極大的進展,有力地推動了中醫藥知識服務工程研究的開展。此外,崔蒙研究員為學術帶頭人的科研團隊還通過虛擬研究院組織全國力量共同開展中醫藥學本體工程的建設工作,舉全國之力、共同建設,使中醫藥知識服務工程的工作獲得了高速推進。
中醫藥學語義網絡是通過構建基于本體的中醫藥學語言系統實現的。所謂本體,從哲學到計算機科學有著不同的理解,而基于中醫藥學知識體系形成的概念與概念間的關聯關系,我們稱之為“輕本體”,這種本體并不強求基于公理的推理,因為在中醫藥學的知識體系構建中,這一點是很難做到的。那么這種基于概念及概念的關系建立起來的語言系統有什么用呢?首先,這是一個概念體系,一個不是基于學科分類、而是基于語義分類的概念體系。這個概念體系幾乎包含了中醫藥學的所有概念,這些概念按照其所屬的語義類型被劃分;然后通過語義關系,亦即除了等級關系的上下位關系外,還包括功能上相關、時間上相關、空間上相關、物理上相關、概念上相關等非等級關系,建立起這些概念間的所有關聯關系,這樣就構建了一個中醫藥學知識的網絡體系。在這個網絡體系中,所有的概念都被相關,并相互聯系。通過這個體系,擴展了人類關于中醫藥學知識關聯的需求,使所有的知識點相互關聯,并無限循環。這樣就擴展了人類的關聯思維,使人們清晰地知道中醫藥知識是關聯的,以及如何關聯的。因為在中醫藥學知識體系中,大量的相關關系都是非線性的相關關系,而我們構建的這個基于本體的語言系統的中醫藥學的知識體系所展示的是概念間線性關系,也許這樣一個知識體系不足以涵蓋所有的中醫藥知識。但它已經能夠滿足對于中醫藥學知識體系中概念間線性關系推演的需要。另外,在研究概念間的相關關系時,由于其非線性的特征,發現中醫藥學概念的關系往往不是二元的,而是三元的,甚至是多元的。也就是說僅用1個關系,不足以表達2個概念間的相關關系,需要用2個或者更多的關系,才能表達出中醫藥學2個概念間的相關關系。但限于中醫藥學語言系統構建的模型,即使中醫藥學2個概念間存在著多元語義關系,也只能將其拆分成多個二元關系分別進行表達,這在很大程度上限制了利用基于本體的中醫藥學語言系統構建完整的中醫藥學知識體系。我們正在研究是否可以解決這個問題,以期能夠進一步推進中醫藥學知識體系的構建。
3.2 開展中醫藥數據挖掘研究
如同圍繞構建中醫藥學語義網絡這一主題,中國中醫科學院中醫藥信息研究所和浙江大學計算機科學與技術學院部署了多名博士、碩士研究生和博士后工作人員開展專題研究一樣,圍繞中醫藥數據挖掘研究,2個單位也同樣部署了多名博士、碩士研究生和博士后工作人員開展該領域的研究工作。如中國中醫科學院中醫藥信息研究所李園白的碩士論文“中醫婦產科疾病辨證用藥規律研究”、王靜的碩士論文“中醫疫病現代文獻評析示范研究”、王靜的博士論文“基于本體的中醫文獻診療信息的智能檢索示范研究”、雷蕾的博士后出站論文“基于文獻的中藥化學數據利用研究”、于琦的博士后出站論文“基于文獻與概念模型的中醫溫病理論繼承與發展研究”等;浙江大學計算機科學與技術學院蔡越君的碩士論文“數據挖掘技術及其在中藥配伍系統中的應用研究”、何前鋒的碩士論文“中藥方劑數據系統挖掘研究”、于彤的碩士論文“中醫臨床數據倉庫的設計與構建”、周忠眉的博士論文“中醫方劑數據挖掘模式和算法研究”、周雪忠的博士論文“文本挖掘在中醫藥中若干應用研究”等。這些學生的研究工作不僅從方法上,而且從內容上,在很大程度上深化了中醫藥數據挖掘的研究工作。盡管這些工作獲得的認可度不是很高,但依舊是中醫藥學領域中數據挖掘的推進動力,為促進行業廣泛開展數據利用的研究奠定了良好的基礎。
如前所述,目前我們研究團隊開展的數據挖掘工作主要是2個方向:中醫臨床決策支持與中藥新藥輔助開發。在中醫臨床決策支持方面,主要開展了方證對應、藥癥對應、方藥對應、病證對應等方面的研究;既有基于整體數據的分析挖掘研究,也有基于某個老中醫經驗的分析挖掘研究;既有基于全體方劑的挖掘研究,也有基于某個病癥的挖掘研究;從研究結果看,既有常識性知識,也有非常識性知識;針對非常識性知識,既有臨床醫生認可的知識,也有他們極不認同的知識??傮w來看,通過數據挖掘,確實可以發現知識,包括已知的和未知的、認可的和不認可的;但在系統性、整體上對于臨床決策的支持力度還是不夠大,未能引起足夠重視,也未能對提高中醫臨床療效發揮重大作用。究其原因,主要是未能找到適合發現中醫臨床診療規律的方法與技術,在數據處理的思路上還存在一定問題。在中藥新藥輔助開發方面,無論是飲片層次、組分層次,還是單體層次,都有過各種嘗試,其中一些組合知識也引起了新藥開發專家的重視。但到目前為止,還沒有一個從數據挖掘到新藥上市的完整案例,主要原因是這個過程過于復雜漫長,而數據挖掘所能提供的知識只是整個新藥開發過程中前期工作的一部分,因此,當整個過程完成時,很難看出數據挖掘工作的成就。只有當數據挖掘的組方能夠完成完整的新藥研發過程時,其作用才能夠得到完整的認可。
白春禮院士指出,“從本質上講,科學、技術和工程三者是不同類型的創造性活動,有著不同的發展規律,體現著不同的價值,需要不同的評價標準和支持政策。‘科學’源于拉丁文scientia,本義是知識和學問的意思。通常認為,科學以探索發現為核心,主要是發現、探索研究事物運動的客觀規律。科學發現,特別是純科學的原始性創新突破,也就是純基礎研究,在于人們對科學真理的自由思考和不懈探索,往往不是通過人為地計劃和組織來實現的?!夹g’由希臘文techne(工藝、技能)和logos(詞,講話)構成,意為工藝、技能。一般認為,技術以發明革新為核心,著重解決‘做什么、怎么做’的問題?!こ獭辉~,最早產生于18世紀的歐洲,其本義是兵器制造、軍事目的的各項勞作,后擴展到許多領域,如制造機器、架橋修路等。一般認為,工程著重解決‘做出了什么’的問題”[1]。工程技術在人類發展過程中發揮重要的作用,并對科學的發展具有很大的促進作用。同樣在中醫藥信息學發展過程中,工程技術也發揮著重要的作用,不僅是在解決現實問題,而且對學科理論的發展也有著重要的促進作用,中醫藥信息學工程技術領域的發展支撐著整個學科在應用領域中的發展。
[1] 白春禮.創新驅動發展戰略靠什么支撐?——從科學、技術、工程的概念說起[N].光明日報,2014-05-15(16).
[2] 李海燕,崔蒙,任冠華,等.ISO/TC215傳統醫學信息標準化工作進展[J].國際中醫中藥雜志,2011,33(3):193-195.
(修回日期:2015-09-27;編輯:魏民)
Research Progress in Engineering Technology of Traditional Chinese Medicine Informatics
CUI Meng1, LI Hai-yan1, YANG Shuo1, GAO Bo1, HU Xue-qin2, ZHU Ling1
(1. Institute of Information on Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China; 2. Zhejiang Chinese Medical University, Hangzhou Zhejiang 310053, China)
Abstract:Engineering technology plays important roles in the development of traditional Chinese medicine (TCM) informatics, which not only resolves the practical problems but also promotes the theoretical development of the discipline. Research on TCM informatics in engineering technology mainly involves three aspects: project of TCM scientific data construction, project of TCM informatics standards development and project of TCM knowledge service. Engineering technology of TCM informatics supports the development of discipline of TCM informatics in application field.
Key words:traditional Chinese medicine (TCM) informatics; engineering technology; TCM informatics standards; TCM scientific data; TCM knowledge service
收稿日期:(2015-09-10)
基金項目:國家科技部重大專項(2012ZX09304003-001);國家中醫藥管理局行業專項(201207001-21);科技部科技基礎性工作專項(2009FY120300);中國中醫科學院創新團隊項目(PY1306)