高 曼 李海燕
(1.中國中醫科學院中醫藥信息研究所情報分析與評價研究室,北京 100700; 2.中國中醫科學院中醫藥信息研究所,北京 100700)
中醫藥信息學是一門由中醫藥學與信息學融合產生的以中醫藥信息為研究對象,旨在提高中醫藥信息獲取、轉化、傳播和利用能力的新興交叉學科。中醫藥信息學主要研究中醫藥信息的運動規律及其相互作用,近年來,中醫藥信息學在理論、方法、技術與標準方面快速發展,已被廣泛應用于中醫臨床規律發現與輔助診療、中藥科研與生產、中醫藥古今文獻知識服務等各個領域,在中醫藥現代化進程中發揮著重要作用,形成了中醫臨床數據挖掘與利用、中醫智能診療裝備研制、中藥數據分析與智能制造研究、中醫古籍智能化研究與知識服務、以及基于大數據的中醫藥評價等熱點研究方向,本文對各個研究熱點進行分析以期為研究人員提供有益參考。
利用數據挖掘等技術研究名老中醫臨證經驗,對解析名老中醫診療規律、總結和傳承其學術思想具有重要意義。采用數據挖掘方法和相關平臺軟件開展名老中醫經驗挖掘的研究有很多,如頻數分析法用于統計名老中醫常用藥物,關聯規則分析方法用于發現名老中醫用藥組合,聚類分析用于名老中醫診治疾病證型分類,因子分析用于總結名老中醫診治疾病的核心處方等等[1-2];中醫傳承輔助系統軟件、古今醫案云平臺集成了數據挖掘、人工智能等多種方法技術,不僅可以實現對醫案信息中的癥狀、證型、疾病名稱、藥物名稱等信息標準化處理,并可采用多種方法實施數據挖掘,近年來在名老中醫經驗挖掘中的應用非常普遍[3]。
利用計算機技術將醫學知識庫與臨床實踐相結合,模擬醫學專家的診治思路,并通過分析臨床數據建立數據與決策邏輯關聯知識點,輔助醫務人員進行臨床決策是臨床決策支持系統的核心[4-5]。中醫臨床知識庫全面整合名醫經驗、中醫醫案、臨床指南、中醫文獻、方劑知識和術語系統等多種知識資源,建立數據標準,規范化表達中醫知識,促進中醫臨床知識互融互通[6];隨著中醫知識庫、藥學知識庫和臨床知識庫的構建,以及知識表達、知識推理等技術的不斷進步,使得面向中醫藥臨床決策支持的知識服務成為可能,中醫藥信息學領域開展了相關研究,以期為輔助臨床決策提供實時、動態及個性化的知識服務,提高決策效率和精確度[7]。
電子病歷、醫保記錄存儲的診療信息能夠較好地體現真實世界中疾病診療情況,以此為數據源可以開展中醫真實世界研究,包括藥物療效評價、藥物安全性分析、臨床診療規律發現和疾病中醫證候特征分析等。根據研究目的對醫院信息系統存儲的藥物治療疾病信息進行分組,統計分析觀察組和對照組的疾病治療差異,可進行藥物療效評價[8-9];獲取醫院信息系統記錄的藥物使用情況及不良反應事件等信息,可實施藥物安全性分析[10-11];采集醫院信息系統中患者醫療數據,分析臨床上疾病治療的用藥特點,可開展真實世界疾病診療規律的發現研究[12];統計比較醫院信息系統中中藥制劑的使用、患者患病特征和診治過程等信息,可分析中藥制劑在臨床上使用的合理性[13];多種維度分析醫院信息系統存儲的疾病中醫證候分布情況,可以幫助臨床醫生了解真實世界中的患者特征、證候分布、核心病機等[14]。
辨證分型是中醫診斷學的精髓,“辨證”是臨床醫生對患者的中醫臨床癥狀和舌脈象等信息加以分析、歸納,以辨清疾病的病因病機、病性和病位的過程。但是中醫臨床辨證中存在著大量主觀性和模糊性,缺乏客觀的評價標準,運用機器學習、數據挖掘等信息技術,分析中醫四診、患者生理指標等信息,建立辨證分型模型對實現中醫診斷數字化、客觀化具有重要意義。利用極值隨機森林等算法結合患者病史和癥狀、生化指標等數據進行癥候分類研究,可構建符合中醫理論的癥候分類模型[15-16];對疾病中醫證候進行聚類分析,亦可輔助中醫證候分類研究[17];運用Logistic回歸、關聯規則分析等方法能分析疾病證素組合分布規律及中醫證候特征[18];利用關聯規則分析和決策樹算法可以挖掘證候與證型之間的關系,對指導臨床辨證具有重要意義[19];亦有研究人員采用數據挖掘方法分析西醫同一疾病不同分型的中醫證候特點,豐富中醫辨病論治的內涵[20]。
以舌診儀、面診儀、問診儀、脈診儀為代表的中醫四診信息采集和處理設備,及四診采集集成設備的研發,對中醫四診客觀化和建設移動健康管理平臺[21]具有重要意義。舌診儀主要由數字圖像采集和舌象特征處理兩個系統組成[22],采用高性能設備獲取舌象圖像后可對舌象顏色、紋理和舌體等特征進行客觀化分析處理[23-24];面診儀可采集患者面部前額、臉頰和口唇等部分在色調、飽和度與明度的色彩空間顏色參數,稱為面象參數[25-26];問診儀可以實現人機對話,智能采集患者既往史、現病史、過敏史以及家族史等信息[27];脈診儀利用傳感器等收集人體脈象生理信息,通過芯片將其發送到中心服務器進行分析[28],四診儀獲取的信息可為中醫臨床疾病辨證分型提供參考。目前集成中醫四診客觀化采集設備的輔助診療系統已經部分應用于醫院健康管理中心、治未病科[29];四診信息規范化、數字化、客觀化采集是創建四診數據庫的關鍵條件,四診數據庫是為遠程醫療提供中醫解決方案的重要基礎[30]。
中醫提倡的“治未病”與現代醫學的健康管理理念頗為一致,睡眠監測、飲食監測、呼吸監測和脈搏監測等可穿戴設備在個體“未病先防”、“欲病先治”中起到了重要作用[31]。可穿戴健康設備可以及時監測用戶血糖、血壓、睡眠、心率及脈搏等數據,為中醫健康管理平臺即時健康監測帶來巨大便捷,除此之外可穿戴設備的即時健康監測數據可借助云存儲技術進行云端存儲和分析,有助于其在遠程診療方面發揮獨特優勢[32]。可穿戴設備提供的實時健康監測,在優化中醫藥大健康管理服務過程中亦發揮著重要作用,促進中醫藥大健康服務向著數字化、智能化和科學化方向發展。
基于中醫基礎理論和適宜技術開發的智能治療設備,區別于傳統的養生保健理療儀器,更貼近中醫防病治病的理論特點,目前中醫智能化治療的研究和應用主要集中在智能穴位刺激治療儀和智能推拿治療儀上[33]。南京中醫藥大學開發的智能針灸機器人可自動檢測穴位、根據治療要求調整艾灸位置和針刺深淺;按摩推拿機器人可以自動確定穴位,采用機器臂控制技術模仿中醫推拿手法,通過測量特定肌肉或肌腱的精準硬度,對軟組織實現精準感控,進行治療[34]。
中藥材質量控制涉及的環節繁多,包括土壤、種質、炮制、存儲和制劑等過程,信息技術的介入可有效解決中藥材質量控制難的問題。“互聯網+”信息技術與中藥農業深度融合,可改造傳統中藥農業產業發展模式,實現中藥農業生產信息化管理、數據追溯、數據反饋和數據預測等[35]。中藥材信息化追溯體系建設,是實現中藥材來源可查、去向可追,治理中藥材質量問題的有效舉措[36]。本草基因組數據庫依據多國藥典收錄草藥物種,為草藥物種鑒定、用藥安全、優良品種分子育種等方面提供信息支撐[37]。人工智能、深度學習及圖像處理技術已經在識別中藥材及中藥飲片中得到深入應用[38],提取不同中藥飲片的圖像大小、顏色、紋理和形狀等參數,運用機器學習算法對樣本數據進行分類訓練,建立飲片圖像特征識別分類模型,為有效辨別不同產地的中藥飲片、相近品種和易混淆品種提供了分析手段。
中藥制藥工業當前正處于數字化與智能化轉型過程中,中藥信息學領域已經開展了大量研究實踐,促進實現中藥智能制造,并已形成一些有益的探索經驗[39]。例如,利用文獻報道數據、中藥制藥過程數據和藥工操作經驗,構建中藥制藥工藝知識庫,并整合深度學習等技術實現知識自動化和決策科學化,推動中藥制藥工業向“智慧制藥”轉型[40];運用數據驅動技術建立中藥生產過程的數字化模型,可為基于模型的中藥制藥過程智能化控制提供優化策略[41];遵循制藥行業自動化生產指南等相關要求,構建實時數據庫系統,實現制藥過程實時監控、數據報表電子化操作和管理、生產工藝可回顧及藥物質量可追溯,以輔助中藥制造工藝改進和質量提升[42]。
藥性理論是中藥學的核心理論,是指導中醫臨床遣方用藥的重要依據,在繼承的基礎上豐富藥性理論、揭示藥性理論的科學內涵,是中藥現代化的研究重點。獲取文獻中記載的中藥藥性、功效等信息并進行標準化處理,運用數據挖掘算法,可以分析中藥藥性與功效的關聯關系[43];中藥藥性與方劑功效存在非線性關系,利用人工神經網絡等算法分析組方中的中藥藥性組合 (性-味-歸經) 及功效規律, 并挖掘藥性組合與功效之間的關聯規則[44],可以為中藥方劑的功效預測提供依據[45]。構建人工智能預測模型,度量中藥成分相似性,可推測辨別中藥藥性[46];利用決策樹算法,結合中藥藥理作用與藥性之間的關系建立藥性預測平臺,實現直觀、快速的藥性預測[47],為缺失藥性的補遺提供了新的思路和途徑。
中藥藥效成分多,作用靶點復雜,呈現出多層次、多系統的復雜作用模式,網絡藥理學是通過構建“藥物活性成分-疾病-靶點-通路”的網絡,分析藥物的活性成分、靶點、通路以及和疾病在網絡中的相互作用關系,從而闡明藥物治療疾病的作用機制[48]。通過中藥系統藥理學數據庫與分析平臺發現中藥活性成分及靶點,取與疾病相關交集靶點,借助網絡藥理學方法進行分析,可幫助闡明中藥的藥效成分、預測藥物作用的潛在靶標[49-50];有研究者[51-52]將網絡藥理學與高效液相色譜相結合,通過高效液相色譜檢測中藥含有的化學成分,然后采用網絡藥理學方法,得到其含有的活性化合物,研究其中的活性成分,提高中藥活性成分的篩選效率;亦有研究者[53]將中藥藥性理論與網絡藥理學方法結合,按照藥性把中藥復方劃分為多個性味模塊后再進行網絡藥理學研究,探索更符合中醫藥特色的藥物作用機制研究方法。
中醫古籍智能化研究是促進中醫古籍保護、傳播和深度利用的重要手段,是“讓古籍活起來”的重要途徑。區別于傳統的中醫古籍數字化閱覽平臺,中醫古籍的智能化數據平臺不僅可以實現古籍的自動校勘、自動標點、自動編纂、自動注釋、自動索引、自動排版等功能,還提供基于中醫古籍知識圖譜的數據分析、挖掘、知識服務等功能[54]。醫案古籍知識庫通過對醫案類中醫古籍蘊含的知識解析、重組和規范,結合中醫古籍后控詞表,可以對古籍知識內容進行全面、系統、準確地表達與顯示,實現醫案古籍的知識化檢索與服務[55]。
學科化知識服務平臺是將知識服務與學科緊密結合,將學科內的知識與知識有機地結合起來,提供專業的知識服務。中醫藥領域開展了大量構建專科、專病知識庫的研究,以為專業內臨床及科研人員提供知識服務,如,整合脾胃病名醫經驗、臨床研究、臨床指南、中醫文獻和方藥知識等資源,構建脾胃病臨床文獻大數據平臺[56];全面收集中醫領域內功能性胃腸病知識,納入醫案、方劑、養生方法等數據,且支持用戶編輯、更新中醫知識,以共建共享的方式構建功能性胃腸病中醫知識庫[57];抽取文獻數據中包含的實驗數據集及其形成的包括機體器官、組織細胞、分子網絡等各級水平的穴位刺激效應數據與數據內在關系,利用計算機生成圖形和圖表,表示針刺效應錯綜復雜的過程,構建穴位刺激效應可視化平臺,為針刺生物學機制的深入研究提供規范化的數據支持及可視化分析[58]。
知識圖譜是一種可視性強、自帶推理規則且便于機器學習和利用的知識存儲與應用技術,在中醫藥領域的研究及應用非常廣泛。中醫藥各子領域構建的知識圖譜,如證候知識圖譜、專病知識圖譜、方劑知識圖譜和中藥知識圖譜,是實現中醫知識可視化、中醫智能問答和語義檢索的關鍵基礎[59]。目前相關研究已深入應用至中醫藥知識服務的各個方向,利用本體技術描述管理中醫醫案,實現醫案的智能檢索,可更有效地發揮中醫醫案的重要價值[60];構建中醫病機內涵知識圖譜,結合臨床個體化診療決策支持系統,建立病機主導的中醫臨床個體化診療決策支持系統,為中醫個體化診療輔助決策提供解決方案[61];基于知識圖譜構建中醫藥智能問答系統,為用戶解答病證相關問題,提供輔助診療建議[62-63]。
隨著循證醫學的發展,以證據為基礎制定的臨床實踐指南已經成為臨床決策的主要依據。高質量臨床研究論文是指南的主要證據來源,對臨床研究類論文進行質量評價,不僅能為指南制定提供證據支持,亦可以對期刊質量評價提供參考[64-65]。評價現代臨床研究論文質量的方法分為定性和定量兩種,定性方法一般根據學科特點結合專家訪談開展文獻質量評價[66],定量方法通常根據公認文獻質量評價量表對文獻質量進行評價[67];中醫古籍亦是指導中醫藥診療實踐的重要證據來源,因此中醫藥領域開展了中醫古籍證據分級體系構建研究,提出了多種中醫古籍證據質量分級方式,但尚未形成完善的評價與分級體系[68]。
學術評價是根據評價目的,從數量、新穎性、認可度和啟發性等角度對研究成果進行評價的過程,合理的學術評價可起到引導研究主體開展高質量研究活動的作用。中國醫學科學院提出科技量值(science and technology evaluation metrics,STEM)的概念,指出其是圍繞科技活動全過程,覆蓋創新活動全鏈條的綜合測算值,并以此為基礎從科技產出、學術影響和科技條件三個維度開展了中國醫院科技量值計算,旨在激勵醫學科技創新、推動醫學學科建設;為區域性引導患者就醫,推動更多優質中醫醫院進入民眾視野,建立和健全中醫藥學術影響力評價長效機制、更好地發揮中醫藥學術引領在中醫醫院建設中的導向作用,中國中醫科學院聯合中華中醫藥學會開展了基于中醫藥特色優勢和科技影響力的中醫醫院評價和中醫醫院學科(專科)學術影響力評價工作[69-70]。
科學知識圖譜是顯示科學知識發展進程與結構關系的一種圖像,CiteSpace知識可視化軟件是目前最為流行的知識圖譜繪制工具之一,它可以繪制引文網絡圖譜來體現一個知識領域的演化歷程,并標識出圖譜上作為知識基礎的引文節點文獻和共引聚類所表征的研究前沿[71]。采用CiteSpace軟件挖掘中醫藥領域文獻的引文、機構、作者、關鍵詞等信息,繪制科學知識圖譜,發現領域核心研究團隊、研究熱點和研究前沿,總結研究領域發展現狀和趨勢,為領域發展提供參考是中醫藥科學知識圖譜研究的熱點[72-74];專利可以體現研究主體的技術實力與創新能力,專利計量研究可以進行領域技術趨勢分析及預測,利用CiteSpace繪制專利科學知識圖譜,分析領域技術熱點、技術趨勢,可為領域創新研究提供參考[75-76]。
近年來,中醫藥與信息技術、人工智能技術的融合發展在中醫臨床輔助決策支持、智能中醫診療裝備研發、名老中醫經驗傳承、藥物療效與安全性評價、中藥智能制造、中藥材質量控制和中醫藥大健康管理等方面都非常活躍,中醫藥信息學這一新興交叉學科的蓬勃發展為古老的中醫藥學帶來新的生機與活力,但要產生重大的突破還面臨著諸多挑戰,如利用現代生物醫學工程、人工智能等技術,研制和開發可應用于中醫臨床實踐的智能診療裝備,客觀化收集和處理中醫臨床診療信息從而輔助基層中醫開展臨床診療研究,患者外在體征(舌脈等)與疾病的非定向對應關系以及中醫診療行為中蘊含的大量隱性知識等都是中醫四診客觀化以及中醫智能診療領域亟待解決的問題;廣泛應用信息技術開展中藥材質量控制、中藥智能制造、中藥藥性與功效關聯關系挖掘、中藥藥性補遺和中藥網絡藥理學研究,從而促進中藥現代化及產業化進程過程中,解析影響中藥材質量的眾多參數、優化反饋控制模型是中藥智能制造的難點;智能計算和語義分析等技術在古籍數字化和知識組織中應用的局限性,以及尚未形成全面可靠的中醫古文語料庫是中醫古籍智能化研究的困境;在運用數據挖掘等技術分析來源廣泛、容量龐雜的中醫臨床診療數據,深入挖掘名老中醫經驗、開展真實世界研究和分析中醫辯證診斷規律的過程中,缺乏中醫藥經驗傳承數據類標準,在一定程度上限制了中醫藥傳承信息化的發展;中醫藥數據量龐大、增長速度快,數據質量問題日益突出,在數據的采集、傳輸和處理過程中如果出現錯誤標注、噪聲大或不完整等質量問題,就會導致源于數據的決策產生嚴重錯誤,從海量數據中有效獲取高質量數據集是開展中醫藥信息學研究的重點和難點,因而基于大數據處理技術,建立完善的評價機制處理海量中醫藥領域信息資源,提高信息獲取的質量是關鍵。
利益沖突所有作者均聲明不存在利益沖突。
作者貢獻聲明高曼:設計研究方案,收集分析資料,撰寫論文;李海燕:提出研究思路,總體把關,審定論文。