李 君 李曉東,△ 宋淑潔 毛樹松 李紫明 周亞娜,3,4 宋幸鈴 陶軍秀 沈紹武
1.湖北中醫藥大學 (湖北 武漢, 430065) 2.湖北省中醫院肝病科、中醫肝腎研究及應用湖北省重點實驗室 3.湖北中醫藥大學附屬醫院 4.湖北省中醫藥研究院
隨著大數據、人工智能研究的不斷深入,各行業領域內的學者開始逐漸認識到大數據價值不單是規模巨大的數據量,更需要挖掘其中蘊含的知識價值。因此從“大數據”概念的提出[1],到“知識工程”[2],再到大數據知識工程(BigKE)的提出[3],研究已從單純的數據挖掘分析逐漸向知識發現、知識表達進行轉變,大數據知識價值逐漸被認知和重視。
中醫肝病的發展淵遠流長,已知記載始于《內經》,肝藏象理論內涵由此起源,張仲景《傷寒雜病論》以“辨病脈證并治”為題,內有黃疸、脅痛等肝病常見癥狀,后有魏晉隋唐《諸病源候論》、《千金方》等多有肝病篇幅,宋金元時期諸家爭鳴,肝為扳機之臟腑,諸家立說不離乎肝,肝病體系在此時期蓬勃發展。明清時期肝病論治理論趨于成熟,豐富和完善了肝病臨床辨治方法。晚清至建國以來,在西學東漸的時代背景下,中醫對于肝病臨床診療的認知不斷細化,走出了中西醫結合的肝病診療道路,中醫藥在肝病的臨床診療中具有明顯的特色優勢。隨著時間的推移,中醫肝病不僅有豐富的理論知識體系,同時臨床上也積累了大量、可供利用的診療數據,這是中醫肝病守正創新,傳承發展的寶藏。
習近平總書記提出:“要發展中醫藥,注重用現代科學解讀中醫藥學原理,走中西醫結合的道路。”因此,面對海量的中醫臨床數據,本研究團隊秉持“守正創新、傳承精華”的精神,以中醫藥理念和真實世界臨床研究范式深度融合現代先進科學技術,在中醫藥領域率先提出開展中醫臨床大數據知識工程研究[4]。并根據該工程的規劃與設計要求,為抓住中醫臨床肝病創新發展的新契機,首先在我院中醫臨床肝病專科組織開展基于真實世界研究的中醫臨床肝病大數據知識工程研究。真實世界臨床研究范式具有以人為中心,以數據為導向,以問題為驅動,醫療實踐與科學計算交替,從臨床中來到臨床中去[5],契合中醫整體觀念指導下的辨證論治的特點,體現了守正創新的原則。大數據時代的來到,真實世界中醫臨床研究面臨著新的機遇與挑戰;而大數據處理技術的飛躍式發展,為中醫肝病真實世界研究提供了廣闊前景。
1.1 總體目標 在提升中醫肝病學科建設水平和中醫肝病臨床醫療服務能力的前提下,踐行中醫臨床研究新模式,有序實施中醫臨床肝病大數據知識工程建設,依照大數據理念,以知識工程的技術與方法,建設中醫肝病的方法學體系、標準體系和技術體系等資源體系,深化中醫肝病學科建設內涵,開展中醫肝病臨床精細化診療模型、知識圖譜、臨床診療知識庫、名老中醫藥專家知識系統及中醫肝病智能化研究。探索真實世界中醫臨床肝病研究新模式和新思路,為其高質量創新發展提供技術支撐為本研究的總體目標。
1.2 研究內容 根據本研究總體目標和中醫臨床大數據知識工程規劃與設計要求[6],以真實世界中醫臨床肝病病例數據為對象,開展中醫肝病臨床病例數據規范化、數字化、結構化等數據治理,構建其臨床病例數據庫。在此基礎上,應用知識工程技術與方法將臨床病例數據知識化,實現病例中隱形知識的顯性化和知識的完整表達,構建中醫肝病病例知識庫;基于中醫肝病重點優勢病種發生、發展、轉歸的演變規律,對該病種病例知識進行關聯分析,探究中醫肝病臨床診療過程中可能存在的“事實與規律”,構建該病種臨床“證、治、效”模型和繪制知識圖譜;在對其進行臨床循證驗證與優化后,反饋應用指導臨床實踐,形成科學的具有反饋機制的閉環中醫臨床研究流程,實現“從臨床中來,到臨床中去”和“臨床科研一體化”的要求。同時將真實世界中醫臨床肝病研究由數據驅動轉變為知識驅動,為該臨床研究的高質量和高水平發展提供新范式。
2.1 變革研究模式,踐行中醫臨床傳承創新發展 變革中醫臨床研究模式,踐行中醫藥守正創新、傳承發展。依據中醫肝病的學術特征和臨床醫教研的綜合需求,以基于真實世界臨床數據的“是什么?”加臨床循證的“為什么?”的研究模式,替代基于“科研假設”的傳統臨床研究模式,踐行中醫藥守正創新、傳承精華的發展策略。應用大數據知識工程技術開展真實世界中醫臨床肝病研究,全面揭示中醫臨床肝病診療數據中的“事實與規律”,解析其學術內涵,并通過臨床循證研究驗證和優化,形成可用于指導臨床實踐的診療規范,為中醫藥傳承創新發展和智慧便民服務提供高質量技術支撐。
2.2 創新研究方法,促進中醫臨床數據治理能力現代化 大數據科學正在以迅猛之勢引領著各行各業的技術革命,推動著整個人類社會的深刻變革和跨越式發展。大數據科學產生了新的認識論、方法論和技術體系,運用大數據理論和技術充分挖掘和利用中醫臨床數據資源,構建具有數據支撐的臨床知識庫和開發中醫臨床智能應用系統,發揮中醫診療肝膽疾病的獨特優勢,逐步實現中醫肝病臨床智慧醫療,推動其管理理念、管理模式和管理技術的變革與創新,實現中醫肝病大數據治理能力現代化,推進中醫肝病臨床服務智慧化
2.3 深化學科內涵建設,實現學科轉型和跨越式發展 習近平總書記提出“厚實學科基礎,培育新興交叉學科生長點”、“要下大氣力組建交叉學科群”。學科建設是中醫肝病事業發展的基石,學科內涵是學術的制高點。中醫肝病提高核心競爭力需要體現中醫診療特色,以特色為統領,穩定已有研究方向的優勢,關注傳承精華;關注交叉學科創新研究方向的培育,求索原創性的發現。明道正綱、務本納新、直面挑戰,抓住時代機遇,利用大數據理念和知識工程方法重構中醫肝病臨床診療知識體系,深化完善學科內涵,推動中醫肝病學科的創新轉型及學術的跨越式發展,探索中醫肝病學科內涵建設的開拓性新方法和新途徑,具有促進肝病學科轉型發展意義和實踐創新價值。
2.4 培養具有創新意識和能力的多學科人才 黨的十八大以來,黨中央作出人才是實現民族振興、贏得國際競爭主動的戰略資源的重大判斷,黨的十九屆五中全會明確了到2035年我國進入創新型國家前列、建成人才強國的戰略目標。學科交叉融合是當前中醫藥現代化發展的重要趨勢,培養具有創新意識、創新能力的多學科人才,是中醫肝病守正創新、傳承發展的現代化內在需求。在中醫臨床肝病大數據知識工程研究實施過程中,以培養出創新型、復合型、應用型中醫肝病臨床人才為目標,從數量和質量上培養出支撐中醫肝病學科高速發展的創新人才隊伍。通過深化中醫肝病人才培養和發展體制,建立合理的溝通機制,強化團隊協作意識,充分發揮人才隊伍的能動性,激發中醫肝病臨床人才的創新活力,持續增強人才效能,充分發揮以人才支撐中醫肝病學術發展的作用。
3.1 工程操作流程圖

圖1 中醫臨床肝病大數據知識工程操作流程圖
3.2 操作流程說明
3.2.1 前期準備 ①建立協同創新體制與機制:黨的二十大報告確立了堅持創新在我國現代化建設全局中的核心地位,強調必須堅持守正創新。在中醫臨床研究領域實施以創新驅動中醫藥現代化發展,協調好現有學科資源。以中醫肝病臨床知識增值為創新目標,組建分工明確的臨床研究機構,制定相關工作制度, 協同中醫臨床、信息技術、數學、大數據知識工程及人工智能等多學科專業人員,開展“臨床中醫肝病大數據知識工程”研究。由學科帶頭人、學術顧問、技術骨干(臨床、技術、標準)、碩博研究生等組成研究團隊,實現多學科間的交叉、滲透與協作,最終形成合理的人才能級搭配和具有旺盛生命力的研究團隊。其組織管理架構:領導小組,下設標準組、臨床組、工程組等3個專題小組,實現分層分級管理體制;制定切實有效的中醫臨床肝病大數據知識工程研究工作管理制度與辦法,充分激發研究團隊中多學科人員的創新活力和積極性,為實現中醫臨床肝病大數據知識工程的總體目標提供組織保障。②確定重點研究方向:中醫臨床肝病專科領域診療病種繁雜,在臨床上常出現合病、并病的情況。按照中醫專科臨床大數據知識工程的整體規劃,由點到面,從單個病種到多病種逐步推進的體系化研究設計要求,在中醫臨床肝病大數據知識工程研究過程中,首先要進行中醫臨床肝病的病種篩選以確定工程研究的方向。本研究是應用中醫醫療與臨床科研信息共享系統對肝病病種進行篩選,優選條件:中醫肝病科的重點、優勢病種;具有課題支撐或前期臨床研究基礎;診療過程中中醫藥參與度高,中醫特色突出;保證獲取足夠數量的臨床數據;并有相關的臨床醫學人員和研究生(碩士、博士)承擔相關研究任務。
3.2.2 數據治理 ①構建中醫臨床肝病標準體系:依據中醫臨床肝病大數據知識工程研究需要,開展肝病標準體系構建研究,該體系主要包括臨床標準和數據標準兩大類,其中臨床標準主要指中醫臨床肝病相關的診療和療效評價等標準,例如中醫臨床基本術語、病證診斷標準、臨床指南、專家共識和臨床路徑等。而數據標準主要包括中醫癥狀信息分類與代碼、舌象信息分類與代碼、脈象信息分類與代碼、中藥信息分類與代碼、數據元、數據集等標準。標準體系建立是為中醫肝病真實世界數據的數字化、規范化、標準化提供依據與支撐,為后續數據治理、數據知識化提供基礎。②構建中醫臨床肝病病例數據庫:真實世界中醫臨床肝病科研體系建設中,形成了中醫醫療與臨床科研信息共享系統技術平臺,建立了湖北省中醫藥數據中心,已經初步實現了中醫臨床數據計算機管理,為中醫臨床肝病大數據知識工程建設提供了數字化的臨床肝病原始病例數據。本研究根據中醫臨床肝病大數據知識工程要求,依照中醫專科專病特點,設計了更能體現中醫臨床診療特色的中醫臨床研究基本信息采集表(CRF),該表分由基本信息表、診斷信息表、干預信息表、評價信息表等子表構成。利用規范化的CRF表不僅是對數據采集流程的規范,亦是同步預處理和清洗數據,此過程中能過濾具有干擾性、重復性的無效數據,對有效數據進行有效提取和分類。再參考中醫臨床肝病標準體系對其進行規范整合,實現臨床病例數據規范化、數字化和結構化,構建具有真實性、準確性、可用性的中醫臨床肝病病例數據庫,將為本研究病種數據知識化提供數據資源。
3.2.3 數據知識化 ①中醫臨床肝病基本知識編碼:中醫數據具有豐富的知識內涵,簡單從癥狀辨識來說,在疼痛癥狀中,脹痛、刺痛、隱痛各有其含義,但在中醫臨床病例數據中的知識表達存在不完整的問題。而中醫臨床肝病基本知識編碼是通過標準的形式表達中醫臨床肝病基本知識,將中醫肝病知識從無序到有序、從隱性到顯性的過程,提高臨床知識顯性化程度。本研究采用非集中化策略對中醫臨床肝病領域中病證、癥狀、舌象、脈象、中藥等進行編碼,構建知識編碼模型,形成中醫臨床肝病基本知識編碼標準,為實現中醫臨床肝病數據的知識化提供依據與支撐,是中醫臨床肝病大數據知識工程的重要基礎環節。②構建中醫臨床肝病病例知識庫:中醫臨床肝病病例數據庫構建過程中,對診療信息已進行提取、分類、規范和結構化,為中醫肝病臨床病例數據知識化和知識庫構建提供了數據資源。再通過編制《中醫臨床肝病診療知識屬性分類與代碼》和中醫臨床肝病基本知識編碼標準,以此為據,對中醫臨床肝病病例數據庫進行知識屬性化重構,將其進行數據知識化處理,將數據隱性知識顯性化,形成中醫臨床肝病病例知識庫,以利于應用知識工程技術開展對中醫臨床診療“事實與規律”的發現,為開展中醫臨床肝病知識發現和知識圖譜繪制,以及智能化AI系統開發提供真實世界中醫臨床肝病病例知識資源。
3.2.4 知識加工 ①構建知識模型:基于數據-信息-知識-智慧的DIKM 模型[7],以中醫基礎理論為指導,順應臨床肝病發展轉歸規律,采用知識工程技術方法針對中醫臨床肝病的病例知識庫進行知識加工,即應用關聯技術方法開展知識關系模型的構建,探尋中醫臨床肝病診療知識間的關聯關系,構建其臨床診療知識模型,例如:基于中醫病證的精細化“證-治-效”診療模型研究,構建中醫臨床肝病重點病種的精細化診療模型,包括診斷、干預和療效評價等3個模型;基于中藥配伍知識的中藥知識關聯分析;診療(藥癥、量效)要素關聯分析等。進一步開展基于臨床診療模型的中醫肝病臨床診療知識圖譜繪制研究,實現臨床診療知識關聯關系的可視化,利于其在臨床研究中深化理解和總結利用。②繪制知識圖譜:基于知識模型構建中醫臨床肝病診療知識圖譜,將中醫臨床肝病領域中知識結構化,將中醫臨床肝病領域知識進行顯性化沉淀和關聯。通過構建肝病診療知識圖譜,梳理肝病診療知識關系體系,有利于做出臨床診療知識引導,輔助臨床數據分析與臨床決策,是中醫臨床肝病智能化、智慧化研究的基石。
3.2.5 臨床診療模型驗證與優化 為了能使基于真實世界臨床數據的中醫肝病診療模型用于指導臨床實踐,以提高中醫臨床肝病診療質量和水平,還需要對這些診療知識模型開展實證研究,即對基于中醫臨床肝病病例知識庫的知識關聯分析研究所發現的“事實與規律”和獲得的知識模型,開展臨床循證研究,對這些診療知識模型進行臨床驗證與優化,以保證其完全符合當前臨床的實際情況,更好的運用指導臨床,提供更高質量的中醫肝病臨床醫療服務。
在真實世界中醫臨床肝病的研究中,大數據知識工程理論和技術方法為該研究提供了理論指導和技術支撐。本研究探索了中醫臨床肝病大數據知識工程的理論與方法,及其臨床價值與應用前景,探索了中醫臨床肝病病例數據管理、數據知識化和知識建模等關鍵技術,促進中醫臨床肝病數據從量變產生質變,形成高質量真實世界的臨床證據,更好地指導中醫臨床診療決策,充分地踐行了真實世界臨床研究理念,實現了其從數據驅動到知識驅動的范式變革。踐行了“從臨床中來,到臨床中去”的具有反饋控制的真實世界中醫臨床研究閉環,進一步提升了中醫臨床肝病研究水平,將助力中醫現代化、智慧化發展,其應用前景廣闊。