李華,郭慧琴,謝偉,林朝陽,徐杭,周開,陳欣然,張若奇
基于臨床大數據的糖尿病中醫專病數據庫建設與展望
李華1,郭慧琴1,謝偉1,林朝陽1,徐杭1,周開2,陳欣然3,張若奇3
1.寧波市中醫院信息科,浙江寧波 315010;2.寧波市中醫院內分泌一科,浙江寧波 315010;3.醫渡云(北京)技術有限公司,北京 100191
通過建立糖尿病中醫專病數據庫,優化數據抽取、統計分析、診療隨訪等方面的中醫循證科研工作流程,并依據寧波市中醫院實際情況,建立以中醫藥診療糖尿病為核心的數據庫,實現數據的科研項目管理、數據統計分析與隨訪管理信息化等功能。寧波市中醫院糖尿病中醫專病數據庫已具備規范化處理患者數據的能力,覆蓋病歷、醫囑、護理文書、課題隨訪數據等多種文檔類型,可輔助醫生建立大規模疾病研究人群。與傳統人工操作相比,糖尿病中醫專病數據庫能夠提升醫生的科研質量和效率,深化推動科研成果的臨床應用。
糖尿病;醫療大數據;大數據處理;信息技術;專病數據庫
隨著云計算、人工智能等新一代信息技術的快速發展,健康醫療大數據的應用和發展已納入國家發展戰略。而中醫治療糖尿病積累了豐富的臨床實踐經驗,是我國中醫藥領域最具傳統特色診療優勢的學科之一[1-2]。在國內外循證醫學研究興起的契機與挑戰下,中醫治療糖尿病亟需提升相關驗證藥物療效和安全性的科研工作[3]。
近年來我國醫療衛生行政部門出臺了一系列政策以支持推動基于健康醫療大數據的服務創新,但就中醫藥大數據的治理與利用仍是目前亟待解決的行業痛點[4]。當前中醫院信息系統數據渠道來源多樣化,數據治理水平參差不齊,中醫病證分類與代碼標準發布較晚,我國的中醫藥“醫療大數據”追溯性差,結構化不統一,互聯互通不足,可用性低,歸屬權不明確[5-6]。因此,依托互聯網及人工智能技術的發展,構建以醫療機構為主體的中醫醫療大數據平臺或專科單病種數據庫,實現對數據采集整合、處理分析、存儲應用,充分發揮信息技術探索發現更多科研靈感,輔助臨床科研工作,打通臨床科研與疾病診療間的“數據通路”,已成為一項重要的中醫藥信息化工作[7]。
中醫藥大數據的信息特征與大數據“4V”,即volume(大量)、velocity(高速)、variety(多樣)及value(價值)具有高度相似性,同時還兼有中醫學領域的整體性、混雜性及相關性[8]。中醫藥診療糖尿病多基于中醫整體觀,通過辨證論治思維辨病因、識病機。醫療機構的中醫診療數據既有混合型數據(結構化和非結構化)又有離散型數據(數據分布在不同的系統或平臺),如定性化的中醫證候、體征癥狀與定量化的實驗室指標數據及影像功能檢查等,目前很難找到標準化、有序性的數據采集處理方法。在糖尿病中醫診療過程中摻入的醫生主觀經驗判斷、模糊語言表達也體現出其數據的混雜紛繁性。中醫診療糖尿病基于復雜的中醫理論治療方法,如陰陽平衡、臟腑辨證、整體調理等,所謂的因果關系不單依賴少而精的數據描述,更關注宏觀的臨床真實世界數據相關性[9]。因此,中醫藥診療糖尿病仍面臨著數據信息標準化不足、診療方案不規范、數據信息化緩慢等重大挑戰。
近年來,隨著信息技術逐漸發展并應用到中醫藥領域,依托自然語言處理、數據挖掘及人工智能等算法將多源異構的數據結構化為“可用”“好用”的數據。通過真實世界數據驅動形成中醫藥臨床研究的循證醫學證據,推動中醫藥研究水平提升[10]。基于海量數據的優勢,我國已初步構建中醫病證分類與代碼的標準體系框架,但中醫治療疾病的療效評價、安全性評價與經濟性評價的相關標準尚未完全確定統一。只有充分發揮我國中醫臨床診療術語標準化示范作用,優化完善中醫糖尿病智能大數據平臺,才能完全掌握糖尿病中醫診療標準的國際話語權[11]。
通過糖尿病專科醫生為核心的團隊與信息管理部門的合作,寧波市中醫院運用大數據和人工智能技術,對數據進行集成與處理,建立糖尿病患者模型和疾病模型,實現中醫臨床醫生對患者臨床、隨訪、健康管理等全量數據的結構化存儲、智能化管理與科研化應用。具體建設包含以下內容。
以寧波市全民健康信息平臺為數據源,進行數據抽取、傳輸和加載,并進行原始數據的清洗、映射及格式轉換。以患者為維度,以患者單次就診為最小顆粒度,將患者在不同系統(電子病歷、檢驗、檢查、用藥等)中的數據關聯起來,建立完整的患者數據模型,并在不影響醫院現有系統的基礎上實現業務數據的自動更新。提供直觀的頁面訪問UI設計,實現在院內任一聯網的計算機終端上支持對多源異構數據采集,進行相關統計分析,評估數據質量及字段映射準確率,進行數據調閱和科研使用,并支持數據溯源,支持圖形化方式展示最終數據字段與原始數據字段之間的關系、數據計算邏輯及中間計算結果。
數據治理支持對患者數據進行多維度、復合條件查詢,并允許對數據質量進行核查,完善數據規約、清洗等治理工作,為臨床研究提供支持。數據字典參考國內和國際醫療行業的權威標準,如《中國藥典》規范數據標準,建立中醫學術語的同義關聯詞表,其意義在于可對多源異構的原始數據進行標準化的數據治理,并為后續數據應用提供統一的信息表達。
通過運用數據清洗、醫療文書后結構化和醫學數據標準化等主要技術手段,實現數據標準化歸一、后結構化處理及元數據與數據質量管理,并進行數據脫敏與加密處理,從而提升數據可用性,建立糖尿病數據模型。根據臨床醫生的需求,以時間為軸整合患者歷次就診數據,建立患者維度的數據集,全景展示各項指標的變化情況,不僅能展示糖尿病患者管理中的用藥情況、主要檢查檢驗指標的治療趨勢,并能在數據分析場景中,發現問題指標后直接點擊打開詳情列表,進入詳情頁面進行查看,查看維度包括病案信息、電子病歷相關信息、費用信息、檢驗檢查結果信息、病程信息、隨訪信息等已集成的數據詳情,從而讓醫生發現問題后可深入細節,找到疾病診療問題背后的原因。
糖尿病是寧波地區最常見的慢性內分泌系統疾病,其特點是病程長,病情易反復且需要長期的隨訪治療,患者多數在門診進行治療,需要全流程管理和密集隨訪[12]。患者的臨床數據涵蓋生活居住環境、門診診療、檢驗檢查、院外隨訪用藥等多來源數據,通過信息化管理可顯著提高患者隨訪和患者管理的效率。
本數據庫通過構建患者隨訪模塊,對需觀察入組的患者,設定相應的隨訪計劃,并實現通過短信、微信推送及電話的方式,對失訪患者進行提醒,并支持自定義隨訪次數、隨訪頻率和隨訪開始時間;配置電子化隨訪病例報告表(case report form,CRF),CRF題目支持使用疾病標準數據集指標和用戶自定義添加指標,通過數據整合技術,從醫院多個信息系統中精準采集CRF中的相關字段進行自動填充,對非結構化數據進行結構化處理,并對以圖像方式存儲的數據進行圖像中字符數據的提取。自動填充的CRF支持臨床多源數據的整合,實現以患者為單位統一展示全生命周期數據。
隨訪數據可回流到專病庫內,與專病庫數據融合,可搜索、可導出、可被其他項目復用,并支持設定不良事件觸發規則,自動提醒不良事件短信及微信隨訪,支持給患者發送短信及推送微信消息,患者在移動端填寫隨訪表單并實時回傳數據。
糖尿病中醫門診及住院產生的海量診療數據經過本數據庫的有效處理,可為開展相關科研工作提供數據基礎。基于臨床數據開展臨床研究,在臨床研究中獲取循證醫學證據,并將其推廣運用于臨床實踐,完全符合“從臨床中來,到臨床中去”的中醫學臨床科研模式[13]。本數據庫可同時對一個或多個科研項目進行實施和管理,包括創建項目、編輯項目、刪除項目、設置項目權限、項目組管理、項目組成員管理等過程管理,實現科研項目/課題流程、進度及科研項目的實時管理。滿足查詢、增加、修改、作廢科研項目功能,同時具備設置項目的基本信息,包括項目名稱、項目類型、項目狀態、相關科室、負責人、相關CRF模板等。管理的相關操作具備權限控制,不同的系統用戶設置不同的數據權限,如數據可訪問范圍、數據脫敏字段范圍、數據導出字段范圍。項目組管理用于創建、編輯、刪除相關項目的項目組,應關聯到對應的科研隊列;項目組成員管理實現項目組成員的增加、刪除及給成員授權角色(如項目組用戶、普通用戶、錄入人員)的功能。臨床研究方式滿足支持前瞻性及回顧性研究,通過設定納入、排除條件及醫療事件基線等條件,可實現自動篩選入組病例,并添加相應的觀測指標,提供多種方式的在線數據統計,以支持科研項目的開展。
循證研究高度依賴臨床數據的高質量收集,而結合數據高效采集和隨訪管理一體化的專病庫正符合中醫藥循證能力建設過程中對臨床科研項目管理、數據采集和數據查詢的要求。滿足用戶通過拖拽組件的方式自動生成完整可用的表單,具備單選框、復選框、日期、下拉框、文本域等控件。實現從新建表單-設計表單-保存表單-創建數據表-保存數據-展示數據-查詢數據的完整操作流程,無需技術人員參與,并具備多種數據錄入方式和數據質量校驗。可實現動態填寫表單,同時滿足從外部獲取數據使用;具備數據校驗功能,能校驗一個表單內部單一或多個數據項間邏輯關系的合法性,同時實現跨表單數據邏輯關系的校驗;通過實現自動計算和評分的功能,可根據多個數據項目的內容進行其他項目內容或分值的自動計算。通過對臨床醫生簡單的軟件操作培訓即可自行設計表單,對表單的維護不需要技術和實施人員參與。
目前針對區域人群糖尿病早期診斷及規范化、個性化治療的臨床研究相對較少,這與醫院缺乏對疾病臨床數據全周期統一規范化處理及未形成高質量的疾病研究數據庫有較大關聯[14]。依托本數據庫開展寧波中醫糖尿病循證醫學研究,可為臨床科研及規范標準的制定提供堅實工具與數據基礎。
醫療大數據時代的到來為真實世界研究的發展奠定基礎。“精準醫療”可理解為以個體化醫療為基礎,治療時強調考慮個人的基因變化、環境影響及生活方式變化[15]。糖尿病中醫藥診療強調整體觀念、辨證論治等治療理念。糖尿病中醫專病數據庫基于個性化原則進行患者診療數據采集,既是對傳統信息數據的有力補充,又對患者全程的診療信息進行跟蹤,真正實現個性化醫療,標志著以預防及控制疾病為核心的新型健康服務模式已開啟。
臨床隊列的建立也為進一步拓展中醫優勢病種研究的深度建立了數據基礎。未來,可在本數據庫基礎上拓展基于人工智能等新興技術的決策支持、患者智慧服務等應用,如結合中醫四診醫療設備報告進行智能識別提供輔助診斷、根據患者自行填報的信息主動給出健康管理建議等。
根據糖尿病患者中醫藥診療特點,本院臨床醫生與信息部門圍繞目前醫院信息系統的管理與應用特點、數據采集內容進行分析,確定需要重點建設的數據庫功能及系統需求。基于中醫診療糖尿病的真實世界數據復雜性及糖尿病患者對醫護協同隨訪的需求,建設一個能將患者首診、復診及院外數據進行整合,實現多維數據良好采集和應用的信息化系統,實現中醫診療糖尿病的臨床智能化管理與科研數字化開展的新模式,不僅有助于中醫糖尿病專科醫護人員為患者提供良好的隨訪和全周期照護,并可積極推廣我市特有的甬派中醫藥診療特色,提高甬派中醫藥傳承創新能力[16],對寧波市糖尿病預防和治療、提升人民健康生活質量具有重大意義。
[1] 張盼, 沈紹武, 田雙桂, 等. 中醫臨床大數據知識工程規劃與設計[J]. 時珍國醫國藥, 2022, 33(3): 764–766.
[2] 王怡菲, 李鵬輝, 張芳, 等. 基于HIS數據的糖尿病腎臟疾病Ⅲ~Ⅳ期中醫證候特點及其影響因素研究[J]. 世界中醫藥, 2022, 17(5): 607–613.
[3] 趙能江, 張智海, 陳薇, 等. 《中國2型糖尿病防治指南(2020年版)》亮點解讀及糖尿病中醫指南分析[J]. 中國中西醫結合雜志, 2021, 41(6): 652–655.
[4] 李曉慧. 任廷革: 艱難的中醫信息化之路[J]. 中國計算機用戶, 2008(11): 64–66.
[5] 馬思佳, 孫旭, 馬鑫燁, 等. 基于病案數據挖掘的中醫臨床理論重建初探[J]. 中國中醫藥現代遠程教育, 2018, 16(11): 52–54.
[6] 陳偉, 沈紹武, 肖勇. 中醫醫院信息化特點、成效及發展[J]. 醫學信息學雜志, 2010, 31(7): 5–8.
[7] 我國16個重點病種的國家中醫臨床研究基地論文統計表(2008年~2013年)[J]. 世界科學技術-中醫藥現代化, 2013(5): 1161–1261.
[8] 陳軼, 晏峻峰. 試析大數據與中醫藥信息學特征的相似性[J]. 飲食科學, 2019(4): 245.
[9] 張亞軍, 孫燕茹, 袁婧茹. 中醫藥防治糖尿病循證醫學研究現狀分析[J]. 內蒙古醫學院學報, 2012, 34(4): 343–348.
[10] 蔡榮林, 胡玲, 吳子建. 循證醫學、真實世界研究在針灸臨床研究中的應用與思考[J]. 中國針灸, 2015, 35(9): 949–952.
[11] 成福春, 方肇勤, 朱抗美, 等. 利用信息技術促進中醫證型的規范化[J]. 中國中醫基礎醫學雜志, 2007, 13(4): 241–242, 308.
[12] 楊甜夢. 寧波市2型糖尿病治療現狀調查[D]. 寧波:寧波大學, 2019.
[13] 劉保延. 真實世界的中醫臨床科研范式[J]. 中醫雜志, 2013, 54(6): 451–455.
[14] 李榕, 潘常青, 袁駿毅, 等. 基于大數據技術的智能化房顫專病數據庫建設和應用[J]. 中國數字醫學, 2022, 17(2): 95–100.
[15] 任思沖, 周海琴, 彭萍. 大數據挖掘促進精準醫學發展[J]. 國際檢驗醫學雜志, 2015(23): 3499–3501.
[16] 打造甬派中醫藥金字招牌, 推進中醫藥強市建設!我市中醫藥大會召開[OL]. (2021-02-05)[2022-08-16]. https://www.nbszyy.com.cn/art/2021/2/5/art_4994_632833.html.
Construction and prospect of diabetes traditional Chinese medicine special disease database based on clinical big data
LI Hua, GUO uiqin, XIE Wei, LIN haoyang, XU hang, ZHOU Kai,
1.Department of Information, Ningbo Municipal Hospital of Traditional Chinese Medicine,Ningbo 315010, Zhejiang, China; 2.The First Department of Endocrinology, Ningbo Municipal Hospital of Traditional Chinese Medicine,Ningbo 315012, Zhejiang, China; 3.Yidu Cloud (Beijing) Technology Co. Ltd., Beijing 100191, China
With the vigorous promotion of internet diagnosis and treatment services, the people’s acceptance of internet diagnosis and treatment is getting higher and higher, and the demand is growing as well. The associated supporting system and process of internet diagnosis and treatment should also be improved simultaneously. This paper is aiming to build a more appropriate settlement model for internet diagnosis and treatment service through streamlining the according processes including charging, obtaining medical bills, refunding, medical insurance settlement, reconciliation and financial management of funds in various payment channels etc. Comparing the pros and cons of various processes, to make the internet diagnosis and treatment services go more smoothly, promote the genuine implementation of the internet diagnosis and treatment services and ensure the general public get the real benefits.
Diabetes; Medical big data; Big data processing; Information technology; Special disease database
R241
A
10.3969/j.issn.1673-9701.2023.07.017
浙江省國醫名師傳承工作室建設項目(GZS2020012)
周開,電子信箱:zhoukaibox@126.com
(2022–09–13)
(2023–01–24)