顧大川,鄭哲,趙韡,張恒,饒辰飛,袁靖,高華煒,張士舉,侯劍峰,趙艷,張穎,李衛,王楊
中國成人心血管外科注冊登記數據庫的構建
顧大川,鄭哲,趙韡,張恒,饒辰飛,袁靖,高華煒,張士舉,侯劍峰,趙艷,張穎,李衛,王楊
目的:介紹中國成人心血管外科注冊登記數據庫構建思路和功能,供國內類似數據庫參考。
方法:通過參考同類數據庫,并結合我國心血管外科注冊登記現狀、硬件條件和國際數據交流的需求,進行變量篩選、元數據創建及數據庫邏輯構建等工作。最終構建基于網頁的能夠進行跨數據庫交換并具備多種功能的心血管外科信息交流平臺。
結果:數據庫包含患者基本信息、危險因素、醫療活動及終點事件等超過300個不同種類的變量,參照臨床數據交換標準協會數據標準,可進行跨領域數據對接;收錄受試者圍術期所有重要信息,同時具有自動邏輯核查、研究進度自動統計、研究數據導出和電子病歷數據導入功能。
結論:中國成人心血管外科注冊登記數據庫是一個符合我國心血管外科發展現狀,具有中國成人心血管外科特征,同時兼顧國際對接和交流的數據研究服務平臺,將在醫療質量改善以及臨床科研中起到重要作用。
心血管外科手術;數據庫;計算機方法學
近年來,中國心血管外科快速發展,手術量飛速增長[1-3],但與此同時,國內不同地區經濟及教育差異明顯,手術質量差異巨大[4-7]。因此,建設國家級心血管外科注冊登記數據庫,并以此描述醫療真實現狀,促進醫療質量改善,對我國心血管外科發展具有重要意義。然而,一直以來我國缺乏國家級心血管外科多中心大規模信息化和標準化數據分享平臺,雖然國際上已有國家級數據庫的案例,但是由于不同國家之間人群和疾病特征以及醫療衛生公共服務系統的差異,這些數據庫并不適合國人直接使用,所以開發符合我國國情同時能夠與國際同類數據庫交流的數據庫是心血管外科注冊登記和質量改善工作的當務之急。
較強的可操作性和數據對接交換能力對于數據庫十分重要[8]。在滿足注冊登記需求的前提下,避免冗余的數據庫結構,提高數據提取、交換、歸檔和存儲的可操作性,方便計算機后臺數據邏輯核查、統計分析和報告,是數據庫設計的重要標準。另一方面,為實現不同數據庫的對接,以及實現國內外數據交換和信息流動,以獲得大規模多元化的數據網絡,需要采用國際通用的標準數據名稱和數據庫結構[9]。因此,兼具較強可操作性和可轉化性就成為注冊登記數據庫建立的關鍵與難點。
中國心血管手術注冊登記(Chinese Cardiac Surgery Registry, CCSR)[10]數據庫是國家心血管病中心(National Center for Cardiovascular Diseases, NCCD)和中國醫學科學院阜外醫院在心外科多中心注冊登記數據庫[5]的基礎上創建的國家級注冊登記數據庫,其目的是實現成人心血管外科手術質量持續監控并進行相應的質量改善工作,以及構建國家級多中心心血管外科臨床科研協作網絡。建立過程中,研究組完成一系列臨床指南查閱和變量篩選工作,以簡潔實用為準則,自主研發了一個基于html和網絡的數據收集、管理、交換和對接平臺,較好地滿足上述需求。本文就自建數據庫的構建思路和功能進行介紹,供國內類似數據庫參考。
注冊登記研究組主持數據庫的構建和管理工作,進行數據庫的設計,包括變量的篩選和對應元數據的編輯,以及對數據集結構規劃和附加功能進行設計,最終進行數據庫開發、建立和維護工作(圖 1)。

圖1 中國成人心血管外科注冊登記系統的建立
研究組成員在大量文獻查閱和指南閱讀的前提下,參考國際其他國家級數據庫[11-13],同時充分考慮了我國心血管外科發展現狀,分析我國患者人口統計學、流行病學及疾病特點,針對我國醫療資源分布極度不均、醫院間硬件水平與診療水平存在巨大差異的問題,篩選出具有代表意義的危險因素、疾病癥狀體征、實驗室檢查指標以及終點事件作為數據庫變量。
在篩選的過程中,研究組對于變量的入選、描述和剔除進行了多次的討論,組內達成了一致意見才能對任何變量進行納入和刪改。
元數據是“數據的數據”,是描述變量特征的結構化編碼數據,對于注冊登記數據的查找、存取、使用和管理十分重要[14]。為此,研究組依據最新的臨床指南,參考現有的注冊登記系統,通過共同商討和決策,創建了注冊登記數據庫的元數據。
除了實用性以外,在創建元數據時還將臨床數據交換標準協會(Clinical Data Interchange Standards Consortium, CDISC)數據標準作為重要的參考內容,其目的是與國際通用的數據交換標準保持一致或具有可轉化性[15],這對于不同數據庫的數據交換以及不同組織機構之間的信息共享至關重要。
數據庫的結構設計目標為:構建規范性與實用性并重,具有中國心血管外科注冊登記特色,同時具有國際可交流性和可轉化性的數據庫。因此,研究組確立了以下要求: (1)CCSR數據庫以美國胸外科醫師協會國家數據庫(Society of Thoracic Surgery National Database)為模板,同時針對中國患者人口統計學特征和疾病特點進行修改。(2)CCSR獲得的數據直接進入CCSR數據庫,在確保數據庫結構完整度的前提下盡量簡潔,操作需簡單高效。(3)CCSR數據庫最終由中國心血管外科注冊登記研究組進行管理,隨著中國心血管外科的發展和疾病特征的改變,研究組需對數據庫進行必要的修改。根據以上內容,研究組成員進行CCSR數據庫的研發設計。
為滿足CCSR的功能需求,簡化研究人員的工作,數據庫的設計之初就考慮了一系列附加功能:(1)電子病歷數據導入:如果協作醫院裝備結構化電子病歷系統,則將電子病歷系統和數據庫對接,數據庫可直接提取協作醫院電子病歷系統中的患者信息。(2)自動邏輯核查:變量經明確定義后可將數據庫分為核心數據集和擴展數據集。核心數據集中包含的變量必須全部錄入完整數據,方能實現病例入選并上傳到數據庫中。擴展數據集變量的數據錄入雖非強制性,但是仍然強烈推薦,以參與整體數據分析。同時數據庫具有自動識別疑點值的功能,通過對數據的可能取值區間進行限定,可以篩檢出不符合臨床環境的數據。如果出現核心變量漏填或賦值不符合邏輯的情況,則不能保存和上傳數據,從而保證數據的完整性和準確性。(3)研究進度自動統計和研究數據導出功能:方便操作者快速獲取數據。
最終由研究組負責數據庫的建立。在工作過程中,研究組成員通過電話、郵件、面談乃至召開會議等多種方式,針對工作進展和問題進行了多次的商討。數據庫建成后,研究組負責維護工作。
研究組最終確定的變量包括如下幾類:(1)患者基本信息;(2)術前危險因素;(3)術前心臟狀態和既往心血管干預;(4)檢查化驗指標;(5)手術操作信息;(6)術后狀態及并發癥;(7)術前用藥;(8)出院醫囑用藥。這些變量涵蓋了中國醫院心血管外科手術質量的過程指標和結局指標,如人口統計學信息、危險因素和終點事件等,能夠實現數據庫用于醫療質量改善及臨床科研數據網絡的建設目標。基于數據庫的變量內容,我們設計了病例登記表。
所有的變量的元數據都經過完整詳盡的定義。元數據主要包括以下類別:(1)變量名稱;(2)變量類型;(3)字符寬度;(4)變量標簽;(5)變量類型;(6)變量角色。元數據的構建以CDISC數據標準作為參考。
同時,數據庫的附加功能使其具有更強的可操作性。數據庫可以直接與結構化的電子病歷系統對接,直接獲取臨床數據,極大減少了操作者的工作量;邏輯核查功能能夠檢查病例報告表的必填項是否完善,拒絕疑點值,從而提高數據質量;研究進度自動統計和研究數據導出功能顯著提高了后續數據分析和質量信息反饋工作的可操作性。
研究組逐步建立了涉及全國97家醫院的多中心心血管外科數據庫,收集逾18萬例心血管外科詳細臨床數據資料[10]。在龐大的病例數據基數下,完整度高于90%的病例比例為86.5%,完整度高于95%的病例比例為71.1%,證實CCSR數據庫有能力高質量地錄入和歸檔相關數據。目前數據庫錄入患者的基本特征見表1。
目前隨著各個中心的數據連續錄入,我們的數據庫已經成為重要的國家級大規模多中心心血管外科注冊登記數據庫,并已經開始了持續的成果產出。通過中國心血管外科注冊登記研究數據分析發現,我國不同地域、不同中心在冠心病外科手術死亡率和并發癥發生率等指標存在差異。研究組持續向各協作中心發布年度數據報告,反饋臨床結果和數據質量,并明確和規范國人心血管外科診療關鍵技術和環節,使協作醫院搭橋院內死亡率和并發癥發生率逐年降低,整體提高了國人冠心病外科療效。以此數據為核心,研究組向國家衛生與計劃生育委員會提交了《心血管外科2015國家醫療質量分析報告》,作為“心血管外科專業”內容被《2015年國家醫療服務與質量安全報告》收錄,達到了反映醫療現狀,促進心血管外科醫療質量改善的目的。
此外,以冠心病個體化治療為指導思想,研究組利用數據庫開展了系列冠心病外科醫療質量評價及質量改善研究,包括復雜冠心病診療指南依從性評價研究,移動醫療技術對冠心病外科二級預防依從性改善研究,我國冠心病患者外科再血管化個體治療策略優化研究等,填補了相關指南的空白,完善了質量評價體系,受到國內外同行的高度評價,實現了數據庫作為臨床科研數據研究服務平臺的功能。

表1 中國成人心血管手術注冊登記數據庫錄入患者基本特征[例(%)]
近年來,我國心血管外科手術發展極為迅速,但同時極不均衡,醫療資源及手術技術存在顯著的地方差異。而“搜集協作醫院數據—分析質量控制指標—反饋質量信息—協作醫院自調”這一模式是實現醫療質量改善的重要途徑[16,17],因此,中國心血管外科注冊登記研究組建立了CCSR數據庫。隨著多中心高質量數據的大規模錄入,CCSR數據庫已經逐漸成為我國國家級成人心血管外科醫療質量監控和科研數據分享的信息化平臺,這與數據庫開發過程中的設計和數據質量控制工作密不可分。
CCSR數據庫的建立以美國STS國家數據庫為模板,但考慮到我國心血管外科患者在人口統計學構成、經濟狀況、醫療保險等基本情況層面,疾病危險因素、疾病易感性等患者層面,以及檢查手段、手術操作、醫囑開藥等醫療層面都與歐美國家存在一定差異[3,5,6,18],所以研究組根據我國國情,篩選了適用于我國心血管外科患者注冊登記的變量,在保證信息完整的同時,避免搜集到過于冗雜的數據。
同時,研究組希望能夠與國際同行進行數據交流與資源共享,因此數據庫在設計之初就參考了國際通用的數據標準。CDISC數據標準作為數據獲取、交換、提交和歸檔的全球性、非平臺依賴性的國際標準,其元數據構成與數據集結構是我們重要的參考對象。CCSR數據庫變量元數據與CDISC標準元數據有著極為類似的類型和標準,能夠提升數據庫變量的實用性,明確變量意義,方便數據庫使用者的數據采集和管理,同時在需要和國際數據庫進行數據交換時能夠方便地轉化和對接。
另一方面,在數據集結構的設計過程中,我們發現CDISC標準中的研究數據表格模型(Study Data Tabulation Model, SDTM)并不符合當前CCSR數據庫的設計需求。SDTM表格模型將數據按照類別分為不同的域(Domain)進行儲存,每個域的數據集以觀測(Observation)作為基本單位,每個觀測通過不同的變量進行描述,而每位受試者的數據需要多個觀測進行描述,由于每一項觀測都包含了部分相同的身份信息變量,而并不適用于目前的心血管外科專科注冊登記數據庫的構建。因此,我們對CCSR數據集結構進行了改進,每一個觀測代表一位受試者,變量直接對受試者進行描述,這種結構避免了記錄不同觀測時需要重復記錄的變量,提升了數據庫的簡潔程度,更符合我國數據使用習慣,完全適用于目前CCSR數據庫。同時,這種數據結構也可轉置為符合SDTM標準的數據集結構,便于與國際數據庫的對接和數據交換。
我們為數據庫添加的附加功能是提升數據庫可操作性的重要措施。在實際操作過程中,即使是同一個變量,由于不同協作醫院的數據的單位可能并不統一,或者錄入員的工作失誤(如將以m為單位的身高值1.60 m沒有經過換算而直接賦值于以cm為單位的數據庫變量,結果出現身高1.60 cm的邏輯錯誤),而導致不同來源的數據值不能進行綜合和比較,從而對數據質量造成嚴重影響。CCSR數據庫邏輯核算功能則可以識別這種邏輯錯誤,并通過拒絕保存或提交等方式提醒數據錄入員,從而獲得極低的疑點值和缺失值百分比,保證了數據的準確性和完整性。電子病歷對接、研究進度統計和研究數據導出功能方便了我們實時地接收數據,及時進行數據分析,并向協作單位反饋質量信息,從而提高數據使用效率,達到促進質量監測和改善的目的。
CCSR數據庫是一個新生的注冊登記數據庫,將在以后的醫療質量控制和大規模隊列研究中起到重要作用。目前注冊登記是醫療行業進行質量控制、指導資源分配、評估患病人群以及疾病特征變化趨勢的重要工具。我們希望在CCSR數據庫構建的工作中積累的經驗和知識可以在行業中得到推廣。我們也希望能夠與國內外的同行進行廣泛的數據交換和合作,以期產生更大規模的多來源數據庫,用于醫療質量改善、促進臨床研究。
但是,CCSR數據庫仍需要進一步的完善。首先,由于多家合作中心的電子病歷系統并沒有實現結構化,所以數據庫的病例信息自動錄入功能的優勢并沒有十分凸顯,而主要還是采用人工錄入的方式,這極大地增加了研究人員的工作量,也更易出現的缺失值和疑點值。另外,由于我們的數據庫仍處于起步階段,目前還未能與國家醫療保險信息數據庫、死亡登記數據庫等進行對接,難以形成全面的國家級公共衛生管理數據網絡,所以與國際較成熟的注冊登記數據庫相比功能相對有限。進一步推進我國各家心血管外科醫療中心的病歷系統的電子化、結構化,探索與其他相關數據庫的對接和交流途徑,是我們未來的工作方向。
隨著協作醫院高質量數據的不斷錄入,CCSR數據庫已成為一個國家級心血管外科數據平臺,將為我國成人心臟手術質量監控、大型臨床研究的實施、人群臨床操作標準制定最終提升醫療質量提供重要的途徑。
[1]Yang G, Kong L, Zhao W, et al. Emergence of chronic noncommunicable diseases in China. Lancet, 2008, 372: 1697-1705.
[2]Moran A, Gu D, Zhao D, et al. Future cardiovascular disease in china:markov model and risk factor scenario projections from the coronary heart disease policy model-china. Circ Cardiovasc Qual Outcomes,2010, 3: 243-252.
[3]朱德明, 龍村, 黑飛龍. 2014中國心臟外科和體外循環數據白皮書. 中國體外循環雜志, 2015, 13: 129-131.
[4]Zheng Z, Zhang L, Hu S, et al. Risk factors and in-hospital mortality in Chinese patients undergoing coronary artery bypass grafting: Analysis of a large multi-institutional Chinese database. J Thorac Cardiovasc Surg, 2012, 144: 355-359.
[5]Hu S, Zheng Z, Yuan X, et al. Coronary artery bypass graft:contemporary heart surgery center performance in China. Circ Cardiovasc Qual Outcomes, 2012, 5: 214-221.
[6]Li Y, Zheng Z, Hu S. Chinese coronary artery bypass grafting registry study. The Chinese coronary artery bypass grafting registry study:analysis of the national multicentre database of 9248 patients. Heart,2009, 95: 1140-1144.
[7]Jiang L, Krumholz HM, Li X, et al. Achieving best outcomes for patients with cardiovascular disease in China by enhancing the quality of medical care and establishing a learning health-care system.Lancet, 2015, 386: 1493-1505.
[8]van den Hoven J. Database management system and XML: interchange of data. Information Systems Management, 2002, 19: 94-96.
[9]Anderson HV, Weintraub WS, Radford MJ, et al. Standardized cardiovascular data for clinical research, registries, and patient care: a report from the data standards workgroup of the national cardiovascular research infrastructure project. J Am Coll Cardiol, 2013, 61: 1835-1846.
[10]Rao C, Zhang H, Gao H, et al. The Chinese cardiac surgery registry:Design and data audit. Ann Thorac Surg, 2016, 101: 1514-1520.
[11]Grover FL, Shahian DM, Clark RE, et al. The STS national database.Ann Thorac Surg, 2014, 97: S48-S54.
[12]Head SJ, Howell NJ, Osnabrugge RL, et al. The European association for cardio-thoracic surgery (EACTS) database: an introduction. Eur J Cardiothorac Surg, 2013, 44: e175-180.
[13]Ferguson TB Jr, Dziuban SW Jr, Edwards FH, et al. The STS National Database: current changes and challenges for the new millennium. Committee to establish a national database in cardiothoracic surgery, the society of thoracic surgeons. Ann Thorac Surg, 2000, 69: 680-691.
[14]Linkert M, Rueden CT, Allan C, et al. Metadata matters: access to image data in the real world. J Cell Biol, 2010, 189: 777-782.
[15]Bruland P, Breil B, Fritz F, et al. Interoperability in clinical research:from metadata registries to semantically annotated CDISC ODM. Stud Health Technol Inform, 2012, 180: 564-568.
[16]Yang Z, Jiang L. Building clinical research capacity in China: the national clinical research centres. Lancet, 2014, 383: 200-201.
[17]Grover FL, Shroyer AL, Hammermeister K, et al. A decade’s experience with quality improvement in cardiac surgery using the veterans affairs and society of thoracic surgeons national databases.Ann Surg, 2001, 234: 464-474.
[18]He W, Ni S, Chen G, et al. The composition of surgical teams in the operating room and its impact on surgical team performance in China.Surg Endosc, 2014, 28: 1473-1478.
Establishment of Chinese Cardiovascular Surgery Registry Database
GU Da-chuan, ZHENG Zhe, ZHAO Wei, ZHANG Heng, RAO Chen-fei, YUAN Jing, GAO Hua-wei, ZHANG Shi-ju,HOU Jian-feng, ZHAO Yan, ZHANG Ying, LI Wei, WANG Yang.
State Key Laboratory of Cardiovascular Disease, National Center of Cardiovascular Disease and Fuwai Hospital, CAMS and PUMC, Beijing (100037), China
Corresponding Author: ZHENG Zhe, Email: zhengzhe@fuwai.com
Objective: To introduce the construction idea and function for establishing China Cardiovascular Surgery Registry(CCSR)database and to provide a reference for domestic congener databases.
Methods: Using peer database as reference, taking current status of cardiovascular surgery registry and hardware in our country with the necessity of international communication, we worked on a variables selection, metadata instruction, logic rules, case report form develpment and finally established a web-based, multi-functional database that enabled cross-database and international merging of data, forming a national intelligent data-exchanging platform for cardiovascular surgery.
Results:CCSR database has over 300 variables of multiple topics including basic information, risk factors, medical procedures and endpoint events. Taking clinical and association data exchange standards as reference, it may conduct cross-discipline data connection, record important peri-operative information in relevant patients and meanwhile, it has the functions of automatic logic check, data report, statistical study, data export and importing the electronic medical records.
Conclusion:CCSR database is a national platform accord with current status of Chinese cardiovascular surgery and characteristics, meanwhile it gives consideration to international communication and data exchange; which may play a important role in improving medical care and clinical investigation.
Cardiovascularsurgery; Database; Computer methodology
(Chinese Circulation Journal, 2017,32:1010.)
100037 北京市,北京協和醫學院 中國醫學科學院 國家心血管病中心 阜外醫院 心血管疾病國家重點實驗室
顧大川 博士研究生 主要從事醫療質量改善研究 Email:SundayMed@163.com 通訊作者:鄭哲 Email:zhengzhe@fuwai.com
R541.4
A
1000-3614(2017)10-1010-05
10.3969/j.issn.1000-3614.2017.10.017
2016-11-26)
(編輯:梅平)