999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

臨床研究數據庫的構建與管理

2022-02-14 02:26:10朱之愷黃馨瑩姜勇
中國卒中雜志 2022年1期
關鍵詞:數據庫研究

朱之愷,黃馨瑩,姜勇,2

臨床研究概念范圍很廣,凡是以患者或健康人為研究對象的醫學研究都是臨床研究。傳統臨床研究包括規定嚴格的實驗性研究(臨床試驗)和其他觀察性研究等;真實世界研究通過收集、分析真實世界環境中與患者有關的數據,獲得醫療產品的使用價值及潛在獲益或風險的臨床證據[1],與傳統臨床研究證據互為補充。臨床研究的過程,是數據產生、管理、分析和發布利用的過程,研究結論的科學性和可靠性建立在高質量的數據基礎上。

數據庫(database)是結構化信息或數據(一般以電子形式存儲在計算機系統中)有組織的集合,具有實現數據共享、數據冗余度減少、數據獨立、數據集中控制、數據一致性和可維護性以確保數據安全和可靠等主要特點[2]。從數據管理發展的歷史看,數據庫是由文件管理系統發展起來的,是數據管理的高級階段。數據管理是臨床研究的關鍵[3],規范臨床研究數據庫的構建及管理,可切實提高科研數據的質量,促進臨床科研的發展。

1 臨床研究數據庫的構建

臨床醫師或科研工作者在進行臨床研究時,需要將目前國內外常用的數據標準和工具應用于數據庫的構建。

1.1 建立臨床研究數據庫的數據標準/規范隨著各類數據標準化方法的因需建立,困擾醫療行業的海量和多源非結構化數據無法進行有效對接、匯交及分析的問題有了一些解決手段和方法。目前國內外常用的數據標準有美國觀察性醫療結果合作組織(Observational Medical Outcomes Partnership,OMOP)項目組開發、觀察性健康醫療數據科學和信息學(Observational Health Data Sciences and Informatics,OHDSI)工作組維護的通用數據模型(common data model,CDM)[4],臨床數據交換標準協會(Clinical Data Interchange Standards Consortium,CDISC)開發的數據制表模型(study data tabulation model,SDTM)和臨床數據獲取協調標準(clinical data acquisition standards harmonization,CDASH)[5-6],美國衛生信息交換標準組織(Health Level Seven,HL-7)開發的快速醫療互操作資源(fast healthcare interoperability resources,FHIR)[7]。以上數據標準的選擇場景:疾病發生、發展和影響因素的研究推薦FHIR;CDM常用于規范觀察性數據的格式和內容;SDTM和CDASH適用于臨床試驗,SDTM規定了病歷報告表(case report form,CRF)中各問題的變量名、提示和問題文字,用于支持臨床試驗方案信息交換的內容和格式標準,為美國食品和藥品管理局(Food and Drug Administration,FDA)接受的數據提交標準。CDASH根據SDTM的數據結構建立CRF,明確變量的數據類型,支持臨床研究從數據采集到數據提交的標準化。

原國家食品藥品監督管理總局組織制定的《臨床試驗的電子數據采集技術指導原則》詳細闡述了電子數據采集(electronic data capture,EDC)系統的基本技術要求以及在臨床試驗實施不同階段的應用要求[8]。中國真實世界數據與研究聯盟制定的“構建基于既有健康醫療數據的研究型數據庫技術規范”和“患者登記數據庫構建技術規范”[9-10],分別介紹了研究型數據庫和患者登記數據庫的構建流程,補充了電子數據采集和真實世界研究方面的原則和數據規范。

根據臨床研究的目的和特點,組合選擇以上數據標準/規范,可大大提高數據庫管理的質量和效率。

1.2 建立臨床研究數據庫的工具 臨床研究數據采集和管理的常用工具有通用軟件EpiData(http://w w w.epidata.dk/)、EpiInfo(www.cdc.gov/epiinfo),專門軟件Access、Visual FoxPro、REDcap、EDC等,可根據研究的應用場景和具體需求,選擇不同的數據庫工具。由于Excel的數據更改不可溯源、數據訪問層級權限設置受限等不足,不建議將Excel作為建立臨床研究數據庫的工具[11]。在信息化技術的支撐下,臨床研究數據采集和管理逐漸由傳統的以紙質CRF采集數據、人工錄入或圖片文字識別技術錄入數據為基礎的數據管理階段轉變為以EDC(可理解為電子CRF)為核心的網絡化及智能化數據管理階段。廣泛使用的EDC系統有Oracle Clinical系統、MySQL系統、Rave系統及eCollect系統[12-15],允許多個用戶同時使用高度復雜的邏輯,快速、安全地訪問和查詢數據,滿足臨床試驗數據采集和科研管理的需求。

國家神經系統疾病臨床醫學研究中心建立的神經系統疾病臨床研究數據采集和管理平臺集成紙質CRF錄入、基于平板電腦的計算機輔助面訪調查(computer assisted personal interviewing,CAPI)或計算機輔助電話調查(computer-assisted telephone interviewing,CATI)及電子病歷數據交換功能,用戶在填寫數據時可以同步進行數據驗證,保證了數據的準確性;平臺在系統內進行了留痕處理,可以看到數據的修改記錄,保證了數據的真實性[16]。平臺可以讓研究者在無網絡狀態下填寫數據,有網絡的時候再進行數據上傳,還可以對患者的資料進行拍照上傳。平臺還包含入組進度通知、填表統計等功能,可實時查看項目進度,在線實時進行質量控制,實現臨床研究數據的及時共享,為績效管理提供依據。

使用統一、標準的數據元是推進高效、科學的數據管理的基礎,基本數據集被賦予符合國家標準、唯一且長期不變的標識符,并配有規范的元數據描述,可指導數據的標準化采集和信息系統的規范化建設,從源頭為不同類型信息系統間的數據交換、共享以及大數據應用奠定基礎。美國國立神經疾病和卒中研究所(National Institute for Neurological Disorders and Stroke,NINDS)于2020年發布的第2版卒中通用數據元素(common data elements version 2.0,CDE V2.0)分為8個亞組,包括卒中CDE的整套數據元素、更新的CRF模板儀器信息文件和指導文件,為促進腦血管病臨床研究的數據采集和共享提供了標準化且經過系統嚴格審查的多樣性結構[17-18]。

2 臨床研究數據庫的管理

數據庫的管理是數據庫系統運行期間對數據庫采取的活動。完整的數據庫不僅包括數據庫本身,還包括數據管理計劃、數據字典、數據清理日志、數據庫使用說明等。數據庫的管理貫穿于數據管理流程,包括從數據收集到數據歸檔的全過程,其中主要包括數據的采集、錄入、審查、清理、保存和歸檔等,目的是保證數據的真實性、完整性和可靠性。

與臨床研究數據管理相關的國際監管法規、規范和指導原則都圍繞著國際協調會議(International Conference on Harmonization,ICH)提出的《人用藥品注冊技術要求國際協調會議——臨床試驗質量管理規范》(international conference on harmonization good clinical practice guideline,ICH-GCP)的原則展開。ICH-GCP對臨床試驗數據管理質量提出了數據的追溯性、清晰性、及時性、原始性和準確性的要求,可作為研究者進行臨床研究時首選參考的數據質量規范。此外,FDA、歐洲藥品管理局(European Medicines Agency,EMA)等認為,TransCelerate BioPharma Inc臨床研究質量管理體系(clinical quality measures,cQMS)作為全面、系統的臨床研究質量管理辦法,對管理復雜的臨床試驗環境有益[19],研究者也可借鑒。

2.1 臨床研究數據管理流程 數據庫管理應貫穿數據生產過程(圖1),各環節協調聯動,進行全流程管理。

圖1 數據生產過程

2.1.1 數據采集 項目準備階段,數據管理人員(database administrator,DBA)依照原國家食品藥品監督管理總局發布的《藥物臨床試驗數據管理與統計分析的計劃和報告指導原則》撰寫項目的數據管理計劃(data management plan,DMP)[20]。數據字典是針對研究用數據進行具體解釋說明的必要的配套文件,最終版本與CRF定稿時一致,應至少包括變量所屬數據集、變量順序、變量名和標簽、變量類型、變量格式與長度、變量賦值范圍或者可選范圍,參考格式見表1。開發人員依據數據庫標準(如CDASH標準)設計EDC系統,發現問題即時修改反饋,測試通過后上線使用。確定研究方案后應開始對臨床數據采集人員進行培訓,使臨床數據采集人員了解研究目的,掌握數據采集方法和要求,熟悉具體的數據錄入操作、數據錄入標準化操作流程(standard operation procedure,SOP)和CRF各個項目的結構、編碼。數據采集階段,仍需對數據管理人員進行多次培訓,出現問題及時解決。建議根據現有工作或患者就診時間順序及習慣(圖2)設計CRF及EDC系統,雙人雙份獨立錄入(重點是ID、數值資料),實時監測數據庫,及時自動備份。

表1 數據字典參考格式

圖2 患者就診時間順序

2.1.2 數據核查與質控 數據核查是指DBA根據研究方案要求,對CRF中的各指標的數值和相互關系進行核查,進一步完善變量邏輯核查表,對于缺失、邏輯矛盾、錯誤或不能確定的異常數據,以疑問表的形式由臨床監查員(clinical research associate,CRA)傳遞給研究者復核并回答,再對數據庫數據進行修訂的過程[21]。在進行數據核查之前,應制訂詳細的數據核查計劃,內容包括但不限于以下幾方面:①納入標準。指研究病例與納入排除標準實際符合的程度。②時間窗。入組、用藥、隨訪是否在時間窗內完成。③CRF填寫。對CRF中的各個指標的數值和相互關系根據方案要求進行核查,確認所有的數據記錄正確完整,字跡清晰整潔,與原始資料一致,所有錯誤或遺漏(缺失、異常值、邏輯關系)均已改正或注明,經研究者簽名,注明日期。④用藥治療。用藥劑量改變、治療變更、合并用藥等均應確認并記錄。⑤不良事件。確認所有不良事件均應記錄在案,嚴重不良事件在規定時間內進行報告,并記錄在案。⑥退出失訪。核實入選受試者的退出與失訪,須確認并記錄。⑦數據質疑表。數據質疑表是否及時填寫與回復。

數據質控在數據庫鎖定前進行,質控的內容建議包括研究進度(分中心入組數、分中心月均入組數排名)、研究質量(EDC填寫完成率、隨訪完成率、質疑生成數、關鍵指標核查/非關鍵指標數據抽查樣本量及錯誤率、影像資料/生物樣本合格率)。

2.1.3 數據庫鎖定 數據庫鎖定階段,DBA重點核查變量數據質量,達到統計師分析要求后,提報數據庫鎖定申請,將過程文件和數據庫文件分類存儲,撰寫數據管理報告。數據庫鎖定前,需檢查數據(包括外部電子數據,如中心實驗室數據)是否錄入完全,質疑表是否全部收回,質疑是否都得到了解決,CRF/數據庫是否得到了糾正,所有與研究方案不相符的事件是否都進行了報告和分類且澄清了相關的影響,同時對數據庫,尤其是所有有關安全性和有效性的主要數據,進行最后的質控和稽查。圖3顯示了臨床研究數據管理的全流程。除數據庫外,數據發布與利用還有數據冊、技術報告、學術論文、臨床指南、政府報告、新聞稿等形式。

圖3 臨床研究數據管理流程

2.2 臨床研究數據庫跨庫鏈接 傳統的院后隨訪方式為患者到門診隨訪和臨床醫師電話隨訪,由于醫師日常臨床工作繁忙,死亡為敏感話題家屬不愿告知的情況,傳統的院后隨訪存在增加工作量負擔、失訪率高等問題。將臨床研究數據庫與國家數據鏈接,如中國疾病控制中心慢病中心的中國死因監測數據集、各省市醫保數據庫,或鏈接基于移動終端技術的多渠道信息報告,如患者通過網頁、微信、手機應用上傳的體檢報告、自報告結局,可有效提升數據完整度,對臨床研究邊界拓展和學科交叉融合具有重要意義。

3 臨床研究數據庫構建與管理實踐的常見問題

研究者在構建臨床研究數據庫時常見或需要關注的問題包括:①設計原則。研究者應在設計臨床研究數據庫前明確研究目的、技術需求和資源,數據錄入程序應有良好的人機界面設計,按照CRF進行布局,避免組合框形式錄入,嵌入自動核查(取值范圍、邏輯錯誤)功能,設置痕跡記錄功能。②數據結構。臨床研究數據庫不同于醫療數據庫,需要滿足統計分析的格式要求,包括變量名命名、數據結構(橫向、縱向、非結構化)。③修改方案。通常數據庫系統值不能隨時增加或修改指標,需要與計算機公司溝通不斷更新的臨床需求。④質量控制。多中心研究中,應加強對各分中心數據的實時監控。⑤數據流轉與傳輸權限管理。設立管理人員層級權限和數據層級文件,數據使用者只能獲取其所申請研究涉及的數據,患者的個人身份信息、加密函數等去標識化后的個人信息和可恢復識別的數據分開存儲,設置嚴格的訪問和使用的權限管理。⑥數據安全與個人信息保護。數據庫的安全性和可靠性體現在防止數據丟失、錯誤更新和越權使用,保證數據正確性、有效性和相容性,允許對數據實現多路存取,防止用戶之間不正常交互,以及由數據庫管理系統提供一套即時發現和修復故障,防止數據破壞的方法上。2021年11月1日起施行的《中華人民共和國個人信息保護法》,規定任何組織、個人不得非法收集、使用、加工、傳輸他人個人信息等,通過規范個人信息處理活動保護個人信息權益,透射出數據安全保護的重要戰略意義[22]。數據庫安全宜從物理安全、網絡安全、服務器安全和數據庫安全4個層次進行操作[23],如安裝正版殺毒軟件,利用相應漏洞掃描系統掃描數據庫和應用系統,加強防火墻保護和安全補丁,使用他人U盤/移動硬盤拷貝數據時應先殺毒;安全存儲和發送文件時加密,實現對文件、文件夾或整個硬盤加密的訪問控制,必須通過電子郵件/網盤傳輸數據時應加密;數據庫文件應自動備份、專人定期備份,包括本機備份、多介質(U盤/移動硬盤/光盤等)備份、異地備份、云端存儲[24]。

國家神經系統疾病臨床醫學研究中心通過建立高性能計算平臺,利用基于虛擬化的桌面云技術將數據和計算資源整合在一起,既保證了數據安全,又提高了數據分析效率,同時有效實現了數據使用權和所有權的分離[25]。

4 小結

臨床醫師或科研工作者在構建臨床研究數據庫和管理過程中,首先需要掌握數據庫構建和管理的規范、標準,對數據庫構建和管理有全面、系統的認識;然后需要明確研究目的,參考數據標準,合理選擇建立數據庫的工具;在研究設計、數據采集、數據清理與核查、數據庫鎖定、數據發布與利用各環節均要應用標準的數據管理技術并進行嚴格的質量控制,全流程協調聯動,如數據采集遵循時效性、準確性、完整性、真實性的原則,數據核查與清理保證研究記錄與報告的數據準確、完整、及時,保證研究遵循既定研究方案。

在臨床研究數據庫構建和管理的實踐中,應有政府力量持續足量投入專項經費,資助專門機構建立、管理和維護高質量的大型綜合或專病數據庫,包括生物樣本庫(biobank);建立統一應用的數據標準和數據共享機制,將項目有關數據庫的考核標準定為對外提供數據共享和支持其他研究的數量和質量;重視數據安全和個人信息保護等。隨著人工智能技術在醫學影像檢查、輔助疾病診斷和預測疾病轉歸等領域的發展,數據庫構建的各個環節會更加便捷,類型及內容將更加精準或全面。大數據分析方法、云儲存及云計算等技術的逐漸成熟,以及區塊鏈、聯邦學習技術的應用,使多維度數據整合及一體化管理成為可能。

猜你喜歡
數據庫研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 亚洲视频影院| 国产黄网永久免费| 国产手机在线小视频免费观看| 欧美伊人色综合久久天天| 久久久久人妻一区精品| 国产免费人成视频网| 国产亚洲欧美在线专区| 人妻中文字幕无码久久一区| av在线无码浏览| 日本a级免费| 国产免费久久精品99re丫丫一| 69免费在线视频| 亚洲色图欧美| 成人在线天堂| 国产肉感大码AV无码| 91无码视频在线观看| 亚洲视频三级| 国产免费高清无需播放器| 在线欧美a| 国产视频大全| 欧美激情成人网| 国产成人免费| 精品成人一区二区| 999精品视频在线| 国产成人精品亚洲日本对白优播| 91口爆吞精国产对白第三集| 国产剧情一区二区| 福利在线不卡| 国产免费a级片| 国产成人精品亚洲77美色| 国产自产视频一区二区三区| 欧美日韩一区二区三| 波多野结衣一区二区三区四区| 毛片免费视频| 国产成人高清在线精品| 亚洲男人的天堂视频| m男亚洲一区中文字幕| 日韩成人在线视频| 欧美一区福利| 国产在线精品人成导航| 香蕉视频在线精品| 99热线精品大全在线观看| 69国产精品视频免费| 97精品国产高清久久久久蜜芽| 中文字幕自拍偷拍| 55夜色66夜色国产精品视频| 成人国产一区二区三区| 国内99精品激情视频精品| 国产麻豆精品久久一二三| 91在线播放国产| 麻豆国产在线不卡一区二区| 五月婷婷亚洲综合| 欧美成人影院亚洲综合图| 亚洲综合激情另类专区| 午夜福利在线观看成人| 日韩毛片免费| 九色在线视频导航91| 成人一级免费视频| 亚洲国产日韩视频观看| 一级毛片基地| 欧美人在线一区二区三区| 国产欧美性爱网| 中文字幕免费播放| 国产亚洲视频免费播放| 亚洲成aⅴ人在线观看| 亚洲国产成人精品无码区性色| 亚洲男人的天堂在线| 国产精品极品美女自在线| 国产成人福利在线| 亚洲一区二区三区国产精华液| 99偷拍视频精品一区二区| 免费一级无码在线网站| 国产视频一二三区| 精品国产91爱| 丰满人妻中出白浆| 国产精品太粉嫩高中在线观看| 久久黄色视频影| 国产熟女一级毛片| 91无码国产视频| 中日无码在线观看| 无码又爽又刺激的高潮视频| 亚洲黄色激情网站|