999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多中心回顧性電子病歷數(shù)據(jù)使用全流程操作規(guī)程Δ

2022-10-14 09:08:54錢東方張子軒譚斯元劉建峰崔學(xué)艷聶瑞芳劉秋爽黃琳李理總封宇飛北京大學(xué)人民醫(yī)院藥學(xué)部北京000北京北方醫(yī)藥健康經(jīng)濟(jì)研究中心北京000山東省千佛山醫(yī)院藥學(xué)部濟(jì)南00山東省立醫(yī)院藥學(xué)部濟(jì)南00北京醫(yī)院藥學(xué)部北京000濟(jì)南市中心醫(yī)院藥學(xué)部濟(jì)南00濱州醫(yī)學(xué)院煙臺附屬醫(yī)院藥學(xué)部山東煙臺哈爾濱醫(yī)科大學(xué)附屬第二醫(yī)院藥學(xué)部哈爾濱00解放軍總醫(yī)院醫(yī)療保障中心藥劑科北京00
中國藥房 2022年19期
關(guān)鍵詞:研究

鐘 雪,錢東方,張子軒,譚斯元,劉建峰,崔學(xué)艷,聶瑞芳,李 婷,王 倩,郭 其,劉秋爽,梁 艷,黃琳,李理總,封宇飛#(.北京大學(xué)人民醫(yī)院藥學(xué)部,北京 000;.北京北方醫(yī)藥健康經(jīng)濟(jì)研究中心,北京 000;.山東省千佛山醫(yī)院藥學(xué)部,濟(jì)南 00;.山東省立醫(yī)院藥學(xué)部,濟(jì)南 00;.北京醫(yī)院藥學(xué)部,北京 000;.濟(jì)南市中心醫(yī)院藥學(xué)部,濟(jì)南 00;.濱州醫(yī)學(xué)院煙臺附屬醫(yī)院藥學(xué)部,山東煙臺 ;.哈爾濱醫(yī)科大學(xué)附屬第二醫(yī)院藥學(xué)部,哈爾濱 00;.解放軍總醫(yī)院醫(yī)療保障中心藥劑科,北京 00)

真實(shí)世界數(shù)據(jù)來源于患者個人診療記錄等多種途徑,已成為上市后藥品安全性監(jiān)測和評價的重要數(shù)據(jù)來源。區(qū)別于基于研究目的主動收集的健康醫(yī)療數(shù)據(jù),來源于常規(guī)工作中收集的醫(yī)療衛(wèi)生數(shù)據(jù)雖然具有數(shù)據(jù)量大、人群覆蓋廣等優(yōu)勢,但也存在數(shù)據(jù)缺失、標(biāo)準(zhǔn)化程度不佳等局限[1]。要將真實(shí)世界數(shù)據(jù)轉(zhuǎn)化為真實(shí)世界證據(jù)以支持臨床決策,需要圍繞具體研究問題或目的,構(gòu)建研究型數(shù)據(jù)處理體系,采用合適的研究設(shè)計和統(tǒng)計學(xué)方法回答設(shè)定好的問題[2]。在將真實(shí)世界證據(jù)用于為相關(guān)領(lǐng)域提供證據(jù)的過程中,需要從數(shù)據(jù)的完整性、一致性、合理性等多角度考慮,從而設(shè)計完善的真實(shí)世界數(shù)據(jù)使用操作規(guī)范。

2021年4月,國家藥品監(jiān)督管理局藥品審評中心發(fā)布的《用于產(chǎn)生真實(shí)世界證據(jù)的真實(shí)世界數(shù)據(jù)指導(dǎo)原則(試行)》對真實(shí)世界數(shù)據(jù)的來源、評價、治理、標(biāo)準(zhǔn)、安全合規(guī)、質(zhì)量保障、適用性等方面給出了具體的要求和建議[3]。2022年7月,國家藥品監(jiān)督管理局藥品審評中心發(fā)布的《藥物真實(shí)世界研究設(shè)計與方案框架指導(dǎo)原則(征求意見稿)》,對藥物研發(fā)中真實(shí)世界研究的設(shè)計及方案制定提出了更有針對性的技術(shù)要求[4]。我國流行病學(xué)與衛(wèi)生統(tǒng)計學(xué)專家組織翻譯的《使用常規(guī)收集醫(yī)療衛(wèi)生數(shù)據(jù)開展觀察性研究的報告規(guī)范》規(guī)范了真實(shí)世界研究報告的內(nèi)容清單,并列舉了實(shí)例以輔助理解[5―6]。中國真實(shí)世界數(shù)據(jù)與研究聯(lián)盟于2019年發(fā)布了真實(shí)世界數(shù)據(jù)與研究的技術(shù)規(guī)范,側(cè)重于體系建設(shè)與步驟細(xì)分[7]。然而,國內(nèi)現(xiàn)有的指南和規(guī)范并未提出研究實(shí)施中的具體措施和方法,尤其是針對常規(guī)收集的醫(yī)療衛(wèi)生數(shù)據(jù)在技術(shù)層面的操作建議,如數(shù)據(jù)提取標(biāo)準(zhǔn)、數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)、針對回顧性數(shù)據(jù)研究設(shè)計的相關(guān)考慮等。

本研究按照多中心回顧性真實(shí)世界研究的流程展開,參考《用于產(chǎn)生真實(shí)世界證據(jù)的真實(shí)世界數(shù)據(jù)指導(dǎo)原則(試行)》[3]對多中心回顧性電子病歷數(shù)據(jù)使用步驟進(jìn)行劃分(圖1),以國內(nèi)現(xiàn)有的指南和規(guī)范提出的標(biāo)準(zhǔn)真實(shí)世界數(shù)據(jù)使用步驟為框架,有針對性地把控和補(bǔ)充真實(shí)世界研究各個環(huán)節(jié)的措施和方法,建立了多中心回顧性電子病歷數(shù)據(jù)使用的全流程操作規(guī)范。本文旨在填補(bǔ)現(xiàn)有指南和規(guī)范在臨床與技術(shù)溝通、方案和數(shù)據(jù)轉(zhuǎn)化、多中心間實(shí)時協(xié)調(diào)等實(shí)踐層面的空缺,為利用真實(shí)世界數(shù)據(jù)開展藥品上市后風(fēng)險評估過程中的各個環(huán)節(jié)提供實(shí)踐指導(dǎo)。

圖1 多中心回顧性電子病歷數(shù)據(jù)使用流程圖

1 真實(shí)世界研究設(shè)計

與傳統(tǒng)的臨床試驗(yàn)相同,真實(shí)世界研究開展之初,首先要進(jìn)行研究方案的確定。明確研究問題后,根據(jù)研究目的設(shè)計研究內(nèi)容,特別是納排標(biāo)準(zhǔn)和研究相關(guān)變量(如性別、年齡、用藥信息、檢驗(yàn)檢查信息等),從而確定需提取的字段,設(shè)計數(shù)據(jù)提取規(guī)則。當(dāng)以某種疾病確定研究人群時,疾病的定義建議明確為通識說法,可使用該疾病的國際疾病分類編碼(international classification of diseases,ICD)進(jìn)行描述,并充分考慮納入編碼的準(zhǔn)確性和完整性;相關(guān)變量的定義建議具體至每一子項,并落實(shí)數(shù)據(jù)提取要求。在設(shè)計研究方案時,要結(jié)合研究目的與數(shù)據(jù)庫可涵蓋的變量,充分了解研究相關(guān)的疾病診斷、治療模式、用藥模式,根據(jù)臨床實(shí)際情況選擇擬納入分析的具體字段,如檢查子項、合并診斷、合并用藥等詳細(xì)信息,并充分考慮以上信息設(shè)計數(shù)據(jù)提取方案。同時,要明確不同數(shù)據(jù)庫的結(jié)構(gòu)及鏈接方式,明確所需變量來源,還應(yīng)注意設(shè)計提取用于鏈接不同數(shù)據(jù)表間信息的關(guān)鍵字段。此外,普適性的真實(shí)世界研究設(shè)計方法在現(xiàn)有指南和規(guī)范中已有描述[1,6,8],本文不再贅述。

2 源數(shù)據(jù)適用性評價

在初步確定真實(shí)世界研究中心后,需對源數(shù)據(jù)的適用性進(jìn)行評價。應(yīng)從可及性、倫理合規(guī)、代表性等維度,對源數(shù)據(jù)進(jìn)行初步評價和選擇。源數(shù)據(jù)的適用性評價受數(shù)據(jù)源類型[如醫(yī)院信息系統(tǒng)數(shù)據(jù)(與本文關(guān)注的電子病歷數(shù)據(jù)屬于同類)、患者自報告結(jié)局、醫(yī)保支付數(shù)據(jù)等]和數(shù)據(jù)性質(zhì)(如回顧性或前瞻性)影響較大,較少受真實(shí)世界研究目的影響。多中心回顧性電子病歷數(shù)據(jù)適用性評價量表見表1。由于多中心醫(yī)療機(jī)構(gòu)常規(guī)診療數(shù)據(jù)存在長期隨訪信息缺失、各中心數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一等局限性,其他既有健康醫(yī)療數(shù)據(jù)也存在各自的優(yōu)勢和局限性[9],因此在選擇研究中心時,需首要考慮樣本量。在條件允許的情況下,應(yīng)充分考慮地域分布問題,盡可能廣泛地納入具有區(qū)域代表性的研究中心。研究參與人員方面,除需具有專業(yè)知識背景外,還需了解真實(shí)世界研究的方法、有真實(shí)世界數(shù)據(jù)提取與分析經(jīng)驗(yàn)、熟悉本院數(shù)據(jù)提取方法及流程,以便在數(shù)據(jù)處理及分析過程中對于一些本院獨(dú)有的情況給予合理的解釋。經(jīng)源數(shù)據(jù)適用性評價無法滿足研究需求的中心(如評價證實(shí)該中心無法提取或無相關(guān)數(shù)據(jù)),應(yīng)考慮用其他數(shù)據(jù)源代替,必要時及時更換研究中心。

3 數(shù)據(jù)提取

數(shù)據(jù)提取時應(yīng)先進(jìn)行樣本數(shù)據(jù)提取,樣本數(shù)據(jù)驗(yàn)證通過后,再進(jìn)行全樣本數(shù)據(jù)提取。原則上,樣本數(shù)據(jù)與全樣本數(shù)據(jù)提取規(guī)則相同,僅存在數(shù)據(jù)量的差異。

數(shù)據(jù)在提取過程中需滿足安全性要求,應(yīng)由各中心內(nèi)部使用不可逆算法對敏感數(shù)據(jù)字段脫敏后匯總處理。在數(shù)據(jù)提取時,建議使用統(tǒng)一的提取格式,采取“csv”格式提取(“csv”格式通用性較好,可兼容多種軟件工具,亦無數(shù)據(jù)量上限,可避免提取過程中數(shù)據(jù)的缺失)。數(shù)據(jù)收集過程中,各中心均應(yīng)在時間允許的情況下進(jìn)行小樣本預(yù)提取;也應(yīng)提供本中心數(shù)據(jù)提取需求模板,明確數(shù)據(jù)存儲結(jié)構(gòu)。各中心在數(shù)據(jù)提取時應(yīng)賦予患者在該院患者唯一識別碼(以下簡稱“患者ID”),并用就診碼(以下簡稱“就診ID”)區(qū)分同一患者不同就診記錄,通過患者ID與就診ID鏈接各表間同一患者的不同字段信息。回顧性數(shù)據(jù)提取應(yīng)注意各類數(shù)據(jù)提取時的要點(diǎn),具體如下。

3.1 數(shù)值型數(shù)據(jù)提取

數(shù)值型數(shù)據(jù)提取時,應(yīng)同時提取用以輔助分析的字段,以滿足數(shù)據(jù)轉(zhuǎn)化的要求,如各類醫(yī)囑均應(yīng)同時提取其開立時間、停止時間、執(zhí)行頻次等。用藥記錄應(yīng)提取完整的通用名及商品名、劑量及單位、給藥途徑、給藥頻次、開始及停止用藥時間;一日記錄多次的生命體征應(yīng)同時提取全部記錄數(shù)值、單位、測量時間。實(shí)驗(yàn)室檢驗(yàn)檢查結(jié)果應(yīng)附量綱及標(biāo)準(zhǔn)值;多中心數(shù)據(jù)需同時提取各中心的檢驗(yàn)檢查結(jié)果正常值,用于數(shù)據(jù)轉(zhuǎn)化。若單獨(dú)標(biāo)記“標(biāo)本類型”(如血液、尿液、糞便等),應(yīng)同時提取“標(biāo)本類型”中的內(nèi)容。

3.2 文本型數(shù)據(jù)提取

文本型數(shù)據(jù)提取時,應(yīng)盡可能提取完整的信息。如超聲、CT、核磁共振等影像學(xué)檢查及心電圖、肌電圖等電生理檢查,一般情況下僅提取文字報告,條件允許的情況下應(yīng)提取圖像資料,由專業(yè)醫(yī)師根據(jù)研究進(jìn)行二次識別分析;現(xiàn)病史、病案首頁記錄、會診記錄、不良反應(yīng)分析等主觀記錄材料根據(jù)預(yù)先設(shè)定的關(guān)鍵詞從病歷記錄中提取。

4 數(shù)據(jù)驗(yàn)證

4.1 樣本數(shù)據(jù)驗(yàn)證

開展樣本數(shù)據(jù)驗(yàn)證時,應(yīng)優(yōu)先比較樣本數(shù)據(jù)與數(shù)據(jù)提取接口文檔,查驗(yàn)字段完整性及字段含義準(zhǔn)確性。未提取到的數(shù)據(jù)應(yīng)核實(shí)原因,若是在數(shù)據(jù)提取時遺漏,應(yīng)立即補(bǔ)充數(shù)據(jù)后再進(jìn)行樣本數(shù)據(jù)驗(yàn)證;若因中心系統(tǒng)建設(shè)問題無法提取數(shù)據(jù),應(yīng)考慮采用其他方式補(bǔ)充數(shù)據(jù)(如按照病歷號查找病例并手動補(bǔ)充臨床系統(tǒng)中的可見內(nèi)容),或考慮該部分?jǐn)?shù)據(jù)是否為必需提取的內(nèi)容。多中心的數(shù)據(jù)提取要求較單中心更嚴(yán)格。單中心數(shù)據(jù)提取大多只考慮數(shù)據(jù)完整性,而多中心數(shù)據(jù)提取要確保提取字段的意義一致,如檢驗(yàn)子項“時間”統(tǒng)一為“送檢時間”而非“報告時間”。同時,要注釋易誤解的字段,如總劑量、處方取藥、給藥停止時間或醫(yī)囑停止時間的定義。

4.2 全樣本數(shù)據(jù)驗(yàn)證

數(shù)據(jù)正式提取后,應(yīng)首先驗(yàn)證提取出的數(shù)據(jù)與數(shù)據(jù)接口文檔的一致性及數(shù)據(jù)完整性。對于過程中出現(xiàn)的數(shù)據(jù)缺失情況,要如實(shí)記錄原因。同時也要檢查數(shù)據(jù)結(jié)尾是否存在截斷情況,如果存在,需考慮數(shù)據(jù)是否在提取過程中丟失,如果數(shù)據(jù)丟失需重新提取。由于正式提取的數(shù)據(jù)量可能與樣本數(shù)據(jù)的量級差距較大,在提取大樣本數(shù)據(jù)時可能出現(xiàn)數(shù)據(jù)截斷,因此并不應(yīng)默認(rèn)樣本數(shù)據(jù)提取完整的中心,在全樣本數(shù)據(jù)提取時的數(shù)據(jù)也完整。每次提取數(shù)據(jù)時均應(yīng)開展數(shù)據(jù)驗(yàn)證。

5 數(shù)據(jù)合庫

數(shù)據(jù)合庫時,應(yīng)先標(biāo)注中心名稱(或代碼)及各條目數(shù)據(jù)序號,以便追溯原始數(shù)據(jù)。按照數(shù)據(jù)驗(yàn)證結(jié)果創(chuàng)建整合表,并從原始表選擇插入目標(biāo)字段、中心名稱(或代碼)、各條目數(shù)據(jù)序號。數(shù)據(jù)合庫過程中,應(yīng)記錄整合表字段與原始表字段的對應(yīng)關(guān)系,并檢查選擇插入的數(shù)據(jù)量和原始表中的數(shù)據(jù)量是否一致,避免合庫過程中導(dǎo)致的刪失。

6 數(shù)據(jù)核查

開展數(shù)據(jù)核查時應(yīng)先將各表通過患者ID及就診ID進(jìn)行關(guān)聯(lián),確定編碼映射關(guān)系是否對應(yīng)且唯一,如確定各表間患者數(shù)及病例數(shù)是否對應(yīng)。建議使用計數(shù)的方式檢查每個表的數(shù)據(jù)記錄數(shù)、字段數(shù)、病例數(shù),檢查表間是否存在數(shù)據(jù)缺失。值得注意的是,提取出的數(shù)據(jù)中的就診ID應(yīng)為脫敏后的患者住院號或就診ID,與院內(nèi)人員在本院系統(tǒng)中所見就診ID不應(yīng)為同一號碼。回顧性研究數(shù)據(jù)的邏輯核查至少應(yīng)包括2個方面的內(nèi)容——完整性、準(zhǔn)確性[10―11]。值得注意的是,前瞻性數(shù)據(jù)核查應(yīng)注意的內(nèi)容(如違背方案)本文暫不涉及。

6.1 數(shù)據(jù)完整性核查

數(shù)據(jù)完整性核查應(yīng)檢查數(shù)據(jù)信息的缺失程度,包括變量的缺失和變量值的缺失。首先,應(yīng)基于源數(shù)據(jù)適用性評價進(jìn)行核查,數(shù)據(jù)應(yīng)滿足相關(guān)研究目的所要求收集的最少變量信息,多中心回顧性電子病歷數(shù)據(jù)的源數(shù)據(jù)各數(shù)據(jù)表注釋及必需字段見表2。其次,應(yīng)核查單個變量的記錄完整度是否滿足待研究變量的最小統(tǒng)計效能,在充分考慮混雜因素、缺失數(shù)據(jù)等因素的基礎(chǔ)上滿足統(tǒng)計假設(shè)的要求。

表2 多中心回顧性電子病歷數(shù)據(jù)的源數(shù)據(jù)各數(shù)據(jù)表注釋及必需字段

6.2 數(shù)據(jù)準(zhǔn)確性核查

數(shù)據(jù)準(zhǔn)確性核查包括一致性、合理性2個方面,具體如下。

6.2.1 一致性核查 一致性核查包括指向一致、定義一致和格式一致[12]。指向一致指相互關(guān)聯(lián)的數(shù)據(jù)應(yīng)符合指定約束關(guān)系,如通過身高、體質(zhì)量計算所得體質(zhì)量指數(shù)應(yīng)與記錄值相同。定義一致指不同表內(nèi)指向同一變量的數(shù)據(jù)定義及內(nèi)容應(yīng)相符,數(shù)據(jù)與其描述的客觀特征應(yīng)一致,同一變量在不同樣本記錄中應(yīng)采用統(tǒng)一的數(shù)據(jù)定義,如不同中心記錄的“藥物劑量”“單次劑量”等說法均代表“單次用藥劑量”,需統(tǒng)一命名。格式一致指數(shù)據(jù)字段內(nèi)容應(yīng)遵守統(tǒng)一格式,如日期MM/DD/YYYY與DD/MM/YYYY易產(chǎn)生混淆。

6.2.2 合理性核查 合理性核查內(nèi)容包括時序、閾值范圍、邏輯等[12]。合理性核查中,時序核查包括出入院時間、檢驗(yàn)檢查取樣時間、送檢與報告時間、醫(yī)囑開立與停止時間等。如存在超出研究設(shè)定提取時間范圍的數(shù)據(jù),應(yīng)與研究人員討論決定如何處理超出研究時間范圍的數(shù)據(jù)(同時應(yīng)檢查是否存在由于合庫導(dǎo)致的時間格式錯誤)。閾值范圍核查,即核查檢驗(yàn)檢查異常值、用藥劑量、用藥開始或停止時間等是否合理。值得注意的是,本規(guī)程僅涉及核查邏輯不合理的異常值,如應(yīng)為正值但是記錄為負(fù)值、應(yīng)記錄為“+/-”但記錄為數(shù)字或文字、時間在1900年以前或者未來等異常值。邏輯核查范圍較寬泛,如結(jié)局變量隨時間變化趨勢是否合理。

7 數(shù)據(jù)清洗

經(jīng)核查完整、準(zhǔn)確的數(shù)據(jù)需要采用信息技術(shù)方法對其進(jìn)行匯總、清洗與轉(zhuǎn)化,形成集成數(shù)據(jù)。在數(shù)據(jù)清洗或任何涉及改變數(shù)據(jù)記錄的操作時,應(yīng)記錄步驟及具體命令代碼以便后續(xù)回查。數(shù)據(jù)清洗包括對原始數(shù)據(jù)進(jìn)行重復(fù)或冗余數(shù)據(jù)的去除、缺失值的核查及補(bǔ)齊等。

7.1 重復(fù)或冗余數(shù)據(jù)的去除

對于明確重復(fù)或冗余的數(shù)據(jù)應(yīng)去除。為提高數(shù)據(jù)治理的效率,不在研究范圍內(nèi)的信息也應(yīng)去除。如以“停藥”為目的的單獨(dú)醫(yī)囑;與研究無關(guān)但同時被提取出的醫(yī)囑字段。無法明確為冗余信息的數(shù)據(jù),需提前了解各中心和各治療領(lǐng)域的開囑習(xí)慣。如對領(lǐng)藥、退藥醫(yī)囑的處理,應(yīng)根據(jù)不同研究方案和需求,與研究者確定。如果患者樣本量大,用藥情況復(fù)雜,退藥較少,且不考慮合并用藥劑量,則退藥相關(guān)醫(yī)囑不應(yīng)被納入研究。而研究生物制劑時,常需考慮各大常用藥物劑量及頻次,所以僅剔除“領(lǐng)藥醫(yī)囑”,單獨(dú)討論“退藥醫(yī)囑”。

7.2 缺失值的核查及補(bǔ)齊

數(shù)據(jù)完整性處理應(yīng)首先檢查缺失數(shù)據(jù)能否補(bǔ)齊。補(bǔ)齊方式應(yīng)根據(jù)數(shù)據(jù)的缺失程度、缺失原因和變量值的缺失機(jī)制設(shè)定。如出現(xiàn)關(guān)鍵數(shù)據(jù)無法補(bǔ)齊的情況,應(yīng)剔除無法補(bǔ)齊的病例。回顧性真實(shí)世界研究中常用的缺失數(shù)據(jù)處理方法包括完整觀測分析、可用觀測分析、末次觀測值結(jié)轉(zhuǎn)法、均數(shù)填補(bǔ)等[1]。在填補(bǔ)用藥時間時,應(yīng)考慮目標(biāo)藥品的用法用量。當(dāng)涉及文字信息的缺失時,可嘗試通過其他字段內(nèi)容填補(bǔ)。如存在用藥信息缺失,可嘗試通過醫(yī)囑文字識別。也可通過醫(yī)囑識別并補(bǔ)齊缺失的手術(shù)名稱,通過主訴、病史等文字描述補(bǔ)充吸煙、飲酒、藥物和食物過敏史等信息。

8 數(shù)據(jù)轉(zhuǎn)化

數(shù)據(jù)轉(zhuǎn)化包括診斷相關(guān)字段轉(zhuǎn)化、藥品相關(guān)字段轉(zhuǎn)化、檢驗(yàn)檢查指標(biāo)轉(zhuǎn)化、其他變量轉(zhuǎn)化和衍生變量計算等。多中心數(shù)據(jù)轉(zhuǎn)化的基礎(chǔ)是建立診斷標(biāo)準(zhǔn)庫、藥品名稱標(biāo)準(zhǔn)庫等通用數(shù)據(jù)模型,必要時應(yīng)按照國際臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)的采集、交換、管理、分析和存儲[12]。國內(nèi)尚未有多方認(rèn)證的標(biāo)準(zhǔn)名稱庫,因此更應(yīng)注重標(biāo)準(zhǔn)的積累。診斷、藥品、檢驗(yàn)檢查等需標(biāo)準(zhǔn)化的數(shù)據(jù)應(yīng)結(jié)合研究目的,提前確定需轉(zhuǎn)化的數(shù)據(jù)范圍,以提升數(shù)據(jù)的轉(zhuǎn)化效率。

8.1 診斷相關(guān)字段轉(zhuǎn)化

診斷字段轉(zhuǎn)化應(yīng)優(yōu)先參考ICD編碼,標(biāo)準(zhǔn)權(quán)威性依次為國際/國家/地方標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、字詞典、教材[12]。如診斷字段存在將多個診斷用分隔符鏈接的情況,可先使用正則表達(dá)式等方法識別出單獨(dú)診斷,之后根據(jù)ICD將診斷標(biāo)準(zhǔn)化。

8.2 藥品相關(guān)字段轉(zhuǎn)化

藥品名稱標(biāo)準(zhǔn)化時,應(yīng)將藥品的商品名、別名、英文名等統(tǒng)一標(biāo)準(zhǔn)化為(帶劑型的)通用名,建議將目標(biāo)藥物匹配解剖學(xué)、治療學(xué)及化學(xué)分類系統(tǒng)(anatomic therapeutic chemical,ATC)編碼[13],以作用器官或系統(tǒng)、治療、藥理和化學(xué)特性將藥物分組,生成可比較、可分類的藥物編碼,方便研究者分析用藥模式、進(jìn)行用藥分層或分組等。藥品名稱標(biāo)準(zhǔn)化時,應(yīng)注意考慮給藥途徑,并根據(jù)研究目的選擇或排除藥品。標(biāo)準(zhǔn)化時也應(yīng)考慮用藥頻率,注意臨時醫(yī)囑的劑量記為當(dāng)日1次,以及臨時醫(yī)囑與長期醫(yī)囑時間重合時的判斷和計算。對于首要目的為含藥物使用劑量的研究,如需考慮精確的藥物使用劑量時,研究成員應(yīng)討論后逐一判斷。為提高效率,在方案允許的情況下,可將帶有“葡萄糖”“氯化鈉”等不影響主要成分的注射溶劑,統(tǒng)一標(biāo)準(zhǔn)化為其主要成分的(帶濃度、劑型的)通用名。同一研究中,藥品劑量單位需統(tǒng)一。

8.3 檢驗(yàn)檢查指標(biāo)轉(zhuǎn)化

在轉(zhuǎn)化多中心檢驗(yàn)檢查指標(biāo)時,需注意對數(shù)據(jù)定義、命名及單位的統(tǒng)一,區(qū)分不同標(biāo)本來源的同名檢驗(yàn)項目。檢驗(yàn)值轉(zhuǎn)化過程中應(yīng)注意攜帶量綱,保證數(shù)據(jù)合并后分析計算時統(tǒng)一單位,并以相同的數(shù)據(jù)量級展示。檢驗(yàn)檢查指標(biāo)標(biāo)準(zhǔn)化基于檢驗(yàn)檢查正常值范圍,每家中心均應(yīng)單獨(dú)提供,絕不可默認(rèn)范圍一致。

8.4 其他變量轉(zhuǎn)化

對于具有多個適應(yīng)證或有除治療之外用途的藥品,應(yīng)根據(jù)研究目的判定是否需要明確處方的用藥目的。用藥科室可以幫助區(qū)分患者,間接判斷用藥目的。對于需要分析科室的研究,需注意統(tǒng)一各中心科室命名。

8.5 衍生變量計算

涉及用藥及檢驗(yàn)檢查時序判斷時,應(yīng)統(tǒng)一時序計算標(biāo)準(zhǔn),如患者就診當(dāng)日記為第0天。在檢驗(yàn)檢查結(jié)果的判定方面,注意區(qū)分包含或真包含(如<或≤)。此外,檢驗(yàn)檢查結(jié)果異常并不等同于發(fā)生不良事件,需使用藥品不良反應(yīng)評價標(biāo)準(zhǔn)進(jìn)行相關(guān)不良事件的判定。

9 數(shù)據(jù)分析

下文以藥品上市后安全性評價為例,描述利用電子病歷數(shù)據(jù)開展多中心回顧性真實(shí)世界研究涉及的數(shù)據(jù)分析方法及要點(diǎn)。

9.1 一般原則

多中心真實(shí)世界研究中統(tǒng)計分析的一般原則[1]:(1)所有的統(tǒng)計檢驗(yàn)均采用雙側(cè)檢驗(yàn),檢驗(yàn)水準(zhǔn)α=0.05。(2)定量指標(biāo)的描述包括例數(shù)、均數(shù)、標(biāo)準(zhǔn)差、中位數(shù)、第25百分位數(shù)、第75百分位數(shù)、最小值、最大值等。(3)定性指標(biāo)的描述包括例數(shù)、率、百分比等。

本例中,參考已有文獻(xiàn)對開展真實(shí)世界研究的基本分析框架要求[1,14―15],基于多中心電子病歷數(shù)據(jù)的一般情況,將重點(diǎn)從干預(yù)性研究轉(zhuǎn)移至回顧性研究,以安全性結(jié)局為目的對數(shù)據(jù)進(jìn)行分析。生命體征和既往史等回顧性數(shù)據(jù)缺失程度較大的字段,本例不予強(qiáng)調(diào)。利用多中心回顧性電子病歷數(shù)據(jù)開展藥品上市后安全性評價可包含的分析內(nèi)容及要點(diǎn)見表3。

9.2 數(shù)據(jù)挖掘

數(shù)據(jù)挖掘的目標(biāo)是從大量的真實(shí)世界病例數(shù)據(jù)中發(fā)現(xiàn)重要特征的相關(guān)關(guān)系。自變量和協(xié)變量可包括:(1)患者基本信息及生理狀態(tài),包括但不限于性別、年齡、煙酒史、家族史、基礎(chǔ)疾病、診斷、特殊狀態(tài)(如妊娠、某些高風(fēng)險職業(yè)等)、基因信息等。(2)對患者生理狀態(tài)的干預(yù),包括但不限于使用藥物、手術(shù)及其他治療手段。上述因素即數(shù)據(jù)挖掘方法的輸入特征(以下統(tǒng)稱“特征”)。考慮到真實(shí)世界病例數(shù)據(jù)的局限性,應(yīng)根據(jù)研究目標(biāo)結(jié)局的時效性,選擇一次住院或多次就診可獲取的數(shù)據(jù),用以觀察目標(biāo)結(jié)局。本文僅探討回顧性電子病歷數(shù)據(jù)的應(yīng)用,因此此處僅簡要敘述適用于回顧性電子病歷數(shù)據(jù)的、挖掘安全性結(jié)局相關(guān)影響因素的方法,并按照單特征、多特征、多特征序列分類。病例的“全周期”數(shù)據(jù)往往無法通過單個數(shù)據(jù)源獲取;如需更強(qiáng)的證據(jù)來源,應(yīng)整合涉及患者流轉(zhuǎn)的多中心數(shù)據(jù),以完善病例全周期數(shù)據(jù)。

9.2.1 單特征對結(jié)果的影響 常用的方法是通過建立暴露-非暴露對照組(或者A、B藥物暴露對照組),對比2組的不良事件發(fā)生率,可定性判斷某個因素對結(jié)果的影響;或可建立低劑量暴露-高劑量暴露對照組,從而定量分析劑量高低對不良反應(yīng)發(fā)生率的影響。這種方法的重點(diǎn)包括建立納排標(biāo)準(zhǔn)、控制協(xié)變量、建立研究基線、選擇適宜的方法構(gòu)建回歸方程等。

9.2.2 多特征對結(jié)果的影響 多個特征對結(jié)果的影響是比較復(fù)雜的,原因分析如下:人體病理與干預(yù)是一個復(fù)雜的因果系統(tǒng);很多關(guān)鍵事件未被記錄在真實(shí)世界數(shù)據(jù)中;無法判斷關(guān)鍵事件的實(shí)際發(fā)生時間。多特征分析常用的方法包括Logistic回歸/線性回歸(線性、定量)、決策樹(線性、定性)、支持向量機(jī)模型(非線性、定量)等[17]。通常將數(shù)據(jù)劃分為2~3個數(shù)據(jù)集,如用于發(fā)現(xiàn)因果關(guān)系的訓(xùn)練集、用于調(diào)整算法參數(shù)的驗(yàn)證集(可選)、用于檢驗(yàn)算法的測試集等。應(yīng)重點(diǎn)關(guān)注對特征數(shù)據(jù)的預(yù)處理。特征通常分為離散型(如性別、是否妊娠、診斷等)和連續(xù)型(如藥物攝入劑量)2種數(shù)據(jù)類型,需要將2種類型歸一化,并形成算法的輸入特征;對缺失特征應(yīng)單獨(dú)處理。

9.2.3 多特征構(gòu)成的序列對結(jié)果的影響 每個特征與結(jié)果發(fā)生的時間間隔不同,如相對發(fā)生時間更早的特征,與不良事件時間上臨近的“短期特征”應(yīng)得到更多的關(guān)注。但這并非絕對,由于人體病理和藥理的復(fù)雜性,較早的“長期特征”亦可能起到更主要的作用。研究者需要從數(shù)據(jù)中挖掘序列特征對結(jié)果的影響。

將時間線上的所有特征和結(jié)果按先后順序構(gòu)建一個序列,這個序列也是患者病程中的關(guān)鍵控制點(diǎn)。處理序列數(shù)據(jù)的常用方法是循環(huán)神經(jīng)網(wǎng)絡(luò)及長短期記憶。這些方法可用于探究序列前后特征與結(jié)果的關(guān)聯(lián),也經(jīng)常被用于自然語言處理。由于加入了時間屬性,此方法對數(shù)據(jù)要求很高。需要注意的是,真實(shí)世界數(shù)據(jù)中特征記錄的時間不一定是特征實(shí)際發(fā)生的時間,如診斷,患者事實(shí)上已經(jīng)有該生理狀態(tài),診斷記錄的是該狀態(tài)被發(fā)現(xiàn)的時間。

當(dāng)使用上述挖掘方法獲得的結(jié)果不佳時,原因可能有多種,如(1)樣本量不夠、不均衡或有偏差。(2)特征選擇不合理、不全面。(3)特征缺失過多,一些關(guān)鍵數(shù)據(jù)未被記錄在“真實(shí)世界數(shù)據(jù)”中,需要根據(jù)實(shí)際情況判斷原因,從而進(jìn)一步調(diào)整數(shù)據(jù)或者訓(xùn)練方法。

10 質(zhì)量控制

數(shù)據(jù)的質(zhì)量控制應(yīng)建立在完善的真實(shí)世界研究數(shù)據(jù)質(zhì)量管理體系及完善的標(biāo)準(zhǔn)操作流程之上[9]。應(yīng)特別關(guān)注以下幾方面——(1)源數(shù)據(jù)的質(zhì)量:高質(zhì)量的研究中心可保障源數(shù)據(jù)的完整性和準(zhǔn)確性,減少數(shù)據(jù)本身的缺失和偏差,也可提升數(shù)據(jù)治理的效率。(2)研究方案和數(shù)據(jù)提取文檔的設(shè)計:根據(jù)數(shù)據(jù)提取文檔采集字段,需確認(rèn)關(guān)鍵字段已被收集;數(shù)據(jù)的提取由指定的專業(yè)人員按照規(guī)定的流程進(jìn)行提取,非授權(quán)人員不應(yīng)對信息系統(tǒng)有任何操作行為。(3)使用標(biāo)準(zhǔn)化字典:保證數(shù)據(jù)治理流程記錄完整、可追溯。(4)在數(shù)據(jù)核查、清洗和轉(zhuǎn)化的各步驟都應(yīng)設(shè)有檢查文檔,避免步驟缺失。

11 數(shù)據(jù)管理與儲存

開展真實(shí)世界研究應(yīng)有獨(dú)立的服務(wù)器用于處理、儲存數(shù)據(jù)。課題原始數(shù)據(jù)應(yīng)存儲在固定存儲設(shè)備中;為保障信息安全,應(yīng)進(jìn)行異地備份,或至少將原始數(shù)據(jù)存儲在2個固定存儲設(shè)備中;為滿足研究需求,應(yīng)將多中心數(shù)據(jù)集中,存儲于獨(dú)立、安全的服務(wù)器中,并應(yīng)分權(quán)限管理,具體要求如下。

11.1 數(shù)據(jù)管理要求

在處理多中心數(shù)據(jù)信息時,應(yīng)將文件存儲在指定的保密區(qū)域中,未經(jīng)管理員的許可,不得以任何手段將涉密數(shù)據(jù)信息帶出保密區(qū)域。在計算機(jī)上使用移動存儲設(shè)備必須有詳細(xì)的登記和使用記錄,包括時間戳與操作內(nèi)容等。應(yīng)對研究人員進(jìn)行Windows域權(quán)限管理,嚴(yán)格管理數(shù)據(jù)的權(quán)限訪問。存放數(shù)據(jù)信息系統(tǒng)的服務(wù)器僅通過交換機(jī)在局域網(wǎng)內(nèi)部應(yīng)用,僅允許維護(hù)和數(shù)據(jù)應(yīng)用的客戶端進(jìn)行訪問,其他電腦一律不得訪問,以確保系統(tǒng)內(nèi)數(shù)據(jù)的安全性。涉及數(shù)據(jù)儲存的軟硬件應(yīng)統(tǒng)一由數(shù)據(jù)處理部或?qū)H斯芾恚瑢τ脖P進(jìn)行定期整理,定期保存系統(tǒng)日志。路由器、交換機(jī)、數(shù)據(jù)存儲設(shè)備和數(shù)據(jù)庫服務(wù)器等關(guān)鍵設(shè)備應(yīng)放置在指定地點(diǎn)。應(yīng)對系統(tǒng)數(shù)據(jù)實(shí)施嚴(yán)格的安全與保密管理,防止系統(tǒng)數(shù)據(jù)的非法生成、變更、泄露、丟失及破壞。

11.2 數(shù)據(jù)傳輸安全

數(shù)據(jù)需通過信息通道與文件雙加密傳輸,個別情況下使用移動介質(zhì)傳輸?shù)臄?shù)據(jù)需對文件進(jìn)行加密,密鑰應(yīng)同數(shù)據(jù)文件分開傳送。經(jīng)遠(yuǎn)程通信傳送的程序或數(shù)據(jù)(如電子郵件等),須經(jīng)殺毒服務(wù)器掃描確定無毒后方可使用。同時,應(yīng)對數(shù)據(jù)傳輸做好傳輸記錄,通過移動介質(zhì)完成傳輸后應(yīng)清除數(shù)據(jù)。

11.3 保存形式及存期

不同類型文檔應(yīng)以不同形式保存,數(shù)據(jù)處理與提取文檔、涉及數(shù)據(jù)的相關(guān)文件電子版應(yīng)永久保存,紙質(zhì)版應(yīng)保存5~10年。

12 結(jié)論

既有的真實(shí)世界研究指南和規(guī)范多基于前瞻性研究設(shè)計,而針對多中心回顧性研究的指導(dǎo)尚不全面。本研究補(bǔ)充了利用多中心回顧性電子病歷數(shù)據(jù)開展真實(shí)世界研究時,現(xiàn)有指南和規(guī)范的流程框架在數(shù)據(jù)提取、治理與分析等關(guān)鍵步驟中所缺失的技術(shù)指導(dǎo),同時針對已有流程框架的實(shí)施細(xì)節(jié)進(jìn)行描述。研究方案的設(shè)計應(yīng)針對回顧性數(shù)據(jù)的特點(diǎn),針對目標(biāo)結(jié)局選擇納入分析的字段;同時應(yīng)注意該字段是否可在回顧性數(shù)據(jù)中獲取,對于無法直接獲取的關(guān)鍵字段,應(yīng)在研究設(shè)計階段考慮補(bǔ)充獲取的辦法或使用替代終點(diǎn)。數(shù)據(jù)提取應(yīng)建立在醫(yī)療人員與數(shù)據(jù)治理人員的充分溝通和對各中心字段的理解之上,確保表間、中心間字段可鏈接,并在數(shù)據(jù)完整的基礎(chǔ)上,注重保障多中心間數(shù)據(jù)字段意義的一致性。對數(shù)據(jù)的處理應(yīng)充分利用標(biāo)準(zhǔn)化數(shù)據(jù)字段庫,并結(jié)合臨床實(shí)際情況,任何操作均應(yīng)記錄備案,保障數(shù)據(jù)治理可溯源。多中心回顧性真實(shí)世界數(shù)據(jù)多源異構(gòu)性高,應(yīng)結(jié)合研究目的,注重積累不同治療領(lǐng)域的數(shù)據(jù)治理要點(diǎn),構(gòu)建標(biāo)準(zhǔn)化數(shù)據(jù)字段庫,以充分發(fā)揮真實(shí)世界數(shù)據(jù)的研究價值。

猜你喜歡
研究
FMS與YBT相關(guān)性的實(shí)證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
關(guān)于遼朝“一國兩制”研究的回顧與思考
EMA伺服控制系統(tǒng)研究
基于聲、光、磁、觸摸多功能控制的研究
電子制作(2018年11期)2018-08-04 03:26:04
新版C-NCAP側(cè)面碰撞假人損傷研究
關(guān)于反傾銷會計研究的思考
焊接膜層脫落的攻關(guān)研究
電子制作(2017年23期)2017-02-02 07:17:19
主站蜘蛛池模板: 国产网站一区二区三区| 国产jizzjizz视频| 九九九久久国产精品| 国产精品大白天新婚身材| 国产永久在线视频| 国产在线视频导航| 看国产一级毛片| …亚洲 欧洲 另类 春色| 国产区精品高清在线观看| 18禁黄无遮挡免费动漫网站| 啪啪免费视频一区二区| 8090午夜无码专区| 亚洲成人播放| 国产91线观看| 片在线无码观看| 国产精品福利在线观看无码卡| 国产亚洲精| 久久精品aⅴ无码中文字幕| 91色在线观看| 亚洲国产成人综合精品2020 | 久久综合一个色综合网| 国产18在线播放| 亚洲最新在线| 亚洲综合精品香蕉久久网| 无码日韩视频| 婷婷99视频精品全部在线观看| 亚洲毛片一级带毛片基地 | 亚洲码一区二区三区| 国产一级无码不卡视频| 五月婷婷导航| 国产精品久久久久久影院| 亚洲国产高清精品线久久| 白浆免费视频国产精品视频| 亚洲 欧美 日韩综合一区| 国产青青操| 精品无码一区二区三区在线视频| 91色爱欧美精品www| 亚洲IV视频免费在线光看| 全午夜免费一级毛片| 亚洲美女AV免费一区| 亚洲美女久久| 国产人碰人摸人爱免费视频| 亚洲综合婷婷激情| 精品久久久久久久久久久| 日本欧美一二三区色视频| 日本成人不卡视频| 一本一道波多野结衣av黑人在线| 国产sm重味一区二区三区| 四虎国产精品永久一区| av色爱 天堂网| 久久国产精品国产自线拍| 国产在线一区二区视频| 亚洲欧美精品一中文字幕| 久久久久无码国产精品不卡| 青青极品在线| 国产成人禁片在线观看| 亚洲第一视频网| 国产成人精品视频一区二区电影| 国产情精品嫩草影院88av| 成年免费在线观看| 99er精品视频| 国产幂在线无码精品| 91网站国产| 欧美福利在线观看| 国产精品午夜福利麻豆| 国产免费福利网站| 免费毛片在线| www.91在线播放| 美女一区二区在线观看| 中文字幕欧美日韩| 亚洲中久无码永久在线观看软件| 国产成人精品高清不卡在线| 在线国产91| 女同久久精品国产99国| 欧美国产日韩另类| 国产在线91在线电影| 精品无码专区亚洲| 日本高清视频在线www色| 毛片大全免费观看| 亚洲h视频在线| 午夜日b视频| 日韩一级毛一欧美一国产|