黃 傲,孫瑞華,王雨萌,李 歡,徐 凱,楊存霞,顧澤龍
(1.北京中醫藥大學 管理學院,北京100029;2.中日友好醫院 科研與學科建設部,北京100029)
藥物臨床試驗是指為了評價藥物的療效和安全性,在人體(病人或健康志愿者)進行的藥物系統性研究,其結論要通過對整個試驗過程中采集到的研究數據加以分析來證實[1]。為了保證結論的真實可靠,完整有效高質量的試驗數據是關鍵。但臨床試驗數據采集過程繁雜,容易產生錯誤,通常會在數據分析前由數據管理人員對數據進行核查和清理,并以疑問表(query form)的形式對問題進行解決,直到所有疑問數據都得到核實或修正后,再對數據庫進行鎖定交由統計人員分析[2]。本文以近期完成的10個多中心、隨機、雙盲臨床試驗項目為例,透過疑問表來分析臨床試驗中常見的數據質量問題,并根據數據管理實際來探討其來源和產生原因,力求從源頭上確保試驗數據的完整和準確。
本研究回顧審核了某三級甲等醫院藥品臨床研究統計分析中心近期進行的10項多中心、隨機、雙盲臨床試驗項目,其共同特點是疑問表發放次數在3輪以上,有完整的疑問表回復記錄及逐次修改的數據庫,可為充分數據采集及管理各環節的質量問題和產生原因提供依據。
根據該臨床試驗統計分析中心的疑問表標準操作規范,利用原始數據庫按照人口學資料、病史及診斷、生命體征、合并用藥、實驗室檢查、療效評價數據、時間和日期、符合方案、不良事件10個模塊的劃分[2],對疑問的分布進行頻數統計,并對疑問數據按書寫規范、邏輯異常、缺失值、異常值4種疑問類型進行研究分析[3,4],探究疑問的主要來源及產生原因。

圖1 疑問條目數的模塊分布
疑問條目數在各模塊間的分布情況見圖1,可以看出實驗室檢查數據的疑問數量最多,其次為療效評價數據,再次為時間和日期數據。人口學資料與病史及診斷2個模塊數量較少。這與一份病例報告表的內容構成基本符合,實驗室檢查、療效數據每個訪視都有涉及,所涵蓋的指標多,數據量大,時間和日期數據更可以說是體現在整個試驗的各個方面,而人口學資料和病史及診斷數據通常只在基線期采集,在病例報告表(case report form,CRF)中所占份額較少。
從疑問類型看,最突出的為缺失值,占疑問總數48.69%,這與于永培、朱賽楠等在《新藥臨床試驗數據管理常見疑問類型分析》一文所得到的研究結果相一致;其次為邏輯錯誤,異常值也占有一定的比例,書寫規范占比例最小,見圖2。
具體而言,不同類型的疑問在數據管理過程中主要包括如下幾種情況:對于書寫規范類的疑問,通常來源于建立原始數據庫的過程中,包括數據錄入人員在錄入數據及一致性比對時記錄的問題。主要是字跡無法辨識,一空多選及未按要求格式填寫等所導致的無法錄入。
缺失值的疑問量最大,幾乎涉及CRF所有必填項,其中尤以與試驗療效評價、安全性評價相關的核心數據所占比重最大。常見的缺失情況有兩種,一種是CRF表上的選擇項及填寫項,如有無合并用藥、有無不良事件、實驗室檢查指標的判定選擇、中止試驗的原因選擇,患者的主訴數據和需計算的數據,以及需多次測量的時點和精確到分的時間數據;另一種是未查指標,既未標明ND(not done),也未勾選未查。
邏輯異常分為判斷類邏輯異常、計算類邏輯異常、衍生類邏輯異常和日期邏輯異常4類[3]。判斷類邏輯主要是指研究者依據正常值范圍和臨床實際情況對實驗值指標的判斷是否合理,符合邏輯。這一類疑問較多,如對指標有無臨床意義的判斷,異常值偏離正常值范圍很大,卻判斷為無臨床意義,又無解釋等。計算類邏輯包括時間窗的計算、依從性的計算以及疾病改善率、量表評分等一些復合指標的計算。除去計算錯誤要發疑問外,對于訪視超窗和依從性差的情況,由于關系到受試者是否違背方案也要通過發疑問進行一次確認,目的在于確保計算情況結果屬實,從而為數據審核會上決定該病例是否應被剔除或是納入何種分析集提供依據。衍生類邏輯主要是指CRF表中書寫結構為“如選(是/否、正常/異常……),請填寫”或類似的相互關聯的一類數據,這類結構在各個模塊均有所體現。常見疑問情況為:“是否合并用藥”選擇了是,而未填寫合并用藥列表;實驗室檢查中,心電圖檢查或妊娠檢查選擇了異常,而無異常描述,或選擇了正常而有異常描述;“是否完成試驗”選擇否,而未選擇中止原因等。其中較為常見的是,受試者實驗室指標療前正常或異常無臨床意義,轉化為療后異常有臨床意義,研究者對此既未報不良事件也無明確的解釋。日期邏輯主要針對的是不同時點固有的先后順序,如訪視1必然要早于訪視2;基線生化檢查時間必然要早于首次發藥時間;除方案規定的特殊檢查如腸鏡、核磁共振外,知情同意簽署日期必然要早于所有試驗相關日期等。
異常值主要有2類,一類是不符合試驗方案的異常受試者,這部分比例雖然不大但對數據集的劃分影響很大;另一類是試驗中所有數值型數據的極端值,如收縮壓為10mmHg、身高14m等不符合常識的情況,這類極端值通常都是需要核實的錯誤數據。
疑問表一方面是要求對試驗數據予以確認并給予說明,從而為盲態審核會上數據集的確定提供依據,如訪視超窗患者、依從性差的患者、不符合方案要求的患者即為此類情況;而另一個重要方面是對CRF中的缺陷數據記錄進行核實完善,從而為下一步的統計分析提供真實可靠的數據。通過分析缺陷數據產生的原因,減少疑問表發放的數量,不僅能減輕研究者、臨床協調員和數據管理人員的工作量,而且對于保證有效樣本量、提高數據質量也具有重要意義。
CRF設計對整個研究而言至關重要,良好的CRF設計應盡可能對數據采集點有清晰的定義,數據采集形式應盡可能簡便。本研究中最主要疑問類型缺失類疑問,部分就與此有關,如本研究中有項目將時間采集點精確到分,實際上常難以操作;也有項目設計短時間內多次重復測量同一指標,這就要求患者有一定的配合度,降低了可行性。此外,過多的主觀指標(如患者主訴數據)也是造成缺失的重要原因。
對于研究者而言,年齡、學歷、職稱、從業年限均非影響試驗質量控制的決定因素,一個好的研究者最為主要的是全面的GCP知識,對研究方案的準確理解和嚴格執行[5]。如臨床試驗中常見的訪視超窗問題,訪視窗的計算應以基線訪視日期為起點進行計算,而往往由于研究者不熟悉GCP知識,對訪視超窗的受試者,以前次訪視為起點確定下次訪視窗,結果造成之后的訪視超窗,以致該病例無法進入全分析數據集,導致有效樣本量的縮小。此外,根據GCP的要求,對不良事件的描述,能明確診斷名稱應填寫醫學診斷,而不是羅列癥狀,如有發熱、咽痛、流涕等癥狀如能診斷為上呼吸道感染應記為上感。當無法明確診斷時,再分別記錄每個臨床癥狀[1],如惡心、嘔吐應按2個不良事件進行填寫,這是因為不同癥狀持續時間不同,只有分開記錄才能保證不良事件相關數據的真實有效,而這點是容易被研究者忽略的。
根據GCP的要求,研究者應確保將任何觀察與發現均正確而完整地進行記錄,對顯著偏離或在臨床可接受范圍以外的數據加以核實,由研究者做必要的說明[1]。CRF的記錄一般先由研究者填寫原始病歷,再由臨床協調員負責抄寫到CRF表上,對書寫規范類疑問中常見的字跡潦草無法辨識、書寫格式不合規以及一空多選、漏填所導致的缺失等低級錯誤,這些多與研究者與臨床協調員在記錄過程中不認真有關。而日期邏輯異常、筆誤造成的異常值等問題,則與監查員未能認真核查或監查力度不夠、未能抓住核查要點有關。
數據管理人員對原始數據的核查主要基于申辦方及合同研究組織提供的原始數據及附帶的相關信息,而其中指標的計算方法、研究方案等的版本更新對于數據管理人員所發疑問的有效性顯得至關重要。有時不同臨床試驗中心可能由于設備儀器的不同,實驗室指標單位不同,未能按照CRF的單位進行記錄,這需事先告知數據管理人員單位轉換的公式,否則會造成數據管理工作的延誤。
對于上述臨床試驗中常見的數據質量問題,需要我們根據不同的疑問特點在試驗研究的不同階段加以重視。對于申辦方和合同研究組織,主要應做好以下幾方面的工作:CRF的設計應安排數據管理人員和統計分析人員的參與,從數據管理的角度保證CRF易于填寫兼具邏輯性;重視研究開始前的啟動培訓,應確保各分中心負責人、研究骨干和科研管理人員參會[6],幫助他們熟悉試驗方案的設計、納排標準、CRF的記錄規范、時間窗的計算等相關的SOPs與GCP知識;重視試驗過程中的監查和管理,應安排經過培訓后熟悉研究方案且富有GCP知識的臨床協調員與監查員,針對上文提到的易錯點,結合原始記錄進行核查,避免簡單疑問的產生,尤其對于CRF不同指標間的邏輯關系要引起重視,確保CRF表前后記錄一致且完整準確;在數據管理階段,應保證向數據管理人員提供的信息及時、有效、完整,以避免無效疑問的發放。
對研究者而言,一方面要嚴格遵循SOPs和GCP的要求,試驗前期嚴守納排標準,避免誤納。另一方面,試驗過程中可以根據方案要求預先制定好受試者聯系一覽表,以便提醒受試者返院檢查的時間及項目[7]。認真核對受試者服藥量,對依從性差的受試者找出原因,并對依從性差和訪視超窗的受試者在CRF上備注說明。還需注意的是,實驗室生化檢查部分產生疑問最多,對于受試者生化指標根據實際情況判定與根據CRF判定標準判定不符的情況,受試者生化指標療前正常或異常無臨床意義轉化為療后異常有臨床意義而未報不良事件的情況,一定要給予合理解釋,以減少數據管理的工作量。
此外,采集方法的改進可以提高數據質量,根據國外學者的研究,使用電子數據采集(electronic data capture,EDC)系統可以使因數據缺失而發布疑問的百分比為0,與本研究的缺失比例48.69%相比有明顯的優勢[8]。其強大的邏輯核查功能可以通過錄入設限及時避免常見的邏輯錯誤,有效加強過程監督[9]。應用EDC系統對臨床試驗數據進行有效的質量控制,將成為今后臨床試驗的發展方向。
[1] 田少雷,桑國衛.藥物臨床試驗與GCP實用指南[M].第2版.北京:北京大學醫學出版社,2010.154-165.
[2] 于永沛,朱賽楠,閻小妍,等.新藥臨床試驗數據管理常見疑問類型分析[J].中國新藥雜志,2011,20(11):1004-1011.
[3] 趙玉婷.臨床試驗數據管理常見問題類型分析方法的建立[D].復旦大學,2012.
[4] 劉強,王亞鋒,常甜甜.中醫臨床試驗病例報告表中的數據記錄缺陷分析[J].中國中醫藥信息雜志,2013,20(2):4-5.
[5] 張文靜.藥物臨床試驗質量控制及相關因素研究[D].山東大學,2011.
[6] 郭建文,李偉峰,黃燕,等.實施大型臨床試驗和質量控制的方法和體會[J].廣州中醫藥大學學報,2008,25(1):9-12.
[7] 范彩霞,吳劍秋,寇瑩瑩,等.RDC Onsite-藥物臨床試驗數據采集系統電子病例報告表常見疑問分析[J].藥學與臨床研究,2013,21(2):196-198.
[8] Ivan Pavlovi,TomaKernc,Damijan Miklavi,et al.Comparison of paper-based and electronic data collection process in clinical trials:Costs simulation study[J].Contemporary Clinical Trials,2009,30(4):300-316.
[9] 李書珍,金香蘭,余學杰,等.中醫臨床研究中電子化數據采集過程的質量控制探討[J].中國中醫急癥,2014,23(8):1416-1417,1420.