王瑞平 肇暉 李斌
(1. 上海市皮膚病醫院臨床研究與創新轉化中心 上海 200443;2. 上海醫藥行業協會 上海 200003)
病例對照研究(case-control study)是分析性流行病學最基本、最重要的一種研究類型。病例對照研究本質上屬于觀察法,研究者不能根據自己的設想對研究進行處理或干預,通常以現有確診患有某種疾病的患者作為病例,以未患有該種疾病但具有可比性的個體作為對照,通過詢問、實驗室檢測、環境因素暴露測量等方式收集既往各種可能的危險因素暴露史,測量比較病例組和對照組中各因素的暴露比例差異,如經統計學檢驗差異有統計學意義,則可以認為暴露因素與疾病之間存在統計學關聯。在評估各種偏倚對研究結果的影響后,借助病因推斷技術,綜合判定某個或某些暴露因素是否為危險因素,達到探索或檢驗疾病病因假設的目的(圖1)。
巢式病例對照組研究(nested case control study):指在已建立的人群隊列基礎上,將隨訪期間確診的病例作為病例組,同時在未患病的隊列人群中隨機抽取可比的人群作為對照組,通過比較病例組和對照組某個或某些危險因素的暴露情況,評估暴露與疾病之間的關聯。巢式病例對照研究是將經典的病例對照研究和隊列研究相結合而形成的一種研究方法,一般適用于有復雜實驗室檢測,生物標本前期已完成采集和保存,后期詳細調查內容在研究期間保存不變的情況。
病例隊列研究(case cohort study):又稱為病例參比式研究,也是一種將病例對照研究和隊列研究相結合的研究類型。其設計方法是在隊列研究開始之前,在所有的隊列人群中按照一定比例隨機抽取一個有代表性的樣本作為對照組,觀察結束時將隊列中出現的所研究疾病的全部病例作為病例組,進而比較病例組和對照組某個或某些危險因素的暴露情況,評估暴露與疾病之間的關聯。相比于巢式病例對照組研究,病例隊列研究在暴露和疾病關聯評估方面更具優勢,可以直接計算相對危險度(relative risk, RR)。
病例交叉研究(case crossover study):主要用于研究某些短暫暴露與隨后發生的急性事件之間的可能關聯。其設計的基本思路是,比較相同研究對象在急性事件發生前一段時間的暴露情況與未發生事件的某段時間內的暴露情況。如果暴露與急性事件有關,那么研究對照在2 個時間段內的暴露頻率一定存在差異。病例交叉研究應用有2 個重要的條件:一是整個研究周期中暴露因素必須是變化的;二是暴露和效應之間的誘導時間和效應期都很短。例如,分析過強的體力活動與急性心肌梗死之間的關系研究,就可以采用病例交叉研究設計。
病例病例研究(case case study):又稱為單純病例研究或病例系列研究,常用于同一疾病不同亞型或同一疾病不同遺傳表型與暴露因素之間的關聯分析。在分子流行病學研究中,由于從健康人群中采集生物學標本可能受到倫理學方面的制約,而病例病例研究則可以免除這種制約,同時減少樣本量,節約研究經費,因此逐漸得到了研究者們的認可和重視。
病例對照研究設計包括2 種類型:病例對照匹配和病例對照不匹配。病例對照匹配要求在選擇對照時,要求對照組對象的某些特征或因素與病例保持一致,如將“性別”“年齡”進行匹配,目的是排除匹配因素對研究結果的干擾和影響,可采取個體匹配(individual matching)或頻數匹配(frequency matching)方案。在匹配時要注意,匹配因素應該為已知的混雜因素,同時注意匹配過頭(over matching)問題[1]。病例對照不匹配是指在選擇病例和對照時,不添加任何限制和規定,分別抽取一定量的研究對象組成病例組和對照組的研究類型。
1 ∶1 匹配的病例對照研究中,樣本量計算與暴露因素在對照組和病例組人群的暴露率有關,也與暴露和疾病的關聯強度(odds ratio, OR)有關,其樣本量計算公式為:
其中,M 是總對子數,α為Ⅰ類誤差,β為Ⅱ類誤差,OR 為關聯強度(RR 可替代),p0和p1分別代表目標人群對照組和暴露組的估計暴露值,q1=(1-p1),q0=(1-p0),p1=p0OR/[1+p0(OR-1)]。
例如,一項關于女性使用月經棉和陰道癌關系的病例對照研究中,采用1∶1匹配設計,設α=0.05,β=0.10,對照組暴露比例p0=0.30,估計OR =2.0,則p1=0.46,代入上述公式計算得M =186,即分別需要納入186 例病例樣本和186 例對照樣本。
非匹配病例組和對照組人數相等時,病例對照研究的樣本量計算與暴露因素在對照組和病例組人群的暴露率有關,也與暴露和疾病的OR 有關,其樣本量計算公式為:
上述樣本量計算公式中,α為Ⅰ類誤差,β為Ⅱ類誤差,p0和p1分別代表目標人群對照組和暴露組的估計暴露值,p1=p0OR/[1+p0(OR-1)],OR 為關聯強度,可用RR 替代。
又如,擬開展一項病例對照研究,探討吸煙與肺癌的關系。既往研究顯示,一般人群吸煙率p0=0.30,預期吸煙者的相對危險度RR =2.0,設α=0.05,β=0.10,根據p1=p0OR/[1+p0(OR-1)],計算p1=0.46,代入上述樣本量計算公式計算后得n=193,即分別需要納入193 例病例樣本和193 例對照樣本。
1)病例對照研究設計原則 與常規的臨床研究設計原則一樣,病例對照研究設計也須遵從PICO 原則,即明確研究人群(population, P)、確定暴露因素(intervention,I)、指定對照組(control/comparison, C)和結局變量(outcome, O)。
2)提出假設和明確研究目的 根據疾病分布研究或現況調查結果,結合文獻復習,提出病因假設。然后基于病因假設,選擇合適的病例對照研究方法,明確研究目標。
3)制定研究計劃 在確定研究目的后,需制定詳細的研究計劃。明確病例和對照的來源和選擇方法,確定病例的診斷標準和方法;根據設定的參數和文獻計算樣本量;根據提出的病因假設和項目團隊所具備的條件,確定暴露變量和調查因素;設計紙質調查問卷和數據采集電子數據庫;制定研究計劃時要全方位考慮整個研究過程中可能出現的偏倚,故應設計好控制偏倚的方案;考慮獲取研究因素信息的方法及數據整理和分析方法;制定項目預算,做好人員分工和工作內容,并配套制定嚴格、可行、針對各個環節的質控措施[2]。
4)確定病例和對照來源 病例和對照的來源包括以醫院現患病者、門診病案等為基礎的人群和以社區居民、社區監測資料或普查抽樣調查為基礎的人群。在選擇病例時,應采用國際通用或國內統一的診斷標準;病例選擇以社區病例為主考慮代表性,避免特殊暴露人群;同時優先選擇新發病例。對照的選擇應遵循原則是,對照應來源于產生病例的源人群,最好是全人群的一個無偏樣本,或是產生病例的人群中全體非罹患該疾病群體的一個隨機樣本,可以是醫院為基礎的人群,也可以是鄰居、同胞、配偶等。因此,對照的選擇應當來自產生病例的人群,在選擇對照組時除了應具有和病例一致的某些特征而與病例有可比性之外,同時還須注意對照組人群應不罹患與所研究疾病有共同已知病因的疾病[1]。例如,研究吸煙與肺癌關系時,不能選擇慢性支氣管炎病人為對照,因為吸煙同時是2 種疾病的可能病因。
5)估算研究的樣本量 根據研究目的,參考既往研究中暴露因素與結局變量的關聯強度(RR 或OR),暴露因素在患病人群和對照人群中的暴露率,Ⅰ類錯誤α和Ⅱ類錯誤β;同時結合研究的設計類型為匹配設計還是非匹配設計,以及病例組和對照組樣本量的比例,選擇適當的樣本量計算公式開展病例對照研究樣本量估算。
6)明確變量類型和資料采集方法 對研究中涉及的所有變量,要給出明確的定義,如吸煙、飲酒等以便調查員采集數據時統一標準,同時在信息采集時盡可能全面細致深入。資料采集的方法與現況研究一樣,主要方式包括通過測量或檢查的方法獲取、問卷調查和信息系統摘錄等3 種類型。須強調的是,無論采取什么方法采集數據,都要實行質量控制,降低研究中可能帶來的選擇性偏倚、信息偏倚和混雜偏倚。
7)制定統計分析計劃并開展數據分析 根據病例對照研究類型和采集的變量,制定數據分析計劃。首先對采集的研究數據進行核查、修正、補充等數據治理工作,然后開展統計描述和統計學推斷。統計學描述對研究對象的一般人口學特征、主要暴露信息和協變量信息進行描述分析;統計學推斷主要采用卡方檢驗(計算OR 值和95%置信區間等)、趨勢卡方檢驗、logistic 回歸分析等分析暴露因素的效應估計與因果關聯分析。
8)常見偏倚類別和控制 病例對照研究屬回顧性觀察性研究,研究過程易出現各類偏倚,包括選擇性偏倚、信息偏倚和混雜偏倚。選擇性偏倚主要是因為入選的研究對象與未入選的研究對象在某些特征上存在差異而引起的系統誤差,包括入院率偏倚(伯克森偏倚)、現患病例新發病例偏倚、檢出征候偏倚、時間效應偏倚等。信息偏倚是在數據采集過程中產生的系統誤差,包括回憶偏倚、報告偏倚、測量偏倚等。混雜偏倚是指由于混雜因素存在導致的暴露與結局變量關聯偏離真實情況的一種系統誤差。對于常見偏倚的控制,應重點做好以下幾個方面:①嚴格落實研究方案,確保對照組選擇的隨機化原則完全實施;②做好宣傳溝通工作,提高研究對象的依從性和應答率;③正確選擇測量工具和檢測方法,并進行統一校對;④做好組織工作,進行統一培訓;⑤做好研究過程中資料的復查和復核,提高數據質量;⑥選擇正確的統計分析方法,注意辨析混雜因素及其影響。
病例對照研究屬于觀察法,分析流行病學范疇,相比于現況研究,對暴露和疾病因果關系可以進行初步驗證。病例對照研究的主要用途包括:①用于探索或驗證病因和流行因素,通過病例對照研究設計,初步探討疾病與某個/某些暴露之間的因果關系,同時也可以分析某些疾病的流行因素,如食物中毒突發事件的現場調查,常常會用到病例對照設計;②用于評估預防和治療措施效果及其不良反應,對于既往實施的一些干預措施,可采用病例對照研究進行療效評估,同時對某些疾病藥物治療后的不良反應也能夠進行評估;③用于國內或國際項目開展效果的評價,對于開展的研究項目,通常可以采用病例對照設計對項目的實施效果進行評價。