王瑞平 肇暉 吳穎 李斌
(1.上海市皮膚病醫院臨床研究與創新轉化中心 上海 200443;2.上海醫藥行業協會 上海 200003)
流行病學(epidemiology)作為一門基礎學科,是研究人群中疾病與健康狀況分布及其影響因素,并研究防治疾病及促進健康的策略和措施的科學[1]。近年來,流行病學在疾病預防和健康促進、疾病監測、疾病病因和危險因素研究、疾病自然史、疾病防治效果評價等方面發揮了重要作用。同時,流行病學也是一門邏輯性很強的應用學科,流行病學以醫學為主的多學科知識為依據,利用觀察和詢問的方式調查社會人群的疾病和健康狀況,描述疾病頻率和分布,通過歸納、綜合和分析提出病因假說,進而應用分析性研究對建立的病因假說進行驗證,最后再通過試驗研究來進一步證實。對疾病的發病規律了解清楚后,可以上升到理論高度,用數學模型預測疾病。
流行病學研究方法可以分為“觀察法”“實驗法”和“數理法”三大類。隊列研究(cohort study)是分析流行病學一種重要研究類型。如圖1所示,隊列研究是在一個特定人群中選擇所需的研究對象,根據研究對象目前或過去某個時期是否暴露于研究的因素或不同的暴露水平將研究對象分為不同組別,如暴露組和非暴露組,高劑量暴露組和低劑量組,通過詢問、實驗室檢測和問卷調查等方法采集相關信息;并隨訪觀察一段時間后,觀察登記不同暴露人群的結局事件發生情況,比較各組結局的發生率,從而評估和檢驗危險因素與結局的關系[2]。

圖1 隊列研究的設計原理示意圖
前瞻性隊列研究(prospective cohort study):是隊列研究最常用的一種類型,研究對象的分組是根據研究開始時研究對象的暴露情況而定,此時研究對象的結局還沒有出現,須前瞻性觀察一段時間才能得到。因此,前瞻性隊列研究所需的觀察時間一般比較長。在前瞻性隊列研究中,由于研究者可以直接獲取關于暴露與結局的一手資料,所以獲得數據的偏倚較小。
回顧性隊列研究(retrospective cohort study):是指研究對象的分組根據研究開始時研究者已掌握的有關研究對象的暴露情況而定,同時在研究開始時,其研究結局已出現,其資料可以從歷史資料中獲取,不需要再開展前瞻性觀察來采集的一種隊列研究類型。相比于前瞻性隊列研究,回顧性隊列研究可以通過回顧歷史資料信息同時獲取研究對象暴露和結局,研究可以在相對較短的時間內完成,具有省時、省力、研究周期短等優勢,近年來受到研究者們的歡迎。
雙向性隊列研究(ambispective cohort study):是在歷史性隊列研究后,繼續前瞻性觀察一段時間,是將回顧性隊列研究和前瞻性隊列研究相結合的一種研究方法。在開展回顧性隊列研究時,如果從暴露到現在的觀察時間還不能滿足研究的要求,可以采用雙向性隊列研究。
隊列研究一般很難將全部暴露人群納入研究,因此需要從目標總體中選擇一部分人群組成樣本開展隊列研究。在隊列研究樣本量估算時,應考慮一般人群中所研究疾病的發病率、暴露組與對照組人群發表率的差異、I類錯誤和Ⅱ類錯誤、失訪率等因素。無論是前瞻性隊列研究、回顧性隊列研究還是雙向性隊列研究,其樣本量計算公式均相同,具體如下:
上述計算公式中,α為I類誤差,β為Ⅱ類誤差,p0和p1分別代表非暴露組和暴露組人群研究疾病的發病率,p1=p0RR,RR為相對危險度(relative risk, RR)。
例如:擬開展一項前瞻性隊列研究,探討吸煙與肺癌的關系。既往研究顯示,非吸煙人群肺癌發病率為0.5‰,估計吸煙與肺癌關聯的RR值為4.0,設α=0.05,β=0.10,根據p1=p0RR,計算p1=2‰,代入上述樣本量計算公式計算后得n=11 648,考慮10%失訪率,即分別需要納入12 812名非吸煙者和12 812名吸煙者。由此可見,對于發病率低的疾病,采用隊列研究需要的樣本量很大,實施難度高,因此采用病例對照研究更合適。
1)遵循隊列研究設計原則 與病例對照研究及其他類型的臨床研究一樣,隊列研究設計也需遵從PICO原則,即明確研究人群(population, P)、確定暴露因素(intervention, I)、設置對照組(control, or comparison, C)和確定結局變量(outcome, O)。
2)明確研究目的 隊列研究是一項費時、費力和費錢的研究類型,且一次只能研究一個暴露因素,因此正式開始前要把握好研究動態,明確研究目的。在隊列研究設計時,一定要明確研究的暴露因素和測量方式,包括暴露時間、暴露頻次,累計暴露劑量等。此外,對于研究的結局變量,要給出全面、具體和客觀的定義。結局變量不僅限于發病、死亡,也可以是健康狀況和生命質量的變化,如分子或血清學變化等。在研究實施過程中,對于潛在的混雜因素,也應該進行合理的測量和記錄,便于后面研究結果的綜合評估。
3)確定研究現場和研究對象 隊列研究的隨訪周期一般較長,在研究現場選擇時應注意目標人群的穩定性,最好能夠獲得當地管理部門的重視,群眾的理解和配合,便于后續研究工作的順利開展。對于研究對象的選擇,根據確定的研究現場和樣本量估算結果,在目標人群中根據研究對象就某一個風險因素的暴露情況,分為暴露組和非暴露組。暴露人群包括職業人群、特殊暴露人群、一般人群和有組織的人群;非暴露人群包括內對照、特設對照和總人群對照,研究者根據實際情況選擇暴露組和非暴露組人群,開展研究即可。
4)資料采集和隨訪 在隊列研究開始之前,項目組應根據研究目的制定研究方案,明確資料采集的方法。隊列研究資料采集主要通過問卷調查方法開展,近年來電子數據庫信息平臺在隊列研究中得到了推廣和應用。在研究數據采集時,須詳細收集每一個對象的基礎信息,包括暴露資料、可能的混雜因素信息和個人資料信息等。在基線信息采集完畢后,則須對研究對象進行長期隨訪,根據實現制定的計劃嚴格落實。在隨訪計劃中,應明確隨訪的對象、內容、方式(如面談、電話、復診檢查等)、頻次(如每年1次、每3年1次等)和結局等內容,然后對暴露對象和非暴露對象開展同質化隨訪工作。
5)研究過程質量控制 隊列研究費時、費力、消耗大,應加強研究實施的過程管理,特別是隨訪過程中的資料采集過程應做好質量控制。①嚴格挑選調查員,強調調查員的科學態度和責任心;②對調查員進行統一培訓,掌握調查方法和技巧,同時考核合格后上崗,并在研究過程中實施定期培訓和考核管理;③加強項目實施過程的監督,做好項目的質量控制,定期組織項目組會議,開展數據核查和質量控制工作,必要時可邀請第三方專業質量控制團隊開展。對完成的調查問卷進行抽樣重復調查,并做好問題及時反饋工作。
6)數據統計分析要點 隊列研究數據統計分析同樣包括統計描述和統計推斷。統計學描述主要是對暴露組和非暴露組研究對象的一般人口學特征、主要暴露信息和協變量信息進行描述分析,計算暴露組和非暴露組人群的觀察人時數(人年數),計算累計發病率、發病密度、RR、歸因危險度(attributable risk, AR)等;統計學推斷主要采用卡方檢驗(計算RR值和95%置信區間等)、二項分布檢驗或泊松分布檢驗;趨勢卡方檢驗、泊松回歸分析等分析暴露因素的效應估計與因果關聯分析。
7)常見的偏倚類別和控制 隊列研究在設計、實施和資料整理分析等環節都可能導致偏倚的產生,包括選擇性偏倚、失訪偏倚、信息偏倚和混雜偏倚。上述偏倚產生的原因與病例對照研究類似。因此,研究人員須注意,在隊列研究實施的全過程都應該采取措施,預防和控制偏倚的產生。
隊列研究屬于觀察法、分析流行病學范疇,相比于現況研究和病例對照,隊列研究可以計算發病率,暴露和結局的時間先后順序更為明確,因此對暴露和疾病因果關系可以進行更深入驗證。隊列研究的主要用途包括:①檢驗病因假設,可以檢驗同一暴露與多種結局之間的關聯;②評估預防和治療措施效果;③用于研究疾病發生和發展的自然史。