李雪迎,康曉平,遲春花,王熙誠,尚美霞,周國鵬,高暢,潘子涵
1.100034 北京市,北京大學第一醫院醫學統計室
2.100191 北京市,北京大學公共衛生學院流行病學與衛生統計學系
3.100034 北京市,北京大學第一醫院全科醫學科
4.University College London,school of management,Gower Street,London WC1E 6BT
橫斷面研究是經典的流行病學研究方法之一。在全科醫學和基層衛生研究中,橫斷面研究是一種耗時相對較少且能夠幫助解決實際問題的研究方法,其特點在于可以在短時間內完成調研,通過了解研究對象在一個時點或短時間內的狀況,了解疾病特征、衛生服務現狀、醫學教育情況、衛生經濟學情況、解釋醫療過程的一般規律、探討信息間關聯的研究方法,所以也被稱為現況研究[1]。相對而言,橫斷面研究是一種研究過程比較迅捷的方法,能夠在較短時間內完成研究,是一種應用廣泛的研究組織方式。
在全科醫學和基層衛生研究中,如下研究場景可以考慮采用橫斷面研究的設計方法驗證臨床命題:(1)以了解現況為目標的研究。例如,當研究的目標集中在了解社區人群的疾病狀況、健康行為習慣、醫療服務現狀、醫療服務利用情況等主題時。(2)以關聯或差異性特征分析為目的的研究。例如驗證患者對治療的依從性與對疾病危害的認識程度相關,不同口腔衛生習慣群體齲齒患病情況的差異。在臨床研究中,了解各臨床特征間共同變化的趨勢或者不同屬性群體其臨床表象的異同,是認識臨床過程的重要工作,可以借助橫斷面研究完成。此處需要特別說明的是臨床研究中存在大量以因果關系驗證為目標的研究,例如疾病發生的影響因素,慢性病患者治療依從性的影響因素研究等。對于因果關聯的驗證,橫斷面研究通常不能勝任,因為橫斷面數據的特征信息是同時取得的,因此常難以具備因果推斷需要的時間特征(即因出現于過之前),但來自橫斷面調查的關聯性分析可以協助獲得針對因果推斷的初步線索,為進一步的工作打基礎。(3)診斷能力評價研究。臨床診斷方法的改進是臨床研究中活躍的研究領域。診斷方法的改進、提升對于提高臨床效率、降低操作風險、改進可操作性具有重要意義,例如研究新的準確度良好而且簡便易行的適用于社區衛生服務的診斷方法。在評價新診斷方法對疾病的診斷能力時,常需要采用所研究的新方法和作為參比的“金標準”同時對研究對象完成測量進而評價新方法的診斷能力,這類研究從研究設計角度看,通常也屬于橫斷面研究。
本文將結合全科醫學和基層衛生的研究需求,基于橫斷面研究的場景與經典案例,對橫斷面研究從設計到實施各個環節的方法學要點進行梳理[2-3],為研究提供借鑒。由于具有足夠代表性的大規模流行病學調查研究,常需要通過完備的抽樣策略,在目標區域內選取充分的樣本作為研究對象,通常規模較大并非單中心,本文不將此類研究作為重點介紹。
研究設計是良好研究的開始,是研究實施的指引,通常包括專業設計和統計學設計2 個部分。臨床設計需要明確研究的目標,并在充分考慮方法學原則的前提下,明確研究中的臨床要素。統計學設計則主要關乎樣本的獲取方式以及樣本量的確定。
1.2.1 明確研究問題:明確研究問題是研究的起點,解決這些問題就是研究的起點和最終目標,明確需要解決的專業問題(比如明確社區人群的醫療服務需求,了解不同特征群體健康狀況的異同;探討行為心理特征與疾病狀態,健康狀況之間的關聯;構建更便捷的社區篩查診斷方法等)、工作的方向。但對于研究而言,有了研究方向并非是研究的真正開始,還需要針對要驗證的研究目的提煉明確的研究問題、建立研究假設。
例如要確證所構建的新診斷方法具有臨床應用價值,就需要將驗證問題具體化:即研究目的可以是評價該診斷方法診斷能力的正確性(靈敏度、特異度),也可以是探討新診斷方法的診斷界值[受試者工作特征曲線(ROC 曲線)]。若是上述第一個目標,建立的研究假設就是新診斷方法可以提高真陽性率(靈敏度),或真陰性率(特異度),或兩者均可。
提煉研究問題的過程是把臨床研究目標具體化的過程。臨床目標指明了工作方向,但其可能是由一個或者多個,也可能是一連串具體的研究問題組成的。因此在研究開始的時候,明確本研究的研究問題是研究的開端和關鍵一步。
例如,PAN[2]在針對初級醫療保健中慢性阻塞性肺疾病的篩查診斷方法研究中,其研究目標在于尋找適合初級醫療保健應用的慢性阻塞性肺疾病篩查方法。依據以上目標將研究問題表述為評價中國初級保健人群中各種慢性阻塞性肺疾病篩查測試方法的準確性和成本效益,從而明確了篩查方法的臨床效用評價與篩選,對診斷準確性與經濟兩個方面做出綜合判斷。
1.2.2 明確研究要素:在明確研究問題的基礎上,進一步需要對驗證研究問題所涉及的諸研究要素加以細化和明確。研究要素通常包括研究對象、研究因素(也包括對照因素)和評價指標。
(1)研究對象:需要明確研究對象的特征,這是一個重要的研究要素,因為其闡釋了研究人群特征與目標人群特征的一致性。只有當研究人群與目標人群特征相同的時候,研究所獲得的結論才可以外推至目標群體,從而獲得具有實際臨床推廣意義的可靠結論。
在研究方案中,通過定義具有足夠嚴謹性及可操作性的納入、排除標準來呈現研究對象選擇的設計思路,同時說明研究對象群體的代表性、科學性、合理性。一般來說,納入標準勾畫目標群體的特征,表征研究結論所對應的臨床目標群體的特點和人群范圍,將目標群體中情況過于復雜、不適宜參加研究或無法配合完成研究的個體排除在研究之外。
例如PAN[2]在慢性阻塞性肺疾病篩查診斷研究中,由于慢性阻塞性肺疾病好發于中老年群體,即所研究的篩查方法針對的目標人群為中老年人,故而研究人群的入選標準定義為年齡40 歲及以上因任何原因就診于社區醫療服務中心的社區居民;同時應將各種原因無法配合檢查及無法參與的研究個體排除在外,所以排除標準則定義為無法給予知情同意、有肺活量檢查禁忌證或因其他原因無法進行檢查者。
從以上設定可見,納入的研究對象反映了未來實際應用中目標人群的群體特征,充分說明了研究對象選擇的代表性。
(2)研究因素:當研究目的不同時,研究因素的定義也會各有不同。無論哪一類研究目標,作者均應對各要素的測量方法和組織方式給予明確說明。當采用量表完成信息收集時應特別注意要選擇信效度良好的量表。
在現況調查研究中,研究因素即為所關注的特征屬性,應明確其獲取方法、判定標準。在關聯性為主要目標的研究中,所要研究的相關因素即為研究因素,其測量方法及測量結局的記錄方式需在方案中明確。關聯性分析中常通過研究因素不同水平間的對比分析獲得是否關聯的結論。在診斷能力評價中,所研究的因素就是等待評價的診斷方法,同時為了獲得準確目標,臨床結局作為診斷能力評價的參照。當前針對該問題的“金標準”診斷方法常作為參比方法引入研究。結局評價指標是對驗證目標給予表達呈現的重要參數。選擇能夠從本質上準確反映研究狀況、關聯強度的指標是研究設計的關鍵。
從指標屬性上看,包括主觀指標和客觀指標。客觀指標是來自于生物學、物理學等特征的測量結果(例如來自各種臨床檢查所獲得的客觀結果、實驗室檢查的測量結果、肺功能測量結果以及病理檢查結果等);主觀指標則需要借助研究者或患者的主觀判斷獲得。其中,以患者為中心的結局指標,即患者報告結局(patientreported outcome,PRO)[4-5],具有重要的實踐意義。在臨床研究中PRO 被定義為:任何來自患者直接報告且不被他人修改或解讀的對自身疾病和相應治療感受的評估結局[6]。在全科醫學和基層衛生領域的研究中,大量針對醫療服務、健康認知以及治療干預的主觀感受和體驗均需要通過來自患者、健康服務對象的主觀感受獲得評價。因此PRO 在全科醫學和基層衛生領域得到了日漸廣泛的應用和重視。從研究設計的科學性角度看,結局指標需要足夠的準確性。在這個問題上,客觀指標因其測量的方法學特性,在可靠測量方法和嚴謹操作的保障下更容易獲得可靠的測量結果。對于主觀指標,由于人為因素的參與,其測量結果的準確性、可靠性自然面臨更大的挑戰。因此PRO 的測量手段就成為影響PRO 測量結果可靠性的重要因素。在PRO 測量過程中,需要具有足夠可靠性的測量首當方可完成研究任務,例如各領域中具有可靠信效度的量表,視覺模擬評分(Visual Analog Scale,VAS)、數字等級評分(Numeric Rating Scale,NRS)等都是常用的評價方法。
從不同的研究目的角度看,評價指標也各有特點:在診斷能力評價中,通常以研究方法診斷結果與“金標準”參比方法診斷結果的一致性作為評價標準,通常會通過靈敏度、特異度等指標呈現對患病與否等二分類結局狀態的判斷準確性(詳見統計分析部分)。在現況調查研究中,則會明確研究目標,例如將患病率、知曉率、滿意率等指標作為評價指標,并通過目標參數的統計描述與相應的區間估計來表達情況特征。在關聯性分析中則以關心的臨床參數為結局指標,經常通過多變量回歸分析,采用回歸系數或通過回歸分析獲得表達關聯強度的指標如OR 值,來闡述研究因素與結局指標之間的關聯強度、關聯特征。
1.3.1 樣本的獲取方式:從統計學角度看,研究樣本的收集分為普查和抽樣調查兩類。
普查是將特定時間點或時間內的全部人群(總體)作為研究對象進行的調查,例如對社區內60 歲以上的老年人進行飲食習慣調查;以研究時間段內所有在社區醫療服務中心完成健康體檢的人為研究對象,了解肥胖情況。
抽樣調查有別于普查之處在于并非將特定群體的全部個體作為研究對象,而是采用隨機或非隨機的方法選擇總體中的部分個體作為樣本,以其為研究對象開展研究來推論總體特征的研究方法。抽樣研究從樣本的選擇角度看分為隨機樣本(即通過隨機化方法完成樣本選擇,具有更好的代表性)和非隨機樣本(即方便樣本)。
例如,曹瑾等[6]在甘肅省急性病患者家庭用藥合理性和藥品可及性調查研究中明確說明,為了了解甘肅省急性病患者家庭用藥合理性和藥品可及性現況,為規范甘肅省急性病患者家庭用藥行為,提高其用藥合理性和藥品可及性,采用了分層多階段隨機整群抽樣法。第1 階段,根據甘肅省各市人均國內生產總值(GDP)排名,并考慮現場配合度,等距抽取5 市;第2 階段,在抽取的5 市中分別隨機抽取1 個區和2 個縣;第3 階段,在抽取的每個縣中分別隨機抽取2 個鄉鎮;第4 階段,在上述36 個抽樣點分別隨機抽取30 戶常住家庭共1 080戶家庭完成問卷調查,從而獲得了具有足夠代表性研究對象。
1.3.2 樣本量估計:樣本量估計是方案設計階段的重要環節,關乎研究設計的科學性和研究工作量的確定。樣本量估算是研究設計的基本要素,是在主要評價指標明確的基礎上完成的,樣本量估算需要以主要評價指標的估計值作為臨床參數才能完成。
主要指標的估計值可以來自前期的預探索研究結果,或者文獻報道中研究者認為具有參考意義的相關結果報告。由此可見,在作為初次“嘗試”的探索性研究中,由于前期尚未獲得相應的可參考信息,沒有辦法對效應強度做出合理的估計,也就沒辦法完成樣本量估算。所以,探索性研究常是小規模的,其樣本量的確定并不依據統計學估算確定,而是綜合考慮數據特征、臨床可操作性等因素決定。同時,探索性研究的分析過程也并不強調需要明確的驗證目標和實現確證,而是完成對研究問題的初步了解,并為確證性研究奠定基礎。探索性研究中所獲得的信息則是確證性研究樣本量估算的重要臨床參數。在最終以確證為目的的研究中,當前期信息尚不充分時,也可以首先考慮完成小規模的探索性研究,從而增加對研究問題更充分的認識,也為確證的實施和研究規模的確定、積累信息奠定基礎。
樣本量實施過程所需要準備的參數包括統計學參數和臨床參數兩部分。在橫斷面研究中,根據抽樣方法的不同及資料性質不同,樣本量估計的方法也不同。針對結局指標是二分類變量的單純隨機抽樣,描述性研究樣本量估算公式適合多個工作場景(例如針對醫療服務滿意率的問卷調查),應用比較廣泛的估算方法[7-10],估算公式如下:
其中n 為樣本量;統計參數α為檢驗水準,通常取0.05,當雙側檢驗α取0.05 時,Z21-α/2=1.96;臨床參數p 為主要結局指標參數的估計值(在診斷能力評價中可以是靈敏度、特異度;在調查研究中可以是滿意率、知曉率等二分類結局指標);δ為允許誤差,即樣本率與參數值相差所允許的限度。通常研究中還會考慮一定比例的數據脫失(通常不超過20%)。也就是說當考慮的脫落比例為20%時,計劃納入的樣本量為估算結果的1.2 倍。
(1)調查研究舉例:在針對社區幼兒齲齒患病率的調查中,預調查顯示,3~5 歲學齡前兒童的齲齒患病率約為60%。如果允許的調查誤差為6%,也就是患病率的調查結果的誤差要控制在±6%以內。取α=0.05,根據以上設定完成樣本量估算:
針對需納入的陽性病例數,采用靈敏度的估計值完成功能計算,帶入以上公式,Z21-α/2=1.96,P=0.60,δ=0.06 得:
故需要完成調查257 例,考慮脫落比例約為20%,故需納入研究樣本:257×1.2 ≈309 例。
當研究目的在于驗證研究所獲得的率指標達到或超過某一特定目標水平時,可采用單組目標值設計[10-12]的樣本量估算公式:
(2)診斷能力評價舉例:在針對某社區篩查診斷方法的評價研究中,根據前期研究,待評價診斷方法的靈敏度可達到95%以上,特異度可達到85%以上;如依據臨床應用要求,靈敏度需達到90%以上,同時特異度需達到80%以上才滿足篩查工作的要求;取α=0.05(雙側),β=0.2;按照前期調研所見,目標群體中陽性病例約占30%,根據以上設定完成樣本量估算:
針對需納入的陽性病例數,采用靈敏度的估計值完成功能計算,帶入以上公式,Z21-α/2=1.96,Z1-β=0.84,P1=0.95,P0=0.90,得:
故需要完成陽性研究病例238 例,因為陽性病例在篩查目標群體中約占30%,則為獲得足夠的陽性檢出病例需納入得研究病例數為:238/0.3 ≈794 例
考慮的脫落比例為20%,則共需納入研究病例794×1.2=953 例。
在診斷能力評價中,以上公式同樣適用于特異度的計算,當臨床應用同時對靈敏度和特異度提出了各自的驗證目標時,則需要對靈敏度和特異度分別完成以上計算并以其中較大者作為研究的樣本量,從而同時滿足兩參數的驗證需要。
以組間平均水平差異為核心驗證目標時,則可以采用組間平均值差別性分析的方法完成樣本量估算,以下介紹兩樣本平均值差異驗證的樣本量估算公式(組間比為1:1 的情況):
其中n1,n2為兩組樣本量;統計參數α為檢驗水準,通常取0.05,當雙側檢驗α取0.05 時,Z21-α/2=1.96;統計參數β為檢驗水準,常用水準為0.2,Z21-β=0.84;臨床參數S 為評價指標參數的公共標準差估計值;δ為兩組平均值差值的估計值。
(3)組間差異性分析舉例:在針對某社區運動習慣和BMI 關系的問卷調查中,根據前期預調查結果,保持良好運動習慣者其BMI 水平更低,與缺乏運動這相比BMI 平均水平差值約為1.5 kg/m2,設公共標準差為3;取α=0.05(雙側),β=0.2;按照前期調研所見,目標群體中堅持運動與缺乏運動者約各占50%,根據以上設定完成樣本量估算:
將以上參數帶入公式,Z21-α/2=1.96,Z21-β=0.84,S=3,δ=1.5,得:
故需要完成堅持運動極缺乏運動社區人群調查各63 例。考慮的脫落比例為20%,則共需納入研究病例(63+63)×1.2 ≈152 例。
1.3.3 統計分析:統計分析的一般原則為統計分析是驗證研究目的的方法和環節。統計分析策略的確定,首先依據驗證目的明確整體思路,進而根據指標屬性選擇統計描述方式和統計推斷方法[13]。
從統計學角度,數據分為數值變量(例如血壓、血糖)、分類變量(例如性別、民族)和有序變量(例如心功能分級、腫瘤病理分級)。
統計描述的目的在于準確呈現研究數據特征,服從正態分布的連續變量數據通常采用(平均值±標準差)表示,不服從正態分布時則采用中位數(上四分位數,下四分位數)或中位數(最小值,最大值)完成描述;對于分類變量統計描述則通常采用相對量形式。有序變量則會考慮數據等級的特點選擇各等級的例數(百分數)或采用中位數(最小值,最大值)的方式描述數據。
統計推斷的目的在于利用樣本信息推知總體特征。統計推斷包括假設檢驗和區間估計兩種方法,其中假設檢驗根據分析目的不同分為差異性分析和關聯性分析。
差異性分析驗證比較組間的不同:連續變量服從正態分布時,兩組間比較常采用t 檢驗,多組間比較采用單因素方差分析;不服從正態分布的連續變量和等級變量則采用秩和檢驗;分類變量則根據數據特征采用卡方檢驗或確切概率法。
關聯性分析包括相關分析與回歸分析兩大類型。相關分析通過相關系數和假設檢驗結果呈現關聯的密切程度及趨勢特征;回歸分析則著重通過針對回歸系數的分析探討變量間共同變化的依存關系。根據分析變量(自變量)的數量,回歸分析又可分為單變量回歸分析(僅包括一個自變量)和多變量回歸分析(包括多個自變量)。
在橫斷面研究中,不同研究目標,其分析策略的重點也各有不同。
現況分析:通過對核心指標的統計描述及其相應的區間估計來呈現結果,例如對于某病患者健康教育知曉率的調查研究,可以計算樣本知曉率并按不同特征分層進行組別間知曉率的比較,并進行假設檢驗及相應的95%置信區間。
關聯性分析:對于臨床信息間關聯性分析,通常通過統計描述呈現數據特征,再通過單變量分析探討變量間的關聯。在臨床過程中常見一個臨床特征與多個因素相關的情況,故而關聯性分析中根據研究目的和臨床特征在很多情況下都會借助多變量回歸分析探討臨床特征間的關聯。常用的方法有多變量Logistic 回歸和多變量線性回歸。在Logistic 回歸中通常通過OR 值及其區間估計表達關聯強度和方向,線性回歸分析中則依靠回歸系數來體現關聯性。
例如曹瑾等[6]在家庭用藥合理性和藥品可及性調查研究中,采用統計描述的方法對家庭用藥情況做出總結和說明,并針對不同特征的群體完成了差別性檢驗或相關分析,從而探討不同地區人群的用藥特征,以及藥品獲取方式與用藥情況的關聯等等信息為臨床醫療提供幫助。
診斷能力評價:在診斷能力評價中最常遇到的是針對二分類結局(鑒別病例和非病例)的診斷能力研究。通常通過“金標準”診斷方法獲得研究對象的準確疾病狀態,將研究對象區分為病例和非病例。同時對研究對象完成所評價的診斷方法的檢測,獲得陽性或陰性的結果,故而所有研究對象的檢測結果可歸納為如表1 中的四格表。

表1 診斷能力評價數據結構表Table 1 Diagnostic capability evaluation data structure
從診斷能力評價角度看,會同時通過檢出病例和排除非病例兩方面的能力來評價試驗診斷方法的效用。故而對于二分類結局通常通過靈敏度(檢出病例的能力)、特異度(排除非病例的能力)為核心指標的一系列診斷指標及其區間估計來說明診斷能力。
另外,診斷方法構建中,根據診斷模型構建的數據屬性不同,連續變量(如血糖、尿素氮)、等級變量(如心功能分級、腫瘤分期)必要時可以首先通過ROC 分析初步說明診斷能力進而尋找診斷界值,通過靈敏度、特異度等呈現診斷能力;當涉及多變量診斷模型時,則可能根據應用需要和數據屬性采用并聯方式(2 個或2個以上的診斷方法同時完成,其一獲得陽性結果即判斷為陽性,旨在提高檢出靈敏度)、串聯方式(2 個或2個以上的診斷方法同時完成,全部獲得陽性結果才判斷為陽性,旨在提高特異度)、序貫方式(診斷過程由一系列診斷方法依序按照事先規定的準則實施,例如在每一步的檢查中獲得陰性診斷的研究對象即判斷為陰性,而獲得陽性診斷的病例將進入下一步診斷檢驗,直至最后一步仍未陽性的研究對象才獲得陽性診斷)以及多變量模型分析(例如:Logistic 回歸分析)或適宜的構建方法完成模型構建,但最終都會通過前述的診斷能力指標呈現驗證能力。
慢性阻塞性肺疾病是常見的呼吸系統慢性疾病,因為通氣功能受損而嚴重影響患者健康和生活質量,需要長期治療和監測防止病情進展和復發。因此慢性阻塞性肺疾病的早診、早治是社區衛生醫療工作的重要任務。如前文介紹中已經簡要提到的有關研究設計的各要素,潘子涵[2]在針對初級醫療保健中慢性阻塞性肺疾病的篩查診斷方法研究中,從社區醫療的實際需要出發,明確研究問題,為社區醫療尋找符合操作條件、診斷準確性良好且具有較好衛生經濟學效用的篩查診斷方法。研究人群特征反映了社區篩查工作的目標群體特點;所評價的診斷方法包括了操作簡便的呼氣峰流速儀等客觀測量方法和反應患者主觀感受的量表評價結果;參比方法采用具有“金標準”意義的診斷性肺量計測量結果作為臨床診斷;統計分析方法遵循了診斷能力評價的要求,通過靈敏度、特異度等指標最終呈現診斷能力,相應設計要素歸納如表2 所示。

表2 社區慢性阻塞性肺疾病篩查研究的設計要素Table 2 Design elements of a community-based chronic obstructive pulmonary disease screening study
方案撰寫在明確研究目的、準確描述研究要素的基礎上開始,應語言簡練、表意準確,充分體現臨床驗證思路的科學性、嚴謹性。(1)題目應簡明,對科學問題、驗證目標做出準確概括。(2)研究目的是對工作目標的概括說明,應簡潔準確,通常在一個獨立的研究中,研究目的應集中于一個明確的科學問題,根據研究目的提出或建立研究假設。(3)研究背景對研究領域的臨床現狀和研究進展做出簡要概括,明確當前面對的未解問題,說明本研究的必要性和臨床意義,從而說明研究工作開展的專業基礎以及本項研究立題的必要性和臨床意義。(4)總體設計對研究設計類型,組織形式(如單中心或多中心研究)等設計特征給予概要說明,從而體現研究的組織思路、組織形式與研究驗證目的的一致性。(5)研究對象說明樣本來源,比如樣本獲取自社區人群或醫療機構的就診患者,并應依據研究要素定義明確入選、排除標準,同時還應注意說明樣本納入的篩選方式:如連續納入就診患者、通過隨機化方法篩選納入符合標準的社區居民或者采用非隨機化方式招募研究對象等。(6)信息采集與明確結局指標需說明針對研究目的所需要收集的信息,以及收集、測量的方法,充分體現科學性及可操作性;應注意包括與研究相關的人口學信息,與入選、排除標準判斷相關的臨床信息,研究要素,研究結局信息;此外,還需要考慮收集可能的分層因素以及混雜因素,為數據分析做準備,在明確收集信息的基礎上,應對結局指標做出明確定義。(7)數據管理方法概要要有說明,包括數據管理工具、安全性措施、數據核查質量控制措施(具體要點可參考2.5數據管理)。(8)樣本量估計與統計分析中樣本量估算過程的報告應包括預期參數、估算公式、估算結果,說明預計納入的研究樣本數量、統計軟件、檢驗水準,概括統計描述、假設檢驗方法,特別應注意說明針對主要指標的統計分析方法(具體要點可參考2.6統計分析),以呈現驗證思路。(9)撰寫及完善研究方案是研究實施前重要的環節,方案一經確立,在獲得倫理委員會批準的前提下,研究實施過程將嚴格遵照方案執行,不得隨意更改。因此,應特別注重研究團隊針對方案的討論和完善。研究開始前,研究人員應對方案設計達成共識,只有在研究團隊認識統一、設計完備合理的情況下,研究開展才能驗證臨床目的。
信息收集前,確定調查工具和信息收集表格是重要的準備工作。在研究方案明確的基礎上,依據方案對研究信息的要求和定義完成信息報告表設計。信息收集以滿足達到研究目的的最小數據集為宜,并非信息收集越多越好,這是因為數據信息收集的增加不僅增加研究工作量,也增加了數據收集階段出現錯誤的機會,影響數據質量,同時過長的訪問時間也可能降低研究對象的依從性,從而給數據質量和完整性帶來影響。
對于數據記錄方式,建議在數據采集表中明確計量指標(例如身高)相應的計量單位(例如:cm),對于分類指標建議通過封閉提問的方式(也就是通過固定的選項收集信息),避免使用自由填寫的報告方式,以促進信息的可利用性。選項設置中應從信息特征出發,對可能出現的情況做出劃分和陳列,應特別注意各選項描述的準確性,避免歧義。同時應注意完備性與互斥性,從而避免部分情況無對應選項或在選項間難以準確判斷的情況。選項設定關乎數據分析和目標驗證,選項應根據研究需要和數據特點設定。多數情況下,所設定的選擇范疇和分類并不難決定,例如性別通常區分為男性和女性兩個選項即可;而有些信息則需要對類別劃分做出有針對性地設定,例如民族信息的取得,是將56 個民族分別作為選項列出,或者在很多研究地區因居民中漢族為主則將民族信息區分為漢族與非漢族,在對少數民族者另設變量記錄其具體民族信息。亦或在特定的民族聚居區根據研究對象特征做出便于分析、易于記錄的分類方法。
涉及量表、問卷時,應盡可能選擇成熟且經過評價被專業內認可的測量工具。問卷、量表作為調查手段是合理的選擇,在需要針對研究目的自行設計問卷時,則應根據問卷設計的一般要求完成設計工作。應特別注意:問題描述清晰、準確避免誘導性,避免歧義;盡量避免否定性問題,不使用雙重否定問題,防止理解困難和可能的錯誤;問卷長度不宜過長,填寫總時間控制在30 min 或更短為宜,防止影響依從性;敏感問題的提問應置于問卷后部。
信息收集表格構建完成后,必要時可以通過預調查了解應用情況,對問卷進行完善,進而開展正式研究。
研究工作開始前,應通過充分的研究者培訓統一對研究內容的理解,以及調研方法的同質性,只有當研究者充分統一認識和具有相同的判斷能力時方可付諸實施。
在研究設計階段工作完成后,應依據相關要求將研究相關信息遞交倫理委員會完成審查。對于前瞻性收集過程,需要在遞交審查前依據倫理委員會的要求撰寫知情同意書,并遞交審查。回顧性收集病例信息的研究則需要提交免除知情同意的申請,只有當研究方案通過倫理審查后方可開始臨床工作。
數據收集工作需在所有研究者通過對方案及信息收集內容做出充分討論、獲得統一認識的基礎上并獲得倫理批準后開展。收集過程需遵照方案規定,認真履行培訓要求,確保數據完整性、準確性,保障數據質量。
數據管理的核心任務在于確保研究數據的準確性,為研究提供可靠的數據基礎。因此需明確數據管理標準化操作流程,并嚴格遵照執行,從而保障數據質量。
(1)管理工具:在條件允許的情況下先選擇功能完備的數據庫系統記錄數據產生過程,保留循證證據,確保數據質量都是有益的。在條件不具備的情況下,研究者亦可借助簡單的數據表工具完成數據管理工作。在采用簡單數據表格存儲研究數據時,則更應注意數據管理的各個環節從而保障數據準確可靠。(2)數據存儲安全策略:專設數據管理員明確權責、設置密碼保護,及時、多設備、多途徑備份存儲是重要的管理措施,對于防止誤操作或可能的安全風險都具有重要意義。(3)數據結構的定義:針對信息采集表中的數據信息內容,在數據庫中給每一個數據點定義相對應的變量名,根據分析工具的要求常采用簡要的詞匯或常用的縮寫為變量命名,對于以固定選項收集的數據經常需要通過數據編碼以便于分析。在有序分類變量的編碼中,需保持選項間的程度關系與編碼所對應的數值大小相對應。例如BMI 分類為消瘦、適中、超重、肥胖時,其對應的編碼可以分別為1、2、3、4。這樣一來,數值的大小與BMI等級特征的程度一致,便于數據分析。對于數據庫中各變量與信息采集表信息的對應關系以及變量名稱,變量屬性(數值變量、分類變量)編碼,取值范圍,錄入要求應作為數據管理重要文檔給予妥善記錄和保存,便于查找和使用。(4)紙質數據采集方式的數據錄入過程:首先需要將來自紙質信息表的數據信息從原始記錄盡可能準確的轉移到電子數據存儲體系中。為確保數據庫中的信息與采集表一致,通常需要完成數據準確性核查。常用的方法例如雙份錄入核查比對:也就是由兩個數據錄入人員分別獨立錄入數據后對兩人的錄入結果進行比對,對二人錄入不一致的數據再與原始數據表完成核對檢查,保留正確結果。顯然,采用電子數據采集時則不需要這個錄入的程序。(5)邏輯核查:無論采用何種方式采集數據,數據邏輯核查都是保障數據質量的重要環節。邏輯檢查的目標在于通過數據內部或數據間的邏輯關系發現可能存在數據準確性問題,進一步提高數據質量。邏輯核查包括但不限于:發現異常缺失的數據并及盡可能及時補救,例如性別信息的缺失;對異于臨床認識的測量值進行復核,例如收縮壓記錄為330 mmHg(1 mmHg=0.133 kPa),明顯異于常理需要進行復核;數據信息間存在矛盾,例如既往病史中說明存在高血壓長期服藥,但合并用藥中未見相應記錄需要核實并及時更正等。
統計分析過程應嚴格遵循方案中關于統計分析的方法和策略完成。評價策略評價指標不應隨意調整,必要時根據研究目的通過未在方案中計劃的事后分析,例如分層分析、亞組分析、敏感性分析等作為補充,為研究提供更多的信息。需要說明的是,事后分析無預先計劃,無法支撐確證性結論,僅可作為探索性分析為今后的相應確證性研究提供研究基礎。
論文撰寫是研究結果呈現和分享的重要途徑,因此對研究過程的簡明準確呈現,在準確呈現研究科學性、循證可靠性的前提下兼顧易讀性是寫作的目標。對研究方法和分析結果進行準確呈現做出研究結論。臨床研究論文寫作,通常包括摘要、前言、方法、結果、討論幾個部分。(1)摘要:對研究核心設計要點和主要結果與結論的精煉概括。通過閱讀摘要能夠有效地讓讀者了解研究目的、研究方法、主要結果以及研究結論。摘要通常為結構式,包括目的、方法、結果、結論。目的概括說明研究要達到的目標,通常為完整的一句話;方法需要對研究對象、研究因素、結局指標、分析方法進行概要說明;結果要說明所納入的研究對象群體特征以及分析所見,著重說明主要評價指標的分析結果,支撐研究結論;結論依據分析結果,概括研究結論與目的相呼應。(2)前言:回顧研究領域的臨床工作現狀和研究基礎,歸納尚待解決的臨床實際問題,明確本研究的研究目標和科學問題,指出本研究的臨床意義。(3)研究方法:說明總體研究設計,逐一報告研究對象特征,觀察指標與觀測方法、評價指標的選擇與定義以及數據管理和統計分析策略。(4)研究結果:完整呈現研究所見,應做到層次清楚邏輯嚴謹,可借助流程圖說明研究對象納入篩選及完成研究情況。數據信息呈現通常包括研究對象的一般特征,研究計劃的完成情況與依從性,并依據方法部分的分析方法說明,完整報告分析結果。調查研究特別注意研究特征的描述及區間估計;關聯性分析則需著重報告關聯性分析結果,特別注意說明關聯強度;二分類診斷能力評價則需要最終通過靈敏度、特異度等診斷能力指標及其區間估計獲得診斷能力驗證。并根據數據特征、建模需要,報告ROC 曲線分析,模型構建情況。結果呈現應注意易讀性,綜合采用文字,統計圖和統計表等呈現方式報告結果。統計表通常采用三線表形式。(5)討論:表達作者對研究問題、研究結果的分析,依據研究所見進一步闡述研究發現,闡釋其理論依據,分析應用前景。對研究成果的科學性意義和實際應用意義做出評價,全面分析本研究的優點與不足,對未來研究做出展望,并最終得出結論。討論過程應基于研究結果展開,避免泛泛而談。
對于論文撰寫而言:清晰準確、詳略得當、科學嚴謹是所有研究需要遵循的準則。不同研究設計類型的報告過程,因其設計方式、論證目標具有各自不同的特點,在報告中又會各有側重。為了讓驗證過程中的設計要點和分析要點呈現更準確,避免遺漏,方便閱讀,各類研究設計均形成了研究報告撰寫要點的指導性意見。在現況研究與關聯強度分析的研究可遵循STROBE[14-15]聲明中的報告要點,一一對照完成研究報告撰寫。診斷能力評價的研究,則須遵循STARD[16]聲明報告研究要點。研究者可對照檢查防止遺漏重要信息。
橫斷面研究僅涉及特定時點或時期內的信息采集,相較于需要長期隨訪的隊列研究,其實施過程更為迅捷,所需研究投入相對較低,在臨床研究中針對適宜的研究目標,應用廣泛。
基于研究信息采集自特定時點的數據特征,橫斷面研究在了解疾病、醫療現況,探究臨床信息之間的關聯,構建診斷方法上具有重要作用,設計實施流程見圖1。

圖1 橫斷面研究設計實施流程簡圖Figure 1 Transect study design implementation flowchart
針對不同的研究目的,研究者需要定義相應的研究要素、組織研究、完成驗證,但三種看似完全不同的驗證目標之間,實際上存在一定的相互關聯,在應用中也有存在聯合運用的方式。
在針對現況特征的研究中,在完成現況分析的同時,還可以在滿足設計要素的情況下,展開針對數據間關聯的分析[17],從而更充分地利用數據。例如通過對某社區60 歲以上居民的調查了解其對社區醫療服務的滿意度,在此基礎上仍可以通過關聯性分析了解疾病情況、生活習慣、家庭情況與醫療服務安逸度的關系。
在關聯性分析中,當關聯足夠密切時,亦有機會構建相應的預測診斷模型。例如通過關聯性分析首先探討胰腺超聲檢查各參數與病理診斷性質(良性及惡性不同程度)的關系。在關聯性足夠強的情況下,則有機會繼續通過構建預測模型,從而通過無創超聲檢查實現對病理診斷的預判,構建具有臨床實際意義的診斷方法,更充分地發揮超聲檢查在良惡性鑒別診斷中的作用。
當研究兼顧多個目標時,需要綜合考慮使研究的諸要素能夠契合每一個目標的驗證需要。
橫斷面研究和其他的研究設計類型也存在協同應用的可能。例如在隊列研究中,會首先完成研究對象入組時的基線信息收集,再通過隨訪獲取臨床結局。在這個過程中可以看到,基線信息的取得實際上具有橫斷面數據的屬性,在科學問題清晰、研究要素具備的情況下,有機會利用隊列研究的基線信息作為橫斷面數據實現可能的研究目的,更加充分的利用研究信息服務臨床工作。
為獲得高質量的循證證據,實際操作中應特別注重充分的方案討論及研究者培訓,從而統一認識,在力求設計嚴謹的前提下確保數據質量,進而通過合理的分析策略驗證研究目標。
全科醫學研究是在實踐中不斷前進的學科。研究的設計、組織、管理、分析方法都隨著研究工作的需要不斷探索前進。本文僅是針對全科醫學與初級保健領域研究中最常見的場景展開,不可能盡述所有細節和要點。例如由于本文著重于小型研究團隊可以完成的研究工作,在針對現況的調查研究中,很多課題目標需要大規模復雜抽樣調查,多機構大規模團隊協作才能完成的課
參考資料推薦:
1.《臨床研究設計》,北京大學醫學出版社,2017,Hulley S,Cummings S,Browner w,et al. 著,彭曉霞,唐迅,譯
2.《臨床流行病學》,人民衛生出版社,2011,李立明、詹思延、譚紅專等 臨床流行病學題任務,本文未對此作展開;再如針對診斷能力的評價過程,通常驗證過程包括內部驗證和外部驗證兩個部分方可確證診斷能力水平,本文則以分析方法為主并未對此進行詳細說明,必要時還請結合相關方法學的指導再做探究。
橫斷面研究具有研究周期相對較短、開展較為便利的特征。在現況特征分析,關聯因素分析及診斷能力評價中有著廣泛的應用。研究實施中應特別注重科學問題提煉,研究要素明確,分析方法應用準確。
作者貢獻:李雪迎負責結構設計、撰寫文章;康曉平、遲春花負責結構設計、審閱修訂;王熙誠負責文獻檢索與討論,參與撰寫及制圖;尚美霞負責方法學要點梳理、案例篩選討論;周國鵬負責臨床應用要點梳理、案例篩選討論;高暢負責文章要點梳理、案例篩選討論;潘子涵負責案例分析、應用要點梳理與討論。
本文無利益沖突。