天津醫科大學公共衛生學院流行病與衛生統計學系(300700)張甜甜 崔 壯 宋德勝 姚婷婷 陳 陽 于澤洋 黃慧杰 張洪璐 李長平 劉媛媛
【提 要】 目的 探討潛在類別分析在男男同性戀(men who have sex with men,MSM)人群分類中的應用,識別HIV感染風險高的MSM人群潛在類別,為采取有針對性的干預措施提供科學依據。方法 將文化程度、戶籍所在地、天津本地居住時間、最近一次安全套使用情況、安全套使用頻率、最近6個月內的異性性行為作為顯變量進行潛在類別分析,對MSM人群進行分類。對不同潛在類別的MSM進行人口學和危險性行為的差異性分析;將是否感染HIV作因變量,潛在類別作自變量進行logistic回歸,分析不同潛在類別MSM的HIV感染風險;進一步將年齡、商業性行為等作為協變量納入潛在類別分析。結果 根據潛在類別模型擬合結果得到3個潛在類別的模型為最佳模型,MSM人群的三個潛在類別分別為:“外地危險行為組”811(15.7%)人,“外地安全行為組”2291(44.33%)人,“本地相對安全行為組”2066(39.98%)人,其中以外地危險行為組MSM感染HIV風險最高。該類人群的多人性行為比例顯著高于其他兩類人群,且衛生服務接受情況及HIV檢測顯著低于其他兩類人群。結論 潛在類別分析可以用于MSM人群的分型研究,探索不同潛在類別人群的HIV感染情況及人口學、行為學特點,為合理分配衛生資源,有針對性地提供干預措施提供科學依據。
UNAIDS最新數據表明,截至到2018年,全球共有3790萬艾滋病患者,并且HIV感染者數量仍呈持續上升趨勢[1]。如何有效地控制HIV傳播,降低HIV感染者人數是國內外亟待解決的問題。
男男同性戀者(MSM)因多性伴、無保護性肛交(UAI)、低安全套使用率、缺乏定期檢測等高危行為[2-4],其HIV感染風險遠高于一般人群[5-6],是普通成年男性的23倍[1]。據中國疾病預防控制中心(CDC)數據顯示,在2018年新增的149 000 HIV感染者中,23.3%的感染者其感染途徑為男性性傳播[7]。正因如此,在HIV防控工作進展的同時,我們應該著重控制MSM人群HIV的傳播。
2013年我國衛生部在61個城市開展的艾滋病綜合防治試點調查發現,浴池型MSM的HIV感染率、梅毒患病率和UAI的比例明顯高于一般MSM[8]。因此,2011年11月,中國CDC、天津市CDC與美國CDC合作,以天津市MSM浴池作為中國的第一個試點,開展浴池MSM的HIV防控干預項目。因此,了解浴池MSM群體人口學以及危險性行為特征,找到高感染風險的MSM亞群,可為實行有針對性的精準干預提供科學依據。
在既往的MSM人群的調查研究中,人口學特征、行為因素與HIV感染的關聯性分析多采用回歸模型,評價危險因素的平均效應以及因素間的一級交互效應,卻很難解釋多個因素的交互作用[9-10]。潛在類別分析( latent class analysis,LCA )是基于現有的數據結構分析目標人群潛在類別的一種統計分析方法。通過將特征相似的個體分為一組,達到同時評價多個危險因素的交互效應的目的。
為探究MSM人群的人口學和危險性行為在HIV感染風險中的多維度特性,我們采用LCA方法,分析天津浴池的MSM人群的人口學以及危險性行為特征,得到浴池MSM的潛在類別。通過比較不同潛在類別的MSM的人口學及危險性行為差異,以及不同潛在類別的MSM的HIV感染風險,揭示MSM人群HIV高感染風險的亞組人群,有助于我們識別HIV感染風險高的MSM,為實行有針對性的防控工作提供科學依據。
1.研究對象
本研究是從2011年3月31日開始實行,截至到2018年10月1日,共納入5168名MSM,其中HIV感染者564人,HIV陰性者4604人。本研究的納入標準為自報是男男同性戀者,且在過去12個月內與男性有過性行為。
2.抽樣方法
由于MSM是特殊群體,因此本研究采用雪球抽樣。在天津浴池,自愿咨詢治療服務站(VCT)的工作人員均是男男同性戀者,同時他們也是天津深藍工作組的工作人員。前來檢測和咨詢的MSM需簽署知情同意書,且在咨檢前需在艾滋病預防管理系統中錄入指紋,并生成唯一的指紋識別號,用以記錄和追蹤MSM的問卷和檢測信息。為保證研究的客觀性和及時性,該系統無管理員許可不能進行篡改。VCT工作人員采用圈內話術與咨檢的MSM進行交流,并且在整個交流過程中填寫調查問卷。完成調查問卷之后,對MSM進行HIV快速檢測,檢測結果將在20分鐘之后遞交受檢人員。在等待檢測結果的這段時間,工作人員會根據該受檢者的問卷調查情況對其進行風險評估,并對他們進行有針對性地安全性教育。出現快速檢測為陽性的受檢者將會提供陽性咨詢,并接受WB(western plot)檢測以確證HIV感染狀況。對于HIV確診檢測為陽性者,將提供標準化HIV治療服務。對于所有的受檢MSM,工作人員會發放免費的安全套和潤滑油,并且鼓勵他們帶性伴或朋友進行檢測。除此之外,為保護受檢者隱私,HIV的檢測和咨詢均是在私密的房間內進行。除負責檢測的工作人員外,只有受檢者本人知道自己的感染狀況。
3.研究設計
本研究針對目標人群設計“浴池健康服務”問卷,問卷內容包括:人口學信息(年齡、戶籍所在地等),行為學信息(最近一次肛交安全套使用情況、安全套使用頻率、最近6個月商業性行為、最近6個月異性性行為等),HIV知識,藥物使用,其他性傳播疾病的感染狀況以及HIV意識和衛生服務使用情況在內的42道問題。除此之外,問卷還包括是否是MSM浴池的男男性工作者,HIV檢測及復檢結果在內的5道問題,將由天津浴池的工作人員填寫。
4.潛在類別模型(latent class model,LCM)基本原理
潛在類別模型基于描述多個潛變量關聯的結構方程模型和尋找多變量模型中潛在公因子的因子分析的理念加以發展,完善既往模型對類別潛變量處理的不足,提升分類變量的利用度。當目標群體內存在多個分布不同的亞組,且各亞組所占比例未知時,利用潛在類別分析構建潛變量解釋群體內存在的異質性[11],從而將目標人群分類。該模型基于兩個基本假設:(1)所有樣本能且僅能分入一個潛在類別中,各類別相互獨立且不相交;(2)局部獨立性假設,即在特定的潛在類別下,顯變量相互獨立。其分析過程包括模型參數化、參數估計、模型識別、擬合優度評價、潛在分類與結果解釋等[12]。
(1)概率參數化(probabilistic parameterization):概率參數化包括兩種類型的分類變量:顯變量(manifest variable)和潛變量(latent variable);兩種類型的參數:潛在類別概率(latent class probabilities)和條件概率(conditional probabilities)。LCM假定任意兩個觀測變量之間的關系可以由潛變量解釋。現假定A、B、C、D為四個顯變量,潛在類別模型可以表達為:
(1)
(2)模型估計與模型擬合:模型估計包括EM(expectation-maximization)算法和NR(newton-Raphson)算法。比較模型適配度的指標有log likelihood檢驗,Akaike information criterion(AIC),Bayesian information criterion(BIC)和樣本校正的BIC(aBIC)。其中,AIC準則和BIC準則在LCA方法中應用最為廣泛[13],兩者的數值越小表明模型適配度越好。當樣本量大于1000時,BIC指標較AIC可靠。當樣本量小于1000時,AIC指標優于BIC[14]。Entropy指數用來評估分類的精確程度,取值范圍在0~1之間。當Entropy=0.6時,表明約有20%個體存在分類錯誤,Entropy在0.8左右時,表明分類的準確度超過90%[15]。
(3)潛在分類:經過以上模型假定、估計、評價等確定模型后,接下來是將各組觀察值分類到適當的潛在類別中,來說明觀察值的后驗類別屬性(posterior membership)。
5.數據分析
本研究的所有的數據分析使用SAS 9.4進行。潛在類別分析使用SAS中的PROC LCA 來執行[16]。P<0.05表明有統計學意義。本研究共納入6個顯變量,包括文化程度、戶籍所在地、天津本地居住時間、最近一次安全套使用情況、安全套使用頻率、最近6個月內的異性性行為。我們通過6個顯變量采用LCA方法將該人群劃分為不同的潛在類別,采用卡方檢驗進一步分析不同潛在類別的MSM人口學和行為學差異,通過logistic回歸分析研究不同的潛在類別人群HIV感染風險,為干預措施的實施以及衛生資源的分配提供科學依據。我們進一步分析帶有協變量的LCA,將年齡、最近6個月商業性行為、最近6個月多人性行為、1年內安全套宣傳和發放情況、1年內艾滋病檢測、MSW作為協變量納入LCA,提高模型的參數估計值的準確性,從而降低分類誤差。
1.模型擬合和選擇
本研究共納入5168名MSM,對這5168名MSM進行潛在類別分析。將潛在類別數分別設置在3、4、5,LCA擬合統計結果見表1。由于AIC與BIC最小為模型最優的衡量標準,且在樣本量大于1000時,BIC為主要衡量指標,因此我們考慮將類型設置為三分類。在三分類時,模型的BIC最低且Entropy為0.78,表示該模型的準確度較高,具有合理性。我們根據MSM后驗概率值最大對其進行分類,可將該人群分為三個潛在類別,即Class1 :戶籍為外地,安全套使用頻率低且(或)最近一次肛交未使用安全套,命名為“外地危險行為組”;Class 2:戶籍為外地,最近6個月安全套使用頻率高且最近一次肛交使用安全套,命名為“外地安全行為組”;Class 3:戶籍為本地,最近6個月安全套使用頻率相對較高且(或)最近一次肛交使用安全套,命名為“本地相對安全行為組”,見圖1。

表1 潛在類別模型擬合結果

圖1 三類MSM人群各變量的響應概率
2.三類潛在類別人群的差異性分析
三類人群在HIV患病率、年齡、文化程度、6個月多人性行為、6個月內商業性行為、6個月內異性性行為、1年內安全套的宣傳和發放、1年內艾滋病檢測、是否是同志浴池MSW、與異性的婚姻狀況方面均有統計學差異。其中,外地危險行為組的HIV感染率(15.54%)最高,其次是外地安全行為組(12.05%),以本地相對安全行為組的HIV感染率(7.84%)最低。在人口學方面,外地MSM的年齡低于本地MSM的年齡,其中以外地安全行為組的年齡最低,且外地MSM的單身、離異、喪偶的比例高于本地MSM。除此之外,外地危險行為組的文化程度為三類人群最低,其次是外地安全行為組。在危險性行為方面,外地危險行為組的MSM最近6個月多人性行為的比例最高,其次是本地相對安全行為組。外地MSM商業性行為的比例以及男性性工作者(MSW)的比例均高于本地MSM。除此之外,外地危險行為組的MSM一年內接受安全套宣傳和發放以及HIV檢測的比例為三類人群最低(表2)。

表2 三類人群差異性分析
3.三類潛在類別人群的logistic回歸分析
與本地相對安全行為組相比,外地危險行為組HIV感染風險的OR值為2.16(95%CI:1.69~2.77,P<0.0001);外地安全行為組HIV感染風險的OR值為1.61(95%CI:1.31~1.97,P<0.0001)。在調整年齡、婚姻狀況、文化程度、最近6個月是否有多人性行為、商業性行為、異性性行為、最近一年HIV檢測以及衛生服務接受情況、是否是MSW之后,與本地相對安全行為組相比,外地危險行為組HIV感染風險的調整OR值為2.27(95%CI:1.74~2.96,P<0.0001);外地安全行為組HIV感染風險的調整OR值為1.52(95%CI:1.22~1.89,P=0.0002)。

表3 三類潛在類別人群HIV感染狀況分析
本研究采用LCA將MSM人群分為三個亞組,分別是外地危險行為組、外地安全行為組和本地相對安全行為組。我們發現,外地(不論是否進行危險行為)MSM,其HIV感染風險均高于本地MSM,且該人群更低齡,文化水平偏低,未婚離異喪偶的比例更高。外地危險行為組是三類MSM中HIV感染風險最高的人群,更傾向于進行多人性行為,且MSW比例較高。該類人群在一年內接受衛生服務以及HIV檢測在三類人群中的比例最低。除此之外,本地相對組的MSM商業性行為,MSW、未婚離異喪偶比例為三類人群最低且衛生服務接受情況為三類人群最高。這提示有關衛生部門,除了針對外地MSM進行規律性的衛生服務以及定期的HIV檢測外,還應對其進行安全教育,以提高該類人群安全性行為。通過本項研究,為MSM人群有針對的實施干預措施,合理分配衛生資源提供科學依據。
本研究存在一定的局限性:(1)本研究納入LCA中的變量較少,雖能在一定程度反應MSM人群的行為和人口學信息。(2)本研究的MSM人群采用雪球抽樣獲得。該抽樣方法雖具有一定的偏性,但是本研究是基于天津浴池開展,天津浴池聚集了全國各地的MSM,可在一定程度上降低抽樣方法帶來的偏性。