俞仁武 張屏
在人們生活方式逐漸改變,生活壓力、工作壓力逐漸增加的過程中,近年來艾滋病的患病人數也在逐漸增加,現階段已成為了一個全球性的社會問題和公共衛生問題。國內外學者在疫情和估計方面開展了大量的實踐研究和理論研究,其目的則是為了對艾滋病的流行趨勢和流行現狀進行準確掌握[1-4]。數據質量與大規模多中心流行病學研究之間的關系非常密切,數據質量的好壞會對分析結果的準確性造成直接影響[5-6]。本研究中主要分析評價了我區艾滋病示范區人類免疫缺陷病毒(Human Immunodeficiency Virus,HIV)篩查項目數據質量,希望能為HIV新發感染率和陽性率的預測提供準確數據,現做如下分析。
于2017年1—12月在福建省泉州市洛江區抽取5 465例居民,開展健康體檢和問卷調查;調查對象主要來源為婚檢、產檢、門診、手術、娛樂場所。全部入選對象均為當地戶籍;嚴重軀體疾病患者、器質性精神疾病史患者、語言表達障礙患者應排除本研究。全部5 465例居民中,2 168例男性,3 297例女性;年齡為15~50歲,平均為(31.2±5.4)歲;其中婦幼所婚檢+產檢2 305例,鄉鎮衛生院產檢+門診+手術3 090例,疾控中心娛樂場所70例。
由洛江區疾病預防控制中心的相關工作人員負責收集調查對象的個人信息,開展包含HIV篩查的健康體檢,統計分析艾滋病史、艾滋病預防措施實施情況、HIV抗體篩查情況等變量。在開始調查之前,應加強調查員的培訓工作,在完成調查后應對問卷進行復核,及時發現和糾正存在的問題。
(1)及時性:體檢日期到錄入日期的時間間隔;(2)準確性:通過邏輯錯誤率來對準確性進行評估[7];(3)完整性:從變量確實率和人次缺失率來對完整性進行評估[8];(4)代表性:標準人口為項目區第六區人口普查所得到的人口構成情況,以樣本人群與標準人口年齡構成的擬合程度進行比較。
采用Excel錄入分析數據,選擇在線錄入的方法。
在年齡構成方面,不管是分性別人群還是全人群,項目區人口普查戶籍人口與調查樣本兩者相似,結果表明樣本人群具有較好的代表性,如表1。
建立個人檔案的共5 465例,其中接受健康體檢的共5 397例,利用身份證號進行匹配,共5 352例同時建立了個人檔案、接受了健康體檢。個人檔案信息包括民族、性別等,而健康體檢內容則包括HIV抗體篩查,所以最終接受完整性分析的調查對象共5 352例。本次調查的人次缺失率為17.64%(944/5 352),整體完整率為82.36%(4 408/5 352)。
共63例確診為艾滋病,有艾滋病既往史但是HIV篩查結果顯示為“陰性”的邏輯錯誤率為6.35%(4/63);在自填的“性別”與身份證號推測的“性別”方面,兩者不一致率為0.21%(11/5 352);于數據錄入日期相比較,體檢日期的邏輯錯誤率為1.80%(96/5 352)。
本次調查共5 072例錄入正確,開始體檢到錄入數據的時間間隔為0~365天;時間間隔≥90天的共51例,占比為1.01%(51/5 072),如表2。
艾滋病是因為人感染免疫缺陷病毒(HIV)所導致的一種慢性致死性疾病。在HIV流行地區實施大規模人群HIV篩查工作,對HIV/AIDS進行早期尋獲,同時及時實施高效逆轉錄病毒療法,則能讓臨床病死率降低,讓艾滋病二代傳播減少。
衛生行政部門在制定決策、實施管理工作時,衛生統計數據是主要的科學依據之一,在制定衛生政策時,衛生統計數據會直接影響其科學性[9]。而客觀和準確地評價數據質量,則能對數據質量進行不斷提高和改進[10]。現階段大部分人僅通過數據準確性來對數據質量進行評估,但是數據質量卻是一個綜合概念,僅通過數據準確性無法客觀評估數據質量[11]。所以在對數據質量進行評估時,也應從多方面入手,對數據質量進行綜合評估。本研究中則從數據準確性、錄入及時性、數據完整性以及樣本代表性等方面來對數據質量進行評價。
本研究中,在年齡構成方面,不管是分性別人群還是全人群,項目區人口普查戶籍人口與調查樣本兩者相似,結果表明樣本人群具有較好的代表性,可將調查結果外推到項目區的整體。在對數據質量進行評估時,數據完整性是比較基本的一項標準,如果數據不完整,則會降低其可利用性[11]。本研究中,本次調查的人次缺失率為17.64%(944/5 352),整體完整率為82.36%(4 408/5 352);出生日期、姓名、體檢日期、居住地址、戶籍地址、行政區域等變量未出現缺失,而HIV抗體篩查、手術史、性別等指標的缺失率則<2%,有無采取艾滋病預防措施、民族、婚姻狀況等指標的缺失率則比較高,出現該情況主要是因為上述條目并不是問卷中的必填項目,部分調查對象為了節省時間而未填寫[12]。臨床研究結果顯示,如果數據缺失率>40%,就算填充缺失數據也無法取得比較理想的效果,導致數據的利用價值喪失[13-14]。所以在開展大規模流行病學研究時,應組建質量控制小組,對數據質量進行嚴格把關。

表1 人口普查戶籍人口與項目縣樣本認可的年齡構成比較(%)

表2 數據錄入情況觀察
數據錄入的及時性雖然不會對分析結果和數據自身的質量造成影響,然而卻會對數據的利用價值造成一定影響[15]。本研究中,整體正確錄入5 072例,開始體檢到錄入數據的時間間隔為0~365天;時間間隔≥90天的共51例,占比為1.01%(51/5 072)。時間間隔較長會降低數據時效性,因此應讓時間間隔縮短。
總之,我區艾滋病示范區的樣本人群代表性比較理想,但是在錄入及時性、調查數據準確性以及完整性方面卻并不理想,需要進一步提升,進而為衛生行政部門制定決策和開展管理工作提供更加準確和科學的衛生統計數據,為艾滋病的防治提供指導。