廣西壯族自治區疾病預防控制中心(530028) 崔哲哲 林定文 林 玫 蘇華斌 區 進
結核病和艾滋病可同時在機體中合并發生。若患者得不到及時有效的診斷和治療,兩種病原體及其引起的免疫反應會在體內互相促進,從而導致病情的惡化[1-3]。因此,結核菌/艾滋病病毒(TB/HIV)雙重感染防治工作是近年來結核病防治規劃和艾滋病防治規劃的重點工作。廣西壯族自治區是結核病和艾滋病疫情最嚴重的省份之一,尤其需要加強結核病防治機構和艾滋病防治機構的聯防聯控。本研究希望通過灰色定權聚類分析,對TB/HIV雙重感染防治工作進行綜合分析、評價和集群劃分,達到科學防控和分類指導的目的。
1.數據來源
本研究數據來源于2016年廣西壯族自治區14個市和所轄92個縣(區)上報的TB/HIV雙重感染防治工作年度報表。
2.TB/HIV雙重感染工作流程
(1)患者發現
患者發現工作主要在縣級結核病和艾滋病防治定點診療機構實施。兩個機構對就診者進行登記并提供篩查服務。按照國家衛計委要求,對登記和既往隨訪的艾滋病病毒攜帶者/病人(HIV/AIDS)提供痰檢和胸部影像學檢查;對新登記結核病提供HIV抗體檢測。接診醫生如實在登記本和網絡專病報告系統填寫篩查結果。
(2)治療管理
經篩查確診的TB/HIV雙重感染患者,由艾滋病診療機構進行管理,結防機構向艾滋病治療醫務人員提供抗結核藥品。艾滋病主診醫師根據最新的艾滋病治療指南[4],對患者進行適時治療,同時登記患者治療及結核病轉歸信息,并定期向結防機構反饋。
(3)數據上報
雙重感染防治工作數據每年上報一次,縣級結核病防治機構為初級上報單位。縣級結核病防治機構(部門)對結核病和艾滋病定點診療機構的數據進行復核后,上報市級結核病防治機構(部門)。市級結核病防治機構(部門)進行二次審核和匯總后上報省級結核病防治。省級結核病防治機構(部門)會同艾滋病防治機構(部門)對手工報表和網絡專病報告系統比對后,上報國家疾病預防控制中心。
3. 統計分析
本研究數據用excel進行錄入和匯總,用R語言(V 3.3.2)進行數據清理、線性變換、計算關聯度、建立矩陣等統計分析并繪制聚類系譜圖。
(1)基本情況分析
根據廣西匯總數據分析:① 新登記和既往可隨訪HIV/AIDS的結核病可疑癥狀篩查接受率和結核病相關檢查接受率;② 新登記結核病患者的HIV抗體檢測接受率;③ 新登記TB/HIV雙重感染患者同時接受抗結核和抗病毒綜合治療率;④ 上年度登記TB/HIV雙重感染患者的抗結核治療轉歸。
(2)線性變換和離差矩陣
以市為單位,建立四項關鍵指標的原始數據矩陣,包含14行(市數量)和4列(關鍵指標數);四項指標值均為越高越好;將每列原始數據最大值轉變為1,其他地區的指標參照最大值進行線性變換;對每列最大值設為基準值(理想值)即x0j,計算每列的離差系數并建立離差矩陣。對象i關于j指標的觀測值是某個市的指標值,即xij(i=1,2,…,14;j=1,2,…,4)。xi對于x0在第k點上的相關系數公式如下:
式中,特征參量序列xi=(xi1,xi2,…,xi14);基準特征向量序列x0=(x01,x02,…,x014);ρ∈(0,1),一般取0.5。
(3)灰色關聯度計算
在上式基礎上,用以下公式可計算每個地區的關聯度(ri):
(4)灰色定權聚類分析
在關聯度的基礎上進行灰色聚類分析。灰色聚類法中一個聚類可以看作是屬于同一類的觀測對象的集合。根據分析對象的特性和分析目的分為灰色關聯聚類(同類因素合并)或灰色白化權聚類(研究對象的歸類)。其中灰色白化權聚類又可分為變權和定權兩類。變權聚類適用于指標意義相似的分析,而本研究的各項指標意義和綱量均不同,適用定權聚類模型進行層次分析。在該分析中,先根據上一步完成的離差矩陣建立差異系數矩陣,差異系數e的公式如下:
式中,i=1,2,…,14,j=1,2,…,4
根據差異距離dij=eij+eji,建立距離矩陣(Ds),最后采用灰色相似關系矩陣(Rg)來反映分析對象中各元素互相間的親疏關系。灰色相似關系系數g公式如下:
其中max(DS)為差異距離矩陣中的最大值。交叉比對形成灰色相似關系矩陣。完成所有的交叉比對后,最靠近對角線的一組數據為灰色相關系數。根據灰色相似關系矩陣中的親疏關系繪制聚類系譜圖。根據需要,可在實數(λ)不同水平截斷以劃分集群。
1.基本情況
2016年,廣西14個市的艾滋病和結核病防治機構上報了TB/HIV雙重感染防治工作年報。當年新登記和既往可隨訪HIV/AIDS 67792例,經動員接受結核病可疑癥狀問卷篩查64676 例,問卷篩查接受率為95.404%,接受相關檢查49787例,結核病檢查接受率為73.441%;63個要求開展HIV檢測的結防機構全年新登記結核病人23524例,其中已知陽性274例,接受HIV抗體檢測20441例,檢測接受率87.918%;通過雙向篩查發現的1448例TB/HIV雙重感染患者,同時接受抗病毒和抗結核治療826例,綜合治療接受率為57.044%。上年度登記抗結核治療的755例雙重感染患者,成功抗結核治療(治愈及完成療程) 593例,成功治療率為78.543%。
2.建立原始數據、線性變換和離差矩陣
以市為單位,根據結核檢查接受率、HIV抗體檢測接受率、治療接受率和成功治療率4個關鍵工作指標建立原始數據矩陣。其中,F市的結核檢查接受率最高(95.983%),K市的HIV抗體檢測接受率最高(98.000%),E市的綜合治療接受率最高(100.000%),N市和E市的成功治療率最高(100.000%)。四項主要指標均是越大越好,所以我們把每列的最大值作為最理想基準值,進行線性處理(每列基準值設為1)。在此基礎上進行離差計算(每列基準值為0)并建立離差矩陣,結果見表1。

表1 2016年廣西各市TB/HIV雙重感染防治主要工作指標(%)及離差值矩陣
3.計算灰色關聯系數、關聯度及綜合排名
根據離差矩陣和與基準比較分析,最終計算出每個市每一項指標的關聯系數和綜合關聯度(與基準方案比較的關聯程度),根據關聯度的大小可以將14個市的TB/HIV雙重感染工作指標綜合完成率進行排名,見表2。與基準方案比較的關聯度,只有E市關聯度超過0.9(排名第1),其次是N市(0.89),M市和B市均低于0.6。

表2 2016年廣西各市TB/HIV雙重感染防治主要工作指標關聯系數和關聯度
4.灰色定權聚類分析
將相關系數矩陣進行降維處理(從二維空間向一維空間映射),計算關聯度差異(ES),然后形成相應的對角線為0的差異距離矩陣(Ds)。根據灰色相似系數計算方法可得主對角線為1的灰色相似關系矩陣,見表3。由最靠近主對角線的次對角線上的數據即為各市的灰色相關系數。任取實數λ∈ [0,1]。將λ水平作為縱坐標,橫軸上依據相關系數大小和聚類情況將14個市進行排列,繪制出聚類系譜圖,如圖1。本次評價選擇截斷水平(λ)為0.15。在該水平上,可將14個市分成4個集群。E市和N市集群代表工作指標完成情況最好的市;C市、F市、J市、K市、A市和D市集群代表工作指標完成情況較好的市;I市、G市、H市和L市集群代表了工作指標完成情況一般的市;M市和B市集群代表了工作指標完成情況較差的市。

圖1 2016年廣西各市TB/HIV雙重感染防治工作主要指標完成情況聚類系譜圖
TB/HIV雙重感染防治工作年度報表是總結和評價雙重感染防治工作的重要工具。根據2010年國家衛計委下發的《全國結核菌/艾滋病病毒雙重感染防治工作實施方案(試行)》要求,廣西開始全面實施TB/HIV雙重感染防治工作,并每年、逐級匯總上報防治工作報表。經過多次培訓和專項督導,數據上報的質量已經得到明顯改善。經逐級的審核,數據真實性較高,邏輯關系正確。但是,如何綜合評價各地區開展結核病、艾滋病雙向篩查及雙重感染患者治療管理工作,仍是亟待進一步探索的問題。
2016年是全國結核病防治十二五規劃(以下簡稱“十二五規劃”)向十三五規劃過渡的關鍵年度。TB/HIV雙重感染工作作為十二五規劃的重要工作,其指標完成的好壞關系到了下一輪規劃的調整。從總體情況來看,2016年廣西新登記和既往可隨訪的HIV/AIDS基數仍然較大,給結核病篩查帶來了一定的困難,但結核篩查接受率(結核病可疑癥狀問卷篩查)還是達到了國家的要求(90%)。63個艾滋病重點篩查縣區的HIV抗體檢測接受率也達到了國家要求的70%。但是,未納入十二五規劃考核指標的抗結核和抗病毒綜合治療率卻一直處于低勢,近幾年均維持在60% 左右[5]。這說明部分地區的艾滋病防治機構和結核病防治機構在TB/HIV雙重感染患者治療管理環節存在銜接不足的問題。不同地區的指標完成情況存在差異。鑒于以上原因,本研究運用灰色聚類法,對工作指標進行轉換、整合和降維,以實現對各市TB/HIV綜合指標完成情況的客觀評價。

表3 2016年廣西各市TB/HIV雙重感染防治主要工作指標的相似關系矩陣
灰色系統是20世紀80年代中國統計學家鄧聚龍教授創立的統計理論[6]。其優勢在于其克服了統計概率統計的弱點,從“小樣本”和“貧信息”中梳理出有用的信息,計算過程簡單。灰色聚類作為灰色模型的一個,是一種將一些觀測指標或觀測對象劃分成若干個可定義類別的方法。此前,該法主要運用于經濟領域解決中小企業聯盟伙伴的選擇問題[7],以及運用于環境領域對水體污染礦層質量進行分類[8-9]。本研究嘗試運用灰色分析技術建立TB/HIV雙重感染防治工作質量評價體系。所運用的灰色定權聚類模型不但可以根據與理想值的綜合關聯度對需考核的個體進行排名,還可以根據系譜圖科學識別各項工作指標及綜合工作水平類似的集群,為結核病防治規劃管理部門開展工作質量評價和分類指導提供依據。本研究最終實現了對14個市TB/HIV雙重感染防治工作綜合質量進行科學比較。若λ選擇在0.2的水平,則只能鑒別出指標完成較好的市,不能區分中等和較差的市;而λ值過小則失去了劃分集群的意義。綜合考慮,最適合的水平為0.15,在此水平劃分出了4個集群(最好、較好、一般、較差)。建議衛生行政部門對工作指標完成情況較差的地區進行重點監督和指導。同時可向指標完成情況最好的2個地區借鑒工作經驗,以期達到TB/HIV雙重感染防治工作均衡發展的目的。
[1] Dheda K,K.Schwander SK,Zhu BD,et al.The immunology of tuberculosis:From bench to bedside.Respirology,2010,15(3):433-450.
[2] Agarwal SK,Singh A,Anuradha S,et al.Cytokine profile in human immunodeficiency virus positive patients with and without tuberculosis.J Assoc Phys India,2001,49:799- 802.
[3] Lawn SD,But era ST,Folks TM,et al.Cont ribut ion of immune act ivation to t.6he pathogenesis and transmission of human immunodeficiency virus type 1 infection .Clin Microbiol Rev,2001,14( 4) :753-777.
[4] World Health Organization.Guideline on when to start antiretroviral therapy and on pre-exposure prophylaxis for HIV.Geneva:World Health Organization,2015.
[5] 崔哲哲,馮啟明,林玫,等.2010-2013年廣西TB/HIV雙重感染監測數據分析與評價.廣西醫學,2015,37(3):364-367.
[6] 鄧聚龍.灰色控制系統.華中理工大學出版社,1985.
[7] 黃會群.灰色關聯分析和粒子群優化算法相融合的合作伙伴選擇.計算機應用,2015,35(4):1045-1048.
[8] 孫維萍,于培松,潘建明.灰色聚類法評價長江口、杭州灣海域表層海水中的重金屬污染程度.海洋學報,2009,31(1):79-84.
[9] 焦明連.基于灰色聚類分析的礦山環境質量評價.煤礦開采,2016,2:78 - 82.