陳 潔,陳 樹,尹玉峰,常 新,武 劍
(蘇州大學附屬第一醫院 風濕免疫科,江蘇 蘇州 215000)
骨質疏松癥是由于各種原因導致骨的密度和質量下降,造成骨微結構破壞和脆性增加,從而導致骨折容易發生的一種全身性骨病。隨著老齡化人口的增加,骨質疏松和骨質疏松性骨折逐漸成為全球關注的健康問題之一,據統計,中國50歲及以上男女骨質疏松癥年齡標準化患病率分別為6.46%和29.13%[1]。雙能X線吸收測定法(dual X-ray absorptiometry,DXA)是骨密度(bone mineral density,BMD)測定的常用方法之一,是世界衛生組織(WHO) 診斷骨質疏松的金標準[2],但當出現壓縮性骨折、脊柱退行性變、骨贅形成等可能影響真實骨密度的情況時該種方法可能造成骨質疏松檢出率下降[3]。Pickhardt等[4]報道通過讀取椎體的CT值可以快速鑒別骨質疏松癥或正常骨密度患者,可以避免皮質骨和異常區域的影響。目前,關于DXA和腰椎CT值對骨質疏松癥診斷的研究較多,但不同研究之間所得出的結論差別較大。本研究通過收集同時使用DXA和腰椎CT值兩種方法診斷骨質疏松癥的研究數據,并進行meta分析,旨在闡明腰椎CT值作為骨質疏松癥診斷方法的價值。
1.1文獻檢索 通過計算機檢索包括PubMed、Cochrane Library、Web of Science、中國知網、萬方及維普等中外數據庫中關于腰椎CT值診斷骨質疏松患者的相關研究并提取基本資料和四格表數據(檢索時限從建庫至2021年12月),采取主題詞和自由詞結合的策略進行文獻檢索, 中文檢索詞: (“CT值”或者“機會性CT”或者“CT衰減值”)并且(“雙能X線吸收法”或者“雙能X線骨密度檢測”或者“DEXA”或者“DXA”)并且“骨質疏松”;英文檢索詞:(“Opportunistic CT” OR “CT attenuation” OR “Hounsfield Unit” OR “computed tomography” OR “Opportunistic Screening”) AND (“Dual-Energy X-Ray Absorptiometry” OR “DEXA” OR “DXA”) AND “osteoporosis”。
1.2文獻納入及排除標準 納入標準:①同時使用DXA和腰椎CT值對骨質疏松癥進行診斷,即所納入的文獻中同時包含雙能X線結果和腰椎CT值結果,采用WHO推薦的T值評分法作為骨質疏松癥診斷的金標準;②納入的文獻臨床資料完整,能從文獻提取完整的診斷四格表結果。排除標準:①動物實驗、病例報道、綜述、薈萃分析等二次研究;②無原始數據或無法通過計算獲得真陽性值(TP)、假陽性值(FP)、真陰性值(TN)、假陰性值(FN);③原始文獻臨床研究設計不合理(如對照組設計不合理,樣本資料交代不全,病例組為腰椎退行性變、強直性脊柱炎的人群[5-6]等)。
1.3研究質量的評價 由兩位研究者獨立篩選文獻,通過閱讀標題和摘要對檢索到的文獻進行初步篩選,初篩符合納入標準的文獻進行閱讀全文,若出現對所納入的文獻意見不一的情況,進行討論無結果時請第3位研究者進行判斷。對篩選所得文獻采用Revman 5.4軟件提供的診斷試驗質量評價工具QUADAS-2量表進行偏倚風險評價[7]。該標準包含有4個域的評價:病例選擇、待評價試驗、金標準、病例流程和進展情況, 從偏倚風險和適用性兩個方面進行。一共有11個條目, 根據每個部分納入的相關標志性問題回答是、否或不確定, 當所有回答均為“是”則判定為低風險, 有1個回答為“否”則判定為高風險, 有1個回答為“不確定”時則風險評估為不清楚;所有部分均評估偏倚風險, 臨床適用性評價僅針對病例選擇、待評價試驗、金標準進行[8]。
1.4數據提取 一般信息包括文章題目、研究作者、國家、發表年份、研究類型、樣本量、研究對象平均年齡、CT值的診斷閾值等信息;診斷參數信息包括TP、FP、TN、FN。
1.5統計學方法 根據所測量的椎體不同,一共分為6個組,使用Meta-disc 1.4軟件對各研究的敏感度(sensitivity,SEN)及特異度(specificity,SPE)進行合并、計算陽性似然比(positive likelihood ratio,PLR)、陰性似然比(negative likelihood ratio,NLR)、診斷比值比(DOR)及其95%可信區間(confidence interval,CI),并進行綜合受試者工作特征(SROC)曲線分析,估計SROC曲線下面積(area under curve,AUC)。閾值效應和非閾值效應造成診斷性試驗的異質性,通過計算敏感度對數與(1-特異度)對數的Spearman相關系數檢驗其閾值效應所造成的異質性,非閾值效應則通過計算診斷比值比的Cochran-Q值檢驗。若P>0.05則無統計學異質性,選用固定效應模式,反之則選用隨機效應模型。通過meta回歸分析尋找異質性來源。
2.1檢索結果及納入文獻基本情況 按照先前確定的檢索策略,初步檢索到了2 772篇相關文獻,通過文獻管理軟件剔除471篇重復文獻,再通過閱讀論文題目和摘要排除了2 214篇不相關文獻,最后閱讀全文篩選不符合納入標準及無法提取完整四格表的文獻,最終納入了13篇文獻[4, 9-20],包括11篇英文文獻,2篇中文文獻,見圖1,表1。

圖1 文獻篩選流程及結果

表1 納入文獻的一般特征及四格表
2.2文獻質量評價 納入的13篇文獻均為回顧性研究,研究設計類型為病例對照設計,因此在病例選擇的偏倚風險方面評價為高風險。13篇文獻均以雙能X線檢查結果為診斷骨質疏松患者的金標準,納入文獻的研究人群為非脊柱退行性變等影響骨密度的人群,因此該金標準能準確分辨目標疾病狀態,在金標準方面均為為低風險。各研究明確描述待評價檢測技術的操作方法及CT值讀取的區域,除1項研究[9]中兩種檢查時間間隔不明外,其余研究中兩種檢查時間均不超過6個月,有 8 篇文獻[4, 10-16]表明未強調是否預先確定了閾值。有13篇文獻在病例流程偏倚方面被判定為低風險,見圖2。

圖2 應用QUADAS-2評分對納入文獻進行質量評估的情況
2.3Meta分析結果 依據測量腰椎椎體不同分成6個組,分別匯總不同腰椎的CT值診斷骨質疏松的準確性,見表2。

表2 不同腰椎的CT值診斷骨質疏松meta分析結果
2.3.1L1椎體的CT值診斷骨質疏松的準確性 本組納入10篇文獻,共納入3 907組數據,Spearman相關系數為-0.127(P=0.726>0.05),提示各項研究中不存在閾值效應,計算診斷比值比的Cochran-Q值(Cochran-Q=50.57,P<0.05),提示納入的研究存在非閾值效應引起的異質性。按照以下因素進行meta回歸分析, 尋找異質性的可能來源:納入研究的地區(分為亞洲組和歐美組)、樣本量(分為樣本量<200、樣本量200~1 000及樣本量>1 000)、納入研究患者的平均年齡(分為平均年齡>60歲、平均年齡≤60歲及未知組),結果發現平均年齡可能是異質性來源。L1的CT值對骨質疏松癥診斷的合并敏感度為0.75(95%CI:0.72-0.77),合并特異度為0.72(95%CI:0.70-0.73),擬合SROC曲線下面積為0.8126,見圖3~6。根據不同年齡進行亞組分析,見表3。

表3 L1的CT值診斷骨質疏松的亞組分析結果
2.3.2L2椎體的CT值診斷骨質疏松的準確性 本組納入3篇文獻,共納入2 435組數據,Spearman相關系數為0.500(P=0.667>0.05),提示不存在閾值效應,計算診斷比值比的Cochran-Q值(Cochran-Q=1.43,P=0.4903>0.05),提示納入的研究間不存在由于非閾值效應引起的研究間的異質性。匯總敏感度為0.73(95%CI:0.70-0.77),匯總特異度為0.75(95%CI:0.73-0.77),擬合SROC曲線下面積為0.8010。
2.3.3L3椎體的CT值診斷骨質疏松的準確性 本組納入3篇文獻,共納入2 449組數據,Spearman相關系數為-0.500,P=0.667>0.05),提示不存在閾值效應,診斷比值比的Cochran-Q值(Cochran-Q=2.59,P=0.2742>0.05),提示納入的研究間不存在非閾值效應引起的異質性。合并敏感度以及特異度等指標,其匯總敏感度為0.78(95%CI:0.75-0.81),匯總特異度為0.72(95%CI:0.70-0.74),擬合SROC曲線下面積為0.7935。

圖3 L1的CT值對骨質疏松癥DOR的森林圖

圖4 L1的CT值對骨質疏松癥診斷合并敏感度的森林圖

圖5 L1的CT值對骨質疏松癥診斷合并特異度的森林圖

圖6 L1的CT值診斷骨質疏松癥的SROC曲線
2.3.4L4椎體的CT值診斷骨質疏松的準確性 本組納入2篇文獻,共納入2 313組數據,計算診斷比值比的Cochran-Q值(Cochran-Q=0.01,P=0.9043>0.05),提示納入的研究間不存在由于非閾值效應引起的異質性。合并敏感度以及特異度等指標,其匯總敏感度為0.76(95%CI:0.73-0.79),匯總特異度為0.73(95%CI:0.70-0.75)。
2.3.5L5椎體及L1-L4椎體平均CT值診斷骨質疏松的準確性 由于測量L5椎體CT值及L1-L4椎體平均CT值的數據僅有一組,因此并未對這兩組數據進行效應量的合并。
骨質疏松癥患病率隨著年齡增長而增高,骨折是其嚴重后果之一,因此盡早診斷和防治骨質疏松癥,在高危人群中進行疾病篩查具有重要意義。雙能 X 線骨密度檢測是目前應用最為廣泛的骨密度檢測技術,但有研究表明,骨贅形成、韌帶鈣化等影響骨密度值的測量,可能造成骨質疏松癥的漏診[21]。在本文中,我們評估了腰椎CT值作為骨質疏松癥診斷的準確性。CT值是CT圖像中各組織與X線衰減系數相當的對應值,是測定人體某一局部組織或器官密度大小的一種計量單位,通常稱亨氏單位(hounsfield unit,HU)。使用椎體CT值對骨質疏松進行篩查具有以下優點:①由于是根據其他適應證所獲取的CT掃描,因此避免了額外的輻射暴露、費用及時間[22];②醫生可以自主選擇感興趣的區域讀取CT值,所選取的區域包括盡可能多的小梁骨,避免皮質骨和異常區域的影響,如后靜脈叢、骨島及偽影等區域,在CT圖像上還可以發現骨折等異常;③讀取CT值方法簡單,經過簡單的培訓后非放射科醫生也可以獲取。但CT值診斷骨質疏松癥在人群中尚未建立起統一的標準,不同人種、年齡、性別、甚至不同椎體之間的CT值都存在一定的差異。
本研究通過匯總13篇文獻,得到了椎體CT值對于骨質疏松癥診斷的合并診斷敏感度及特異度。結果表明,L1的CT值對于鑒別骨質疏松癥診斷準確性較好, 其合并敏感度及特異度分別為0.75(95%CI:0.72-0.77), 0.72(95%CI:0.70-0.73), SROC曲線下面積為0.8126,提示其診斷效能尚可。似然比是將敏感度和特異度結合起來的指標,是一個相對穩定的綜合指標。本研究合并PLR為2.54(95%CI:2.00-3.23),合并NLR為0.36(95%CI:0.27-0.48),結合SROC曲線和似然比結果,尚不能認為其具有較高的準確性。異質性是meta分析研究中的一個關鍵問題。計算得到的Spearman相關系數表明本文中不存在閾值效應引起異質性。使用Meta-Disc進行meta回歸后提示異質性來源與平均年齡有關。其余腰椎的合并效應量見結果部分。
本研究也存在局限性:①納入的研究間異質性較大,存在非閾值效應引起的異質性。②納入的研究使用不同的掃描系統、造影方案和管電壓,所獲取的CT衰減值可能因此存在影響。③納入研究的數量少,未進行亞組分析等探索異質性的來源;部分納入研究的分組由于數據較少,無法繪制SROC曲線及合并效應量,數據的說服力有限, 有待更多的大樣本的研究予以驗證。
總之,腰椎CT值在骨質疏松癥的篩查方面具有一定意義,而其確診能力欠佳, 故對于骨質疏松的高危人群可使用CT值進行篩查,確診還需結合其他檢查結果綜合分析。