張旭胤,郭銀霞,PAXON Julien Michael,ABDETA Bogale Girma,杜永浩,牛剛
作者單位:西安交通大學第一附屬醫院影像科,西安 710061
下腰痛(low back pain, LBP)是導致全球不同性別人群殘疾的三大原因之一[1],腰椎間盤退變(lumbar intervertebral disc degeneration, LIVDD)是造成下腰疼痛的常見原因。腰椎間盤退變早在無癥狀的青年時即已發生[2],隨著年齡的增加,退變程度逐漸加重[3]。有研究表明,采用細胞、基因及生長因子等治療方法可對退變的椎間盤進行修復,緩解癥狀[4]。因此,早期診斷椎間盤退變對椎間盤的早期治療有著重要的臨床意義。傳統MRI 基于T2 加權成像通過觀察腰椎間盤信號和形態學的改變來評價腰椎間盤退變,是一種定性的方法。T2 mapping 通過測定橫向弛豫時間能夠定量評價腰椎間盤退變,但髓核橫向弛豫時間能否區分腰椎間盤的早期退變仍有爭議[5-6],同時尚未有大樣本的研究。因此,本研究擬對腰椎間盤在不同程度的退變過程中髓核橫向弛豫時間的變化規律進行探索分析,以作為臨床應用的重要參考依據。
在維普網、萬方數據、中國知網數據庫檢索中文文獻,在PubMed、EMBASE、Cochrane Library 數據庫檢索英文文獻。中文數據庫的檢索策略是“腰椎間盤退變”and“T2 map or T2 mapping or T2 值”;使用主題詞以及自由詞對英文數據庫進行檢索。檢索詞主要包括“intervertebral disc degeneration”“lumbar”“T2 mapping”“T2 map”“T2 value”“T2 relaxation time”。追溯了納入文獻中相關的參考文獻。
納入標準:(1)自數據庫建庫至2021 年10 月31 日發表的中英文文獻;(2)研究對象不小于20 人;(3)資料完備(至少包含髓核T2 弛豫時間);(4)使用Pfirrmann五分級法評價椎間盤的退變程度。
排除標準:(1)摘要、動物實驗、綜述等文獻類型;(2)重復發表文獻;(3)研究對象的腰椎間盤退變由各種疾病引起,如脊柱腫瘤等。
資料收集先由一名研究人員按照收集表獨立進行,后交由另一研究人員復查,數據不一致時再進行核查,以確保數據的可靠性。兩名研究人員均為醫學影像學專業的研究生,均已系統閱讀腰椎間盤退變診斷的相關文獻。提取的內容為文獻基本信息、不同級別的椎間盤數量和相應髓核橫向弛豫時間的均值及標準差。
在本研究基礎上,參考2020 年澳大利亞喬安娜循證護理中心(https://synthesismanual.jbi.global)研制的橫斷面研究質量評價方法,決定從研究目的是否明確、納入和排除標準是否清晰、樣本特征是否清晰、確定資料真實性的措施是否合適、是否考慮倫理、統計方法是否正確、結果陳述是否準確恰當、是否清晰闡述研究價值八個方面進行評價。每個問題按照“不符合要求”“提到但未詳述”“詳細、全面及正確描述”分別評0、1、2 分,八個問題得分相加即為該篇文獻的總質量評分。兩名研究生獨立評價,出現評分不一致時先進行協商解決,協商后仍不能達成一致時,交由具有年10 年以上研究經驗的主任醫師決斷。
統計分析使用Stata1 5.0 和RevMan 5.3 軟件。基于I2統計量和Q檢驗判斷異質性,當I2<50%且P>0.1時,表明異質性可接受,使用固定效應模型,否則采用隨機效應模型。合并效應量用加權均數差值(weighted mean difference, WMD 及其95%可信區間(confidential interval,CI)表示,P<0.05表明合并效應量有統計學意義。敏感性分析使用去除單項研究法。使用Egger 法評價發表偏倚,P>0.05 時說明不存在發表偏倚。
初步檢索到325 篇文獻,依據納排標準篩選后,共納入13篇文獻[5-17],其特征信息及質量評分如表1所示,文獻檢索及納入排除過程如圖1所示。13篇文獻樣本總量為726人,Ⅰ~Ⅴ級椎間盤分別有362、1418、1006、548、201個。
圖1 文獻檢索及納入排除流程圖。Fig.1 Flow chart of literature retrieval and selection.
表1 納入文獻特征信息Tab.1 Main characteristics of inlcuded literature
T2 mapping 區分腰椎間盤退變程度的分析結果如表2所示,相對應的森林圖如圖2所示。各級文獻間異質性檢驗I2均大于50%,且P值均小于0.1,故均采用隨機效應模型。Ⅰ級腰椎間盤髓核橫向弛豫時間明顯高于Ⅱ級腰椎間盤髓核橫向弛豫時間(WMD=35.58,P<0.01),Ⅱ級腰椎間盤髓核橫向弛豫時間明顯高于Ⅲ級腰椎間盤髓核橫向弛豫時間(WMD=32.93,P<0.01),Ⅲ級腰椎間盤髓核橫向弛豫時間明顯高于Ⅳ級腰椎間盤髓核橫向弛豫時間(WMD=26.52,P<0.01),Ⅳ級腰椎間盤髓核橫向弛豫時間高于Ⅴ級腰椎間盤髓核橫向弛豫時間(WMD=4.23,P<0.01)。
圖2 髓核T2弛豫時間區分不同等級腰椎間盤的森林圖。2A~2D:依次為Ⅰ和Ⅱ級、Ⅱ和Ⅲ級、Ⅲ和Ⅳ級、Ⅳ和Ⅴ級的文獻。Fig. 2 Forest maps of T2 relaxation time of nucleus pulposus distinguishing lumbar intervertebral disc in grade Ⅰand grade Ⅱ, grade Ⅱand grade Ⅲ, grade Ⅲand grade Ⅳ,grade Ⅳand grade Ⅴ,respectively.
表2 T2 mapping區分不同分級的腰椎間盤退變結果匯總Tab.2 Effects of T2 mapping in distinguishing different grades of lumbar disc degeneration
不同分級之間的合并效應量在去除不同單項研究后無明顯變化,表明合并結果的穩定性較好,如圖3所示。Ⅰ級和Ⅱ級、Ⅱ級和Ⅲ級、Ⅳ級和Ⅴ級文獻的異質性在去除不同單項研究后無明顯改變,但在Ⅲ級椎間盤和Ⅳ級椎間盤中,去除劉珍珍等[15]的研究文獻后,I2統計量降低了16%,說明其對文獻的同質性影響較大。各個級別間的文獻不存在發表偏倚,如表3所示。
表3 Egger法檢測發表偏倚結果Tab.3 Results of publication bias evaluation with Egger method
圖3 敏感性分析結果。3A~3D:依次為Ⅰ和Ⅱ級、Ⅱ和Ⅲ級、Ⅲ和Ⅳ級、Ⅳ和Ⅴ級的文獻。Fig.3 Sensitivity analyses for studiesin grade Ⅰand grade Ⅱ,grade Ⅱand grade Ⅲ,grade Ⅲand grade Ⅳ,grade Ⅳand grade Ⅴ,respectively.
本研究通過Meta分析的方法基于大樣本量探索不同等級腰椎間盤髓核橫向弛豫時間的變化規律,結果顯示隨著腰椎間盤等級的增加,髓核橫向弛豫時間逐漸下降,特別是髓核橫向弛豫時間可以區分Ⅰ級腰椎間盤和Ⅱ級腰椎間盤,為早期診斷腰椎間盤退變從而實現早治療以最終提高患者生存質量提供有力的影像學依據。
納入的13項研究均表明髓核橫向弛豫時間可以區分Ⅱ級和Ⅲ級、Ⅲ級和Ⅳ級腰椎間盤,說明髓核橫向弛豫時間在區分上述三個等級的腰椎間盤時的一致性很好,與本研究的結果一致。除了2 項研究[15,17]未觀測到Ⅰ級腰椎間盤外,納入的9項研究[7-14,16]均表明髓核橫向弛豫時間可以區分Ⅰ級和Ⅱ級腰椎間盤,2 項研究[5-6]則表明不能區分,而本研究通過匯總362 個Ⅰ級腰椎間盤和1418 個Ⅱ級腰椎間盤表明髓核橫向弛豫時間能夠區分Ⅰ級和Ⅱ級腰椎間盤,解決了上述研究的矛盾之處。推測產生差異的主要原因是Ⅰ級腰椎間盤樣本量不足。導致不足的可能原因有:(1)原始研究納入的患者數量不足;(2)原始研究納入的患者腰椎間盤退變程度較重。需說明的是,由于腰椎間盤在發生退變時,不同部位的腰椎間盤退變程度和順序有差異,一般以L5/S1 最常見,其次為L4/L5[18],因此同樣是腰痛患者,不同部位的腰椎間盤可有不同分級。除了2 項研究[6,13]未觀測到Ⅴ級腰椎間盤外,余11 項研究均表明髓核橫向弛豫時間不能區分Ⅳ和Ⅴ級腰椎間盤,而本研究通過匯總548 個Ⅳ級腰椎間盤和201 個Ⅴ級腰椎間盤,發現髓核橫向弛豫時間能夠區分Ⅳ級和Ⅴ級腰椎間盤,得到了和之前多項研究均相反的結論,考慮原因是單向研究Ⅴ級腰椎間盤數量不足,導致不足的原因可能與原始研究中患者的數量和癥狀的輕重有關。必須指出的是,雖然在分級時可能受到主觀因素的影響[19],但本研究通過樣本量的大幅增加使得各分級間的誤差得到更好地平衡,因此組間比較結果的可信程度也更高。腰椎間盤發生退變時,髓核的病理改變主要為水的含量降低,并且退變程度越嚴重水的含量越少[20]。通過T2 mapping 技術獲得的橫向弛豫時間可以直觀地反映腰椎間盤髓核的含水量。因此,從理論上講,髓核橫向弛豫時間可以區分不同程度的退變,而本研究的結果也證實了這一點,表明了髓核橫向弛豫時間變化與其病理改變的一致性。
溫群等[12]認為Ⅰ級是正常腰椎間盤,Ⅱ級為早期退變的腰椎間盤,牛剛等[10]認為Ⅱ級包括正常和早期退變的腰椎間盤,筆者結合上述觀點認為從疾病的二級預防角度看,將Ⅰ級視為正常腰椎間盤、Ⅱ級視為早期退變的腰椎間盤對患者來說更有價值。納入文獻的研究對象大多只包含患者,而Ⅱ級腰椎間盤數目最多,可見及時區分Ⅰ級和Ⅱ級腰椎間盤的必要性。Pekala 等的研究[21]表明將Pfirrmann 分級和病理分級進行比較時,在Ⅰ級腰椎間盤的區分上有較大的不一致性,因此定量反映腰椎間盤等級的指標對臨床的輔助價值更大,本研究表明髓核橫向弛豫時間能夠定量區分Ⅰ級和Ⅱ級腰椎間盤,差異具有統計學意義(P<0.01),從而為早期診斷腰椎間盤退變及進一步采取治療提供了證據支持。雖然本研究納入的椎間盤數量比其他單項研究多,但Ⅰ級腰椎間盤相對Ⅱ級來說還是較少,因此建議在以后的研究中可以適當納入更多的健康志愿者,增加Ⅰ級腰椎間盤的數量,提高檢驗效能。
敏感性分析時發現在Ⅲ級和Ⅳ級的文獻中,刪除劉珍珍等[15]的研究文獻后,異質性從96%降低至80%。對其進一步分析后,發現其髓核橫向弛豫時間相比納入的其他研究普遍偏低,在排除場強、掃描序列、測量方法等因素后,推測可能是測量時間[22]或者測量機器的原因。針對本研究中不同等級腰椎間盤的文獻間異質性較高的情況,分析可能的來源有:(1)方法學異質性(包括檢查的時間、成像質量的控制、感興趣區的繪制、盲法的應用、評價的一致性、測量的信度等);(2)設備及其成像參數的異質性(包括檢查設備的類型、場強的大小、成像序列的差異等)。由于上述因素在不同研究間很難保持一致,因此對其進行亞組分析也比較困難。Raudner等[23]使用GRAPPATINI序列、Jiang等[24]使用MAGiC序列對T2 mapping進行了不同程度的改進,結合上述提及的異質性來源,提示在以后的研究中,需要對納入標準進行更嚴格的限制,以提高納入研究的同質性。
(1)未進行手工檢索及檢索灰色文獻;(2)未納入非中、英文文獻,可能會影響結果的穩定性;(3)不同級別腰椎間盤髓核橫向弛豫時間的界值尚未明確;(4)擴散加權成像[25]也可對腰椎間盤退變進行有效評估,但兩者的效果尚未闡明,下一步研究考慮對比兩種定量方法的診斷效果。
綜上所述,髓核橫向弛豫時間隨著腰椎間盤退變程度的增加而逐漸下降,T2 mapping 可對腰椎間盤進行客觀、準確地評估,為臨床決策起到重要的輔助作用。
作者利益沖突聲明:全部作者均聲明無利益沖突。