查云飛
武漢大學人民醫院放射科,湖北 武漢 430060
本文為定量CT(QCT)工作組報告的第二部分,陳述了QCT臨床應用的演進,并為國際臨床骨密度學會(ISCD)新的官方意見提供了相關證據。本部分重點闡述了基于定量CT有限元分析(FEA)骨強度評估的臨床價值,并介紹 ISCD對FEA新的官方立場。第一部分介紹了髖部QCT的臨床應用價值,第三部分基于體素/張量的形態學分析、統計學參數圖等先進方法。第三部分還論述了如何從獲得的CT掃描獲得可靠的骨密度(BMD)信息,以解決除了骨質疏松癥之外的診斷問題(比如CT掃描通常不使用標準QCT應用中使用的掃描內標定模型)。基于FEA的骨強度測量的臨床應用已在之前的文章中簡要討論過,但自那時以來,又發表了大量的臨床研究,鞏固并進一步證明了將整體幾何結構和局部骨密度整合到脊柱、髖部或前臂骨強度計算中FEA的價值。
有限元(FE)法常用于機械工程中,以計算剛度、強度以及受外力影響的復雜結構的內部應變和應力。常有人將骨骼比喻為老式的鋼橋,因為它與骨小梁結構有驚人的相似性。因此,FEA被用來模擬骨骼的力學行為、提高保真度已經40余年。計算由最終可能導致骨折的外部載荷引起的骨內應變和應力的復雜問題,可通過創建具有已知材料屬性的元素網格來解決,在局部和整體上均衡力和力矩。大多數用于骨骼分析的FEA軟件仍處于試驗階段,但VirtuOst軟件(ON Diagnostics,Berkley,CA)最近獲得美國食品和藥物管理局(FDA)的批準,用于鑒別骨折風險患者和隨訪治療效果。
在骨骼方面,μFE模型不同于均勻FE模型,前者需要高空間分辨率圖像,以便顯示僅含有骨骼材料的網格元素。然而在脊柱和髖關節中,高分辨率在活體是無法實現的,為了說明這一點,圖1選用的是橈骨遠端。從全身臨床CT掃描獲得的QCT圖像上應用均勻的FE模型進行后處理。在整個椎體或髖部應用網格分析技術,使得其在單位毫米的圖像內同時包含有礦化骨和骨髓。均勻化(homogenization)這一術語用于表示確定骨髓混合物特性的平均化過程,是FE分析的基本輸入參數。
通過雙能量X射線吸收測定法(DXA)測量面積骨密度(aBMD),通過QCT測量體積骨密度(vBMD)和通過骨強度的FE分析預測衰竭的可行性已經被許多體外研究在骨骼標本中所證實。對于這些研究的闡述,骨強度在物理參數中被明確定義為一種施加在骨骼上導致其位移并最終骨折的力。力-位移曲線(force-displacement curve)的斜率被定義為剛度。曲線上能達到的最大力Fu表示破壞骨骼所需的極限力(也稱為極限載荷或破壞載荷)。最大力Fu點的曲線下的面積(AUC)表示產生骨折所需的能量。強度(Strength)是一個更常應用于材料研究而非結構研究的概念,但在后一種研究中,它是極限載荷的同義詞,并且是最常被報道的FE結果變量。極限載荷隨著骨骼體積的增加而增大,但較大的骨骼通常必須在生理和病理載荷條件下(例如跌倒)支持更大的重量。對于均勻材料(例如一處均勻變形的骨小梁),力-位移曲線可以被轉換成應力-應變曲線(stress-strain curve),其中應力被定義為施加的力除以樣本的抵抗面積。應力和應變之間的線性關系的斜率表示楊氏模量(Young’s modulus)。破壞材料所需的最大應力稱為極限強度。應力應變曲線下的面積具有單位體積能量密度的物理意義。楊氏模量、最大應力和能量密度是材料的固有性質,與形狀無關。而相反,極限力和剛度是與外形有關的結構特性參數。
材料和結構變量的不同對應用于計算骨強度的成像技術有著重要的影響。例如,QCT或者DXA測量的骨礦物質含量(BMC)像結構特性一樣是一個外延變量,因為骨骼體積越大,包含的礦物質就越多而且越堅硬。相反,QCT測量的vBMD是一個與材料特性(如極限強度或極限模量)相一致的內涵變量,因為vBMD本質上是獨立于骨骼大小的。因此,當與QCT所測得的vBMD相關聯時,極限載荷或剛度應當調整其大小。有趣的是,aBMD與結構特性相關性更好,這很可能是因為DXA能利用單投影并提供面積密度來部分調整大小。混合變量aBMD的強度預測水平取決于解剖部位、載荷配置以及特定的樣品采集區域。
一些脊柱和股骨的體外研究結果顯示DXA、QCT、FE的結果與骨的結構特性有著很好的相關性(r=0.6-0.9)。表1顯示的是胸腰椎和髖部在典型的骨折-負重狀態下FE研究的概述。在大多數研究與骨破壞性載荷相關或有預測作用的成像技術中,QCT的預測性較DXA略好。在椎體研究中,FE方法預測骨骼負載失效或表觀極限強度實驗中展現出最高的相關性和最低的誤差,但決定系數并不總是明顯高于QCT變量。
按尺寸校正的骨骼形態或本質特性、按vBMD校正的骨質量、按面積校正的外力(表觀應力)以及按身高校正的位移(表觀拉伸),吸引人們從關注骨強度轉移到關注依賴外加負荷和患者體重的骨折風險。基于簡單的量綱分析,也有人認為不同于最大受力,最大壓力基本獨立于骨的大小和重量,因此它可提供一個更為客觀的骨折危險因素。
體外實驗的陽性結果為流行病學研究脊柱和髖部均一性FE分析的使用提供了堅實的依據,用以確定骨強度或預測脊柱及髖部骨折或確定骨強度隨著年齡的變化以及相關治療。然而,現在被用于估算骨強度的FE技術方法仍然有一些限制,這些限制大致被分為3類。
QCT評價骨結構的分辨率有限。在這種情況下,脊柱和髖關節的致密骨往往比圖像體素尺寸要薄。雖然有效的算法可以分割髖關節骨皮質,但同時評估皮質厚度和孔隙度仍然是一個重大的挑戰。
用于脊柱和髖關節的FEA網格技術主要有兩種,一是忽略皮質和骨小梁區別的體素網格技術,二是包括可變或恒定厚度致密層的平滑網格技術。前者使用相同的關系將材料屬性分配給致密骨和骨小梁,而后者則為每個分隔間使用不同的關系。固定骨皮層厚度的建模方法提高了椎體內FE預測的準確性。令人驚訝的是,在髖關節中加入骨皮質似乎并沒有對椎體的強度預測產生同樣的影響。這很可能歸因于部分容積偽影、圖像分割質量以及每個分隔所使用的材料模型。總的來說,當單元尺寸縮小時,FE分析解決邊界值問題必須集中在一種分析解法
骨骼是一種具有多維度、非均質、各向異性和彈性特征的材料,能承受即時的塑性變形和損傷。然而,在基于QCT的有限元模型中,只有vBMD用來決定密質骨和骨小梁的物質特性,受很多因素的影響:
1. 縱向研究中,在細胞外基質(ECM)水平,骨組織的成分與解剖部位、性別、年齡、時間無關。定量背散射電子成像研究也證實這一觀點,發現在同一解剖部位的健康骨組織具有相似的鈣含量分布。另外一項壓痕實驗也提示成人椎體ECM的平均楊氏模量與年齡和性別無關。然而,隨著年齡增加,骨的微損傷增加,骨的韌性相應地減低。某些特殊疾病如成骨不全等,會改變ECM的物質特性,這種情況應該在FEA中加以考慮。
2. 在骨小梁結構水平,骨的機械性能完全由骨的體積分數決定。所謂的結構是指骨小梁的各向異性及方向。假設結構相似的骨組織具有相同的平均鈣含量分布,那么我們就可以從vBMD中估測出骨體積分數。一些研究利用QCT圖像估測骨小梁結構,但收效甚微,其原因與臨床CT圖像的空間分辨率不高有關。
3. 在FE分析中,骨骼vBMD和機械性能之間的關系,與解剖結構、性別、年齡、疾病無關。由于骨構造的不同,vBMD單獨使用時常需要區別不同載荷情況下的不同參數。顯然,骨質疏松并不改變體積分數、結構和性能間的關系,但其他骨骼疾病的影響不能排除在外,還需要進行調查研究。
4. 皮質骨的性能通常由松質骨推斷得來,這使得椎體或髖關節的測量值不能準確匹配。
5. 利用線性FE分析,骨結構的剛度常與強度具有良好的相關性。但是,總的來說,非線性分析可提供更好的強度結果。
總之,骨的物質特征對載荷率及周期數敏感。如:髖關節骨折好發于碰撞,而椎體骨折常源于疲勞。大多數FEA專注于準靜態單調加載,而載荷率和周期數的參數校正將結果進行標化,并保存于不同個體間的相對骨強度。
對有限元模型進行驗證的體外實驗經常受到的質疑是,它們并不代表真實的患者在現實生活中的載荷情況。在活體內受到外力的大小和方向,特別是在特定的跌倒中,只能進行粗略估計,從而影響骨強度結果的計算。這個問題是真實存在的,但是這些體外實驗的目的并不是完全符合個體的實際情況,而是要對具有代表性的解剖學和負荷模式進行基于QCT的FEA驗證。為了解決這一問題,有研究在多種載荷條件下進行FEA,如脊柱軸向壓縮、前屈和扭轉,以及臀部的不同姿勢和墜落場景的模擬,初步結果表明,負荷與椎體剛度值高度相關。最近發表的一項針對步行和爬樓梯的髖關節個體化載荷情況首次進行了FEA研究。這種有限元模型的精化對骨折風險預測的收益還不清楚,仍需要進一步調查。受到其他力學領域的啟發,工程師們也開始研究骨骼和關節的隨機載荷,以解釋骨骼力和力矩的意外變化,這樣可能有助于制定更好的統計學策略來評估未來的骨折風險。
綜上所述,QCT的FEA是基于力學的基本原理,結合患者的個體情況和通用特性,計算出臨床相關負荷下的骨力學性能。準靜態骨強度是關鍵的結果變量,不應與已經包含在有限元模型精化中的形態學性質相結合。體外實驗是未來在皮質厚度和材料性能方面進行改進測試的金標準。據報道,使用體素模型對椎體和髖關節的準確性約為15%(均方根誤差)。參考更多臨床病例的具體負荷情況將有助于提高FEA的準確性,以達到預測骨折風險目標。盡管同質FEA的精度主要依賴于QCT圖像采集、校準和處理的精度。然而,骨強度的變異系數可能會被vBMD與材料特性的非線性關系所放大。由于體素有限元模型的生成可以完全自動化,只有更復雜的四面體或六面體網格與皮質的識別可能會適度影響FEA的精度。
以下部分,我們將陳述對FEA的ISCD官方共識。
對髖部和腰椎FEA的官方共識
在以下各節中,脊柱和髖關節的FEA分別指椎體或股骨強度。
FEA可以用于骨折風險評估嗎?
ISCD官方共識
基于QCT的FEA可評估骨強度來預測絕經后婦女椎體骨折。
等級:Fair-B-W
基于QCT的FEA評估椎體強度,與脊柱DXA一樣,可預測老年男性椎體骨折。
等級:Fair-B-W
基于QCT的FEA評估股骨強度,與髖部 DXA一樣,可預測絕經后婦女和老年男性髖部骨折。
等級:Fair-B-W
理由:在男性中,腰2椎體強度的標化風險比(standardized hazard ratio,HR)要高于腰1-腰4椎體的雙能X線吸收測定法(DXA)aBMD值。在女性中,腰2椎體強度的比值比(odds ratio,OR)要高于腰2椎體的vBMD。與脊柱aBMD相似,其他兩項女性研究亦顯示,區分椎體骨折時,AUC值較大或強度參數相關性較高。
在男性中,MrOs研究中髖部強度的HR要高于DXA的aBMD值。大部分研究表明,在女性中,FEA對髖部骨折的鑒別能力與股骨總 aBMD 或 vBMD 測量結果一致。從體外生物力學測試來看,相較于DXA 的aBMD,FEA對于脊椎和髖關節破壞載荷是一個比較好的替代方法。除了相關性之外,FEA可以為任何載荷情況提供定量估算。
討論:體外研究表明,FEA的使用可預測脊柱和髖骨骨折。當判斷脊椎的破壞載荷時,脊柱的FEA優于DXA的脊柱aBMD且優于或相當于QCT脊柱vBMD。當預測髖關節的破壞載荷時,髖關節FEA優于或相當于DXA的髖關節aBMD,優于QCT髖關節vBMD或骨礦含量。FEA和QCT測量方法必須具有可比性,即整個髖關節測量而不是僅測量股骨頸部,整個椎體測量而不是僅測量中央小梁部分。
與體外研究結果相同,在體研究中DXA和FEA預測或鑒別脊椎骨折,再次強調了DXA投影成像的局限性。一項對老年男性的隊列研究中,整個椎體極限載荷和BMD積分的HR和AUC要明顯高于DXA的aBMD。日本女性的脊柱研究中也得出相似的結論,但并未給出具體的AUC值。FEA計算的危險值或OR的置信區間遠遠大于DXA的置信區間,因此,這兩種技術間點估計值差異可能無法達到顯著統計學意義。
在髖部兩者的數值差異是非常小的,但這種差異是否具有統計學意義卻鮮有報道。在回顧性分析中,髖部FEA的極限載荷提高了骨折預測的準確性,但與DXA相比略有差異。有趣的是,在研究中,發現髖部骨折和股骨近端骨折之間的關聯存在性別差異,但DXA測量的髖部aBMD預測髖部骨折并無性別差異。在一項流行病學研究中,比較了髖部骨折的DXA、QCT和FEA在男性和女性中的OR值,該值不依賴于脊柱、髖部、橈骨或肱骨等各種骨質疏松骨折類型,OR值在vBMD最高而在aBMD則最低,但兩者的置信區間大部分重疊。目前,支持FEA用于骨折預測的體內研究數量太少,仍存在爭論,但離體的生物力學研究卻強烈支持這一證據。雖然骨強度(或BMD)與體外測量的破壞載荷的相關性高于體內骨折的相關性,但實際的跌倒情況并不能夠被完全模擬。基于體外數據表明,有限元模擬的極限骨強度可能優于DXA測量的aBMD。
ISCD官方共識
如果應用當前WHO推薦的T值,FEA并不能用于診斷骨質疏松癥。
等級:Good-A-W
理由:WHO對于DXA的診斷分類定義具有排他性。因此,除DXA以外的技術缺乏等效分類,并不是這些技術的問題,而是WHO分類缺陷所致。由于少量流行病學數據被DXA所采用,這種歷史局限性在當時是可以理解的。
討論:其他非DXA技術都存在相同的問題,如脊柱或髖部的QCT。WHO診斷標準的具有一定的局限性,例如確定骨折風險高的受試者卻未被診斷為骨質疏松癥或骨質減少癥。基于其他骨密度測量技術的診斷標準已經被討論過。我們重點關注用于脊椎和髖部的QCT或FEA。
一般來說,大多數的替代標準都是基于骨折預測相關的受檢者特征曲線(ROC)。具體診斷的標準要求在ROC上選擇一個確定的點,或者是一個明確的敏感性-特異性或AUC閾值。在密度測量技術中,不基于ROC分析這種方法是諸技術之間風險梯度差異的原因之一。在ROC分析的情況下,例如,對于給定的技術,AUC閾值可以定義為導致DXA等價診斷,然而,風險預測只能針對某個特定的DXA進行匹配vBMD或強度值。
因此,潛在的問題是診斷和風險預測的二元性,其兩者的結合具有技術特異性,目前需要通過WHO定義與DXA相關聯。而為其他技術定義診斷標準并不能解決這個問題,因為這些不能等同于DXA。只有在診斷和風險預測一致時,才能避免對單一技術的依賴。在這種情況下,年齡依賴的T值或Z值的任何技術才可以通用。
髖部FEA的骨強度閾值,等同于aBMD 的T值。對于aBMD而言,T值為-1時,相當于女性股骨強度值4000牛,男性股骨強度值5000牛。對于脊柱而言,抗壓強度值120 mg/cm3相當于女性骨強度6000牛,相當于男性骨強度8500牛。盡管骨小梁vBMD值并不能完全等同于WHO定義的aBMD值,但骨小梁vBMD值120 mg/cm3和 80 mg/cm3常被定義為骨量減少和骨質疏松的臨界值。需要注意的是,上述強度臨界值 與CT掃描設備無關。
ISCD官方共識
基于QCT的FEA評估脊椎或股骨強度,需要結合臨界值和相關臨床風險因素,可以用于決策藥物治療。
等級:Fair-B-W
理由:如果條件允許,脊柱和股骨DXA測量可以作為制定臨床治療決策的優選方案。
如前所述,脊柱和股骨的FEA可分別用于預測脊柱骨折和髖部骨折。如果骨強度足夠低,并且存在額外的危險因素,初始化治療方案就存在合理性。FEA椎體骨強度對應vBMD值(80 -120)mg/cm3以及股骨強度值對應aBMD T值(-1 ~ -2.5)的相關研究已有發表,這些研究可以指導骨強度測量對骨折風險評估的影響,從而指導干預決策。
討論:該患者是否需要治療,取決于患者骨折風險是否超過特殊界值。類似于FRAX評分,BMD評估骨折風險是系統評分的一部分。因此,治療決策并不僅僅是基于BMD或T值閾值,同時也考慮到其他骨折風險。盡管如此,BMD起著重要作用,但與許多其他危險因素相反,它可以通過治療增加(即相關的骨折風險可以降低)。 如前所述,已經描述了與aBMD髖關節T值和QCT脊柱vBMD值相當的強度閾值。 羅徹斯特隊列研究發表了男性和女性股骨強度在(30-80)歲之間的年齡相關變化,但椎體抗壓強度的正常數據仍然缺失。
ISCD官方共識
基于QCT的FEA評估椎體或股骨骨強度可以用于監測年齡和治療相關的改變。
等級:Fair-B-W
理由:FEA用于監測年齡相關的改變,相關的研究已有許多。在體的FEA研究已公布了精確數據。
女性脊柱骨強度的FEA已成功地用于監測多種藥物治療效果的前瞻性研究,例如阿侖膦酸鈉、伊班膦酸鹽、雷洛昔芬、特立帕肽、狄諾塞麥以及奧當卡替。在男性研究中有特立帕肽以及利塞膦酸鹽。
女性髖關節骨強度的FEA也用于監測多種藥物治療效果的前瞻性研究,例如阿侖膦酸鈉、伊班膦酸鹽、甲狀旁腺素(PTH)、狄諾塞麥以及奧當卡替。大多數研究對絕經后婦女進行了評估。這些研究中的一部分也采用了脊柱以及髖關節DXA。在男性中,FEA僅被用于脊柱的特立帕肽及利塞膦酸鈉治療評估。
討論:關于年齡和治療相關的vBMD變化FEA研究已有報道。這些研究表明FEA測得的改變高于aBMD所測得變化。目前為止,在體的FEA研究的準確性僅有一篇文獻報道。在相同的CT掃描方案下,1.9%CVrms與0.9%全股骨vBMD積分相符合,而使用3 mm層厚的QCT誤差要好于1 mm。KV和mAs參數在3個研究中也存在差異,但有研究報告基于體素的FEA準確度與QCT結果非常相近,主要是因為FEA過程高度自動化,且QCT精度誤差來源于掃描和圖像分割過程。對于非體素FEA、網格劃分、材料特性和邊界分割定義都需要額外操作和干預,因此QCT的精準數據并不能簡單地由在沒有更深層次證據的FEA中所得出。
對于骨強度的測量,FEA是可以選擇的方法之一。 在控制良好的體外實驗中,CT分辨率、圖像處理和骨本質模型構建方面的進展導致FEA影響髖部和脊柱骨強度的程度,而這些都是通過密度測量法所無法得到的。然而,由于不良載荷相關的隨機因素的影響,這種體外FEA的優異性不一定會轉化為骨折風險預測的改善,除非對大規模的隊列研究所證實。盡管如此,FEA有可能成為骨強度測量的金標準,它不僅可用于評估治療效果,而且也可用于確定合成代謝策略的靶向區域。在臨床實踐中,來自QCT分析的密度和幾何參數的組合是否能夠提高FEA的準確性,仍需要進一步調查。
FEA的更深層次提高,將包括小梁結構、多孔皮質和患者特定邊界的自動光滑網格形成和更精確建模。尤其,肌肉骨骼生物力學將為生理活動、跌倒和可適應個體解剖學的其他創傷提供載荷情況的概率分布。微裂紋、骨密度、膠原交聯和/或礦物結晶度相關的老化組織材料性質,都是將來需要考慮的因素,以獲得更高的骨折預測準確度。
未來的任務還包括:在國際層面上不斷改進QCT和FEA方法,并將所提出的介入閾值與其他前瞻性研究進行整合,從而保證FEA的準確性。為了提高QCT和其他基于CT分析方法的可接受性,應通過改進硬件設備和采用低劑量掃描方法進一步減少輻射劑量。
ISCD的官方共識闡述了基于QCT的髖關節和脊柱FEA在診斷骨折風險評估和骨質疏松癥臨床評估中的應用。文章在2007版的基礎上補充了脊柱QCT的描述。在廣泛回顧的基礎上,介紹了支持ISCD官方共識的證據。從過去的幾年來看,FEA仍然是一個快速發展的領域。因此,建議在不久的將來再次進行回顧性證據收集,以便在新形勢下及時更新ISCD證據。