甄濤 胡大成 周健 沈起鈞
膝關節半月板損傷是指半月板的連續性和完整性遭到破壞,可由退變或外傷引起,而其損傷程度與骨關節炎的嚴重程度呈正相關[1-2]。膝關節半月板撕裂是一種常見的半月板損傷,每年發病率高達(60~70)/10萬[3]。半月板撕裂可以引起膝關節的應力異常及關節內環境的變化,從而引起關節軟骨損傷及關節交鎖,是導致膝關節骨性關節炎發生和發展的主要危險因素之一[4-5]。因此,早期評估半月板損傷程度,提前進行干預,有助于延緩骨關節炎的發展。目前MRI是評估半月板損傷的首選檢查,但由于傳統評估方法仍屬于定性評估,且膝關節MRI圖像細節較多,且受到主觀因素的影響,組內及組間結果的不統一不可避免[6],另外作為定性診斷其無法對撕裂風險度進行評估。隨著人工智能的發展,計算機輔助診斷系統被用來檢測膝關節的異常,以達到早期診斷和治療的目的[7]。人工智能深度學習的方法也已經初步在骨關節病變的檢測中發揮作用[8-10]。但多數針對半月板的研究仍停留于損傷有無的定性評估,且深度學習模型解釋性較差,并無可視化的過程[6,9,11]。本研究通過基于多參數MRI影像組學特征及臨床特征的列線圖,以可視化的形式對膝關節半月板損傷風險度進行量化,旨在為臨床精準治療提供更客觀更有效的評估。
1.1 對象 選取2020年11月至2021年11月在浙江大學醫學院附屬杭州市第一人民醫院行右膝關節MRI檢查的患者86例。其中男33例,女53例;年齡12~90(52.9±11.7)歲。按照7∶3的比例進行分層抽樣,將86例患者隨機分為訓練組59例,驗證組27例。兩組患者性別、年齡和外傷史等一般資料比較差異均無統計學意義(均P>0.05),見表1。另選取2020年9月至2021年12月在浙江大學醫學院附屬杭州市腫瘤醫院(下稱外院)行左膝關節MRI檢查的患者30例作為外部驗證,其中男7例,女23例;年齡19~82(57.3±12.6)歲。納入標準:(1)有膝關節疼痛、活動障礙、關節不穩或有彈響等癥狀的患者;(2)通過查體發現可疑半月板損傷的患者;(3)能夠配合MRI檢查的患者。排除標準:(1)由膝關節骨性關節炎、類風濕性關節炎等導致膝關節嚴重損壞的患者;(2)有膝關節感染及其他系統性疾病的患者;(3)膝關節周圍腫瘤累及半月板的患者;(4)由于圖像偽影或者魔角效應等導致圖像模糊的患者。本研究經浙江大學醫學院附屬杭州市第一人民醫院醫學倫理委員會審批通過[倫理號(2020-150-01)],所有患者或其家屬簽署知情同意書。

表1 訓練組和驗證組患者一般資料比較
1.2 臨床資料收集 由同一位骨科醫生完成,包括患者性別、年齡、外傷史等指標。
1.3 MRI掃描方法 使用西門子avanto1.5T MR掃描儀配備膝關節專用線圈行膝關節掃描,掃描序列包括矢狀位質子密度加權像(proton density weighted image,PdWI)、T1WI及冠狀面PdWI。掃描參數分別為:T1WI[重復時間(repetition time,TR)418 ms,回波時間(echo time,TE)11 ms],PdWI(TR 2 810 ms,TE 47 ms),層厚3 mm,層間距0.5 mm,視野170 mm×170 mm;掃描圖像以DICOM格式導出。外院患者使用同型號掃描儀及相同參數進行圖像采集。
1.4 膝關節半月板損傷的MRI評價 由2位有10年以上骨肌系統影像診斷經驗的高級職稱醫師根據Stoller等[12]提出的MRI診斷標準進行膝關節半月板損傷分級,若存在分歧時,通過與另1位有10年以上骨肌系統影像診斷經驗的高級職稱醫師討論后進行診斷。根據MRI信號將半月板損傷分成Ⅰ~Ⅲ級,Ⅰ級:半月板內有1個或多個點狀高信號;Ⅱ級:半月板內條狀高信號未達關節面;Ⅲ級:半月板內出現條狀或其他復雜形態的高信號到達關節面。由于Ⅲ級損傷即半月板撕裂需要手術治療,而Ⅰ~Ⅱ級損傷未達到需要手術治療的程度,因此本研究將Ⅲ級損傷定義為半月板撕裂,Ⅱ級以下損傷及正常半月板定義為未撕裂。
1.5 圖像勾畫、特征提取及篩選 由2位具有5年以上骨肌影像診斷經驗的放射科主治以上職稱醫師使用聯影智能科研平臺上的圖像分割軟件手動對膝關節MRI的T1WI及PdWI圖像上的半月板進行勾畫,沿著半月板邊緣逐層勾畫其感興趣區(region of interest,ROI),盡量避免將周圍關節囊、軟骨及韌帶等組織勾畫其中,并保存勾畫的ROI,勾畫示意圖見圖1-2。勾畫完成后,應用平臺上的組學模塊進行特征提取,對2位醫師所提取的特征進行一致性分析,保留組內相關系數(intraclass correlation coefficients,ICC)≥0.75的特征,然后對其中1位醫師保留的特征數據使用Z值歸一化算法進行標準化,通過最小絕對緊縮與選擇算子(least absolute shrinkage and selection operator,LASSO)回歸對各個特征進行降維,得到有統計學意義的影像組學特征參數,同時計算影像組學特征參數分數(Rad-score),基于Rad-score建立影像組學模型。對每個潛在預測變量包括性別、年齡、外傷史等進行單因素分析及多因素二元logistic回歸分析,最終篩選出獨立危險因素。

圖1 矢狀位質子密度加權像的感興趣區勾畫示意圖

圖2 感興趣區的三維容積重建圖像
1.6 模型建立與驗證 將篩選出的獨立危險因素和Rad-score構建聯合模型,并制作列線圖。模型建立之后,使用Hosmer-Lemeshow檢驗分析擬合度。繪制ROC曲線,采用AUC評價各個模型對半月板損傷風險度的評估效能。使用決策曲線評估各個模型的凈效益。
1.7 統計學處理 采用MedCalc 19.1及R 4.1.2統計軟件。符合正態分布的計量資料以表示,組間比較采用兩獨立樣本t檢驗;不符合正態分布的計量資料以M(P25,P75)表示,組間比較采用 Mann-WhitneyU檢驗。計數資料組間比較采用χ2檢驗。訓練組和驗證組構建的Rad-score對半月板損傷風險度的評估效能比較采用Wilcoxon秩和檢驗。采用Hosmer-Lemeshow檢驗分析模型擬合度,P>0.05提示模型擬合較好。繪制決策曲線分析凈效益。模型間AUC的比較采用Delong檢驗。采用ICC評價2位ROI勾畫醫生的測量一致性,ICC≥0.75為一致性較好。采用Kappa檢驗比較外部驗證數據實際結果與聯合模型預測結果的一致性,Kappa值≥0.75為一致性較好,0.4<Kappa值<0.75為一致性中等,Kappa值≤0.4為一致性較差。P<0.05為差異有統計學意義。
2.1 臨床特征選擇 根據Stoller等[12]提出的MRI診斷標準將所有患者分為撕裂組50例和未撕裂組36例。撕裂組患者年齡大于未撕裂組,差異有統計學意義(P<0.01);而兩組患者性別和外傷史比較差異均無統計學意義(均P>0.05),見表2。經多因素二元logistic回歸分析顯示年齡的OR值為1.068,P<0.01,因此篩選出年齡這個獨立危險因素用于建立臨床特征模型,見表3。

表2 撕裂組和未撕裂組患者一般資料比較

表3 患者一般資料的多因素二元logistic回歸分析
2.2 組學特征篩選及模型建立 兩位ROI勾畫醫生均提取得到2 475個PdWI和2 475個T1WI特征,其中Pd-WI特征中 ICC≥0.75的特征 2 203個,T1WI特征中ICC≥0.75的特征數2 251個,對其中1位醫師提取并保留的所有組學特征進行降維共得到8個PdWI和4個T1WI圖像的影像組學特征。再用二元logistic回歸對12個特征進行進一步篩選,最終選定5個特征:包括2個T1WI特征[log_glcm_log-sigma-0-5-mm-3D-JointEntropy(LGLS)和 wavelet_glcm_wavelet-LHH-Idnd2(WGWLI)]和3個PdWI特征[recursivegaussian_gldm_Large DependenceHighGrayLevelEmphasis(RGL)、wavelet_glszm_wavelet-LLL-HighGrayLevelZoneEmphasis(WGWLH)、curvatureflow_gldm_DependenceNonUniformity(CGD)],見圖3-4。

圖3 訓練組最優特征間的相關系數熱圖

圖4 驗證組最優特征間的相關系數熱圖
按相關系數加權求和得到Rad-score,最終公式為:Rad-score=LGLS×(-0.1408)+WGWLI×(-1.5147)+RGL×2.203 4+WGWLH×0.679 0+CGD×0.632 1+1.486 6。基于Rad-score建立影像組學特征模型。撕裂組組患者Rad-score為2.58(1.13,6.08),高于未撕裂組的[-0.88(-2.74,0.24)],差異有統計學意義(Z=5.699,P<0.01);訓練組和驗證組患者Rad-score分別為 1.08(-0.50,2.76)和2.41(-1.48,6.22),兩組比較差異無統計學意義(Z=-1.112,P>0.05)。訓練組與驗證組患者半月板損傷程度鑒別的Rad-score比較,差異均有統計學意義(均P<0.01),見圖5。

圖5 訓練組與驗證組的半月板影像組學特征參數分數比較
將Rad-score和年齡共2個特征作為評估半月板損傷風險度的危險因素進行聯合模型建立,并獲取聯合模型的列線圖(圖6),實現模型的可視化,該列線圖可以作為指導臨床快速預測半月板損傷風險度的工具。分別繪制臨床模型、影像組學特征模型及聯合模型的ROC曲線,見圖7。訓練組患者聯合模型和影像組學特征模型的AUC均高于臨床模型,差異均有統計學意義(Z=2.910、1.963,均P<0.05),但聯合模型和影像組學模型AUC比較,差異無統計學意義(Z=0.234,P>0.05),見表4。驗證組患者聯合模型的AUC最高,臨床模型的AUC最低,但3者兩兩比較(臨床-影像組學、臨床-聯合、影像組學-聯合),差異均無統計學意義(Z=0.753、1.197、1.647,均P>0.05),見表5。決策曲線顯示聯合模型在大部分概率閾值范圍都有最高的凈獲益(圖8)。

圖6 聯合模型的列線圖

圖7 訓練組和驗證組的各個模型的ROC曲線比較

表4 訓練組模型間的比較

表5 驗證組模型間的比較

圖8 3種模型的決策曲線圖
2.3 外部數據驗證 通過外院30例膝關節MRI圖像進行聯合模型的外部驗證,結果顯示,模型預測結果準確度為0.733(22/30),聯合模型預測結果與膝關節半月板實際損傷呈中等的一致性(Kappa=0.467,P<0.01),因此該模型的預測結果可以較好反映半月板實際損傷情況,見表6。

表6 外部數據驗證模型
本研究建立了一種用于評估膝關節半月板損傷風險度的臨床-影像組學聯合模型,結果發現聯合模型優于單獨的臨床模型及影像組學特征模型,同時制作的決策曲線也顯示聯合模型較影像組學特征模型有更好的凈效益,并且本研究通過構建列線圖實現了模型可視化。本研究結果表明,該聯合模型構建的列線圖可以作為半月板損傷風險度的定量評估工具,可以一定程度的減少臨床醫生診斷誤差,提高診斷的準確性。
目前MRI對膝關節半月板的評估主要還停留在定性診斷,而定性診斷往往受多種因素影響。因此,MRI由于其固有的局限性導致了人為判讀的偏差,特別是內側半月板后角的小撕裂和累及不到1/3外側半月板的撕裂的檢測,是MRI評估的一個盲點[13-14]。在合并前交叉韌帶損傷的患者中,MRI診斷半月板撕裂的準確性也會降低[11]。另外半月板的特殊解剖結構,如膝橫韌帶、腘肌腱等走行不規則時,也常被誤診為半月板撕裂。半月板的游離緣的纖毛化也常被過度診斷為半月板撕裂。由于每個膝關節MRI檢查的圖像的細節較多,判讀時容易出現組間及組內的一致性差異,即使是獲得認證的高級骨肌關節放射科醫生也存在同樣的問題[6,15],因此準確判讀膝關節MRI需要豐富的經驗及大量的時間。早在2009年,Ramakrishna等[16]就試圖通過計算機輔助診斷系統幫助醫生探查半月板損傷,他們通過對40例膝關節可疑損傷患者T1WI的內外側半月板的各一個層面的圖像進行半月板的撕裂的評估,得到該系統的靈敏度和特異度分別為83.87%和75.19%,是對人工智能應用于半月板損傷的初步探索,但該系統的數據只基于二維圖像。本研究的模型基于整個內外側半月板的三維圖像信息,且融合了T1WI及PdWI的影像特征,除了基本的形態特征,還包括紋理特征、小波特征等內在信息。Bien等[6]開發了一個基于MRI的膝關節半月板撕裂檢測深度學習模型,該模型的AUC為0.847,靈敏度為74.1%,特異度為71%,靈敏度顯著低于人工判讀結果,特異度與人工判讀結果無明顯差異。Roblot等[17]同樣開發了一個基于神經卷積網絡的算法模型,其AUC為0.94。這些模型的診斷效能與本研究相近或略高,然而其數據量卻數十倍于本研究。深度學習與本研究一樣都是構建了一個分類模型,然而深度學習的解釋性較差,無法對分類的結果進行原因分析,且深度學習為確保結果的準確性,需要的樣本量巨大,單中心機構難以獨立開展,而且深度學習對計算機硬件及軟件的要求也較高,因此開展及推廣有一定難度。本研究旨在應用小樣本量的數據構建模型,提高模型的普適性。本研究還通過繪制列線圖實現了模型的可視化,通過該列線圖可以實現半月板損傷風險度的量化評估。與傳統評估方法相比,它友好的數字界面,不僅能夠實現快速診斷,而且可以賦予半月板一個損傷風險的定量值,該數值越高,患者半月板損傷的風險越高。這也使臨床能更容易了解疾病的預后,并作出相應決策[18]。
研究發現隨著年齡的增長,半月板無癥狀撕裂的發生率增加,而且通常是水平狀撕裂[13]。這與本研究相符,本研究通過對患者各種臨床因素進行二元logistic回歸分析,發現年齡是導致半月板撕裂的危險因素,撕裂組患者年齡明顯高于未撕裂組。因此雖然單獨的影像組學特征模型的診斷效能已經較高,但年齡這個臨床特征也被納入了診斷模型,以進一步優化模型,提高診斷效能。本研究聯合模型訓練組診斷準確度為0.797,驗證組的準確度為0.889,外部驗證的準確度也有0.733(22/30),已經接近甚至超過了人工診斷的水平。同時本研究模型數據全部用的是右膝關節的數據,而外部驗證全部用了左膝關節的數據,提示該模型有較好的泛化能力。
本研究仍存在不足之處:本研究所提取的影像學數據都是手工半自動勾畫,工作量較大,并且目前的數據量還不足以使聯影智能科研平臺的訓練模塊通過自主學習生成自動分割圖像的模型,隨著未來樣本量的擴大,通過聯影智能科研平臺的訓練模塊得到的自主勾畫模型不僅可以較大程度減少工作量,同時可以減少人工誤差。本研究缺少盤狀半月板患者,而盤狀半月板由于其解剖學變異及紊亂的膠原纖維結構,使其更易受到接觸面壓力和剪切力的影響出現退行性改變,因此更易引起半月板撕裂,也是預測半月板損傷的危險因子之一[19]。另外受限于樣本量的原因,本研究未對撕裂組樣本進行撕裂類型的區分。
綜上所述,本研究獲得了一個聯合影像組學特征和臨床危險因素的臨床-影像組學列線圖,可以作為評估膝關節半月板損傷風險度的工具,輔助臨床作出治療決策,實現個體化精準醫療。