王 肖 ,李 晶 ,李天然(通訊作者)
(1.佳木斯大學 臨床醫學院,黑龍江 154007;2.解放軍總醫院第四醫學中心,北京 100048)
在上世紀五十年代首次提出了人工智能(Artificial Intelligence,AI)的概念,其主要包括機器學習、高級算法、模式識別和挖掘數據等[1]。隨著現代科技的進步,AI通過利用計算機來模仿人類活動的過程,而形成一個完整的體系,來幫助人類解決更多的工作負擔,進一步解放人力資源。目前,AI和醫療領域的融合主要是采用大數據分析和機器學習(Machine Learning,ML)算法,這降低了醫療服務成本,提升了服務效率,也推動了醫療領域發展的進程。現階段具體應用在骨關節系統主要包括以下3個方面:①骨關節的影像數據的處理;②對部分疾病分類篩查;③代替影像科醫師做出簡單決策。鑒于此,當前AI更擅長進行一些簡單計算工作和機械記憶,而對更高層次的邏輯推理有待提高。
骨關節系統疾病圖像模態呈多樣化,X線對部分骨性病變及骨折的檢查效果較佳,而MRI掃描可觀察平片及CT無法清晰顯示的軟組織病變,但多數影像數據結構復雜,醫師獨自閱片診斷任務量大且煩瑣,AI輔助醫學影像可應用在多個場景下幫助醫師提高診斷能力和工作效率。目前,AI在骨關節應用方面表現出巨大的潛力,本文對其應用現狀及發展進行綜述。
在醫學影像學中骨齡(Bone Age,BA)檢測能查看骨骼的成熟度,這對兒童的遺傳、生長和內分泌等均具有重要意義[4]。通常,BA使用Greulich-Pyle(GP)或 Tanner-Whitehouse(TW)方法對 X 射線圖像手動篩選評估。GP使用標準手部圖譜作為預測患兒骨齡的參考,而TW使用評分機制對多個感興趣區域的信息評估BA。但是檢測骨齡用此種方法十分耗時耗力,且不同影像科醫生之間會因經驗、主觀差異等影響評估準確性。當前關于實現骨齡自動化檢測,已有學者提出基于AI的計算機輔助診斷(Computer Aided Diagnosis,CAD)方法[5]。 因其過度依賴編碼的算法特性,所以傳統機器學習的CAD工具存在一些缺點。因此迫切需要合適的工具自動化檢測BA,來減少主觀差異、提升檢測效能。
Koitk 等(2020)[6]基于 DL 算法開發了一種模型,通過檢測各個骨化區域對BA評估,其模擬了TW程序的工作流程,且平均誤差為4.56個月。Bui等(2019)[7]基于 TW方法及深度卷積神經網絡(Deep Convolutional Neural Network,DCNN)提取的感興趣區域對患兒進行檢測和分類,結果表明影像科專家與所提出模型方法之間的平均絕對誤差約為0.59年。同年,有學者使用了北美放射學會兒科骨齡提供的公共匿名數據集,該數據集包含12 611張用于訓練和200張用于測試的手部X線照片[8],證實了卷積神經網絡(Convolutional Neural Network,CNN)模型可比影像科醫生更準確地評估骨齡。Booz(2020)[9]等在 2020年開發了一種新型自動 BA 評估的模型,由3位不知情的影像科醫生使用GP方法和AI軟件評估進行比較,證明使用AI軟件不影響評估準確性,且平均閱讀時間減少了87%。
因此,這些研究證實AI在實際臨床應用中的潛力,能幫助專家或影像科醫師客觀地評估BA。近年來,國內外已有研發AI的骨齡評估系統,其時效快、準確率高,讀片及“診斷”可數秒完成,且各模型評估骨齡的準確率與影像科醫師水平相當。
骨折的識別及分類對手術治療選擇相當重要,目前諸多復雜骨結構的骨折,在快速識別分類上仍存在一定困難。因此,使用AI對骨折準確識別并分類具有重要的臨床現實意義。 Aghnia 等(2021)[10]提出的DCNN模型,可將CT跟骨骨折圖像分為四個Sanders類別,準確率能達到72%,與使用原始非增強數據訓練的基線模型相比,準確性幾乎提高兩倍,證實了在DCNN算法幫助下的CAD系統能夠提供一種可行、有效的方法,協助醫生對跟骨骨折類型進行評估。同年,Murata 等(2020)[11]基于 DCNN開發了一種模型對椎體骨折的圖像進行識別,其模型的準確度、敏感性和特異性分別為86.0%、84.7%和87.3%,且與骨科醫師的準確性和敏感性相當。Sato等(2021)[12]研究開發了一個關于髖部骨折的新CAD系統,其使用了來自多中心的10 484張正位骨盆X光片,準確度高達96.1%,曲線下面積(Area Under Curve,AUC)為0.99,系統實現了對髖部骨折患者高效的診斷性能。在另一項研究中[13],DNN模型對X線照片中的骨折進行檢測和定位,發現臨床醫生的診斷敏感性為80.8%,特異性為87.5%,而在深度學習(Deep Learning,DL)算法幫助下臨床醫生的診斷敏感性為91.5%,特異性為93.0%,同時臨床醫生平均的誤診率相對降低了47.0%,這證實了DL算法協助診斷可為臨床提供可靠依據。
當前,多研究表明AI診斷骨折的準確率類似或高于影像科醫生,AI通過對骨折的識別、定位及身體側別的判讀來進行骨折研究,以減少誤診漏診率,從而為患者護理提供實質性的改善,同時減少臨床醫生的工作負擔。
骨代謝疾病異常表現為骨密度 (Bone Mineral Density,BMD)改變及骨組織異常退化,在骨質疏松癥中表現為BMD減低、骨骼脆性大、易骨折。目前AI主要針對于BMD的定量及定性檢測進行研究。Tang 等(2021)[14]對 150 名患者的腰椎 CT 切片進行了骨密度CNN模型訓練,發現模型在篩查BMD改變的準確率為76.65%,AUC為0.9167,可作為BMD定量檢測新方法 Meng 等(2019)[15]發現,人工神經網絡(Artificial Neural Networks,ANN)和骨質疏松癥評估工具的聯合應用可改善中國老年女性骨質疏松癥風險篩查。另一項研究[16]開發了一種基于DCNN的全自動CT圖像椎體分割和BMD計算方法,DL可以對CT圖像中的腰椎體進行準確地全自動分割。通過自動回歸計算的平均BMD可顯示出高相關性(r>0.98),這將實現CT圖像中骨質疏松、骨質減少和正常骨密度的全自動識別。Lim等(2021)[17]通過使用具有影像組學特征和腹盆腔CT的ML模型對股骨骨質疏松癥預測,其準確度、特異性和陰性預測值均超過93%。
骨腫瘤種類繁多且發病率低,是臨床影像診斷的一大難點,現有多項研究希望通過AI進一步獲取更多準確的診斷信息。Zhang 等(2018)[18]開發并驗證了一種專門用于骨肉瘤圖像分割的多重監督殘差網絡模型,可在CT圖像中骨肉瘤區域精準化自動分割,來幫助醫生合理制定治療方案,從而提高治愈率。接下來有學者開發并評估了一種DL模型[19],證實DL算法可以對多機構數據集中的X線原發性骨腫瘤影像進行分類,它與專科醫生具有相似的準確度,并且比初級放射科醫生表現得更好。在另一項研究中,有學者[20]利用AI與CT和MRI圖像融合技術,構建了個性化3D模型對骨盆骨肉瘤女性患者進行了術前腫瘤邊緣評估。模型發現靜脈內以前被忽視的多個栓子,栓子的發現,意味著預后極差,因此,圖像融合模型可為骨腫瘤提供更豐富的信息。 Aoki等(2020)[21]應用 DL 算法在骨閃爍掃描前列腺癌患者的骨轉移方面進行診斷,發現其結果與核醫學專家相似,可作為治療和預后客觀依據。2021年有學者[22]使用DL對膝骨腫瘤進行分類研究,根據它們是正常、良性腫瘤還是惡性腫瘤區域來檢測和分類膝骨區域。發現其分類準確率為99.05%,表明DL模型可幫助醫生進行膝骨腫瘤檢測分類。
AI對骨腫瘤圖像處理具有優勢,但對骨腫瘤圖像判讀的準確性仍有進步的空間。特別對較小的骨腫瘤病灶還有一定的局限。因此,仍需要大量數據對模型進行優化。
當軟骨出現退行性改變和磨損消失等情況,表明其存在不同程度的骨關節炎,盡早發現軟骨變化,對于診斷慢性骨關節炎具有極高的價值。現如今AI在關節軟骨診斷中的應用有定性檢測、軟骨識別等。2018年有學者[23]應用DL算法對MRI中膝關節軟骨病變進行檢測,其中包含局部缺損、纖維化、軟骨軟化、軟骨退變和軟骨損傷等,證明ML在骨關節炎分類研究方面具有一定前景。Park等(2021)[24]提出的ML算法對髖關節發育不良的診斷具有較高的準確性,其診斷能力與有經驗的影像科醫生相似。2021年有研究者[25]進一步開發了一種基于DL的自動化算法聯合使用膝關節X光片的后-前和側位圖,根據Kellgren-Lawrence分級系統評估膝關節骨關節炎的嚴重程度,模型測試集獲得了71.90%的準確率,證明了DL算法對膝關節骨關節炎嚴重程度的評估有一定的應用價值。在另一項研究中[26],回顧性收集了11 353張膝關節MRI檢查的冠狀和矢狀位質子密度加權脂肪抑制圖像。研究發現,3DCNN模型的內側半月板撕裂檢測的AUC值為0.93和0.95,外側半月板撕裂檢測的AUC值為0.84和0.91。這表明ML算法在膝關節半月板病變檢測方面具有較高準確性。
目前,AI在骨關節軟組織方面也有所涉及,如關節韌帶損傷、肌間脂肪定量分析、肌腱撕裂識別等。關節韌帶的狀態與膝關節各類疾病的診斷有關。 Namiri等(2020)[27]開發使用 3DCNN 和 2DCNN模型,其對前交叉韌帶損傷(Anterior Cruciate Ligament,ACL)分類的總體準確率分別為89%和92%,表明CNN可對ACL損傷進行檢測并分級。目前,大腿肌肉和脂肪組織的分割對于了解骨關節炎等肌肉骨骼疾病相當重要,Ding 等(2020)[28]在 MRI圖像上基于DL開發并評估了一種自動化全大腿肌肉分割方法,發現自動分割產生的ICC總體上高于手動分割(0.921 vs 0.902),且在脂肪定量估計中有更高的準確性,同時節約了分割時間。Kang 等(2021)[29]開發了一種基于腋外側肩部X光片DL算法,可根據腋側位片上小結節的變化及臨床數據評估肌腱撕裂。這進一步證實了DL算法可作為初步評估肌腱完整性的客觀依據。目前,在骨關節系統應用領域內,以DL為代表的AI技術仍在不斷拓展。
近年來,盡管人工智能在骨關節系統醫學影像上已經取得了一定進展,但與其他熱門領域如神經系統、呼吸系統等相比仍然存在不足:①數據處理系統仍需完善,對于研究最多的是前交叉、半月板、韌帶及軟骨,而對肌腱、肌肉等關節周圍組織的研究相對較少[30]。關節是人體重要的承重及運動系統,解剖關系精細復雜,各結構組織間緊密聯系,需要看作一個整體進行探索研究;②當前實驗大多是對已有數據進行回顧性研究,缺乏骨關節系統疾病的前瞻性研究,以提供更有價值的診療及預后參考;③模型效能有待提高,目前AI骨關節系統醫學影像模型數據來源相對單一,多數模型仍處于開發驗證階段,極少數研究模型可在復雜的臨床環境里對患者癥狀的安全性及通用性進行評估,表明模型具有不穩定性。在未來,需著重提升模型在多中心數據上的泛化性和穩定性,為復雜的臨床環境提供更堅實的理論依據;④模型應在影像資料開發的基礎之上,結合患者實驗室檢查及病史等綜合信息,提高模型的準確性,更好地服務于患者和臨床。
隨著AI技術與醫學影像的深度融合,AI在影像中的應用和研究將進一步拓展和深化。同時,隨著影像圖像數據集的增多及診斷參考標準的收集,未來將開發更精確、更先進的AI模型,也將收集更多的前瞻性數據,構建更具有代表性的骨關節系統疾病的預測模型。堅信在未來不斷的嘗試與突破后,AI能克服當前的不足,為影像科提供更高效的幫助,從而降低醫療成本,優化服務模式,踏入智能醫療影像的新征程。