李星宇,雷禹,黃曉旗,李建龍,閆軍
延安大學附屬醫院 影像科,陜西 延安 716000
肋骨骨折是胸部外傷后較為常見的損傷,通常采用保守治療,雖然死亡率相對較低,但多發肋骨骨折可能會造成嚴重并發癥,如肺挫傷、肺不張,甚至血氣胸等[1]。大多數學者認為,肋骨骨折數量越多,患者越容易出現肺部并發癥,導致預后不良[2-3]。也有研究表明,中肋外側骨折可誘發更高的并發癥發生率,因此需要更密切的觀察[4]。X線與CT均是診斷肋骨骨折的常用檢查手段[5],MRI對細微肋骨骨折有較大意義,可用于輕度胸外傷患者的補充診斷[6]。但目前,CT已逐漸成為胸部外傷后首選的影像學檢查手段,尤其在醫學鑒定時顯得尤為重要[7]。隨著多層螺旋CT在臨床上的廣泛應用,肋骨骨折的檢出率也越來越高[8]。
由于肋骨解剖形態的特性,診斷時需要逐肋、逐側觀察,此過程較為繁瑣。目前已有人工智能(Artificial Intelligence,AI)對肋骨骨折的診斷效能的報道,并利用CNN模型可在較短的時間內自動檢測并分類肋骨骨折,達到放射科主治醫師的診斷水平[9]。同時研究表明,AI可以在不增加假陽性率的基礎上,提高診斷的準確性及敏感性,提升醫師的診斷效率[10-11]。但目前對于不同類型的肋骨骨折診斷的準確性及誤漏診原因尚鮮見報道。因此,探究人工智能軟件輔助影像科醫師是否可以在保證診斷準確度的前提下提升工作效率具有重要意義。
本研究主要針對在不同類型的肋骨骨折中AI的檢出率及靈敏度,以及在本研究中存在的誤漏診原因進行分析,探究影像科醫師在使用AI進行肋骨骨折診斷時應注意的問題;同時,針對這些問題以及敏感度較低的骨折進行系統機器學習、訓練,以優化算法,以期提高AI對肋骨骨折的檢出性能,減少AI對肋骨骨折的誤診率和漏診率。
回顧性分析本院2020年10—12月進行CT檢查中明確為肋骨骨折患者77例的影像資料,其中男性49例,女性28例;年齡21~83歲,中位年齡52歲;合并胸腔積液17例,肺挫傷8例,肺不張7例,氣胸5例。納入標準:① 有肋骨骨折的影像學特征;②CT掃描骨痂形成或骨折愈合。排除標準:① 圖像中有明顯的呼吸及放射狀偽影,影響肋骨骨折的診斷;② 存在骨破壞或骨腫瘤病史;③ 先天胸廓發育不良或畸形。所有影像資料均來源于本院PACS系統。所有患者均對本研究知情同意,并簽署知情同意書。
使用聯影uCT-760 64排螺旋CT。掃描時患者取仰臥位,頭先進,深吸氣后屏氣,掃描范圍由肺尖至上腹部。掃描參數:管電壓120 kV,自適應動態管電流,準直寬度40 mm,螺距1.0875,掃描層厚5 mm。圖像重建1 mm薄層,層間距1 mm,矩陣512×512,骨算法重建。
使用人工智能軟件(uAI EasyTriage-Rib)進行肋骨骨折的自動檢測。將符合標準的CT圖像導入AI系統后,AI軟件可對其進行圖像后處理和分析,輸出軟件預測出的肋骨骨折區域,并做標記。肋骨骨折自動檢測基于V-Net[12]完成,V-Net提供了3D卷積神經網絡架構,用于對骨折特征的提取及圖像的定位。該神經網絡首先經過圖像特征壓縮網絡路徑提取相應特征,再經1個與壓縮網絡對稱的去壓縮網絡恢復到與輸入等尺寸的三維矩陣。由軟件研發公司開發訓練了此軟件。軟件處理結果界面中包括帶肋骨骨折標記的橫軸位圖像、CPR圖像及VR圖像,以方便診斷醫師觀察AI檢測的肋骨骨折情況。軟件處理結果頁面包括帶有肋骨定位標簽及骨折處標記的橫軸位圖像,同時可在軟件中進行多平面重建(Multiple Planar Reformation,MRP)及容積重建(Volume Rendering,VR)的后處理以多方位觀察AI檢測的肋骨骨折情況。同時軟件診斷肋骨骨折自動表示骨折類型,如錯位性骨折、非錯位性骨折及陳舊性骨折,并通過MPR及3D后處理技術幫助醫師識別骨折及判斷骨折性質(圖1~2),其中陳舊性骨折定義為骨折處骨痂形成或骨折畸形愈合。

圖1 AI操作界面

圖2 AI軟件自動識別并分析肋骨骨折部位及類型
① 由兩名具有5年診斷經驗的影像科醫師甲、乙使用層厚為1 mm胸部CT軸位圖像并采用多種CT后處理技術,如容積重建及多平面重建等進行診斷;② uAI EasyTriage-Rib軟件自動定位肋骨,識別骨折部位及骨折類型,得出診斷結果;③ 醫師甲、乙使用uAI EasyTriage-Rib軟件對肋骨骨折進行診斷;④ 以兩名從事影像診斷工作15年以上的高年資影像科醫師聯合閱片的最終結果作為“金標準”,高年資醫師獨立確定閱片結果,出現分歧時,商討一致確定。
分別采用兩種方法對診斷結果進行分析,分別對比骨折的檢出率及骨折診斷的準確性。在金標準判定為骨折的位置中,診斷結果也判斷為存在骨折(包括骨折類型診斷錯誤),則認定為檢出;若診斷結果判定為無骨折,則認定為未檢出。將3組診斷結果與金標準進行對比,若骨折位置及性質與金標準一致,則認定為診斷正確;若骨折與金標準不一致,則認定為診斷錯誤。研究中診斷錯誤包含兩種情況:①AI或醫師診斷為骨折而金標準未認定為骨折;② 醫師和AI診斷骨折的性質與金標準不符合。
應用SPSS 24.0統計學軟件進行數據分析,計算出兩種方法對肋骨骨折檢測的檢出率及假陰性率以及對肋骨骨折診斷的準確度、靈敏度,并比較各組之間各指標的差異。采用多重修正χ2檢驗及Fisher確切概率法分別比較兩名醫師與AI單獨及醫師在使用AI后的診斷準確性。采用配對t檢驗對影像科醫師單獨診斷與使用uAI EasyTriage-Rib軟件閱片的診斷用時進行比較。
根據兩名高年資影像科醫師商討一致后得出,77例患者共328根肋骨骨折,骨折434處,其中錯位性骨折101處,非錯位性骨折168處,陳舊性骨折165處。
uAI EasyTriage-Rib檢測正確的部位中,醫師甲獨立診斷時有30處檢測錯誤,醫師乙有24處檢測錯誤,見表1。在金標準檢出的骨折434處中,uAI EasyTriage-Rib檢出骨折423處,漏診11處,醫師甲獨立診斷時漏診44處,醫師乙漏診55處,見表2。

表1 uAI EasyTriage-Rib與影像科醫師診斷結果(例,n=434)

表2 uAI EasyTriage-Rib與影像科醫師對骨折的陽性檢出情況(例,n=434)
uAI EasyTriage-Rib對非錯位性骨折、陳舊性骨折的檢出率明顯高于醫師甲及醫師乙(P<0.05),但在對錯位性骨折的診斷中,uAI EasyTriage-Rib與醫師甲及醫師乙的檢出率無明顯差異(P>0.05)。醫師使用 uAI EasyTriage-Rib對3種類型骨折的檢出率與uAI EasyTriage-Rib單獨診斷相比無明顯差異(P>0.05),見表 3~4。

表3 uAI與影像醫師及uAI聯合影像醫師對不同類型骨折的檢出情況(%)

表4 uAI與兩名影像醫師及uAI聯合醫師對骨折檢出率的差異分析
uAI EasyTriage-Rib對3種類型骨折診斷的準確度及敏感度明顯高于醫師甲及醫師乙(uAI與醫師甲準確度比較,錯位性χ2=12.320,P<0.001,非錯位性χ2=11.390,P=0.001,陳舊性χ2=7.639,P=0.002;靈敏度比較,錯位性χ2=13.713,P=0.001,非錯位性χ2=12.789,P<0.001,陳舊性χ2=7.017,P=0.008。uAI與醫師乙準確度比較,錯位性χ2=13.902,P<0.001,非錯位性χ2=4.260,P=0.039,陳舊性χ2=5.938,P=0.015;靈敏度比較,錯位性χ2=15.572,P<0.001,非錯位性χ2=11.172,P=0.001,陳舊性χ2=8.769,P=0.003);醫師甲及醫師乙使用uAI EasyTriage-Rib對3種類型的骨折診斷準確度明顯高于uAI EasyTriage-Rib單獨診斷(醫師甲使用uAI診斷vs.uAI單獨診斷的準確度比較,錯位性χ2=4.256,P=0.039,非錯位性χ2=19.257,P<0.001,陳舊性χ2=31.381,P<0.001。醫師乙使用 uAI診斷vs.uAI單獨診斷的準確度比較,錯位性χ2=14.910,P<0.001,非錯位性χ2=38.229,P<0.001,陳舊性χ2=13.541,P<0.001);uAI EasyTriage-Rib對錯位性骨折診斷的靈敏度略低于醫師乙使用uAI EasyTriage-Rib診斷(95.8%vs.96.1%,χ2=14.736,P<0.001),對陳舊性骨折診斷的靈敏度高于兩位醫師使用uAI EasyTriage-Rib,差異具有統計學意義(uAI與醫師甲比較,χ2=32.728,P<0.001;uAI與醫師乙比較,χ2=14.149,P<0.001),見表 5。

表5 uAI與兩名影像醫師及uAI聯合醫師對不同類型骨折的診斷效能(%)
比較金標準與uAI EasyTriage-Rib診斷結果,共有41處骨折存在診斷偏差,其中漏診11處,假陽性9處,這兩者主要見于非錯位性骨折;性質診斷錯誤21處,該情況主要存在于陳舊性骨折。uAI EasyTriage-Rib對錯位性骨折、非錯位性骨折及陳舊性骨折診斷的漏診率分別為3.96%、2.98%、1.21%,對所有骨折的總漏診率為2.53%(表6~7)。

表6 uAI EasyTriage-Rib骨折誤診和漏診情況(例)

表7 uAI EasyTriage-Rib與影像醫師及uAI聯合影像醫師對不同類型骨折診斷的漏診率(%)
甲、乙兩位影像科醫師獨立閱片的診斷用時分別為(306.3±65.3)s、(301.4±55.9)s,甲、乙兩位醫師使用uAI EasyTriage-Rib閱片的診斷用時分別為(210.1±49.5)、(206.3±43.6)s,使用 uAI EasyTriage-Rib閱片的診斷平均用時顯著低于兩位影像科醫師單獨閱片(醫師甲單獨診斷與使用uAI診斷用時比較,t=21.591,P<0.001;醫師乙單獨診斷與使用uAI診斷用時比較,t=18.121,P<0.001)。
目前,隨著人們生活節奏的加快及出行方式的改變,胸部損傷也越來越常見。肋骨骨折作為胸部損傷中最常見的并發癥,發生率可高達40%~80%[13]。肋骨骨折是嚴重損傷的標志,常伴有多發傷,且伴多發傷及連枷胸的患者通常結局更差[14]。而多根多處肋骨骨折往往合并了嚴重的胸腹聯合損傷,有研究表明,肋骨骨折的骨折根數可以作為肺部并發癥發生的獨立危險因素[15];同時,肋骨骨折的誤診、漏診是在日常工作中引起醫療糾紛的一個常見原因,因此,提高肋骨骨折的診斷準確性及時效性具有重要意義。目前,針對醫學影像領域的AI已經廣泛應用于肺結節、新冠肺炎的檢出等[16-17]。AI可為影像科醫師提供更多的信息,以利于其診斷疾病。
AI軟件可以快速完成胸椎及肋骨的分割,并對肋骨骨折部位及性質進行自動標識。在對明顯的、易于診斷的錯位性骨折中,醫師與AI診斷的檢出率無明顯差異,但在非錯位性及陳舊性骨折中AI的檢出率明顯高于醫師,表明AI對難以診斷及易遺漏骨折的檢出更具意義,這與既往研究中認為AI與醫師聯合閱片時骨折檢出率的優勢主要表現在輕微骨折的檢出上相一致[18]。AI與人工聯合后較AI單獨診斷檢出率并沒有顯著提高,這可能因為AI在單獨診斷時檢出率已經達97%以上,AI中未檢出的骨折多為較難診斷的非錯位性骨折,因此AI漏診后低年資醫師使用AI多數也未診斷出。
就診斷準確性而言,AI在3種骨折類型中的診斷準確度均優于影像科醫師單獨診斷,同時,醫師在使用AI后對3種類型骨折的診斷準確度優于AI單獨診斷,這與之前的一些報道相似[11,19]。醫師使用AI后對肋骨骨折診斷的準確度較單獨AI明顯提高,可能是因為醫師對AI的部分骨折類型判斷錯誤進行了診斷結果的修正,減少了誤診的發生。盡管在3種骨折類型中AI的診斷準確度及靈敏度均高于影像科醫師,但陳舊性骨折的診斷準確度及靈敏度略低于非錯位性骨折及錯位性骨折,這也與相關報道相似[20]。因此,需要對非錯位性骨折及陳舊性骨折的征象進行機器學習及驗證。
本研究中,AI對骨折的漏診較少,其假陰性率明顯低于兩名醫師的診斷,AI大多為假陽性及性質判斷錯誤,其中性質判斷錯誤占比較大,漏診大多為不完全性骨折。假陽性情況最多的為將肋軟骨的不完全鈣化誤認為非錯位骨折;其次包括呼吸運動偽影、滋養孔影及引流管影。性質診斷錯誤大部分為陳舊性骨折,這可能是由于AI對于輕微的骨痂形成識別能力較弱,將其誤判為非錯位性骨折。此外,也存在有輕微的錯位性骨折被判定為非錯位性骨折的情況。以上結果表明,AI還有繼續優化的空間,可以進一步進行機器學習及驗證,提升診斷的準確性。醫師在使用AI輔助診斷時,應更注意以上提到的問題,從而做出更準確的判斷。在診斷用時的比較中,醫師使用AI閱片對肋骨骨折的診斷用時顯著短于自身單獨診斷用時。表明AI在保證醫師診斷準確度的同時,能夠提高對肋骨骨折的診斷效率。
綜上所述,AI可快速、直觀地識別肋骨骨折部位及類型,較影像醫師獨立診斷具有更高的準確度及靈敏度。AI與醫師的聯合診斷還明顯縮短了醫師的診斷時間,提高了醫師的診斷效率,具有較高的臨床應用價值。