樓毅 王志祿 倪捷 侯玨 劉正 劉偉光*
兒童脛腓骨骨折是兒童骨折中最常見的類型之一,受傷原因以交通運輸傷為主,及時診斷并選擇合適的治療方案是取得良好預后的關鍵[1]。臨床醫師通常應用數字X射線攝影(DR)對骨折進行診斷,其結果受到醫師的經驗、拍攝體位、影像質量等因素影響。近年來,以深度學習算法為代表的人工智能技術在醫學圖像處理領域中得到越來越多的應用[2],據相關文獻報道,深度學習算法在骨折檢測和分類任務中展現出較大的潛力[3]。本研究使用標準數據增強方法構建了數據集,其中包含各年齡階段的兒童脛腓骨骨折DR圖像,采用深度學習算法(YOLOv5)對兒童脛腓骨DR圖像進行檢測。
1.1 臨床資料 選擇2014年1月至2022年1月本院302例使用數字化醫用X線攝影系統拍攝的兒童脛腓骨影像圖,輸出匿名影像圖。剔除帶有植入物,其他骨性疾病,畸形骨骼,隱匿性骨折等特殊樣本。年齡1~15歲,平均年齡7.38歲。本項目經杭州市兒童醫院醫學倫理會批準。
1.2 方法 (1)儀器設備:數字化X射線攝影(digital radiography,DR)系統,型號Digital Diagnost C50 65。(2)數據預處理:302張圖像中,262張作為訓練、驗證集,40張作為測試集。由于X線系統所采集到的圖像分辨率為2,284×2,142~2,449×998,無法統一輸入至算法模型中進行訓練。因此,采用雙線性插值算法[4]將圖像分辨率歸一化為512×512,該算法如下:

其中Q11,Q12,Q21,Q22表示最近像素鄰點,雙線性插值算法可以保留更多的圖像細節,有利于模型對細微骨折的判斷。然而,深度學習模型的訓練需要大量數據支撐,262張圖像所組成的訓練、驗證集會造成模型過擬合現象。因此,在尺寸歸一化的基礎上,采用水平、垂直翻轉、平移、隨機添加像素等方法對訓練集進行擴充,總共得到2096張圖像,并按8∶2的比例劃分為訓練集和驗證集(見圖1)。(3)YOLOv5模型:采用CNN模型[5](見圖2),模型由輸入層、主干網絡、特征加強網絡和輸出層組成。輸入層圖像尺寸為512×512,主干網絡由FOCUS結構、卷積塊、殘差模塊以及SPP結構組成,FOCUS結構是在保留特征的前提下進行下采樣而加速模型訓練,SPP結構能夠抽取特征再聚合,提升模型的魯棒性和精度。特征加強網絡使用主干網絡的三個特征層進行特征融合,特征融合的目的是將不同尺度圖像上的骨折特征信息結合,輸出得到3個預測特征層,預測出骨折區域的位置和置信度。為了讓模型從圖像中提取到更多骨折特征,主干網絡中使用的殘差結構模塊(見圖3),以跳層連接方式將輸入與輸出特征拼接,有效防止骨折特征在網絡深處的“退化”問題。卷積塊由Conv2D(卷積)+BatchNormal(歸一化)+LeakyRelu(激活函數)組成,這是一個基本的卷積單元。圖像進行卷積運算后能夠提取出用于骨折區域定位的特征,如骨折線,骨折位置信息等。

圖1 數據擴充效果圖

圖2 卷積神經網絡模型圖

圖3 殘差模塊
1.3 模型評價指標 骨折檢測研究領域常用的評價標準包括精確率,召回率和平均精確率(AP)。精確率是衡量模型檢測骨折的準確性,即查準率;召回率是衡量模型檢測骨折的全面性,即查全率[6]。AP是通過積分法計算精確率,召回率曲線下面積,AP值是綜合評價模型檢測骨折性能的重要指標,公式如下:

其中TP表示真陽性,FN表示假陰性,FP表示假陽性。
模型經過150輪(epoch)訓練和驗證模型的總loss函數曲線逐漸收斂(見圖4)。模型在獨立測試集上的精確率為93.62%,召回率為91.67%,AP值達到93.07%。模型檢測骨折的效果見圖5,除具有明顯識別特征的骨折如橫形、斜形及螺旋形骨折可以被準確識別外,該模型還可以對裂紋骨折進行準確識別(見圖6)。裂紋骨折雖然痕跡相對較淺,然而模型通過殘差模塊學習圖像高度抽象的骨折特征表達,經過特征加強網絡不斷提取特征,使得模型能夠檢測出裂紋骨折。該結果表明模型具有較強的泛化能力。數據增強是訓練卷積神經網絡模型的有效辦法,訓練和驗證數據經過擴充后,在測試集上AP值從78.86%提升至93.07%,見表1。不同模型算法的比較見表2。

表1 數據擴充后的模型性能比較(%)

表2 不同模型算法的比較(%)

圖4 模型訓練和驗證的Loss結果

圖5 兒童脛腓骨骨折醫師標注圖與機器檢測對比圖(A~D依次為輸出匿名影像圖、預處理后的圖、放射科醫師標注圖、模型檢測結果圖)

圖6 測試結果圖

本研究由放射科醫師標注兒童脛腓骨骨折X線影像,然后利用雙線性插值算法對圖像進行預處理,最后將人工智能算法(YOLOv5)用于兒童脛腓骨骨折檢測,建立了完整的自動檢測兒童脛腓骨骨折模型,驗證了數據增強能夠有效提高深度學習算法在兒童脛腓骨骨折檢測的精確率;構建了一個自動檢測兒童脛腓骨骨折的系統模型,該模型在獨立測試集上的精確率、召回率、AP值均達到90%以上。
以深度學習算法為代表的人工智能檢測技術已應用于各種醫學成像任務中,如癌癥和肺炎的放射檢查結果的自動檢測[7],以及骨齡評估、骨折檢測等[8],既往應用深度學習算法對脛腓骨骨折自動檢測的研究中,主要思路是對DR進行二項式分類,即判斷DR圖像是否骨折。ZBIGNIEW等創建了一個含有980張兒童腳踝和腿部X線影像數據集,其中490張兒童脛骨遠端骨折圖像,490張正常X線影像圖,使用Xception-V3網絡模型進行訓練學習,最終在測試集上取得95.6%的精確率[9]。MUCHTAR等[10]提出了一種掃描線算法,在40張脛腓骨骨折圖像中測試識別骨折,精確率為87.5%。這些研究在識別脛腓骨骨折檢測任務中均取得較高的精度,然而,在這些研究中僅對X線影像圖分類,判斷是否骨折,并未將骨折區域識別出。在最近一項研究中,REN等[11]應用Faster-RCNN網絡模型對50張脛腓骨骨折X線影像圖進行再訓練,最終獲得97%的精確率。然而,本研究使用該算法在擴充后的數據集上訓練學習,在相同實驗環境配置下,相同參數訓練相同的次數,最終測試集上獲得49.30%的平均精確率,遠低于訓練模型的檢測精度。與以往研究相比,本模型能夠將骨折區域標記出,更符合臨床醫師診斷骨折的情形。
本研究提出的模型檢測兒童脛腓骨骨折AP在90%以上,精確率較高,可以輔助放射科醫師對兒童脛腓骨骨折進行檢測,在一定程度上能夠節約診斷時間,降低兒童脛腓骨骨折誤診率及漏診率。同時,也為DR圖像自動化檢測骨折積累經驗,為促進人工智能技術在人體骨骼損壞智能檢測的研究打下良好基礎。