魏鵬磊,雷菊陽
(201620 上海市 上海工程技術大學 機械與汽車工程學院)
新冠病毒疫情之下,醫生需要尋求更加快捷的診斷方式來確定疑似病例。除核酸檢測外,胸部X 射線影像識別成為篩查病人的主要手段。在國家衛健委發布的《新型冠狀病毒感染肺炎診療手段(試行第八版)》里,具有新冠肺炎影像學特征的臨床表現已被明確納入確定疑似病例的診斷標準中[1]。新冠肺炎很多患者是干咳,采集痰液困難,而咽拭子核酸檢測的總陽性準確率為30%~60%,敏感性欠佳,可能會漏診。胸部影像診斷敏感性好,準確率高達97%。故疑似病例較多的情況下,單憑核酸檢測容易漏診,胸透篩查更有優勢,可早發現、早隔離、早治療。而在實際臨床中,疑似病患、密切接觸者篩查會產生大量胸透影像,醫生肉眼辨別胸透影像效率較低[2-4]。
鑒于此,本文使用加州大學圣地亞哥分校的開源數據集,通過構建卷積神經網絡模型對影像進行識別,并進行數據可視化。實驗結果表明,本文的模型和方法有較好的效果和很強的可行性。
卷積神經網絡(CNN)非常適合做圖片分類任務。通過制定卷積大小、窗口移動大小,一步一步地學習數據特征。每次學習計算卷積層后,計算一次最大池化層,就是對輸入圖像進行下采樣。之后,通過dropout 對結果進行正則化,這樣可以防止過擬合,降低維度,經過反向傳播訓練,直到最優。隨著卷積網絡的不斷發展,圖像變得越來越小,但由于卷積層的存在,圖像也越來越深(即具有更多的特征圖),如圖1 所示。在堆棧頂部添加一個常規的前饋神經網絡,該網絡由幾個全連接層組成,最后一層輸出預測。

圖1 典型的CNN 架構Fig.1 Typical CNN architecture
本文所采用的CNN 為一種深度神經網絡,其基本模型如圖2 所示。

圖2 深度神經網絡基本模型Fig.2 Basic model of deep neural network
本文所用數據集為加州大學圣地亞哥分校的開源數據集,該數據集共包括542 張附有標簽的胸部X 射線影像,其中確診患者胸部影像數據共289例,未確診患者胸部影像數據共253 例。本實驗選取的訓練集、驗證集和測試集數據如表1 所示。

表1 新冠肺炎胸部影像數據集Tab.1 New coronary pneumonia chest imaging dataset
本實驗中,使用Keras 的ImageDataGenerator加載所需數據,并且做數據增強與處理。對于訓練數據,分別做以下處理:將像素值歸一化;剪切強度(逆時針方向的剪切變換角度)為0.2;隨機縮放的幅度為0.2 以及水平翻轉。對測試數據只做歸一化處理,即將RGB 對應的具體數值轉換成0~1之間的值,便于神經網絡計算。本實驗采用最大最小標準化,計算公式為

隨機查看9 張病理圖片,圖片以3 行3 列的方式顯示,每張圖片下面都顯示出對應的病理類別,其中covid_with_PNEUMONIA 表示陽性,covid_without_PNEUMONIA 表示陰性。可視化輸出圖如圖3 所示[5]。

圖3 病理圖Fig.3 Pathological image
本文創建的CNN 模型主要由卷積層、最大池化層和Dropout 層組成,最后有一個全連接層作為輸出層。首先輸入預處理后得到的224×224×3 大小的圖片,經過64 個卷積核的2 次卷積后,采用一次最大池化;再經過2 次128 的卷積核卷積之后,采用一次最大池化;再經過3 次256 的卷積核卷積之后,采用最大池化;繼續重復兩次3 個512 的卷積核卷積,之后再最大池化;最后經過3 次全連接層后輸出。其中,該模型每個卷積層的卷積核大小均為3×3×3,步長為1,邊緣填充也是1,最大池化層大小采用2×2,Dropout 層丟棄的比例為0.5。構建的神經網絡具體參數如圖4 所示。

圖4 網絡模型概況Fig.4 Network model overview
本文使用的優化算法為Adam 算法,因為它實現簡單,計算高效,適用于大規模數據和參數的場景,設置學習率為0.000 1,batch_size 為16,迭代次數為10 次,并對驗證集的精確度添加提前終止監控,patience 設置為3。
首先用498 張病理圖片訓練樣本進行模型訓練,其訓練結果的準確率以及損失函數分別如圖5、圖6 所示。

圖5 準確率Fig.5 Accuracy

圖6 損失函數Fig.6 Loss function
再用54 張病理圖片測試樣本進行評估。測試結果如圖7 所示。

圖7 測試集準確率Fig.7 Test set accuracy
由圖7 的測試結果可知,在現有樣本下基于深度學習的新冠肺炎影像學診斷方法準確率可達96.23%。為更好地說明本模型的可行性以及實際效果,對未知標簽的新冠肺炎病理圖片進行預測,結果如圖8 所示。即有97.61%的概率表明該病理影像為陽性,有2.38%的概率表明該病理影像為陰性。由此可知,該模型有較好的效果[6]。

圖8 預測結果Fig.8 Forecast result
本文基于深度學習對新冠肺炎影像學診斷進行了分析和網絡模型構建。實驗結果表明,所構建的基于深度學習的新冠肺炎影像學診斷方法具有較高的準確率,具有一定的實用性[7]。由于目前新冠病毒毒株仍在不斷變異,該模型存在缺少最新的新冠肺炎影像學樣本,故還需更多的實驗和樣本對該模型進行完善。