謝豆 鄭菲 陳濤 劉文軍



摘要:借助人工智能技術以及信息化遠程醫(yī)療技術,搭建基于人工智能的影像遠程會診平臺,成為提高醫(yī)學影像診療效率的一種有效手段。目前的新冠肺炎疫情檢測方法有臨床表現(xiàn)描述、病原學檢測、血清學檢測,以及使用肺部影像進行進一步的輔助診斷。探索建立醫(yī)學影像遠程診斷平臺,并基于卷積神經(jīng)網(wǎng)絡VGG模型對X射線肺部影像進行診斷,這種自動化的方法能夠對患者的輔助診斷起到一定的效果,從而減輕醫(yī)生的工作量。
關鍵詞:機器視覺;深度學習;計算機輔助診斷;VGG16;新型冠狀病毒肺炎(COVID-19)
中圖分類號: TP393? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)23-0137-03
Abstract: With the help of artificial intelligence technology and information telemedicine technology, the establishment of an artificial intelligence-based remote imaging consultation platform has become an effective means to improve the efficiency of medical imaging diagnosis and treatment. The current COVID-19 detection methods include description of clinical manifestations, pathogenic testing, serological testing, and the use of lung imaging for further auxiliary diagnosis. Explore the establishment of a medical imaging remote diagnosis platform, and diagnose X-ray lung images based on the convolutional neural network VGG model. This automated method can have a certain effect on the auxiliary diagnosis of patients, thereby reducing the workload of doctors.
Key words: machine vision; deep learning; computer aided diagnosis; VGG16; COVID-19
2019年底爆發(fā)至今的COVID-19肺炎是由SARS-CoV-2感染引起的一種嚴重急性呼吸綜合癥,伴有發(fā)燒、咳嗽、頭痛、肌痛,在某些情況下還有腸道癥狀。疫情蔓延全世界,爆發(fā)初期病例呈指數(shù)增長,它被世界衛(wèi)生組織(World Health Organization,縮寫WHO)稱為一種大流行病,每個國家都深受其害。面對COVID-19大流行,我國政府采取了科學、有力的防控措施,使得疫情在國內得以有效控制,但仍有大量的境外疫情輸入威脅著人們的健康。
隨著我國對COVID-19肺炎的臨床表現(xiàn)、病理認知的深入和診療經(jīng)驗的積累,提早檢測出COVID-19患者,阻止病情擴散成為控制疫情發(fā)展的關鍵。除了使用核酸檢測進行是否患病的判斷并及時進行相關人員的14天隔離,作為補充還可以使用肺部影像進行輔助診斷。因為COVID-19以肺臟和免疫系統(tǒng)損害為主,當成人肺內病變在短期內迅速發(fā)展、兒童影像學顯示雙側或多肺葉浸潤、胸腔積液或短期內病變加速,都是重型、危重型臨床預警指標。由于需要篩查的人員數(shù)量眾多,需要進行診斷的肺部影像基數(shù)大,放射科醫(yī)生數(shù)量有限,這不僅讓患者就診時間增加,也給醫(yī)院診療帶來了壓力。
當前存在多項采用卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)分類方法輔助COVID-19的診斷相關研究[1]。為了緩解醫(yī)患壓力,縮短肺部醫(yī)療影像就診時間,降低就診成本,本文將深度學習算法與計算機視覺相結合,對肺部醫(yī)療影像進行處理,并將訓練好的深度學習模型用于診斷用戶是否患病。模型還可靈活部署于各種遠程診療應用中,大大縮短了就診時間,可用于輔助醫(yī)生進行前期篩查診斷,提高就醫(yī)效率。
1 預備知識
1.1 數(shù)據(jù)集
訓練使用的數(shù)據(jù)集采用了X射線肺部影像。數(shù)據(jù)集為二分類數(shù)據(jù)集,一類為正常肺部影像4098張,用標簽normal(正常)表示,另一類為COVID-19肺部影像4098張,用標簽pneumonia(肺炎)表示。總的數(shù)據(jù)集為8196張圖片,因為兩類樣本的數(shù)量相同,因此大大降低了二分類中常出現(xiàn)的樣本不均衡問題發(fā)生降低性能的概率。與多分類比起來,二分類的復雜程度更低,從而使單類的判斷確定性提高。
關于肺部影像除了X射線影像還有CT影像,如圖1所示分別給出了兩種圖像類型在正常和異常(確診)情況下的對比。圖1中的CT圖像數(shù)據(jù)集內容由Yang等人提供[2],而本文選用X射線影像的原因在于X射線圖片更大更清晰,圖片上的無用信息少,不容易干擾模型學習。相比之下,CT影像常常出現(xiàn)設備信息干擾模型學習。此外,X光機更便宜、操作速度更快,檢測成本更加低廉。
1.2 數(shù)據(jù)預處理
卷積神經(jīng)網(wǎng)絡是深度學習代表性的網(wǎng)絡,能夠學習強大的表征空間,這是解決復雜學習任務所必需的。由于在訓練過程中容易發(fā)生過擬合現(xiàn)象,因此需要適當?shù)恼齽t化。考慮到現(xiàn)有數(shù)據(jù)集數(shù)量有限,對原有的數(shù)據(jù)集進行圖像處理增加圖像數(shù)量繼續(xù)訓練的技術稱為圖像增強。圖像增強是正則化中重要的一種形式,也是訓練模型時常用的方式,它可以提高模型的魯棒性,同時最大限度地提高模型的精度,使模型更加貼合真實的使用場景。