夏啟銘,余響全,韋 勇,肖雪梅
(遵義醫科大學 信息工程學院,貴州 遵義 563000)
肺結核疾病自19世紀以來,發展至今有100多年的歷史。在國際肺病大會期間,世界衛生組織(World Health Organization,WHO)提出2035年初步消滅結核病,2050年完全消滅結核病的遠景目標[1]。在全球范圍內,每年新發結核病患者在1 000萬左右,死亡人數接近150萬人,作為全球前十的死因之一[2],結核病容易造成聚集性疫情,構成突發的公共衛生事件,給人們帶來極大的健康威脅。目前,中國仍是世界結核病高發區30個國家之一,結核病病例數居世界第三位[3]。可以感受到,2020年初來勢洶洶的新型冠狀病毒,為我們的生產生活帶來了極大的阻礙,嚴重地威脅到了人類的身體健康,疫情控制過程中,醫學影像診斷也發揮了重要作用,在醫學成像技術和計算機技術不斷進步的形勢下,醫學圖像分析已經成為醫學研究、疾病診療中必不可少的一部分。
目前醫學圖像處理作為臨床診斷的主要輔助工具,而計算機技術應用在醫學領域也是近些年來國內外的一項熱門研究。隨著近年來深度學習的快速發展,基于深度學習的計算機輔助診斷技術在醫學圖像處理方面受到了極大的關注[4],在醫學圖像處理方面的圖像識別、醫學病理、檢測等很多領域逐漸起著越發主要的作用,具有廣闊的應用前景和科研視覺算法價值,逐漸成為醫學圖像處理方面的一個熱門研究方向。利用計算機輔助診斷技術對醫學圖像進行自動分析能夠提供一個客觀的診斷結果,減少醫生的主觀性判斷,提高醫生的工作效率。現代醫療體系下,醫生需要執行治療過程中的每一個步驟,這就需要醫生有快速的思考和決策能力,很多在醫學上的認知都來源于經驗的積累和總結,由于這種對醫生診斷依賴,診斷結果會產生一定的偏差,而機器學習的應用可以觀察到更加細微的東西,來達到輔助診斷的目的。
世界衛生組織推薦的痰涂片熒光顯微鏡和X射線檢查,是識別PTB可疑癥狀最廣泛且較為有效的診斷方法[5]。以人的肉眼直接通過痰涂片顯微鏡進行檢測,不僅煩瑣、工作量大,還會降低檢測結果的準確性。因此,計算機輔助診斷是一條很有必要發展的檢測路徑。推薦肺結核影像檢測方法:胸部X線片和CT成像。前者是肺結核影像診斷標準中明確提出胸部X線片可作為肺結核篩查或治療后療效評估的常用手段[6],后者作為目前診斷的主要手段。
本系統是在Windows10操作系統下利用PyCharm作為開發平臺,MySQL數據庫作為數據支撐進行設計的。該系統用戶主要為就診的患者和診斷的醫生,以及管理員。目前,醫療數據中很大部分都來源于醫學,這些數據已經成為醫生診斷必不可少的東西,在一些重大疾病的輔助篩查、診斷、決策和治療過程中發揮著關鍵作用。生物醫學是在不同尺度下對人體的觀測,具有多種成像模式,這些影像數據會對醫生的診斷產生部分影響。隨著醫學圖像數據量的快速增長,醫生長時間的閱片診斷,難免出現視覺疲勞,并且一些細小的病變難以用肉眼觀察到,出現診斷效率下降等問題,而機器學習在影像分析過程中,可以觀測得更加細微。因此,通過計算機進行醫學肺部圖像的處理就顯得極為重要。本項目將利用Python實現肺結核胸片檢測,使患者胸片診斷質量得到一定的保障。
本系統的設計主要針對醫學圖像數量日益增長,醫生閱片壓力增加的需求,在保障一定的診斷質量的前提下,協助醫生診斷,為閱片醫生省時省力,大大降低了醫生的工作壓力,醫學信息影像所面臨的診斷結果準確性和醫生缺口等問題也迎刃而解,而患者通過此系統也比較便捷地了解到自己的診斷結果。同樣,在后臺管理方面,此系統設置了雙重管理機制,即普通管理員和超級管理員,只有管理員才能登錄后臺,超級管理員決定了管理員的權限,包括所展示的內容及數據操作權限,不同管理權限意味著不同的管理條目,管理員在管理數據表時,數據量較少時方便管理,為滿足數據量大的情況,在后臺自定義中加入了查找功能,使管理更加方便合理。
肺結核病灶檢測系統分為3個板塊,即用戶模塊、圖像處理模塊。用戶模塊又分為用戶登錄/注冊和用戶信息管理。注冊/登錄模塊用于完成用戶的注冊/登錄,以及個人信息管理功能,管理員對用戶信息的管理功能。由于Django管理員由后臺超級管理員添加和分配管理權限,此處便沒有管理員注冊;圖像處理模塊又分為導入圖像、圖像預處理、圖像分析、圖像管理4個小模塊,該模塊為此系統核心功能,圖像的管理由超級管理員完成。系統功能模塊如圖1所示。

圖1 系統功能模塊
核心功能概述如下。
(1)導入圖像:將病人的肺結核胸片導入系統中,此系統采用本地上傳的方式,對圖像進行導入和存儲,存儲內容包括胸片位置、名稱、所屬、診斷結果、時間。
(2)圖像預處理:對比度增強、去噪。
(3)標出病灶可疑區域:將圖像傳入算法,在算法分析過后,對圖像可疑區域進行標注,框選出可疑病灶區域,以便醫生觀察,做出診斷,診斷結果也將和胸片基本信息一同存儲。
此檢測系統分為用戶模塊、圖像處理模塊和管理模塊,首先進行用戶注冊,注冊成功后方可登錄,進入登錄界面后選擇身份(用戶或管理員)登錄,登錄后檢查相關個人信息。若信息不完善,提示完善個人信息,也可對個人信息進行修改操作。若要修改個人信息,提交修改保存個人信息后即可進行其他操作。若是管理員登錄此系統,管理員分為超級管理員和普通管理員,不同權限的管理員進行不同的信息管理,超級管理員的權限比普通管理員稍大,超級管理員可對普通管理員、醫生、圖像等進行管理,普通管理員則無此權限。普通管理員可對用戶信息進行管理。進入圖像處理部分流程,首先導入圖像,即將病人的肺結核胸片導入系統中;對圖像預處理,對比度增強、去噪;標出病灶可疑區域,對圖像可疑區域進行標注,以便醫生觀察,在醫生診斷完成后,輸入診斷結果并提交,胸片和診斷信息便存儲到數據庫。操作完成若對檢測結果不滿意,可再次檢測,滿意則可返回系統界面,在需要某一患者胸片信息的情況下,醫生也可對胸片信息表進行查詢操作,若無其他操作可退出系統,系統流程如圖2所示。

圖2 系統流程
此系統采用的是MySQL數據庫,由此建立了4張表。主要的數據表有:auth_user為管理員信息表、user為患者信息表、d_user為醫生信息表、images為胸片存儲表。
其中,用戶信息表user與胸片存儲表images相關聯。系統E-R圖如圖3所示。

圖3 系統E-R圖
Efficientdet算法是由Google Brain團隊的三位領導者于2019年提出,其亮點在于使用雙向特征金字塔網絡以 及 一 種 復 合 尺 度 縮 放 方 法(見 圖4)[7]。EfficientDet可以分為主干特征提取網絡、加強特征提取網絡和預測網絡。特征提取網絡是基于Google的EfficientNet網絡,有D0~D7八個主干特征提取網絡層次,依次速度逐漸變慢,但精度主鍵提高,其功能是將輸入的圖片不斷下采樣,下采樣次數為5次(p1~p5)。p1是輸入圖片長、高壓縮后的結果;p2是長、高壓縮2次后的結果;p3是長、高壓縮3次后的結果;p4是長、高壓縮4次后的結果;p5是長、高壓縮5次后的結果。P3~P5具有較高的語義信息;P6和P7是在P5的基礎上壓縮得到的語義信息。BiFPN Layer是加強特征提取網絡,采用雙向特征金字塔網絡。預測網絡的功能是將提取到的特征轉化成預測結果,分為類別預測網絡(Class prediction net)和邊界框預測網絡(Box prediction net),前者的功能是對先驗框進行分類,后者的功能是對先驗框進行調整,獲得最終的預測結果。

圖4 Efficientdet算法流程
我國有世界上第二大的結核病病情,因此,快速、高效的診斷,對病人及時采取治療,是控制該種疾病的關鍵問題。本文首先研究了肺結核疾病的檢測現狀,發現當前的結核病檢測率不高。隨著社會經濟、科學技術的發展,傳統的檢測方法已無法滿足臨床的醫療診斷。本文旨在設計一個針對肺結核疾病的檢測系統,主要應用的算法是EfficientDet算法。該算法不僅高效,還能很大程度上減少影像醫生的工作量,提高結核病的檢測率。如何利用該圖像識別算法制作一個完善的系統將是下一步的研究方向,畢竟傳統的肺結核病診斷方法已滿足不了臨床醫學的需求。在此背景下,利用人工智能計算機輔助診斷是一個能幫助影像醫生快速、高效判斷的有效途徑。