劉志華,卡迪力亞·庫爾班,李豐軍,嚴傳波
新疆醫科大學 a. 公共衛生學院;b. 醫學工程技術學院,新疆 烏魯木齊 830011
肝包蟲病又稱作肝棘球蚴病,是一種因棘球絳蟲的幼蟲寄生于人體肝臟而導致的寄生蟲病[1-2]。肝包蟲病是牧區常見的人畜共患寄生蟲疾病,在我國多見于新疆、西藏、青海、甘肅、寧夏、內蒙古、四川等西北農牧區, 嚴重危害人體健康和畜牧業的發展, 是嚴重的公共衛生問題[3]。肝包蟲病患者在患病初期無特異性的癥狀及體征,隨著包囊的生長,患者出現腹部不適、疼痛、惡心、嘔吐等臨床體征表現,當囊腫破裂時,將會引發機體感染甚至發生過敏反應等并發癥,對人體健康造成極大危害。如今,治療肝包蟲病的首選方案是手術,但無論何種手術方式其術后并發癥的發生率都達到了60%[4-5],對人體產生極大危害,然而通過對醫學圖像進行病灶檢測可以協助醫生診斷疾病,有效減少疾病的死亡率。在病灶檢測方面,國外研究學者做了一些研究,提出一個深度目標檢測網絡定位視盤和視杯來進行青光眼的篩查和診斷[6]。有研究提出一種改進的自動腦腫瘤分割和識別方法,利用人工神經網絡和灰度特征對腦瘤進行分析診斷,區分良惡性病例[7]。Yahalomi等[8]訓練了一種更快的用于目標檢測的機器視覺神經網絡,來識別和定位前后X射線圖像中的橈骨遠端骨折,對骨折的識別正確率為96%。除此之外,國內許多學者在肝包蟲病分類[9-10]、分割[11-13]方面做了一些研究,但存在超參數調整困難、模型預測存在很多假陽性、誤分較多、需要人工交互、相鄰器官之間邊界輪廓分割不精確等問題。以上僅僅是對肝包蟲病病灶分類、分割方面的研究,并沒有對肝包蟲病在肝臟發病的位置進行統計學意義的研究,然而統計常發病的位置對區分鑒別肝硬化、肝囊腫等病變具有指導意義。因此,本文提出使用深度學習的方法對肝包蟲CT圖像進行病灶檢測,然后統計并分析病灶區域在肝臟左右葉發生的位置,確定了常發病的位置,有助于輔助醫生快速診斷疾病,增強診斷準確性和減少漏診率,為后續對病灶區域進行紋理分析提供幫助。
在放射科醫師的指導下,本文選取單囊型和多囊型肝包蟲病CT圖像1000張,實驗數據均來自新疆醫科大學各附屬醫院放射科。在獲取肝包蟲病CT圖像后,需要對圖像進行預處理操作,使圖像盡可能地反映診斷時所需的圖像信息。本實驗對圖像進行以下預處理操作:① 對圖像進行灰度歸一化,減少后續計算量;② 使用改進的中值濾波算法對圖像進行去噪;③ 常用的數據增強方法有添加噪聲、旋轉、翻轉、平移等[14]。圖像翻轉是在幾乎不改變圖像數據分布的情況下,數據翻倍。本文使用垂直翻轉、水平翻轉的方法[15]對圖像進行數據增強,增強后的圖像共3000張。以單囊型肝包蟲病CT圖像為例,圖像預處理后的效果及圖像增強后的效果如圖1所示。

圖1 圖像預處理效果
卷積神經網絡基本結構主要包括卷積層、池化層、全連接層及輸出層。卷積神經網絡根據圖像數據逐層抽象提取原始醫學圖像中隱藏的數據信息,隨著特征提取網絡層數越深,提取出來的特征越豐富,提取特征的效果就越好。Faster RCNN常用的特征提取網絡主要有ZFNet、VGGNet、ResNet等。ResNet網絡在2015年首次提出,在ImageNet比賽分類任務上獲得第一名,之后許多方法基于ResNet網絡在圖像檢測、分割等領域得到廣泛應用。ResNet網絡常被用于骨干網絡對輸入圖像進行特征提取,為解決深度網絡訓練過程中的退化問題,其將殘差思想引入網絡結構中,在深層網絡與淺層網絡間引入跳躍連接增加網絡層[16]。ResNet101采用bottleneck結構搭建更深的網絡層,增強學習能力,利用1×1卷積減少通道數以降低計算量,采用恒等快捷連接實現跳躍連接,加快收斂速度。因此,本文將ResNet101網絡代替原始的VGG16網絡作為肝包蟲病CT圖像檢測的特征提取網絡,對肝包蟲病CT圖像進行病灶檢測。bottleneck結構圖如圖2所示。

圖2 殘差塊結構圖
在影像科醫師的指導下,找到肝包蟲病CT圖像的八個解剖標志:下腔靜脈、肝右靜脈、肝中靜脈、肝左靜脈等,以肝左靜脈和下腔靜脈連線作為縱軸,同時建立坐標系,以肝臟八段劃分法標準建立肝臟分區,并找到每一區域的質心點。圖中紅色縱軸以肝左靜脈為界限分為Ⅰ、Ⅱ、Ⅲ段和Ⅳ段,紫色射線以肝中靜脈為界限分為Ⅳ段和Ⅴ/Ⅷ段,綠色射線以門靜脈為界限分為Ⅴ/Ⅷ段和Ⅵ/Ⅶ段,坐標系中紅點為所在區域質心點。肝臟分區圖如圖3所示,建立坐標系分區圖如圖4所示,肝臟分區標準信息如表1所示。

圖3 肝臟分區圖

圖4 坐標系圖

表1 肝臟分區標準信息
關于目標檢測模型的定位問題,不少的研究者進行過相關研究,如一些學者首先使用Canny算子識別目標區域的輪廓,再使用Hough梯度圓變換算法、最小二乘法、形心偏差法等方法定位目標,該方法取得了不錯的效果,但定位結果存在一定的偏差[17-19]。蔣蕓等[20]利用YOLO算法對眼底圖像視盤定位,該方法檢測效果較好,但對目標的標注花費大量時間。李傳朋[21]通過計算目標檢測框中心的方法實現定位,然而該方法對位置的統計存在一定的誤差。由于肝包蟲病病灶大小不一,拍攝CT圖像時每個人的體位不同,僅僅通過計算目標檢測框的中心不足以說明病灶在肝臟每一區域的位置。針對上述問題本文提出一種Sobel算子和連通區域與極坐標融合的方法(Sobel Operator and Connected Component and Polar Coordinate Fusion Method,SCP)對病灶在肝臟區域的位置進行統計。本文基于CT圖像器官輪廓的質心點和病灶的質心點構建極坐標系,以水平方向為單位始向量,利用空間余弦定理計算目標向量和單位始向量的夾角,單位始向量的夾角即為極角,目標向量的模即極徑。
本實驗目標檢測模型的檢測結果使用平均精度、均值平均精度等評價指標進行模型性能評價,模型性能評價結果如表2所示。圖5所示為模型對兩類肝包蟲病CT圖像的檢測結果。圖5a為單囊型肝包蟲病CT圖像檢測結果,圖5b多囊型肝包蟲病CT圖像檢測結果。

表2 模型對肝包蟲病CT圖像的性能評價

圖5 目標檢測模型檢測結果
由表2可知,對于兩種類型的肝包蟲病CT圖像病灶檢測,基于ResNet101的特征提取網絡比基于VGG16的特征提取網絡在AP、mAP指標上都取得了較好的效果,說明更深層的網絡在肝包蟲病檢測任務上具有更優秀的特征表達能力。基于ResNet101特征提取網絡的兩種類型肝包蟲病CT圖像的平均識別率均有所提高,然而對于多囊型肝包蟲病CT圖像的平均識別率提高了3.5%,由0.870提高至0.905,說明基于ResNet101的特征提取網絡對多囊型肝包蟲病CT圖像的檢測識別效果較好。由表2可知,基于ResNet101特征提取網絡的漏檢率、錯檢率均低于基于VGG16的特征提取網絡,說明基于ResNet101的特征提取網絡病灶檢測結果較好,對病灶檢測時存在的錯檢及漏檢率較小,使用深度學習方法對肝包蟲病的病灶檢測具有一定的可行性,在測試集上取得了良好的效果。
使用計算機估計某病常發位置,必須以器官CT輪廓為參考建立坐標系,常見的坐標系有直角坐標系、極坐標系,又由于從醫學角度對器官分區時某分區可能跨直角坐標系的兩個象限,不易估計病灶位置。因此,本實驗采用極坐標系來描述病灶在器官中的位置。為了構建極參考系,必須確定極點和極徑,本實驗采用器官CT輪廓質心點作為極點,病灶的質心點作為終點。本實驗基于這兩個質心點構建目標向量,以水平方向為單位始向量,利用空間余弦定理計算目標向量和單位始向量的夾角,即為極角,目標向量模即極徑。
本實驗使用Sobel算子提取CT圖像器官輪廓,并使用連通域方法得到CT圖像器官輪廓的質心點,圖6所示為Sobel算子提取CT圖像器官輪廓邊緣的結果,圖7所示為使用連通域方法得到的CT圖像器官輪廓質心點位置,圖8所示為病灶質心點與CT圖像器官輪廓質心點在CT圖像中的位置,表3所示為部分圖像器官輪廓質心點坐標。

圖6 Sobel算子邊緣提取結果

圖7 CT圖像器官輪廓質心點

圖8 質心點位置圖

表3 多例圖片名稱對應的圖像質心點
基于兩個質心點建立極坐標系,如圖9所示為建立的極徑極角圖,根據肝臟分區標準信息,可以得到各區域圖像數量以及極徑極角范圍。本研究使用秩和檢驗方法對不同區域的極徑和極角進行統計學意義的研究,表4所示為肝包蟲病CT圖像在各區域的極坐標信息統計結果。

圖9 極徑極角圖

表4 CT圖像在各區域的極坐標信息統計結果
本研究對測試集中的數據使用秩和檢驗方法統計得到了表4所示的單囊型和多囊型肝包蟲病的極徑和極角信息在肝臟分區中的統計分析結果,從表4可知,H=402.25,P<0.001,四個區域的極角之間具有顯著性差異,四個區域的極角大小不全相同;H=39.69,P<0.001,四個區域的極徑之間具有顯著性差異,四個區域的極徑大小不全相同。
基于肝包蟲病CT圖像在各區域的極徑極角范圍,可以得到單囊型和多囊型肝包蟲病CT圖像在各區域的數量,從而可以得到肝包蟲病在各區域的百分比。根據在各區域占比大小可以得出肝包蟲病在肝臟區域常發位置。表5所示為肝包蟲病CT圖像各區域數量一般統計結果,表6所示為肝包蟲病CT圖像各區域百分比統計結果。

表5 肝包蟲病CT圖像各區域數量一般統計結果[n(%)]

表6 肝包蟲病CT圖像各區域占比統計結果
本研究使用卡方檢驗方法對得到的極坐標進行統計,得出表5所示的單囊型和多囊型肝包蟲病CT圖像在肝臟各區域的數量,由表5可知,單囊型肝包蟲病在Ⅱ區、Ⅴ區/Ⅷ區的數量多于多囊型肝包蟲病,而多囊型肝包蟲病在Ⅳ區、Ⅵ/Ⅶ區的數量多于單囊型肝包蟲病。基于表5統計結果,本文使用卡方檢驗方法得到表6所示的單囊型和多囊型肝包蟲病CT圖像在肝臟各個區域的占比,由表6可知,χ2=20.896,P<0.001,差異有統計學意義,單囊型和多囊型肝包蟲病在肝臟各個區域的占比不全相同。經過兩兩比較后,單囊型肝包蟲病在Ⅳ區和Ⅴ/Ⅷ區、Ⅴ/Ⅷ區和Ⅵ/Ⅶ區的占比有差異,在Ⅱ區和Ⅳ區、Ⅴ/Ⅷ區、Ⅵ/Ⅶ區的占比無差異;多囊型肝包蟲病在Ⅳ區和Ⅴ/Ⅷ區、Ⅴ/Ⅷ區和Ⅵ/Ⅶ區的占比有差異,在Ⅱ區和Ⅳ區、Ⅴ/Ⅷ區、Ⅵ/Ⅶ區的占比無差異,且單囊型和多囊型肝包蟲病在肝臟的Ⅳ區占比較高,Ⅵ/Ⅶ區次之。又由于單囊型肝包蟲病囊壁發生破裂后,會逐步增長為多囊型肝包蟲病,因此在單囊型肝包蟲病囊壁無破裂的情況下,單囊型和多囊型肝包蟲病常發病位置分別在肝臟的Ⅳ區、Ⅵ/Ⅶ區,Ⅴ區/Ⅷ區次之,在單囊型肝包蟲病破裂的情況下,肝包蟲病的常發位置主要在Ⅳ區、Ⅵ/Ⅶ區。
本研究使用Faster RCNN模型和SCP方法統計肝包蟲病在肝臟區域常發病位置,基于ResNet101的目標檢測模型對肝包蟲病病灶的檢測準確率達到了89.6%,說明該模型能夠有效地檢測出病灶從而可以得到病灶的質心點坐標;然后使用SCP方法統計出肝包蟲病常發病位置主要發生在肝臟的Ⅳ區、Ⅵ/Ⅶ區。一些學者在目標定位方面使用邊緣檢測、目標檢測等方法來確定目標位置,然而這些研究方法存在一些問題,如耗費時間、計算量大、定位結果有誤差等,因此,以往的研究方法對目標位置的定位具有一定的局限性。本研究將目標檢測方法和極坐標系相結合來確定病灶的發病位置,相比于使用直角坐標系中的坐標點確定常發位置更具有可靠性。除此之外,該方法使用極徑和極角確定病灶常發病位置結果更加精確,并且具有統計學意義。因此,本文方法相比于前人的研究具有一定的創新性。
本文將Faster RCNN網絡應用于肝包蟲病CT圖像的目標檢測,并使用SCP方法統計肝包蟲病在肝臟的發病位置,該方法可以輔助醫生診斷疾病,減少漏檢、錯檢的發生,同時能夠為醫生診斷提供導向,更高效地診斷疾病,做到早發現、早診斷、早治療。本研究使用基于ResNet101網絡的目標檢測模型能夠較好地檢測肝包蟲病病灶,模型檢測準確率達到了89.6%,并使用 SCP 方法統計出肝包蟲病常發位置在肝臟的Ⅳ區、Ⅵ區/Ⅶ區。然而該方法對肝包蟲病CT圖像器官輪廓的質心點位置確定存在一定的偏差,本文后續將繼續研究對器官輪廓質心點的精確位置定位,通過大量數據對CT圖像器官輪廓的質心點進行聚類,以求得精確的質心點位置。除此之外,該方法具有一定的普適性,可以將肝包蟲病常發病位置估計方法應用于其他疾病的研究,通過確定疾病常發病的位置,對早期發現疾病具有一定的臨床價值,即能減輕患者病痛,又能節省醫療資源。