李艷 楊國慶 胡納 齊曉寧 付泉水
1.都江堰市人民醫院放射影像科,四川成都 611800;2.遂寧市中心醫院放射影像科,四川遂寧 629000;3.中國科學院計算技術研究所,北京 100190
病灶的體積定量在臨床工作中可用于評估患者的病死率,同時體積倍增時間也是鑒別疾病良惡性的重要指標[1,2]。目前,將深度學習技術應用于基于CT 圖像的自動定量分析是醫學影像領域的熱點問題,有助于提高醫學影像的診斷效率和診斷準確性,但病灶體積量化分析的準確性與很多因素有關,包括病灶本身的特征、掃描設備、掃描參數和圖像重建方式等[3,4],現有的研究模型大多針對單一掃描設備,數據來源局限。另外,手動逐層分割被認為是最接近真實值的表現[5,6],常被用作驗證標準,但其存在測量者間和測量者內部的誤差。本課題比較不同CT 掃描設備對人工智能深度學習模型定量測定結果準確性的影響,以實驗室量筒量取的標準溶液作為驗證標準,將模型測得結果與CT 設備自帶體積測量軟件進行比較,分析探討人工智能模型應用于臨床工作中體積測量的可行性及影響因素。
不規則密閉容器、量筒、燒杯、A 溶液(碘帕醇與生理鹽水1:50 混合溶液)、B 溶液(碘帕醇與生理鹽水1:100 混合溶液)、C 溶液(碘帕醇與生理鹽水1:500 混合溶液)。
1.1.1 模型制備 選取體積、材質相同的不規則密閉容器,用量筒分別精準量取不同體積(10ml、20ml、30ml)、不同密度(50Hu、135Hu、190Hu)的溶液注入各容器制成水球,見圖1。量筒量取溶液過程嚴格遵循使用規范,并以量筒讀數作為驗證標準;根據溶液的不同密度和體積分為9 組,每組25 例,共225 例,見表1。而后按順序編號,采用分層抽樣法在每組中隨機抽取5 個作為訓練集(n=45),其余的為測試集(n=180)。

圖1 實驗自制的標準容積水球

表1 實驗自制水球的密度和體積分組(n)
1.1.2 掃描方法 將水球放置在掃描孔的中央,用CT 機激光線定位使水球的x、y、z軸線分別與CT機的x、y、z定位線重合,常規軸位掃描,GE Revolution 256 排512 層CT 掃描層厚和層間距設置為1.25mm,Siemens SOMATOM Defintion AS 64排128 層螺旋CT 的層厚和層間距設置為1.20mm,其余掃描參數相同,均設置為管電壓120kV、管電流360mAs、機架旋轉時間1.0s,獲得CT 平掃影像資料。
1.2.1 模型建立 GE Revolution 256 排512 層CT 掃描的訓練集圖像傳至其后處理器RAW 工作站,Siemens SOMATOM Defintion AS 64 排128 層螺旋CT 掃描的訓練集圖像傳至其后處理器MMWP 工作站,均行1.50mm 層厚和1.50mm 層間距的圖像重組。將重組圖像統一傳至圖像存檔及通信系統(picture archiving and communications system,PACS),圖像數據以醫學數字影像和通訊(digital imaging and communications in medicine,DICOM)格式導出。Labelme3.11.2 作為一個開源圖像標注工具,影像科醫生通過它勾畫CT 圖像病灶,再將勾畫好的帶標簽圖像傳至中國科學院計算技術研究所基于U-NET 網絡架構的CT 切片自動分割診斷算法進行數據模型訓練,訓練好的神經網絡模型可以預測相應類型疾病的病灶,計算病灶體積,通過不斷優化,從而訓練出一個準確度非常高的自動病灶勾畫人工智能數據模型,見圖2。

圖2 水球圖像對比
1.2.2 體積測量 將通過兩種CT 設備掃描的測試集圖像分別傳至各自的后處理器進行1.50mm 層厚和1.50mm 層間距重組,并基于CT 值進行體積測量,同時將重組圖像傳至PACS 系統,圖像數據以DICOM 格式導出至數據模型并得出體積測量結果,見圖3。具體的體積測量方法如下。①基于CT值的半自動體積測量方法:將GE Revolution 256排512 層CT 掃描圖像傳至RAW 工作站后,點擊Volume Viewer 進行水球體積測量,CT 值范圍為水球密度±50Hu,然后由軟件計算出該閾值范圍內的水球體積;將Siemens SOMATOM Defintion AS 64 排128 層螺旋CT 掃描圖像傳至MMWP 工作站三維重建卡中,Editor Region Growing 進行水球體積測量,CT 值范圍為水球密度±50Hu,然后由軟件計算出該閾值范圍內的水球體積。②基于深度學習的全自動體積測量方法:針對水球模型分割的復雜性,先對跨設備掃描影像數據進行預處理后,采用U-Net 網絡作為主體框架,它基于編碼器-解碼器架構,編碼器部分包括了一系列的卷積塊,每個卷積塊先通過卷積將輸入的特征圖規范化,并提取特征,最后激活函數。編碼器相鄰兩層通過最大池化的方法將圖像尺寸減小為1/2,同時增加特征的通道數為2 倍。解碼器部分的結構類似編碼器,但是每層只包含一個卷積塊。不同于編碼器,解碼器通過卷積將特征的通道減少為1/2,然后通過上采樣將特征的空間尺寸加倍,最后通過與編碼器的skip 連接,將獲得的特征與對應層次編碼器的輸出相結合并傳到上層。解碼器最終的輸出尺寸與原圖相同,最后通過Sigmoid 函數得到分割結果,使用EfficientNet-B0 作為主干網絡,從網絡的深度、寬度和圖像分辨率3 個維度擴張網絡,提升網絡精度,并統一矩陣為(512,512),由于水球是不規則連續區域,可將其視為等厚切片,然后根據像素間距計算每層切片病灶區域的面積,通過對面積積分得出病灶區域的體積,最后根據公式計算水球體積,見圖4。

圖3 半自動和全自動體積測量方法定量不同CT 掃描設備來源的水球的流程圖

圖4 基于Efficient-BO-UNET 的分割框架模型分割水球的流程圖
采用SPSS 26.0 統計學軟件對數據進行處理分析,計量資料采用均數±標準差()或中位數(四分位數間距)[M(Q1,Q3)]表示。同一水球采用兩種體積測量方法結果對比或同一水球經兩種CT掃描設備掃描后體積測量結果對比分析,采用配對設計資料的統計分析,首先對變量的差值進行正態性檢驗,差值呈正態分布,采用配對設計t檢驗,差值非正態分布則采用配對設計的Wilcoxon 符號秩檢驗,檢驗水準為0.05,P<0.05 為差異有統計學意義。
對測試集水球分別經兩種CT 測量方法測量后體積的結果顯示,半自動體積測量方法[-18.750(-23.400,-14.850)]和全自動體積測量方法[-1.872(-8.423,3.123)]的測量結果百分誤差比較,全自動體積測量方法優于半自動體積測量方法,差異有統計學意義(t=-16.443,P<0.001)。
測試集水球分別經兩種CT 掃描設備掃描后的分析結果顯示,GE Revolution 256 排512 層CT[2.050(-1.691,5.935)]和Siemens SOMATOM Defintion AS 64 排128 層螺旋CT[-7.837(-14.599,-2.337)]來源的水球測量結果百分誤差比較,差異有統計學意義(t=-10.348,P<0.001)。
測試集中同一水球模型針對兩種掃描設備來源的數據體積測量結果變異系數分析顯示,GE Revolution 256 排512 層CT 的水球測量結果變異系數(0.029±0.007)較Siemens SOMATOM Defintion AS 64 排128 層螺旋CT(0.055±0.029)更大,差異有統計學意義(t=-2.432,P=0.041)。
基于Bland-Altman 圖的分析顯示,GE Revolution CT 掃描數據比 Siemens SOMATOM Defintion AS 掃描數據的測量結果的差值平均值更接近0,見圖5。

圖5 不同掃描設備來源的數據測量結果相對于實驗室量筒量取標準溶液的一致性分析
近年隨著神經網絡相關算法的進步與提高,深度學習算法被廣泛用于體積測量。基于深度學習的全自動分割技術可以對病灶和器官的影像進行高效、準確的分割,并利用分割結果進行體積計算,深度學習在分割如血腫[7-12]、梗死[13]、結節[14]、肺炎[7,15]及腫瘤[10,16-18]等定量病灶中表現優異,Ironside等[7,8]使用深度學習算法分別開發了用于顱內出血和血腫周圍水腫體積分析的全自動分割算法,當對照手動和半自動分割方法測試時,全自動分割算法的血腫平均體積相似性系數分別為0.894 和0.905,血腫周圍水腫的平均體積相似性系數分別為0.838 和0.843,使用全自動分割方法測得的顱內出血量與使用手動(R2=0.981)和半自動(R2=0.979)方法測量的體積之間有很強的相關性。另外,在定量常見器官如肝臟[19-21]、脾臟[19,20]及前列腺[22]等的體積方面,深度學習自動分割算法也具有較高的準確性,Ahn等[20]開發和驗證了一種深度學習算法用于在各種肝臟條件下使用門靜脈期CT 圖像進行全自動肝臟和脾臟分割,深度學習算法實現了肝臟和脾臟分割的平均體積相似性系數分別為0.973 和0.974,不同肝臟條件下的平均體積相似性系數比較,差異無統計學意義。由此可見,深度學習具有較大的臨床應用價值。
目前國內外關于體積測量的研究報道很多,但大多數研究以放射科醫師的手動測量測得的結果作為“金標準”[7,8,13,20,23],不僅需要專業知識還需要花費大量的時間,且存在測量者間和測量者內部的誤差,“金標準”難以得到有效保證。本研究采用標準體積的水球進行體積測量的評估,以實驗室量筒量取的標準溶液作為“金標準”,較手動分割更具客觀性和準確性,且操作簡單快捷、具有可重復性,并對不同掃描設備的水球進行研究,將數據來源不同的影響納入了研究。
由于本實驗中水球背景單一,模型訓練相對簡單,因此研究僅采用45 例水球作為訓練集。將模型測得結果與CT 設備自帶的基于閾值的半自動體積測量軟件進行比較,可以初步得到以下結果:①基于深度學習建模的全自動體積測量方法計算CT 平掃圖像中的水球體積的各組測量數據的百分誤差小于半自動體積測量結果的百分誤差,提示全自動體積測量方法優于傳統的設備自帶的基于CT 閾值的半自動體積測量方法;②將不同掃描設備來源的數據用于同一個模型進行體積測量,測量結果的準確性和穩定性不同,這提示在未來建模過程中,需要考慮到數據來源不同的影響,提前對數據進行標準化校正,通過算法糾正減少差異,建立一個適用性強的模型,并且這個結果也可能成為CT 掃描設備采集數據準確性評估的一個新的客觀指標。但因病例數較少,測試集中的水球呈偏態分布,對不同掃描設備來源數據的準確性的差異比較采用了非參數檢驗,并且研究僅納入了兩種掃描設備,未來需要擴大樣本量對算法的推廣、泛化進行深入研究。