賴麗莎,鄧任堂,張露,揭育幫,丘文峰,徐軍發(fā),付文金(1.廣東醫(yī)科大學(xué) a.檢驗醫(yī)學(xué)研究所,b.生物醫(yī)學(xué)工程學(xué)院,廣東東莞 53808;.廣東醫(yī)科大學(xué)附屬厚街醫(yī)院檢驗科,廣東東莞 53945)
泌尿系感染(urinary tract infection,UTI)是泌尿系受到細(xì)菌侵襲而出現(xiàn)的炎癥,嚴(yán)重影響患者的生活質(zhì)量,一旦擴(kuò)散,將造成全身性感染[1]。目前,明確UTI病原菌的金標(biāo)準(zhǔn)是進(jìn)行尿培養(yǎng)[2]。然而,尿培養(yǎng)所需時間長,可能耽誤感染患者的及時治療。因此,尋找一種快速可靠且易于分辨UTI病原菌的方法迫在眉睫。
隨著人工智能技術(shù)的推廣,深度學(xué)習(xí)越來越普遍應(yīng)用于醫(yī)學(xué)[3-5]。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的分支,是一種以人工神經(jīng)網(wǎng)絡(luò)為計算架構(gòu),對數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)作為深度學(xué)習(xí)最有效的神經(jīng)網(wǎng)絡(luò)方法,已在醫(yī)學(xué)顯微圖像分類中有較多應(yīng)用,例如:細(xì)菌性陰道病圖像分類[6],糖尿病眼底視網(wǎng)膜病變圖像分型[7],乳腺活檢樣本組織學(xué)切片中的癌癥標(biāo)志物檢測[8-9],血細(xì)胞形態(tài)識別[10-12]等。然而將深度學(xué)習(xí)技術(shù)與UTI革蘭染色圖像分析相結(jié)合,判斷中段尿沉渣中的病原菌,鮮有研究。本研究通過構(gòu)建快速診斷模型EKNet,對引起UTI常見的革蘭陰性桿菌大腸埃希菌和肺炎克雷伯菌[13]進(jìn)行分類,以實現(xiàn)對UTI病原菌的快速診斷。
1.1一般資料 選取2020年5月至12月在廣東醫(yī)科大學(xué)附屬厚街醫(yī)院確診UTI(未用抗菌藥物)病原菌為大腸埃希菌、肺炎克雷伯菌患者的中段尿標(biāo)本,其中大腸埃希菌368例,肺炎克雷伯菌292例,采用ARIS 2X微生物系統(tǒng)鑒定病原菌。
1.2儀器與試劑 革蘭染色液(珠海貝索公司),BX51顯微鏡(奧林巴斯公司),TK-C9501EC高清彩色攝像機(jī)(日本JVC公司),ARIS 2X微生物鑒定系統(tǒng)(美國賽默飛公司),電熱恒溫培養(yǎng)箱(德國BINDER公司)。
1.3方法
1.3.1樣本收集、處理與圖像采集 留取UTI患者清潔中段尿5 mL,離心后吸取尿沉渣涂片,自然干燥,革蘭染色。收集經(jīng)ARIS 2X微生物系統(tǒng)鑒定病原菌為大腸埃希菌或肺炎克雷伯菌的尿沉渣標(biāo)本涂片,采集細(xì)菌顯微圖像。見圖1。為保持?jǐn)?shù)據(jù)來源的多樣性和真實性,每份標(biāo)本僅選取1張圖像。顯微圖像于正常臨床檢查過程中收集,為達(dá)到真實性,沒有對深度學(xué)習(xí)的顯微圖像的生物豐度或染色質(zhì)量進(jìn)行預(yù)篩選,圖像在染色強(qiáng)度、染色偽影和樣本分布方面具有典型的可變性。

圖1 顯微圖像采集步驟(革蘭染色)
1.3.2顯微圖像數(shù)據(jù)集的劃分 為驗證學(xué)習(xí)模型的訓(xùn)練有效性,將760像素×570像素的顯微圖像數(shù)據(jù)按照8∶1∶1的比例隨機(jī)劃分為訓(xùn)練集、驗證集和測試集3個部分。訓(xùn)練集用于訓(xùn)練模型,調(diào)整參數(shù);驗證集用于檢驗?zāi)P偷男Ч粶y試集用于檢驗最優(yōu)模型的性能和分類能力。見表1。

表1 各類樣本圖像數(shù)目
1.3.3細(xì)菌顯微圖像的預(yù)處理 為減少細(xì)菌圖像特征之間的相關(guān)性,同時保證模型的泛化能力,對原始圖像進(jìn)行歸一化,對訓(xùn)練集圖像以隨機(jī)水平翻轉(zhuǎn)的方式進(jìn)行增強(qiáng)操作,將數(shù)據(jù)增強(qiáng)后的細(xì)菌圖像每批8張圖片進(jìn)行歸一化后傳入網(wǎng)絡(luò)。
1.3.4基于深度學(xué)習(xí)方法的網(wǎng)絡(luò)訓(xùn)練 細(xì)菌圖像分類的深度學(xué)習(xí)方法是一種改進(jìn)的輕量級殘差網(wǎng)絡(luò),暫命名為EKNet(取Eco和Kpn英文縮寫的首字母),網(wǎng)絡(luò)參數(shù)個數(shù)為2 791 826,訓(xùn)練優(yōu)化器使用Adam,學(xué)習(xí)率為0.000 1,將預(yù)處理后的細(xì)菌圖像輸入殘差網(wǎng)絡(luò)模型,計算交叉熵?fù)p失,通過反向傳播算法進(jìn)行參數(shù)優(yōu)化,獲得預(yù)訓(xùn)練模型EKNet。使用基于PyTorch的開源深度學(xué)習(xí)框架LisaDPF(開源地址:https://gitee.com/summit/lisadpf),可以讓使用者針對應(yīng)用場景快速生成訓(xùn)練模型。該模型基于殘差網(wǎng)絡(luò)ResNet18進(jìn)行改進(jìn),網(wǎng)絡(luò)由殘差前的卷積層(conv)、池化層(pool)、殘差塊層(Bottleneck)和全連接層(fc)組成,EKNet的網(wǎng)絡(luò)結(jié)構(gòu)見圖2。

注:網(wǎng)絡(luò)輸入顯微細(xì)菌圖像,輸出所屬細(xì)菌分類的概率。框中的數(shù)字代表每個模塊輸出的通道數(shù)。conv,卷積層;pool,最大池化層;bottleneck,殘差塊層;avg pool,平均池化層;fc,全連接層。
1.3.5模型比對 以圖像分類常用的ResNet50模型和AlexNet模型作為對照,對表1訓(xùn)練集和驗證集的顯微圖像進(jìn)行迭代訓(xùn)練和驗證,并對模型進(jìn)行比對,評估EKNet模型的實用性。
1.3.6臨床測試 為評估EKNet模型的性能,使用UTI患者尿沉渣顯微圖像作測試集(病原菌為未知的革蘭陰性桿菌)對模型進(jìn)行測試,輸出大腸埃希菌和肺炎克雷伯菌2種細(xì)菌類別中的每一種的相對概率,以概率高的細(xì)菌作為測試集的輸出結(jié)果,測試集的正確性以尿培養(yǎng)的結(jié)果作為評判。通過對測試集的準(zhǔn)確性進(jìn)行量化,初步評估模型的泛化能力。
2.1深度學(xué)習(xí)模型的建立 本研究模型在殘差網(wǎng)絡(luò)ResNet18基礎(chǔ)上進(jìn)行改進(jìn)。與ResNet網(wǎng)絡(luò)模型相比,當(dāng)前EKNet 4個殘差塊層的通道數(shù)均為ResNet18的一半,在不降低精度的同時,EKNet模型的參數(shù)量大幅度減少,以降低模型的復(fù)雜度,提高其泛化性,并減少推理時間。該模型測試單個樣本的平均用時是0.165 s,優(yōu)于ResNet模型的0.38 s和AlexNet模型的0.66 s。使用不同的模型對表1訓(xùn)練集和驗證集的顯微圖像進(jìn)行迭代訓(xùn)練和驗證,結(jié)果表明,EKNet模型能對2種不同的細(xì)菌進(jìn)行精確的分類。EKNet模型實驗結(jié)果的驗證集準(zhǔn)確率達(dá)到98.8%,優(yōu)于ResNet50模型的96.4%和AlexNet模型的78.6%。見表2。EKNet模型的訓(xùn)練損失和驗證損失均能保持一致下降,表明訓(xùn)練過程無過擬合跡象,見圖3A。相對于EKNet模型,ResNet50模型的訓(xùn)練集與驗證集的損失函數(shù)在縱向存在一定距離,即存在一定的過擬合現(xiàn)象,見圖3B。與EKNet模型相比,AlexNet模型的訓(xùn)練無法正常收斂,存在明顯過擬合現(xiàn)象,見圖3C。

表2 不同模型的訓(xùn)練結(jié)果對比
2.2臨床測試結(jié)果 104例測試集包含大腸埃希菌56例,肺炎克雷伯菌48例,輸出結(jié)果與尿培養(yǎng)結(jié)果完全吻合,正確率為100%。該模型測試樣本的平均用時為0.165 s。

注:A,EKNet模型;B,ResNet50模型;C,AlexNet模型。
UTI是常見的感染性疾病,革蘭染色法能在較短時間內(nèi)對感染的細(xì)菌進(jìn)行識別[14],但革蘭染色結(jié)果只能提供細(xì)菌形態(tài)學(xué)依據(jù),不能定位病原學(xué)種類。本研究選擇使用CNN,是因為其在圖像分析任務(wù)中具有出色的能力,除圖像采集之外無需人工干預(yù)。本研究擬建立EKNet模型對大腸埃希菌和肺炎克雷伯菌這2種細(xì)菌圖像進(jìn)行快速判讀分析,快速可靠地分辨UTI病原菌,為臨床早期診斷提供重要的指導(dǎo)意義。
ResNet18是針對ImageNet自然場景數(shù)據(jù)集的分類,由于細(xì)菌顯微圖像與通過攝像機(jī)采集的自然場景圖像在采集方式、數(shù)據(jù)源上不一致,使用原模型對細(xì)菌進(jìn)行分類可能會失效,而且網(wǎng)絡(luò)模型深度增加容易出現(xiàn)參數(shù)量過多、過擬合以及難以訓(xùn)練等問題[15]。因此,本研究在殘差網(wǎng)絡(luò)ResNet18基礎(chǔ)上進(jìn)行改進(jìn):引入殘差塊、進(jìn)行數(shù)據(jù)增強(qiáng)和歸一化。引入的殘差塊有利于網(wǎng)絡(luò)在梯度下降時的快速收斂,提高模型的表達(dá)能力;數(shù)據(jù)增強(qiáng)能有效地緩解訓(xùn)練數(shù)據(jù)不足導(dǎo)致的深度學(xué)習(xí)模型過擬合,進(jìn)一步提高模型的精度和泛化能力;歸一化處理能消除采集數(shù)據(jù)過程中存在的噪音,使采集的數(shù)據(jù)統(tǒng)一到一個特征維度,有利于網(wǎng)絡(luò)訓(xùn)練在反向傳播期間更好地收斂。與ResNet18網(wǎng)絡(luò)模型相比,EKNet模型的特征通道數(shù)量減少,通過減少模型參數(shù)以降低模型的復(fù)雜度,對圖像的識別準(zhǔn)確率達(dá)98.8%。在臨床測試中,EKNet模型的輸出結(jié)果與尿培養(yǎng)結(jié)果完全吻合,顯示該模型具有較好的泛化能力,在大腸埃希菌和肺炎克雷伯菌這2種細(xì)菌之間具有強(qiáng)大的區(qū)分能力。由此可見,本研究構(gòu)建的EKNet模型實現(xiàn)了對泌尿系統(tǒng)感染常見細(xì)菌的快速診斷。
本研究也存在一定的局限性。該模型目前僅包含大腸埃希菌和肺炎克雷伯菌2種病原體,缺乏抗菌藥物作用下的細(xì)菌L型和其他革蘭陰性桿菌。課題組正在添加樣本的種類與數(shù)量,以期區(qū)分更多不同類別的細(xì)菌。我們相信,提供深度學(xué)習(xí)圖像分類的結(jié)果,可以為微生物的診斷提供廣闊的前景。
綜上所述,本研究成功構(gòu)建的大腸埃希菌和肺炎克雷伯菌的圖像診斷模型,具有識別準(zhǔn)確率高、速度快、操作簡便、泛化強(qiáng)等優(yōu)點,為臨床UTI的快速診斷提供參考。