



摘 要:在醫(yī)療領(lǐng)域,準(zhǔn)確及時(shí)的醫(yī)學(xué)影像診斷對(duì)疾病早期發(fā)現(xiàn)和治療至關(guān)重要。而傳統(tǒng)的人工解讀方法基于醫(yī)生的經(jīng)驗(yàn)和技能,在日益增長(zhǎng)的影像數(shù)據(jù)量面前力不從心,尤其是在罕見(jiàn)病和復(fù)雜病癥的識(shí)別上,誤診和漏診成為亟待解決的問(wèn)題。鑒于此,本文提出一種集成深度學(xué)習(xí)技術(shù)的醫(yī)學(xué)影像自動(dòng)診斷系統(tǒng)設(shè)計(jì)方案,深入剖析自動(dòng)診斷系統(tǒng)的設(shè)計(jì)思路與實(shí)現(xiàn)框架。經(jīng)測(cè)試試驗(yàn)驗(yàn)證,該系統(tǒng)在敏感性和特異性方面表現(xiàn)優(yōu)異,在實(shí)際應(yīng)用中具有一定有效性。
關(guān)鍵詞:深度學(xué)習(xí);醫(yī)學(xué)影像;醫(yī)學(xué)診斷;系統(tǒng)設(shè)計(jì)
中圖分類號(hào):TP 391 " " 文獻(xiàn)標(biāo)志碼:A
在21世紀(jì)的信息時(shí)代,醫(yī)學(xué)成像技術(shù)的發(fā)展極大豐富了臨床醫(yī)生的診斷工具箱,從X射線、CT掃描到MRI和超聲波等,這些技術(shù)為疾病的早期檢測(cè)和精準(zhǔn)治療提供了前所未有的可能性。然而,醫(yī)學(xué)影像的解讀對(duì)放射科醫(yī)師的專業(yè)知識(shí)和經(jīng)驗(yàn)有較強(qiáng)的依賴性,不僅限制了診斷效率,而且增加了誤診風(fēng)險(xiǎn),尤其是在資源有限的地區(qū),專業(yè)醫(yī)師的短缺更加劇了這一問(wèn)題[1]。在此背景下,基于深度學(xué)習(xí)的醫(yī)學(xué)影像自動(dòng)診斷系統(tǒng)應(yīng)運(yùn)而生,它能夠模仿人類視覺(jué)系統(tǒng),利用自動(dòng)特征學(xué)習(xí)和模式識(shí)別對(duì)疾病早期跡象進(jìn)行快速識(shí)別與定位。然而,要構(gòu)建一個(gè)既高效、又可靠的自動(dòng)診斷系統(tǒng),需要克服數(shù)據(jù)標(biāo)注成本高、模型泛化能力不足和解釋性差等挑戰(zhàn)。本文旨在深入探討深度學(xué)習(xí)在醫(yī)學(xué)影像自動(dòng)診斷中的應(yīng)用,提出一種系統(tǒng)設(shè)計(jì)方案,以期減輕醫(yī)生的工作負(fù)擔(dān),提高診療效率,減少誤診率,為患者提供更及時(shí)和個(gè)性化的醫(yī)療服務(wù)。
1 基于深度學(xué)習(xí)的醫(yī)學(xué)影像自動(dòng)診斷系統(tǒng)架構(gòu)設(shè)計(jì)
基于深度學(xué)習(xí)的醫(yī)學(xué)影像自動(dòng)診斷系統(tǒng)的系統(tǒng)架構(gòu)分為3個(gè)關(guān)鍵層次,即用戶界面層、業(yè)務(wù)邏輯層以及數(shù)據(jù)庫(kù)層,每個(gè)層次都具有重要作用,共同促進(jìn)系統(tǒng)的高效運(yùn)作與智能化診斷[2]。基于深度學(xué)習(xí)的醫(yī)學(xué)影像自動(dòng)診斷系統(tǒng)架構(gòu)如圖1所示。
數(shù)據(jù)庫(kù)層是系統(tǒng)的基礎(chǔ)支撐,主要用于存儲(chǔ)海量的醫(yī)學(xué)影像、病歷資料以及模型參數(shù)等關(guān)鍵數(shù)據(jù),為臨床決策及時(shí)提供信息支持。業(yè)務(wù)邏輯層是系統(tǒng)的核心,采用微服務(wù)架構(gòu),將數(shù)據(jù)處理、模型識(shí)別和自動(dòng)標(biāo)注等功能模塊化,輔助醫(yī)生做出高效診斷。用戶界面層是人機(jī)交互的窗口,采用響應(yīng)式設(shè)計(jì),主要包括門診檢查模塊、病理模板編輯器和病歷庫(kù)查看界面,保證在多種設(shè)備上均能提供一致的用戶體驗(yàn)。在系統(tǒng)運(yùn)行過(guò)程中,用戶界面層與業(yè)務(wù)邏輯層間通過(guò)WebSocket協(xié)議建立長(zhǎng)連接,以進(jìn)行實(shí)時(shí)通信。WebSocket協(xié)議通信流程如圖2所示。
醫(yī)生在用戶界面層輸入患者信息并啟動(dòng)檢查后,業(yè)務(wù)邏輯層立即響應(yīng),調(diào)用深度學(xué)習(xí)模型進(jìn)行影像分析。分析結(jié)果由WebSocket實(shí)時(shí)傳輸至前端界面。醫(yī)生可以根據(jù)結(jié)果進(jìn)行診斷并編輯檢查報(bào)告。最終生成的病理檢查報(bào)告存儲(chǔ)至數(shù)據(jù)庫(kù)層,便于患者和醫(yī)生后續(xù)查詢。
2 軟件設(shè)計(jì)
2.1 影像預(yù)處理
由于原始醫(yī)學(xué)影像是三維空間的投影,其灰度值分布可能受成像條件的影響(例如曝光時(shí)間、探測(cè)器靈敏度等),因此需要進(jìn)行歸一化處理。具體為統(tǒng)計(jì)每幅圖像的最小和最大灰度值,并對(duì)每個(gè)像素點(diǎn)進(jìn)行映射,如公式(1)所示。
(1)
式中:I表示原始圖像中某個(gè)像素點(diǎn)的灰度值;Imin和Imax分別表示原始圖像中的最小灰度值和最大灰度值;In表示經(jīng)過(guò)歸一化處理后,對(duì)應(yīng)像素點(diǎn)的新灰度值。
這樣,無(wú)論原始圖像的灰度分布如何,經(jīng)過(guò)處理后,所有圖像的像素值都被約束在0~1,保證所有輸入數(shù)據(jù)具有統(tǒng)一的動(dòng)態(tài)范圍。
為降低掃描儀電子噪聲和患者移動(dòng)造成的模糊影響,采用(3×3)ppi的高斯濾波器,標(biāo)準(zhǔn)差設(shè)置為1.5,對(duì)影像進(jìn)行平滑處理,提升圖像的對(duì)比度和細(xì)節(jié)可見(jiàn)度。針對(duì)紋理豐富的醫(yī)學(xué)影像區(qū)域,采用自適應(yīng)直方圖均衡化(CLAHE)技術(shù),將圖像劃分為多個(gè)(8×8)ppi的子區(qū)域,每個(gè)子區(qū)域獨(dú)立進(jìn)行直方圖均衡化,以放大局部灰度變化。為避免在紋理密集區(qū)產(chǎn)生過(guò)度增強(qiáng)的偽影,設(shè)置剪切閾值為40,從而限制直方圖均衡化強(qiáng)度,保持圖像的自然觀感。
2.2 特征提取與增強(qiáng)
醫(yī)學(xué)影像的特征提取主要包括高級(jí)、低級(jí)特征2種。高級(jí)特征主要涉及圖像的語(yǔ)義內(nèi)容,低級(jí)特征則更多關(guān)注圖像的紋理和形狀等基本屬性[3]。為了提高特征提取的可靠性和效率,本文采用一種新的混合特征提取框架。該框架分為2個(gè)主要部分:一是基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的高級(jí)特征提取,二是針對(duì)紋理和形狀的低級(jí)特征提取。
對(duì)于高級(jí)特征,利用TensorFlow深度學(xué)習(xí)框架,加載由50個(gè)深度卷積層組成的ResNet-50模型。為了實(shí)現(xiàn)這一過(guò)程,需要遵循遷移學(xué)習(xí)策略,即在保留ResNet-50的前49層卷積層的基礎(chǔ)上,移除模型的最后一層全連接層,保證能直接從卷積層的輸出中提取特征,而不是進(jìn)行最終的分類。使用全局平均池化(Global Average Pooling,GAP)算法來(lái)處理第49層的輸出,如公式(2)所示。
(2)
式中:v表示單個(gè)特征圖的全局平均池化結(jié)果;N表示一個(gè)特征向量元素;ai表示單個(gè)特征圖中的元素?cái)?shù)量;i表示特征圖中第i個(gè)元素的激活值。
計(jì)算每個(gè)特征圖中所有激活值的平均值,將每個(gè)特征圖轉(zhuǎn)換為一個(gè)單一數(shù)值,即該特征圖的“代表性”值,從而有效捕獲影像中的高級(jí)語(yǔ)義內(nèi)容,例如器官的結(jié)構(gòu)特征和病變的形態(tài)細(xì)節(jié)等。
低級(jí)特征提取需要采用尺度不變特征變換(SIFT)算法和方向梯度直方圖(HOG)技術(shù),以精細(xì)捕捉醫(yī)學(xué)影像的紋理和形狀特征。具體來(lái)說(shuō),需要檢測(cè)圖像中的關(guān)鍵點(diǎn)并計(jì)算其梯度方向直方圖,生成128維的描述符,每個(gè)描述符能夠詳細(xì)描繪關(guān)鍵點(diǎn)周圍的紋理信息。為了實(shí)現(xiàn)這一點(diǎn),需要對(duì)灰度醫(yī)學(xué)圖像進(jìn)行高斯金字塔構(gòu)建,以多尺度方式定位關(guān)鍵點(diǎn)。給定一張灰度醫(yī)學(xué)圖像I(x,y,σ),應(yīng)用一組高斯核函數(shù)G(x,y,σ)來(lái)生成尺度空間,如公式(3)所示。
L(x,y,σ)=I(x,y)*G(x,y,σ) (3)
式中:σ表示尺度參數(shù);*表示卷積運(yùn)算。
進(jìn)而在尺度空間中尋找關(guān)鍵點(diǎn),即那些在局部區(qū)域和尺度上都是極值的位置。對(duì)每個(gè)關(guān)鍵點(diǎn)選取(16×16)ppi鄰域內(nèi)的梯度方向直方圖,將其量化為128維的SIFT描述符,從而構(gòu)成紋理細(xì)節(jié)的密集表示,為自動(dòng)診斷系統(tǒng)提供強(qiáng)大的底層支撐。
2.3 異常檢測(cè)
完成特征提取與融合后,采用區(qū)域生成網(wǎng)絡(luò)(RPN)對(duì)潛在異常區(qū)域進(jìn)行初步定位[4]。使一個(gè)3*3的卷積核在特征圖上滑動(dòng),以錨點(diǎn)(anchor)機(jī)制生成9個(gè)不同比例和尺寸的候選區(qū)域(Region Proposal),每個(gè)錨點(diǎn)生成3個(gè)比例(1∶1、1∶2和2∶1)和3個(gè)尺寸((128×128)ppi、
(256×256)ppi和(512×512)ppi)的候選框。進(jìn)而對(duì)這些候選區(qū)域進(jìn)行softmax分類(前景與背景)和邊界框回歸(用于修正錨點(diǎn)坐標(biāo))。設(shè)pti為第i個(gè)錨點(diǎn)屬于前景的概率預(yù)測(cè),ti為實(shí)際標(biāo)簽(前景為1,背景為0),交叉熵?fù)p失函數(shù)Lcls的計(jì)算過(guò)程如公式(4)所示。
(4)
式中:Ncls為錨點(diǎn)的數(shù)量。
對(duì)于邊界框回歸,使用平滑L1損失使預(yù)測(cè)邊界框坐標(biāo)與實(shí)際邊界框坐標(biāo)間的差異最小化。設(shè)tix和tiy分別為第i個(gè)錨點(diǎn)在x、y方向上的實(shí)際邊界框偏移量,和為預(yù)測(cè)的偏移量,平滑L1損失函數(shù)Lreg的計(jì)算過(guò)程如公式(5)所示。
(5)
式中:Nreg為用于回歸的錨點(diǎn)數(shù)量;smooth "L1(?)為一個(gè)分段函數(shù)。
smoothL1(?)如公式(6)所示。
(6)
式中:?為平滑L1損失函數(shù)的輸入,代表預(yù)測(cè)值與真實(shí)值間的差異,即邊界框回歸中的坐標(biāo)偏移量誤差。
當(dāng)?的絕對(duì)值<1時(shí)使用平方項(xiàng),以減少梯度在?接近0時(shí)的劇烈變化。當(dāng)?的絕對(duì)值>1時(shí)使用線性項(xiàng),以保持對(duì)較大錯(cuò)誤的懲罰。RPN的總損失函數(shù)L是分類損失和回歸損失的加權(quán)和,如公式(7)所示。
L=λclsLcls+λregLreg (7)
式中:λcls、λreg分別為平衡兩項(xiàng)損失的權(quán)重參數(shù),通常需要根據(jù)具體任務(wù)進(jìn)行調(diào)整。
為了提升檢測(cè)精度,本文引入非極大值抑制(NMS)算法,設(shè)置IoU(交并比)閾值為0.7,對(duì)RPN輸出的候選區(qū)域進(jìn)行篩選,移除那些與更高置信度區(qū)域重疊面積>0.7的候選區(qū)域,最終保留約300個(gè)最具代表性的異常區(qū)域,用于后續(xù)精確分類和定位。
2.4 診斷結(jié)果輸出
為了精確診斷病灶,系統(tǒng)運(yùn)用基于數(shù)學(xué)形態(tài)學(xué)的圖像處理技術(shù),即采用開(kāi)運(yùn)算與閉運(yùn)算對(duì)分割結(jié)果進(jìn)行優(yōu)化。開(kāi)運(yùn)算利用3×3結(jié)構(gòu)元素進(jìn)行腐蝕操作,有效剔除<3ppi的小型噪點(diǎn),再進(jìn)行等尺寸膨脹恢復(fù)病灶邊緣,保證病灶主體不受損。閉運(yùn)算則相反,先使用相同的3×3結(jié)構(gòu)元素對(duì)圖像進(jìn)行膨脹,填充病灶內(nèi)<3ppi的孔洞,再執(zhí)行腐蝕操作,平滑邊界同時(shí)保持病灶形狀的連貫性,以提升分割精度與病灶輪廓的清晰度。
與此同時(shí),為了滿足醫(yī)生對(duì)診斷結(jié)果可解釋性的要求,系統(tǒng)引入Grad-CAM(Gradient-weighted Class Activation Mapping)算法,如公式(8)所示。
(8)
式中:LcGrad-CAM表示針對(duì)類別c的Grad-CAM熱力圖;αkc表示特征圖Ak對(duì)于類別c的權(quán)重,由該類別得分相對(duì)于特征圖Ak的梯度全局平均池化得到;Ak表示第k個(gè)特征圖。
計(jì)算分類層相對(duì)于特征圖的梯度,得到每個(gè)位置的重要性權(quán)重,進(jìn)而生成加權(quán)激活圖,高亮顯示模型認(rèn)為重要的病灶區(qū)域。這樣不僅能夠促進(jìn)醫(yī)生對(duì)模型推理過(guò)程的理解,而且可以為臨床驗(yàn)證診斷結(jié)果的有效性提供直觀的視覺(jué)依據(jù),保證技術(shù)輔助診斷的可靠性和接受度。
3 測(cè)試試驗(yàn)
3.1 試驗(yàn)準(zhǔn)備
在試驗(yàn)準(zhǔn)備階段,采用來(lái)自多個(gè)醫(yī)療機(jī)構(gòu)合作的公開(kāi)數(shù)據(jù)集,包括CT和MRI影像,分別對(duì)應(yīng)不同疾病類別。具體來(lái)說(shuō),在CT影像數(shù)據(jù)集中,中央型肺癌正樣本共計(jì)450張,周圍型肺癌正樣本460張;在MRI影像數(shù)據(jù)集中,浸潤(rùn)性導(dǎo)管癌正樣本520張,小葉癌正樣本530張,阿爾茨海默病正樣本500張。此外,每個(gè)疾病類別均配有相應(yīng)的負(fù)樣本,分別為CT影像負(fù)樣本500張和MRI影像負(fù)樣本600張。數(shù)據(jù)集內(nèi)的影像均來(lái)源于權(quán)威醫(yī)學(xué)期刊,例如NEJM、JAMA、Lancet和Radiology等,保證樣本的準(zhǔn)確性和試驗(yàn)的可靠性。
3.2 試驗(yàn)結(jié)果
基于上述試驗(yàn)準(zhǔn)備,系統(tǒng)輸出醫(yī)學(xué)影像自動(dòng)診斷結(jié)果,并與專業(yè)放射科醫(yī)生的人工診斷結(jié)果進(jìn)行比較,以獲取檢測(cè)敏感性、檢測(cè)特異性等評(píng)價(jià)指標(biāo)。為了保證評(píng)估過(guò)程的客觀性和公正性,采用盲法評(píng)估方式,即醫(yī)生在不知系統(tǒng)診斷結(jié)果的情況下對(duì)影像進(jìn)行獨(dú)立診斷,然后將系統(tǒng)診斷結(jié)果與醫(yī)生的人工診斷進(jìn)行比較,進(jìn)而獲取試驗(yàn)結(jié)果,見(jiàn)表1。
由表1可知,本文系統(tǒng)在多種疾病識(shí)別中均表現(xiàn)優(yōu)異。在CT影像領(lǐng)域中,針對(duì)中央型肺癌,系統(tǒng)不僅能夠?qū)崿F(xiàn)95.6%的高敏感性,敏銳地捕捉到微小的病灶變化,而且還維持了95.1%的特異性,有效避免了健康個(gè)體誤診;在周圍型肺癌的檢測(cè)中,系統(tǒng)的敏感性和特異性分別為95.2%和97.3%,表明該系統(tǒng)不僅能夠準(zhǔn)確檢測(cè)病灶,而且能夠更精準(zhǔn)地區(qū)分腫瘤與良性病變。在MRI影像中,系統(tǒng)在乳腺癌識(shí)別中表現(xiàn)尤為突出。無(wú)論是浸潤(rùn)性導(dǎo)管癌還是更具挑戰(zhàn)性的小葉癌,其檢測(cè)敏感性和特異性均高于96%,表明系統(tǒng)幾乎能發(fā)現(xiàn)所有病例,極少出現(xiàn)誤報(bào)。而在阿爾茨海默病這項(xiàng)更隱匿的病理類型上,系統(tǒng)的表現(xiàn)同樣亮眼,敏感性和特異性均高于95%。該結(jié)果表明,即便是在疾病發(fā)展的初期階段,系統(tǒng)也能由MRI影像捕捉到微妙的腦結(jié)構(gòu)變化,為早期干預(yù)和治療提供寶貴的時(shí)間窗口。
4 結(jié)語(yǔ)
綜上所述,本文設(shè)計(jì)在醫(yī)學(xué)影像自動(dòng)診斷中具有高靈敏度和高特異性的優(yōu)勢(shì),能夠精準(zhǔn)識(shí)別微小病變,有效區(qū)分不同疾病的亞型。這種高水平的識(shí)別精度表明系統(tǒng)能夠在復(fù)雜多變的醫(yī)療圖像中準(zhǔn)確無(wú)誤地篩選出病灶,為臨床診斷提供強(qiáng)有力的支持。未來(lái)的研究應(yīng)當(dāng)更注重跨學(xué)科合作,結(jié)合臨床專家的知識(shí)與經(jīng)驗(yàn),進(jìn)一步提升系統(tǒng)的魯棒性和實(shí)用性。開(kāi)發(fā)更智能、自適應(yīng)的學(xué)習(xí)框架,以應(yīng)對(duì)不斷變化的醫(yī)療需求,將是下一階段的重要任務(wù)。
參考文獻(xiàn)
[1]唐蟄雨,李紹欽,賈中芝.基于CT圖像的深度學(xué)習(xí)在主動(dòng)脈夾層中的應(yīng)用進(jìn)展[J].南京醫(yī)科大學(xué)學(xué)報(bào)(自然科學(xué)版),2024,44(8):1170-1174.
[2]林書(shū)臣,魏德健,張帥,等.深度學(xué)習(xí)在膝關(guān)節(jié)骨關(guān)節(jié)炎磁共振診斷中的研究進(jìn)展[J].激光與光電子學(xué)進(jìn)展,2024,61(14):61-78.
[3]李云飛,李淑婷,張帥,等.深度學(xué)習(xí)在腫瘤影像分類中的研究進(jìn)展[J].中華腫瘤防治雜志,2024,31(12):719-724.
[4]莫瑩君,郭瑞斌.基于聲像圖深度殘差網(wǎng)絡(luò)ResNet模型自動(dòng)診斷腎囊腫[J].中國(guó)介入影像與治療學(xué),2022,19(4):221-224.