劉中華,王小莉,呂國(guó)榮,杜永兆2,,4,柳培忠2,,4,吳秀明,何韶錚
1.福建醫(yī)科大學(xué)附屬泉州第一醫(yī)院超聲科,福建泉州362000;2.泉州醫(yī)學(xué)高等專(zhuān)科學(xué)校母嬰健康服務(wù)應(yīng)用技術(shù)協(xié)同創(chuàng)新中心,福建泉州362000;3.華僑大學(xué)醫(yī)學(xué)院,福建泉州362000;4.華僑大學(xué)工學(xué)院,福建泉州362000;5.福建醫(yī)科大學(xué)附屬第二醫(yī)院超聲科,福建泉州362000
胎兒顏面部超聲標(biāo)準(zhǔn)切面(Fetal Facial Ultrasound Standard Plane,FFUSP)在胎兒顏面部結(jié)構(gòu)畸形篩查與診斷中發(fā)揮重要作用[1]。近年來(lái)利用人工智能(Artificial Intelligence,AI)實(shí)現(xiàn)了FFUSP的自動(dòng)識(shí)別[2],但AI在超聲圖像質(zhì)量控制及醫(yī)生培訓(xùn)的應(yīng)用尚少見(jiàn)報(bào)道[3-4]。本研究分析AI自動(dòng)識(shí)別分類(lèi)FFUSP在超聲圖像質(zhì)量控制和醫(yī)師規(guī)范化培訓(xùn)方面的價(jià)值。
以妊娠20~24周正常FFUSP圖像為研究對(duì)象,包括鼻唇冠狀切面(Nasolabial Coronal Plane,NCP)、正中矢狀面(Median Sagittal Plane, MSP)、經(jīng)眼球橫切面(Ocular Axial Plane,OAP)、非標(biāo)準(zhǔn)切面(Non-Standard Plane,N-SP)4個(gè)切面圖像。圖像按照用途分為標(biāo)準(zhǔn)集圖像與實(shí)驗(yàn)集圖像,分別用于AI模型訓(xùn)練、測(cè)試及評(píng)價(jià)不同經(jīng)驗(yàn)醫(yī)生與AI識(shí)別分類(lèi)FFUSP能力。所有圖像均來(lái)自于福建醫(yī)科大學(xué)附屬泉州第一醫(yī)院超聲圖文工作站,使用儀器為GE Volusen E8超聲儀及Philips EPIQ5超聲儀。
圖像納入標(biāo)準(zhǔn):①圖像清晰,目標(biāo)結(jié)構(gòu)位于圖像正中占據(jù)整個(gè)圖像1/2以上,背景純凈無(wú)偽像;②圖像內(nèi)無(wú)疊加彩色血流圖像,無(wú)測(cè)量卡鉗、文字標(biāo)識(shí)等人工注釋?zhuān)虎郛a(chǎn)后證實(shí)胎兒無(wú)顏面部及其它結(jié)構(gòu)畸形。圖像排除標(biāo)準(zhǔn):①由于孕婦肥胖、圖像抖動(dòng)等原因?qū)е聢D像模糊、拖尾,目標(biāo)結(jié)構(gòu)顯示欠清晰;②超聲檢查或產(chǎn)后證實(shí)胎兒異常。最終納入標(biāo)準(zhǔn)集圖像1 906張,實(shí)驗(yàn)集圖像4 532張。
本研究AI 模型使用局部二值模式(Local Binary Pattern,LBP)和梯度方向直方圖(Histogram of Oriented Gradient,HOG)提取訓(xùn)練集圖像紋理特征[5-6],通過(guò)支持向量機(jī)(Support Vector Machine,SVM)學(xué)習(xí)其紋理特征[7],實(shí)現(xiàn)FFUSP的自動(dòng)分類(lèi),最后通過(guò)預(yù)測(cè)分類(lèi)測(cè)試集圖像評(píng)估模型(圖1)。

圖1 AI模型識(shí)別FFUSP流程Fig.1 Process of identifying FFUSP by AI model
實(shí)驗(yàn)集圖像由產(chǎn)前超聲專(zhuān)家以《中國(guó)胎兒產(chǎn)前超聲檢查規(guī)范》[8]為依據(jù)分為OAP 組、MSP 組、NCP組、N-SP 組(圖2)。AI 模型構(gòu)建成功后,由3 名僅完成住院醫(yī)師規(guī)范化培訓(xùn)的醫(yī)生組成的初級(jí)醫(yī)生組、3名經(jīng)過(guò)半年以上產(chǎn)科超聲檢查專(zhuān)科培訓(xùn)的醫(yī)生組成的中級(jí)醫(yī)生組及AI分別獨(dú)立對(duì)實(shí)驗(yàn)集圖像進(jìn)行識(shí)別分類(lèi),比較分析初級(jí)醫(yī)生組、中級(jí)醫(yī)生組及AI 對(duì)FFUSP 各切面分類(lèi)的敏感度、特異度、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值、準(zhǔn)確率,觀察AI 與不同經(jīng)驗(yàn)醫(yī)生對(duì)FFUSP識(shí)別分類(lèi)能力差別。

圖2 FFUSP各切面超聲圖像Fig.2 Ultrasonic images of each kind of FFUSP plane
采用SPSS22.0軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。計(jì)量資料用均數(shù)±標(biāo)準(zhǔn)差表示,符合正態(tài)分布,使用t檢驗(yàn)或方差分析。計(jì)數(shù)資料以例(n)或率(%)表示,組間比較采用χ2檢驗(yàn)。AI對(duì)FFUSP分類(lèi)與專(zhuān)家分類(lèi)的一致性分析采用Kappa檢驗(yàn)。AI與初級(jí)醫(yī)生、中級(jí)醫(yī)生對(duì)FFUSP的識(shí)別能力比較采用McNemar檢驗(yàn),并比較相應(yīng)ROC曲線下面積(AUC)。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
標(biāo)準(zhǔn)集圖像1 906張,按8:2比例分為訓(xùn)練集和測(cè)試集;實(shí)驗(yàn)集圖像4 532張。各圖像集各切面分布見(jiàn)表1。

表1 各圖像集各切面分布情況Tab.1 Distribution of each kind of plane in each image set
AI對(duì)測(cè)試集圖像各切面分類(lèi)的敏感度、特異度、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值、準(zhǔn)確率均達(dá)90%以上,與專(zhuān)家分類(lèi)一致性強(qiáng)(P<0.001,表2)。

表2 AI對(duì)測(cè)試集各切面識(shí)別水平Tab.2 Recognition level of each kind of plane in test set by AI
(1)中級(jí)醫(yī)生對(duì)各切面識(shí)別能力均優(yōu)于初級(jí)醫(yī)生(P<0.05)。AI對(duì)FFUSP 各切面總體識(shí)別能力均優(yōu)于中級(jí)醫(yī)生與初級(jí)醫(yī)生(P<0.05);AI 對(duì)NCP、MSP識(shí)別敏感度和特異度均優(yōu)于中級(jí)醫(yī)生(P<0.05),對(duì)OAP 識(shí)別敏感度優(yōu)于中級(jí)醫(yī)生(P<0.05),兩者間特異度差異無(wú)統(tǒng)計(jì)學(xué)意義(P=0.125)(表3)。

表3 不同級(jí)別醫(yī)生與AI對(duì)實(shí)驗(yàn)集各切面識(shí)別水平(n=4 532)Tab.3 Recognition level of each kind of plane in experimental set by doctors and AI (n=4 532)
(2)AI 對(duì)各切面識(shí)別水平與專(zhuān)家分類(lèi)一致性強(qiáng)(P<0.05),k值分別為NCP:0.886、MSP:0.937、OAP:0.771。
AI對(duì)FFUSP實(shí)驗(yàn)集圖像分類(lèi)效率顯著優(yōu)于各組醫(yī)生人工識(shí)別效率(P<0.001),專(zhuān)家與中級(jí)醫(yī)生識(shí)別效率無(wú)顯著差異(P=0.364),專(zhuān)家識(shí)別效率優(yōu)于初級(jí)醫(yī)生(P=0.012),見(jiàn)表4。

表4 實(shí)驗(yàn)集分類(lèi)時(shí)間Tab.4 Time for classification of images in experimental set
醫(yī)生在超聲檢查中對(duì)FFUSP 的準(zhǔn)確識(shí)別對(duì)胎兒顏面部畸形篩查起到?jīng)Q定性作用,但不同經(jīng)驗(yàn)的醫(yī)生對(duì)超聲切面的識(shí)別能力存在差異[9]。本研究中經(jīng)過(guò)產(chǎn)科超聲系統(tǒng)培訓(xùn)的中級(jí)醫(yī)生對(duì)FFUSP的識(shí)別與分類(lèi)能力明顯優(yōu)于未經(jīng)系統(tǒng)培訓(xùn)的初級(jí)醫(yī)生體現(xiàn)了這一差異。對(duì)超聲醫(yī)生進(jìn)行規(guī)范化的專(zhuān)科培訓(xùn)能夠明顯提高超聲醫(yī)生對(duì)標(biāo)準(zhǔn)切面的識(shí)別能力,進(jìn)而提高超聲醫(yī)生的檢查水平[10]。進(jìn)行超聲圖像質(zhì)量控制亦能改善胎兒超聲檢查質(zhì)量,整體提高檢查的準(zhǔn)確性[11],因此在臨床工作中需要對(duì)超聲醫(yī)生進(jìn)行高效率培訓(xùn)并對(duì)其所獲取的超聲圖像進(jìn)行質(zhì)量控制。然而超聲醫(yī)生培訓(xùn)以及超聲圖像質(zhì)量控制均是由人工進(jìn)行,除了受到師資力量不足以及培訓(xùn)時(shí)間不足等因素影響[12-13],還極易受主觀因素影響,并且耗費(fèi)大量的人力物力,難以進(jìn)行大范圍的標(biāo)準(zhǔn)化專(zhuān)科培訓(xùn)及圖像質(zhì)量控制。
AI是計(jì)算機(jī)程序執(zhí)行與人類(lèi)智能相關(guān)行為如推理、學(xué)習(xí)、適應(yīng)、感知和交互的能力。近年來(lái)AI技術(shù)逐漸應(yīng)用于醫(yī)學(xué)影像自動(dòng)識(shí)別及疾病輔助診斷[9,14-17],并實(shí)現(xiàn)胎兒超聲標(biāo)準(zhǔn)切面的識(shí)別與分類(lèi)[18]。本研究利用AI對(duì)FFUSP進(jìn)行識(shí)別分類(lèi)以進(jìn)行超聲圖像質(zhì)量控制評(píng)價(jià),采用基于傳統(tǒng)手工特征串聯(lián)加主流分類(lèi)器的方法構(gòu)建FFUSP識(shí)別分類(lèi)模型。這一方法克服了卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練過(guò)程復(fù)雜、運(yùn)算速度慢等問(wèn)題,節(jié)省了時(shí)間、空間資源。結(jié)果表明AI分辨FFUSP各切面的準(zhǔn)確率達(dá)90%以上,尤其MSP、NCP達(dá)到95%以上,與專(zhuān)家分類(lèi)相比均有極強(qiáng)的一致性。當(dāng)AI具有較高水準(zhǔn)的分辨超聲圖像能力時(shí),可輔助超聲醫(yī)生優(yōu)化超聲圖像并提高診斷的準(zhǔn)確性[14,19]。利用AI輔助教學(xué)能夠提高超聲醫(yī)生整體素質(zhì)[4]。本研究中AI對(duì)FFUSP的分類(lèi)能力明顯優(yōu)于初級(jí)醫(yī)生和中級(jí)醫(yī)生,尤其對(duì)于結(jié)構(gòu)復(fù)雜的MSP,初級(jí)醫(yī)生與中級(jí)醫(yī)生的識(shí)別水平均較低,而AI經(jīng)過(guò)標(biāo)準(zhǔn)化訓(xùn)練后對(duì)該切面的識(shí)別水平明顯高于兩者。AI在效率上明顯高于人工,對(duì)實(shí)驗(yàn)集的分類(lèi)用時(shí)不到20 min,平均每張圖像識(shí)別時(shí)間為0.21 s;而專(zhuān)家對(duì)同一實(shí)驗(yàn)集圖像分類(lèi)效率為每張圖片2.73 s。實(shí)際工作中進(jìn)行大規(guī)模胎兒超聲圖像采集和質(zhì)量控制的工作量遠(yuǎn)遠(yuǎn)大于本實(shí)驗(yàn)集內(nèi)所包含的圖像,這對(duì)人工操作人員的體力和腦力勞動(dòng)均是極大挑戰(zhàn),因此AI輔助具有重要現(xiàn)實(shí)意義。
綜上所述,AI 對(duì)正常FFUSP 識(shí)別分類(lèi)具有較高的準(zhǔn)確性,可作為胎兒超聲規(guī)范化培訓(xùn)和圖像質(zhì)量控制的輔助工具。然而本研究仍然存在一些不足之處,如僅對(duì)FFUSP 進(jìn)行粗略分類(lèi),且僅對(duì)正常胎兒切面進(jìn)行識(shí)別與分類(lèi),尚未涉及精細(xì)結(jié)構(gòu)及顏面部畸形識(shí)別。未來(lái)將訓(xùn)練AI 對(duì)重要解剖結(jié)構(gòu)的精準(zhǔn)識(shí)別,以期利用AI輔助超聲診斷胎兒顏面部畸形。
中國(guó)醫(yī)學(xué)物理學(xué)雜志2021年12期