何佳雯,王莉菲,張如如,譚 玲,劉 毓,王晴川,陳正宇,范家偉,鄂海紅,宋美娜*
(1.北京郵電大學計算機學院,北京 100876;2.教育部信息網絡工程研究中心,北京 100876;3.河北省眼科醫院眼底外科,河北 邢臺 054001)
光學相干斷層掃描(optical coherence tomography, OCT)是無接觸、無創成像技術,以較高分辨率快速對眼部結構進行可視化,提供清晰的橫軸位成像[1],現已成為診斷老年性黃斑變性(age-related macular degeneration, AMD)和糖尿病黃斑水腫(diabetic macular edema, DME)等眼底疾病的金標準[2];但圖像中病變區域與正常區域之間的對比度較低,且成像過程受儀器噪聲及其他生物組織的干擾,分析圖像較為耗時,結果難以避免主觀性。近年來,深度學習(deep learning,DL)技術發展迅速,用于醫學圖像處理可快速、準確地捕捉病變特征并判斷疾病類型,提高工作效率和診斷精度及穩定性[3]。本文對基于DL的OCT輔助診斷常見眼底疾病研究進展進行綜述。
基于干涉儀原理,不同深度的生物組織對于OCT設備發出光波的后向反射能力不同。以近紅外弱相干光照射待測組織,檢測不同深度層面生物組織的背向反射或數次散射信號,可得到眼部組織的二維或三維結構圖像(圖1)。OCT具有出色的光學切片能力,能利用寬帶光源的低相干性實現對次表面的高分辨率層析成像而捕捉病變的精確信息[4],其探測深度遠超過傳統共焦顯微鏡。

圖1 視網膜黃斑區OCT INL為內核層,IPL為內部網狀層,ILM為內限膜,GCL為神經節細胞層,NFL為神經纖維層,OPL為外叢狀層,ONL為外核層,ELM為外部限制膜,IS/OS為內部和外部感光段的連接,RPE為視網膜色素上皮+布魯赫膜,OPR為光感受器外節/RPE復合體,Choroid為脈絡膜,Bruchs Membrane為布魯赫膜
2.1 DL概述 DL是機器學習最重要的分支之一,通過大量訓練樣本而學習樣本的內在規律和表示層次,具有預測、分類及分割能力?;贒L的OCT輔助診斷眼底疾病主要包括OCT預處理、OCT分割和OCT分類各環節。預處理指對OCT圖像進行去噪、圖像增強及形態學處理,以去除散點噪聲、提高對比度,清晰顯示特征區域;提取ROI,后續僅針對其進行分割或分類。OCT分割可量化圖像中不同組織層的厚度及病變區域范圍,幫助臨床醫生或輔助診斷系統根據病變類型、位置、區域及數量判斷疾病嚴重程度。在分割基礎上進行分類,通過DL技術分析OCT圖像中病變區域特征與眼底疾病的關系,實現自動篩查眼底疾病,輔助眼科醫師提出進一步診療計劃及轉診建議等。
對于DL模型而言,足量訓練樣本非常重要。目前主要OCT開源數據集見表1,可根據不同需求適當選用。

表1 現有主要可用 OCT開源數據集
2.2 基于DL的OCT輔助診斷常見眼底疾病研究進展 視網膜內液(intraretinal fluid, IRF)、視網膜下液(subretinal fluid, SRF)及色素上皮脫離(pigment epithelium detachment, PED)等是OCT診斷常見眼底疾病的重要依據。目前針對OCT的DL模型已可分割多種病變區域及對眼底病變進行分類,主要包括AMD、DME及青光眼等。
2.2.1 AMD AMD為黃斑區結構衰老性改變,分為干性AMD和濕性AMD。干性AMD表現為黃斑區存在玻璃疣等;濕性AMD表現為CNV異常生長。2018年,SEEB?CK等[11]以正常人眼部OCT圖像訓練多尺度深度去噪自編碼器(deep denoising autoencoder, DDAE)用于提取正常OCT圖像中的特征,并訓練單類支持向量機模型用于識別OCT圖像中的AMD區域,根據聚類結果將OCT圖像分為正常及早期、晚期AMD,預測分類準確率達81.40%,使模型可解釋性趨于更好。2019年,HWANG等[12]以InceptionV3模型將583例AMD和174名正常人的35 900幅OCT圖像分類為正常、干性AMD、活躍性濕性AMD及非活躍性濕性AMD,降低了任務復雜度,準確率達92.67%。ASLAM等[13]基于OCT訓練前饋神經網絡模型,以預測滲出性AMD患眼的視力,與實際視力相比,其均方根誤差為8.20個字母,并可用于監測AMD患眼視力,有助于及時診斷和治療ADM復發。基于DL智能診斷AMD現已達到較高精度,有待進一步研究驗證并付諸臨床應用。
2.2.2 DME DME是糖尿病眼部主要并發癥,為四大致盲眼病之一,在OCT圖像中主要表現為高反射點、視網膜內囊樣積液及中心凹下脈絡膜厚度改變等。2018年,PERDOMO等[14]提出端到端的OCT-NET DL模型,實現DME與正常二分類,通過網格搜索方法篩選最優的批量大小和學習率,其準確率、敏感度和特異度均達93.75%。VAHADANE等[15]提出兩階段DL網絡篩查DME,第一步使用圖像處理技術檢測硬滲出物和積液區域的候選補??;第二步以卷積神經網絡(convolutional neural network, CNN)對候選補丁進行分類,判斷是否存在DME病理特征,以篩查DME;補丁可有效提高模型的聚焦特性、降低模型規模,使其精確率達96.43%。2019年,HASSAN等[16]提出基于雙模態數據的DL框架,通過CNN自彩色眼底圖像和OCT圖像中提取特征并加以融合,之后通過人工神經網絡、支持向量機和樸素貝葉斯進行集成,以分類DME與正常,其準確率達94.33%。上述研究表明,OCT圖像中DME的病變特征相對明顯,對經典DL模型進行遷移即可獲得較高的診斷精度。
2.2.3 青光眼 青光眼是視神經受損所致,因早期癥狀不明顯而診斷困難,需綜合考慮眼壓、眼底形態、視野及視網膜神經纖維層(retinal nerve fiber layer, RNFL)等多個因素。2018年,WANG等[17]提出了分割檢測聯合網絡(joint segmentation and diagnosis network, S-D Net),以模擬臨床醫師診斷青光眼:首先應用分割網絡(segmentation network, S-Net)對OCT圖像進行視網膜層分割,之后以診斷網絡(diagnosis network, D-Net)依據RNFL厚度診斷青光眼,由于存在正常人RNFL變薄、而青光眼RNFL無變化的現象,該網絡的診斷準確率為85.40%。2019年,AN等[18]基于OCT和彩色眼底圖像開發了一種智能輔助診斷開角型青光眼的算法,通過OCT圖像分別獲取黃斑區、視盤區、RNFL和神經節細胞覆蓋合體(ganglion cell complex, GCC)的厚度,結合視盤區域的彩色眼底圖像,使用5個基于VGG模型的預模型,并采用隨機森林算法分類青光眼與正常,其曲線下面積(area under the curve,AUC)達0.963;但該研究樣本量較少,且部分患者合并近視,導致結果可能存在偏差。RAN等[19]基于譜域OCT(spectral-domain OCT, SD-OCT)數據開發一種3D DL系統,通過檢測RNFL厚度自動診斷青光眼視神經病變,基于深度殘差網絡(deep residual network, ResNet)生成熱圖,顯示青光眼視神經病變相關組織結構;經香港中文大學眼科中心和香港眼科醫院收集的數據初步驗證其診斷效能優于2D DL系統,并基于香港威爾斯親王醫院、屯門眼科中心及美國斯坦福大學拜爾斯眼科研究數據進行了外部驗證,其表現良好,但仍需進一步研究評估其增量成本效益。現有多數DL模型基于RNFL及GCC厚度診斷青光眼,總體診療精度相對較低,結合視盤和黃斑區血管密度、黃斑全層厚度、視野及眼壓等綜合數據進行多模態[20-21]分析有助于準確診斷青光眼。
2.2.4 其他眼底疾病 隨著技術的迅速發展,現已實現同時分割多種病灶區域或同時分類多種眼底疾病。2018年,谷歌DeepMind團隊[22]提出一種兩階段DL模型,先以3D U-Net分割模型分割OCT圖像中眼部15種不同組織和病變區域,再利用CNN進行診斷和轉診推薦分類,可準確檢測50余種眼部疾病,且其遷移性在不同設備上均較好,準確率達94.5%,符合醫師診療流程,適用于臨床。KERMANY等[7]以Inception V3模型為基礎進行遷移學習,以篩查CNV、DME和玻璃疣,并根據檢測到的疾病類型提出轉診建議,分類準確率為96.60%,敏感度為97.80%,特異度為97.40%。FANG等[23]提出的病變感知CNN模型可用于分類玻璃疣、CNV、DME與正常,該模型模擬醫師診療習慣,首先以注意力機制生成病灶檢測軟注意力圖,并將之合并到分類模型中,根據注意力程度對局部卷積表示進行加權,分類玻璃疣、CNV、DME與正常的準確率分別為94.9%、94.5%、97.1%及97.5%。2020年,ZHANG等[24]提出BMM-Net模型分割OCT圖像中的視網膜水腫、SRF和PED病變區域,以U-Net為基礎,集成邊界提取模塊、多尺度信息感知模塊,以捕捉準確位置和語義特征,解決病變區域對比度低及病灶尺寸不均衡的問題,并在AI Challenger挑戰賽數據集上進行驗證,平均Dice系數達82.22%,性能佳。目前基于DL的OCT圖像已在分割多種病變區域及分類多種眼底疾病方面取得突出成果,且正朝向可解釋、多分類及泛化方向發展。
基于DL的OCT輔助診斷眼底疾病具有廣闊應用前景,但仍面臨挑戰:①由于隱私問題,可用于訓練模型的高質量、標準化OCT圖像數據仍甚匱乏;②DL模型的機制缺乏可解釋性[25],這在很大程度影響輔助診斷系統用于臨床實踐。相信未來將會克服上述不足,獲得優秀成果,推動該領域的發展。