




摘要:脈絡膜是人眼球中的一層重要組織,準確測量和分割脈絡膜,對于預防、診斷以及預測視網膜疾病具有重大的醫學意義。文章對光學相干斷層掃描(Optical Coherence Tomography,OCT)技術在脈絡膜分割中的應用進行評估,并對近年來提出的結合OCT和深度學習技術的脈絡膜分割方法進行歸納和總結。研究結果顯示:與傳統算法相比,帶有特征提取或者特征融合模塊的U形網絡架構有著更好的魯棒性與泛化性。在實際應用中,該架構能有效解決OCT圖像中脈絡膜分割面臨的邊界模糊和斑點噪聲等問題,已成為脈絡膜分割算法中的主流模型。在眼科成像領域中,這些算法不僅提高了脈絡膜分割的效率和準確性,而且還減輕了醫生手工分割的工作負擔,有助于提升視網膜疾病的診斷和治療的水平。
關鍵詞:脈絡膜分割;脈絡膜厚度;OCT;深度學習
中圖分類號:TP312 文獻標志碼:A
0 引言(Introduction)
脈絡膜是一層柔軟光滑、血管豐富的棕色薄膜組織,其主要功能是為眼球輸送血液提供營養。在眼科醫療診斷領域,脈絡膜厚度被視為一種重要的生物標志物,對于檢測和預防老年性黃斑變性(Age-related Macular Degeneration,AMD)、視網膜色素變性(Retinitis Pigmentosa,RP)、青光眼等多種視網膜疾病具有重要意義[1]。OCT是一種非侵入性技術,主要用于人類眼底視網膜和脈絡膜的成像,與傳統的成像方法相比,OCT有著成像快、分辨率高、實時性強且無創成像等優點[2]。然而,目前的OCT還沒有開發出專門針對脈絡膜自動分割的軟件,大多數眼科醫生都只能手動測量和劃分脈絡膜邊界。人工分割方式不僅耗時長、費力、受主觀因素影響較大、效率低下,而且還易產生人為偏差,給醫生關于脈絡膜疾病的診療帶來了諸多困擾[3]。
近年來,隨著人工智能技術的迅猛發展、計算能力的顯著提高及大量數據的積累,深度學習技術取得了長足的進步,這也為醫療圖像成像的研究帶來了前所未有的契機。LITJENS 等[4]總結了相關深度學習算法,尤其是卷積神經網絡(Convolutional Neural Network,CNN)在視網膜、心臟、神經等醫學成像領域的優勢。SHEN等[5]提出了圖像計算機輔助分析方法,在醫學圖像配對、組織分割、疾病預測等領域展現出廣闊的應用前景。目前,越來越多的研究開始采用深度學習算法實現脈絡膜的分割與可視化[6-8]。本文首先探討了脈絡膜厚度作為病理性指標與相關視網膜疾病之間的密切關系,其次回顧了OCT成像技術在脈絡膜成像中的廣泛應用,最后對當前的脈絡膜自動分割算法進行了綜述,并著重介紹以U-Net為基本模型的改進算法。
1 脈絡膜的形態變化引起的相關病癥(Related disorders caused by morphological changes in the choroid)
脈絡膜厚度與視網膜健康密切相關,其變化會導致多種眼部疾病的發生。以下是脈絡膜厚度變化可能引發的病癥。
年齡相關性黃斑變性:老年性黃斑變性(AMD)是一種多發于中老年人群的、具有慢性和持續性特點的視網膜疾病。在AMD的不同階段和分類中,脈絡膜厚度會發生特征性變化,患者的脈絡膜會明顯變薄,因此監測這一指標可以幫助醫生更準確地評估AMD疾病的進展程度[9]。
高度近視:隨著近視度數的不斷增加,近視患者的視網膜淺層和深層的血流量會大幅減少,進而導致眼球結構發生變化,包括視網膜和脈絡膜的拉伸、變薄和彎曲。因此,脈絡膜厚度可以作為近視眼預測、近視發展監測[10]以及高度近視相關并發癥預防的一個重要指標。
視網膜色素變性:視網膜色素變性(RP)主要表現為視網膜色素上皮細胞的退行性改變,從而引起中心視力下降和色覺異常。羅英子[11]通過對照實驗提出RP組黃斑中心脈絡膜厚度與黃斑脈絡膜血管密度之間存在明顯的正相關性,這提示脈絡膜的厚度變化可能與RP的發病機理或病程進展有關。
糖尿病視網膜病變:糖尿病視網膜病變(Diabetic Retinopathy,DR)是糖尿病患者常見的并發癥之一。徐芳等[12]提出糖尿病黃斑水腫患者的黃斑中心凹下脈絡膜厚度會隨著黃斑中心視網膜厚度的增加而逐漸減小。董秀清[13]研究發現,糖尿病患者的血糖狀況也會影響脈絡膜的形態變化。
青光眼:青光眼是一組以特征性視神經萎縮和視野缺損為共同特征表現的眼科疾病,其發病的原發性因素主要是眼內壓增高,導致視神經損傷。有研究表明,與正常眼球相比,青光眼患者的眼球脈絡膜厚度明顯更厚。古麗皮亞·肖吾開提[14]通過一系列對照實驗得出結論,脈絡膜增厚可能是導致原發性閉角型青光眼疾病發生的誘因之一。
中央漿液性脈絡膜視網膜病變:中央漿液性脈絡膜視網膜病變(Central Serous Chorioretinopathy,CSC)是一種表現特征為視網膜神經上皮層漿液性脫離的視網膜疾病。毛盼等[15]提出,患者同側眼和患側眼的脈絡膜增厚,這表明即使在未出現視網膜下積液的眼睛中,雙側脈絡膜的血流密度也會增高且患眼的脈絡膜厚度明顯增厚。
2 OCT在脈絡膜成像中的應用(Application of OC Tinchoroidal imaging)
OCT于1991年由麻省理工的HUANG等首次提出,是一種利用光的干涉現象成像的斷層掃描技術[16],可以觀察視網膜的形態,測量視網膜的厚度和容積,進行視乳頭與神經纖維層成像,并進行黃斑區神經節細胞繪圖。隨著科技的進步,OCT技術發展迅速。2002—2003年,時域OCT(TD-OCT)應運而生,它通過使用移動參考鏡來測量光的反射時間,提高了生成圖像的成像深度和分辨率。然而,參考鏡的機械運動會導致圖像質量降低,并延長圖片生成處理的總時間[17]。為了攻克TD-OCT的技術缺陷,2006年有研究者推出了光譜域OCT(SD-OCT),它采用低相干干涉儀和高速光譜儀,通過測量干涉光譜同時檢測光的回波,摒棄了TD-OCT的移動部件。與TDOCT相比,SD-OCT在圖像質量、體積掃描密度及圖像分辨率方面均有所提高。由于透鏡本身會對光線的傳播造成衰減和散射,所以會影響TD-OCT和SD-OCT對脈絡膜-鞏膜界面成像的清晰度,導致脈絡膜細節處的成像模糊、分辨率低。2008年有研究者開發的增強深度成像(EDI-OCT)有效解決了這一問題。EDI-OCT通過移動零刻度線的位置,使其向脈絡膜方向偏移,首次測量出脈絡膜在縱向時的深度,從而能完整勾勒脈絡膜結構的細節[18]。EDI-OCT是在傳統頻域OCT基礎上改進的技術,能夠完整造影出脈絡膜的組織結構,可以定量測量脈絡膜厚度,是目前使用廣泛、效果顯著的醫學眼科成像技術[19]。
如今,EDI-OCT已廣泛應用于脈絡膜厚度的測量。在傳統的自動或半自動OCT圖像脈絡膜分割方法中,大多數方法都是基于圖搜索或圖紋理算法。ALONSO-CANEIRO 等[20]提出了一種以圖搜索技術為核心的分割方法,該方法使用邊緣濾波器和方向加權圖像來檢測脈絡膜的上邊界,并通過圖像增強技術及雙亮度概率梯度來描繪脈絡膜的下邊界。TIAN 等[21]提出了一種基于圖像動態處理的方法來檢測分割脈絡膜,該算法首先通過圖形的動態編程方法檢測脈絡膜的上邊界,其次尋找RPE以上梯度的最大值來檢測脈絡膜的下邊界。MAZZAFERRI等[22]基于圖論提出了一種新的算法,該算法能自動生成視網膜組織的二維厚度圖,并分割出脈絡膜的后方和前方的分界面。然而,上述方法的參數依賴人工設置,導致訓練效率低下,分割精度也不理想,特別是對于圖像中復雜的紋理結構與細節難以捕捉,導致脈絡膜下邊界存在邊界模糊等問題。對于醫學圖像中的偽影、偽像等圖像噪聲,基于圖搜索或圖紋理的算法可能會出現分割結果錯誤或不穩定的情況。
3 脈絡膜分割中常用的深度學習模型(Commonlyused deep learning models in choroidal segmentation)
近年來,深度學習算法與OCT技術的結合越來越緊密,被廣泛應用于臨床診斷。采用OCT成像技術能夠獲取眼球各組織層的高分辨率圖像,而卷積神經網絡等圖像處理技術則通過學習這些圖像的內在規律與聯系,輔助醫生更準確地識別和分割醫學圖像中的病灶[23]。
3.1卷積神經網絡結構
神經網絡是一種模擬人腦神經元之間相互連接的計算模型,它由大量基本處理單元(神經元)組成,通過這些神經元之間的連接進行信息的傳遞和處理,從而實現對輸入數據的學習和預測[24]。CNN是一類包含卷積計算且具有深度結構的前饋神經網絡,其不僅繼承了傳統神經網絡的自適應學習能力,而且還具備局部感知、權值共享等特點,被廣泛應用于計算機視覺與醫學成像領域中。SUI等[25]提出了一種多尺度、端到端的CNN架構,通過數據驅動的方式直接從原始像素點中學習最優圖邊權重,并與先進的圖搜索技術相融合,消除了基于圖形邊緣權重的人工模型邊界薄弱、脈絡膜紋理結構異質及脈絡膜變化所帶來的性能限制。HE等[26]提出了一種基于CNN 分類器和l2-lq(0lt;qlt;1)擬合器的自動分割方法,該方法能夠有效識別并分割脈絡膜的邊界,從脈絡膜圖像中生成脈絡膜厚度輪廓,用于檢測脈絡膜區域。GEORGE等[27]以圖像區域輪廓為基礎,提出了一種多級輪廓演化方法,該方法更加高效、簡潔,分割出的脈絡膜厚度輪廓與人工獲得的脈絡膜厚度輪廓相比在準確性和一致性方面表現良好。然而,上述方法都依賴于大量的訓練數據,計算成本更高,并且在處理特定情況如病態脈絡膜時分割精度不夠,對圖像中的具體細節與紋理特征的提取能力有待加強,因此在脈絡膜的分割中存在一定局限性。
3.2 編碼-解碼(U-Net)網絡結構
2015年,RONNEBERGER等[28]在第十八屆“醫學圖像計算與計算機輔助干預”會議上提出的U-Net網絡,標志著深度學習在醫學影像分割領域中取得重大突破。U-Net網絡結構由編碼器模塊、瓶頸模塊及解碼器模塊3個部分組成,其中編碼器模塊和解碼器模塊之間通過跳線實現連接,深層和淺層的語義特征通過跳線進行特征融合,這些使網絡具有了強大的分割性能。在U-Net的基礎網絡結構上,將注意力機制、稠密模塊、特征增強、評價函數等深度神經網絡領域的最新技術引入醫學影像分割應用中,成為被廣泛采取的改進方法[29]。
ZHANG等[30]提出了一種脈絡膜自動分割的生物網絡(Bio-Net),將深度學習網絡與OCT成像知識相結合,并采用了GAN架構,用于消除視網膜血管陰影帶來的影響。實驗結果表明,Bio-Net與傳統網絡架構相比,在陰影消除和形態保持方面表現出顯著的優勢,大幅減少了傳統方法存在的分割不足、精度低的問題。CHAI等[31]提出了一種用于脈絡膜分割的感知輔助對抗自適應方法(Perception Assisted Adversarial Adaptation,PAAA)。該方法首先利用基于U-Net架構的分割網絡對輸入圖像進行預測,其次通過計算分割損失并輸入PAAA模塊來處理輸入圖像與標簽之間的形狀和邊緣的細節差異,從而實現對不同脈絡膜樣本的精細分割。YAN等[32]提出了一種上下文高效自適應網絡(Context Enhanced Adaptive" Network,CEA-Net)的框架,旨在解決脈絡膜和鞏膜邊界定位模糊、脈絡膜層紋理和強度不一致等問題。WU 等[33]通過在主干網絡結構中添加一個邊界增強模塊,使主干網絡能夠更多地聚焦于邊界特征的提取。除此之外,該方法還引用了真實標簽數據的邊界信息并生成軟點圖,然后引入邊界感知損失,從而將邊界區域信息反饋到該分割網絡,實現對脈絡膜層的精確分割。
CHAI等[34]提出了一種記憶輔助雙端自適應網絡,旨在改進脈絡膜分割領域中網絡框架的一對多適配難題,通過縮小不同數據集上的網絡框架間的分割差異,提高了模型的泛化能力。SHI等[35]提出了一種分組上下文選擇網絡(Grouped" Context Selection Network,GCS-Net)。該網絡在U形網絡的基礎上,通過添加通道擴張模塊和空間擴張模塊,有效地增強了網絡的感受野,并提升了分割目標區域的精確性和一致性,從而使網絡在分割厚脈絡膜和薄脈絡膜區域時都能發揮更好的作用。ZHU等[36]提出了一種脈絡膜U 形網絡(Choroidal U-shape Network,CU-Net)的多任務分割網絡,該網絡可以同時實現脈絡膜層及其血管的分割。
LIU等[37]基于課程學習開發了一個全自動的脈絡膜自動分割網絡。該網絡能計算出平均脈絡膜厚度和脈絡膜血管指數,并能在有病變樣本干擾的情況下,實現對脈絡膜及其邊界的準確分割。XU等[38]提出一種結合圖像增強和基于注意力機制的ADU-Net網絡,旨在解決糖尿病視網膜病變和高度近視等病態眼球所帶來的脈絡膜層邊界模糊問題。在骨干網絡為U-Net的情況下,許祥叢等[39]還提出了另一種名為壓縮-激勵-連接U形網絡(Squeeze-Excitation-ConnectionU-Net,SECUNet),通過添加壓縮-激勵-連接(Squeeze-Excitation-Connection,SEC)模塊,提升了主干網絡對細節特征的提取和關注能力,尤其是對病態樣本的分割處理能力。相關算法的提出者、算法名稱、數據集、結果以及與基準模型相比較的結果如表1所示。
如表1所示,上述方法旨在通過結合深度學習網絡和OCT成像技術,以有效解決脈絡膜層分割中存在的問題,如圖像陰影消除、形態保持、邊界模糊、多類型樣本等。這些網絡架構采用編碼-解碼結構作為網絡主體,每個小模塊中包含多個卷積塊,在此基礎上進行衍生與拓展。有的網絡通過添加特征提取模塊,使網絡專注于提取某些重要特征,加強網絡對圖像的分割能力;有的添加了特征融合模塊,使網絡實現了對上下文或者多模態的特征融合,保證了分割的精確性;有的網絡對編碼-解碼結構進行了改進,通過融合不同的網絡結構,使得網絡能同時處理不同的任務,增強了網絡的功能性和魯棒性。U 形網絡的出現,使得脈絡膜分割的研究逐漸轉向脈絡膜層結構的特征提取、脈絡膜層細節紋理的處理以及脈絡膜邊界與鞏膜邊界的準確定位,而不再局限于單純的提高分割效率和優化模型上。這些方法在不同方面、不同尺度上展現了其優勢,不僅提高了脈絡膜層分割的精確度和泛化能力,而且還能準確提取脈絡膜層的結構特征和邊界信息,以更好地應用于脈絡膜圖像診斷和疾病分析中。以U形網絡架構為基礎的網絡模型在脈絡膜層圖像分割中也成為應用廣泛且效果顯著的模型。
3.3 評價指標
評價指標是用來衡量模型性能和評估模型效果的一種度量方法,在醫學眼科成像領域,常用的評價指標有準確率(Accuracy,ACC)、Dice、IOU(Intersection over Union,IoU)等。混淆矩陣(Confusion Matrix)是一種評估模型分類效果的實用工具,以表格的形式展示了模型的預測結果與真實結果之間的對應關系。在對最終模型進行測試時,許多評價指標都可以通過計算混淆矩陣中的某些參數,直接得出結果。常見的用混淆矩陣計算的評價指標有精確率(Precision,P)、召回率(Recall,R)、ACC等,其計算公式如下:
在混淆矩陣中,TP 表示真陽性(True Positive),即預測為正類且真實為正類的樣本數;FP 表示假陽性(False Positive),即預測為正類但真實為負類的樣本數;FN 表示假陰性(False Negative),即預測為負類但真實為正類的樣本數;TN 表示真陰性(True Negative),即預測為負類且真實為負類的樣本數。相比于直接通過模型輸出與標簽計算評價指標,利用混淆矩陣中的參數計算不僅能簡化計算步驟,而且還能準確掌握模型輸出與輸入之間的數據分布,更有助于接下來的數據分析和參數調試。上述指標的取值范圍為0~1,越接近1,表示預測結果與真實樣本之間相識度越高,模型預測結果就越準確。
4 結論(Conclusion)
在上述深度學習模型算法中,從最初的卷積神經網絡(主要是CNN及其相關改進版本)、全卷積網絡(主要是FCN、Res-Net等),到后面的編碼-解碼網絡模型(主要是U-Net及其相關改進版本),脈絡膜自動分割算法也在學者的不斷探索與開拓中逐漸走向完善和穩定。計算機視覺領域的技術進步,尤其是在圖像處理技術方面的突破性進展,為OCT成像的自動分割技術帶來了深遠的影響,并極大地推動了眼科醫學成像的發展與進步。
在深度學習圖像技術領域,仍然存在許多技術難題和實際問題亟待解決。其中,公開數據集的匱乏,一直是模型訓練需要面臨的一大難題。在深度學習中,需要有大量的輸入樣本來優化訓練并減少過度擬合,從而提高模型的泛化性。不同廠商生產的OCT設備,在應用端生成的圖像并不通用,這給模型的訓練調試帶來了困難。通常,不同數據集在不同模型上獲得的效果不一樣。盡管目前有學者提出了相應的改進模型,增加了模型的泛化能力,并提高了模型在不同數據集上的兼容性,但是在實際應用端,所面臨的數據集會更加復雜且多樣。
上述文獻中采用的大多數算法都是基于有監督學習方式進行訓練的,有監督學習的關鍵就是需要一個帶有標簽數據的數據集,只有通過這種方式,模型才能通過輸出結果與真實結果(標簽數據)之間的差異來更新網絡權重參數,進而調整并優化模型效果。人工劃分脈絡膜邊界不僅需要專業醫生參與,而且受設備儀器、病人病情、醫院環境等多種因素的影響,所劃分的脈絡膜邊界往往存在差異。此外,模型分割方法還受到圖片斑點噪聲的影響,因此減少圖像的斑點噪聲和開發圖像去噪技術,有助于改善脈絡膜自動分割算法的性能。相關文章提出了一些降噪算法,主要是通過GAN網絡或者其改進模型,在數據進入分割模型訓練時先對數據進行降噪預處理,這種方式雖然能降低圖像斑點噪聲帶來的干擾,但是模型的體積、訓練時間都會大幅增加,所需的計算能力會大大提高訓練模型和實際應用所需的經濟成本也會增加。因此,一種輕量級的能同時兼顧分割與降噪的脈絡膜自動分割算法有待學者們提出和改進。除此之外,OCT技術在三維體積分割測量、病態脈絡膜層分割測量等方面也面臨挑戰。相信在不久的將來,學者們通過科技創新和研究探索,能夠開發出完整且實用、高效的算法并將之廣泛應用于醫療設備中,以提升醫生的診療手段和治療效果。
作者簡介:
范興鴻(2000-),男(漢族),遵義,碩士生。研究領域:醫學圖像處理。
陳湘萍(1977-),女(漢族),貴陽,教授,博士。研究領域:人工智能,可再生能源系統優化與控制。
刁昕龍(2000-),男(漢族),貴陽,碩士生。研究領域:醫學圖像處理。