高荔姍 朱萍
糖尿病是全球重大的健康衛生問題,2015 年,全世界約4.15 億人被診斷患有糖尿病,預計2040 年將增加至6.42 億[1],勢必造成沉重的社會醫療經濟負擔。糖尿病性視網膜病變(diabetic retinopathy,DR)是糖尿病患者最常出現的致盲性微血管并發癥之一,超過80%的1 型糖尿病患者和70%的2 型糖尿病患者會在10~15 年病程中患上不同程度的DR[2]。研究顯示,中國糖尿病人群中DR 患病率高達23%,其中非增殖型DR 為19.1%,增殖型DR 為2.8%[3]。由于DR 患者在早期通常無明顯癥狀,因此有必要進行篩查,并通過早期干預來避免視力受損[4]。然而,由于糖尿病患者數量龐大、眼科醫師相對缺乏等因素的影響,篩查需求尚未得到滿足[5-6]。人工智能(artificial intelligence,AI)是將算法運用于大量數據,使計算機系統具備一定的認知能力,是目前計算機學科的一個重要前沿方向[7-8]。近年來,基于圖像的AI技術逐漸應用于醫學領域,特別是眼科領域[9]。本研究通過比較AI 系統與眼科醫師對糖尿病患者DR 的診斷效能及其一致性,探討AI 軟件的應用價值,以期為基層醫院糖尿病患者DR 篩查提供新的方法與平臺。
1.1 對象 依托2020 年海寧市民生實事項目“糖尿病眼底智能篩查”,選取2020 年7 月至2021 年12 月在本院行DR 篩查的28 300 例(56 600 眼)糖尿病患者為研究對象。采用分層隨機取樣法抽取3 512 例(7 024 眼)糖尿病患者進行研究,其中男1 964 例,女1 548 例;年齡22~80(58.48±21.31)歲;糖尿病病程1~22 年,中位病程為11(6,17)年。納入標準:(1)符合中華醫學會糖尿病學分會制定的《中國2 型糖尿病防治指南(2017 年版)》[10]中2 型糖尿病診斷標準;(2)無惡性腫瘤、血液系統、免疫系統等嚴重全身疾病;(3)精神狀態及溝通能力良好。排除標準:(1)玻璃體、晶狀體、角膜等屈光介質渾濁,不能獲得良好質量圖像;(2)合并其他眼底病變,如視網膜靜脈阻塞、中心性漿液性脈絡膜視網膜病變、老年性黃斑變性、葡萄膜炎、息肉樣脈絡膜血管病變等眼部血管疾病。本研究經本院醫學倫理委員會審查通過(批準文號:2022 倫審5 號)。
1.2 方法 AI 系統和眼科醫師分別針對3 512 例(7 024 眼)的眼底照片進行閱片。
1.2.1 AI 系統閱片 AI 系統利用自動免散瞳眼底照相機(型號:AFC-330,日本尼德克)進行眼底照相,以黃斑為中心對患者拍攝1 張45°彩色眼底相片。將拍攝的照片上傳到AI 系統(浙大睿醫AI 系統視網膜閱片系統),由AI 系統進行閱片,并結合DR 國際分期診斷標準,對眼底影像自動給出判讀結果。典型DR 患者眼底彩色相片見圖1(插頁)。

圖1 DR 患者眼底彩色相片(A:DR 患者右眼彩色眼底相片,根據DR 國際分期診斷標準,其分期為DR 輕度非增殖期;B:糖尿病患者右眼彩色眼底相片,根據DR 國際分期診斷標準,其分期為DR 中度非增殖期)
1.2.2 眼科醫師閱片 眼科醫師利用超廣角眼底照相機(型號:CLARUS 500,德國蔡司)拍攝后極部(黃斑為中心)眼底彩照,在所有拍攝的眼底彩照上識別DR 早期治療研究(early treatment diabetic retinopathy study,ETDRS)標準7 視野進行視網膜圖像分析,象限的范圍遵循ETDRS 的規定:橫軸為通過視盤上下緣的雙橫線,縱軸為通過視盤中心垂直線。兩條軸線相互垂直所形成的4~7 的圓形區,即為顳上、顳下、鼻上、鼻下4個象限,所有圓的半徑為視盤中心至黃斑中心的連線長度。由3 位經驗豐富的眼科醫師根據眼底彩照進行閱片,3 位醫師彼此間為雙盲診斷判定有無DR,診斷為DR 的患者均行光學相干斷層掃描成像(optical coherence tomography,OCT),初診為中度非增殖性DR(non-proliferative diabetic retinopathy,NPDR)、重度NPDR以及增殖性DR(proliferative diabetic retinopathy,PDR)患者均行熒光素眼底血管造影(fluorescein fundus angiography,FFA),輔助分期診斷。以3 位醫師相同診斷結果為最終診斷結果,若3 位醫師診斷存在爭議,由本院另一位眼底病專家進行評定并給出最終結果。
1.2.3 診斷標準 AI 系統和眼科醫師均根據2003 年國際DR 分期標準將DR 分為無DR、輕度NPDR、中度NPDR、重度NPDR 和PDR。考慮到AI 系統進行大基數DR 初篩后需進一步給予轉診治療的臨床需要,因此本研究統計了需要眼科專業醫師干預的有轉診意義的DR(referable diabetic retinopathy,RDR),即中度以上NPDR、PDR 或黃斑水腫[11]。
1.2.4 OCT 檢查 使用光學相干斷層掃描儀(型號:VG100D,中國視微),按操作標準對前額及下頜位置進行固定,確保相干光線無法垂直進入眼內;應用內注視的方式,以黃斑中心凹為中心分別行水平、垂直角度的線形掃描。陽性表現為視網膜黃斑中心凹厚度>250 μm。
1.2.5 FFA 檢查 使用FFA 儀(型號:Meditec AG,德國蔡司),造影前對患者進行熒光素鈉注射液皮試;對皮試陰性患者經肘靜脈推注200 g/L 熒光素鈉3 mL,推注完畢后即刻開始計時,對患者進行相應顯影分期的拍照。陽性表現為靜脈早期視網膜瘤樣強熒光點,毛細血管閉塞、擴張,動靜脈早期新生血管熒光形態可見、無灌注區弱熒光、出血遮蔽熒光,動靜脈晚期新生血管滲漏融合、動靜脈異常血管網,晚期熒光滲漏持續不退、邊界模糊。
1.3 統計學處理 采用SPSS 26.0 統計軟件。符合正態分布的計量資料以表示,當方差不齊時,組間比較采用不假定方差相等的t檢驗;不符合正態分布的計量資料以M(P25,P75)表示。計數資料組間比較采用χ2檢驗。以眼科醫師診斷為金標準,計算AI 系統診斷DR、DR 分級和RDR 的靈敏度[靈敏度=真陽性人數/(真陽性人數+假陰性人數)×100%]、特異度[特異度=真陰性人數/(真陰性人數+假陽性人數)×100%]、漏診率[漏診率=(漏診DR 人數/總人數)×100%]和誤診率[誤診率=(誤診DR 人數/總人數)×100%]。采用Kappa 檢驗評估AI 系統與眼科醫師診斷DR、DR 分級及RDR 的一致性,Kappa 值0.61~0.80 為顯著一致性,Kappa 值>0.80 為高度一致性。P<0.05 為差異有統計學意義。
2.1 AI 系統與眼科醫師DR 診斷的一致性比較 7 024眼中,AI 系統診斷顯示DR 825 眼,無DR 6 199 眼;眼科醫師診斷顯示DR 807 眼,無DR 6 217 眼。以眼科醫師診斷為金標準,AI 系統診斷DR 的靈敏度為91.69%,特異度為98.63%,漏診率為8.30%,誤診率為1.36%。AI 系統與眼科醫師DR 診斷的一致性比較差異有統計學意義(Kappa=0.831,P<0.001),見表1。

表1 AI系統與眼科醫師DR診斷的一致性比較(眼)
2.2 AI 系統與眼科醫師DR 分級診斷的一致性比較7 024 眼均納入DR 分級診斷檢測。以眼科醫師診斷為金標準,AI 系統診斷輕度NPDR 的靈敏度為82.72%,特異度為98.93%,漏診率為17.27%,誤診率為1.07%;AI 系統診斷中度NPDR 的靈敏度為84.36%,特異度為99.27%,漏診率為15.63%,誤診率為0.72%;AI 系統診斷重度NPDR 的靈敏度為86.11%,特異度為99.92%,漏診率為13.88%,誤診率為0.07%;AI 系統診斷PDR的靈敏度為86.95%,特異度為99.97%,漏診率為13.04%,誤診率為0.03%。AI 系統與眼科醫師DR 分級診斷的一致性比較差異有統計學意義(Kappa=0.847,P<0.001),見表2。

表2 AI系統與眼科醫師DR分級診斷的一致性比較(眼)
2.3 AI 系統與眼科醫師RDR 診斷的一致性比較7 024 眼均納入RDR 診斷檢測。以眼科醫師診斷為金標準,AI 系統診斷RDR 的靈敏度為88.16%,特異度為99.32%,漏診率為11.83%,誤診率為0.67%。AI 系統與眼科醫師RDR 診斷的一致性比較差異有統計學意義(Kappa=0.828,P<0.001),見表3。

表3 AI系統與眼科醫師RDR診斷的一致性比較(眼)
2.4 AI 系統與眼科醫師單張閱片平均耗時比較 AI系統單張閱片平均耗時為(1.58±0.22)s,短于眼科醫師的(5.83±2.11)s,差異有統計學意義(t=-118.723,P<0.001)。
近年來,在眼科領域,尤其在眼底疾病方向,基于AI 的計算機輔助和自動視網膜圖像評估工具的診斷性能和技術已經取得了迅速的發展,主要應用于DR、青光眼、年齡相關性黃斑變性、早產兒視網膜病變等疾病[12-13]。AI 系統能夠識別出血、滲出、棉絮斑和視網膜微血管循環異常等DR 病變,對視網膜圖像進行血管分割、視盤定位、動靜脈分類和病變檢測,通過特征檢測網絡模塊、分類網絡模塊、注意力機制和特征融合3 個相互關聯的DR 分級模塊處理,對患者進行診斷并協助臨床分級診療。
本研究中眼科醫師基于ETDRS 模式的眼底彩照、OCT、FFA 等多種影像結果參考下輔助診斷,這對眼科醫師診斷的精確性有了極大保證,相比之下,AI 系統僅根據眼底彩照閱片就能進行DR、DR 分級和RDR 診斷,并基于RDR 分級轉診,后者更能充分發揮基層醫院和二級及以上醫院共同組成的醫療團隊服務作用,達到降低DR 致盲率的防控目標,符合目前我國大部分地區,尤其是基層醫院在醫療資源方面相對不足的現狀。
本研究7 024 眼中,眼科醫師診斷DR 807 眼,發病率為11.48%,提示平均每11 例糖尿病患者中就有1~2例發生DR,發病率較高,因此對糖尿病患者進行定期DR 篩查具有極大的必要性[14]。以眼科醫師診斷為金標準,AI 系統診斷DR 的靈敏度為91.69%,特異度為98.63%,Kappa 值為0.831。其中,診斷輕度NPDR 的靈敏度為82.72%,特異度為98.93%;診斷中度NPDR 的靈敏度為84.36%,特異度為99.27%;診斷重度NPDR的靈敏度為86.11%,特異度為99.92%;診斷PDR 靈敏度和特異度最高,分別為86.95%、99.97%;兩組DR 分級診斷結果一致性分析的Kappa 值為0.847。在判斷RDR 中,AI 診斷靈敏度達到88.16%,特異度為99.32%,Kappa 值為0.828。以上結果提示,在DR 診斷和分級診療中,AI 系統診斷與眼科醫師診斷具有高度一致性,且該數據與相關研究結果大致相同[14-17],可滿足基層醫院AI 大規模DR 初篩的需要,對“基層首診、分級醫療、上下聯動”DR 分級轉診醫療模式的推進有重大意義。
雖然AI 系統與眼科醫師的診斷有高度一致性,但是仍有部分診斷不一致的案例,分析兩者結果存在差異的原因可能有:(1)AI 僅以黃斑區為中心的45°彩色眼底相片結果為參考,眼科醫師則在ETDRS 7 個象限眼底彩照、OCT、FFA 等多種影像結果參考下輔助診斷;(2)部分患者屈光間質混濁,眼底圖像質量不高;(3)機器長期使用后出現鏡頭變臟或反光等因素影響閱片;(4)AI 系統在深度學習法中使用的眼底彩照與本研究中使用的眼底彩照來源于不同的眼底照相機,成像質量存在差異。因此,保障圖像質量是AI 系統篩查DR 的關鍵[18]。此外,本研究中不足之處在于,所采用的浙大睿醫AI 系統視網膜閱片系統所識別的照片均為AFC-330 自動免散瞳眼底照相機拍攝,并未考慮該系統對其他型號眼底照相機的兼容性。
在閱片時間方面,本研究中AI 系統單張閱片平均耗時較眼科醫師明顯縮短。李萌等[19]指出,與醫師組相比,AI 系統對1 000 張確診的彩色眼底照片的單張閱片時間總耗時均明顯縮短,與本文研究結果一致。說明相對于人工閱片,AI 系統更加適用于區域集中閱片、大規模篩查等高工作強度的工作;此外,人工閱片耗時可能受到專業程度、熟練程度、身體狀況、注意力等因素的影響,但AI 系統則避免了上述因素。然而值得指出的是,AI 系統閱片速度可能受到系統本身運行速度、計算機配置、算法復雜程度等因素的影響。
綜上所述,AI 系統用于糖尿病患者DR 診斷的閱片時間較眼科醫師短,且診斷DR 和RDR 的靈敏度、特異度與眼科醫師具有高度一致性。AI 系統的應用可大幅度提升眼科醫師的接診數量,緩解基層醫院專科醫師工作壓力及醫療資源緊張情況,且其具有不受疲勞影響和自始自終以細節為導向的優勢,值得推廣應用,以期為廣大糖尿病患者帶來極大的福音。