周安艷 胡蓉
最新研究報道稱,2023 年美國約有1.97 萬例卵巢癌新發病例,1.33 萬例死亡[1]。我國卵巢癌發病率居全球第1 位,是女性病死率最高的惡性腫瘤,也是臨床治療最棘手的婦科惡性腫瘤,其發病率和死亡率呈逐年上升趨勢[2]。由于卵巢位于盆腔深處,卵巢癌早期無明顯癥狀,且具有高復發率、高轉移率、低生存率的特點,故對于卵巢腫瘤最迫切的任務是尋找一種有效的早期診斷方法。而超聲檢查具有安全、經濟、可重復性高等特點,且具有較高的靈敏度和特異度(90%~97%)[3-5],被認為是術前鑒別診斷附件腫塊(adnexal masses,AMs)的最佳影像學檢查方法。由經驗豐富的超聲醫師對盆腔腫塊的圖像進行主觀評價是鑒別AMs 惡性和良性的準確方法,其準確率約為90%[6-9]。然而,初級超聲醫師(住院醫師)尤其是基層超聲醫師的人數遠遠多于專家(主任醫師),大多數AMs 只能由初級超聲醫師進行評估和診斷,而且不同經驗及不同研究中心的診斷準確率差異較大,任何使用邏輯回歸分析或神經網絡等數學方法進行的分析均必須獲得非常高的測試效能,才能與專家的診斷準確率相媲美[7]。Aslam 等[10]對3 種不同邏輯回歸模型進行前瞻性比較得出,Timmerman 等[11](AUC=0.93),明顯優于Alcazar 等[12](AUC=0.70)及Tailor 等[13](AUC=0.86);此外,Valentin 等[9]將Timmerman 與Tailor 的模型進行了比較,發現AUC 分別為0.84 和0.87,證明由超聲專家進行的主觀評估表現更好。因此目前更需要可靠性高的AMs 惡性風險評估方法,為經驗不足的超聲醫師診斷AMs 提供幫助,美國放射學會(American College of Radiology,ACR)超聲工作組的卵巢附件報告及數據系統(ovarian-adnexal reporting and data system,O-RADS)由此提出。本文就O-RADS 的提出、診斷效能及聯合應用等相關研究作一綜述。
AMs 多為生理性改變或典型良性病變,惡性程度較低[14]。面對非典型AMs 時,評估惡性腫瘤風險仍然存在挑戰。卵巢癌發病率較低,但是高度致命,總體5年生存率低于50%[15]。因此,AMs 的準確診斷在患者管理中起著至關重要的作用。近年來,已經開發了多種超聲結構報告系統來評估卵巢癌的風險,2000 年國際卵巢腫瘤分析(international ovarian of tumor analysis,IOTA)小組提出了描述附件腫瘤超聲特征的術語和定義[16],隨后在2005 年開發了“logistic 回歸模型”[17],2008年開發了“IOTA 簡單規則(IOTA simple rule,IOTA SR)”[18],2009 年開發了婦科成像報告數據系統(gynecology imaging reporting data system,GI-RADS)[19],2014年開發了“ADNEX 模型”[20],2016 年開發了“Simple Rules-Risk 模型(simple-rules-risk model,SR-Risk)[21];2018 年,ACR 發布了一份描述AMs 的白皮書詞典[22];2020 年超聲工作組發布了O-RADS 超聲風險分層和管理共識指南[23]。該共識指南是ACR 超聲工作小組在2018 年發表的白皮書O-RADS 超聲詞典的基礎上推出的,共識指南將卵巢附件超聲所見的風險分為6類(O-RADS 0~5 類),0 類:不能進行超聲評估;1 類:正常絕經前卵巢,包括≤3 cm 的卵泡或黃體;2 類:惡性風險<1%的幾乎肯定是良性的病變;3 類:惡性風險為1%~<10%低惡性風險病變;4 類:惡性風險為≥10%~<50%中等惡性風險病變;5 類:惡性風險≥50%高惡性風險病變。該分類是目前唯一包含所有風險類別及相關管理方案的詞典和風險分層系統,根據風險類別不同,可酌情進行重復超聲檢查、隨訪復查、MRI 檢查、超聲科專家檢查及婦科醫師進行管理。對于具有一定惡性風險類別的病變,如存在卵巢惡性病變風險的不典型良性病變,需要由超聲專家檢查,或進一步行MRI 檢查以得到較明確的診斷,避免過度治療;對疑似惡性病變的患者應安排MRI 檢查或超聲專家會診。高度懷疑惡性腫瘤的患者應轉診到婦科腫瘤醫師并及時治療。患者的病史(如絕經狀態)、影像學檢查(如超聲專家的影像學評估及MRI 的影像學特征)和血清糖類抗原125(carbohydrate antigen 125,CA125)對患者的管理起著非常重要的參考作用。O-RADS 的應用使超聲報告得以標準化,對卵巢附件腫物進行詳細的分層及管理,減少解讀報告的混亂,降低超聲醫師與臨床醫師之間對超聲診斷報告的誤解,方便臨床處理及隨訪,縮小低年資醫師與資深醫師在臨床診斷中的差距,提高準確率。
O-RADS 提出之后,各國超聲專家紛紛對其進行研究驗證,評估其診斷效能,包括AUC、靈敏度、特異度、陽性預測值和陰性預測值、觀察者間的一致性以及與其他現有分類系統的比較,包括IOTA SR、GIRADS、ADNEX 模型等。
Guo 等[24]比較了O-RADS、惡性腫瘤風險指數4(risk of malignancy index 4,RMI4)、國際卵巢腫瘤分析logistic 回歸模型2(IOTA LR2)和IOTA SR 在AMs惡性預測價值,發現O-RADS 表現最好,靈敏度和AUC 最高,資深醫師組(Ⅰ組)靈敏度為91.0%,初級醫師組(Ⅱ組)為84.8%,AUCⅠ組為0.90,Ⅱ組為0.89。O-RADS 分類系統以降低特異度為代價,對良、惡性病變的特征和詳細描述解釋確保了檢測惡性腫塊的最高靈敏度。RMI4、IOTA SR、IOTA LR2 系統所涉及的簡單診斷指標容易誤診一些沒有典型惡性特征的腫瘤。而O-RADS 可用于識別實際惡性病變,以減少漏診的嚴重后果。Guo 等[24]認為4 種系統的診斷效能和可靠性可彌補初級超聲醫師對AMs 惡性程度預測的不足。
也有研究認為O-RADS 與某些診斷模型的診斷效能差異不大。Lai 等[25]將O-RADS、GI-RADS 和ADNEX進行比較,得出O-RADS(0.88)和GI-RADS(0.90)的靈敏度低于ADNEX(0.95)(P<0.05),O-RADS 的陽性預測值(0.98)高于ADNEX(0.96)(P<0.05)。O-RADS、GI-RADS 和ADNEX 的Kappa 值分別為0.830、0.821 和0.861,一致性較好,與Van Calster 等[26]研究結果相似,他們均認為由于3 種系統的診斷效果差異不大,可以根據中心類型、對患者臨床資料的獲取或個人舒適度進行選擇。
為了消除絕經前后對卵巢腫瘤診斷的影響,Wang 等[27]對絕經前婦女和絕經后婦女分別進行評價,結果發現在絕經前婦女中,O-RADS 和O-RADS聯合血清CA125 和人附睪蛋白4(human epididymal protein 4,HE4)的靈敏度分別為92.2%和94.8%,特異度分別為91.8%和93.4%,準確度分別為91.9%和93.8%。在絕經后婦女中,O-RADS、O-RADS 聯合血清CA125 和HE4 的靈敏度分別為94.8%和95.8%,特異度分別為83.9%和93.6%,準確度分別為90.5%和95.6%。O-RADS 聯合CA125 和HE4 在絕經前和絕經后婦女中的靈敏度、特異度和準確度均高于O-RADS(均P<0.05)。該研究認為O-RADS 提供標準化的超聲術語,在AMs 中具有較高的靈敏度。O-RADS 聯合CA125、HE4 診斷AMs 時,提高了靈敏度和特異度,對AMs 的早期發現可能有幫助,具有較高的臨床應用價值。除此之外,Wu 等[28]及Xie 等[29]研究均證實了CA125的加入提高了O-RADS 區分卵巢良性和惡性腫瘤的能力。然而,他們研究也存在不同之處。Xie 等[29]研究是在腫瘤中心進行的,而Wu 等[28]研究包括來自綜合性醫院的女性,這導致Xie 等[29]研究惡性腫瘤率高于Wu等[28]研究(59.4%比29.6%)。
少數研究對O-RADS 進行了亞分類研究。Cao等[30]試著將O-RADS 4 類病變細分為兩大類,包含病變的O-RADS 4a 類為規則的多房囊腫和光滑實性腫塊,其惡性風險低于20%,而包含病變的O-RADS 4b 類為單房和多房囊腫,但含有實性成分,其惡性風險高于40%。亞分類后,準確度、靈敏度、特異度分別為90.6%、96.1%、88.4%,AUC 略有升高。該研究者認為亞分類提高了部分O-RADS 4 類惡性病變的特異度,有利于更好地對中間風險進行分層,而更好的分層對確定手術策略和手術等待時間有很大幫助。
Basha 等[31]研究結果顯示O-RADS 對惡性腫瘤的靈敏度明顯高于GI-RADS和IOTA(96.8%、92.7%、92.1%,P=0.003、0.0007),但特異度略低(分別為92.8%、93.6%、93.2%,P>0.05)。O-RADS、GI-RADS 和IOTA 的觀察者一致性相似(Kappa 值分別為0.77、0.69 和0.63),O-RADS 的觀察者一致性傾向高于GI-RADS 和IOTA。O-RADS 的高靈敏度,主要歸因于O-RADS 提供了全面的描述和解釋,以確定哪些AMs 不需要隨訪、保守性隨訪或手術切除。O-RADS 和IOTA 的惡性腫瘤率與以往文獻中推薦的惡性腫瘤率相當,但GI-RADS的惡性腫瘤率更高。相比之下,IOTA SR 和GI-RADS沒有提供足夠的后續指南。
Guo 等[24]研究結果表明,高級和初級超聲醫師的O-RADS 系統AUC 分別為0.90 和0.89。相比之下,Wu等[32]卻認為高級超聲醫師O-RADS 系統的AUC 明顯優于初級超聲醫師。這種差異可能是由于在婦科超聲方面的訓練水平不同。Guo 等[24]研究中的初級超聲醫師均有1 年以上的超聲診斷經驗,而Wu 等[32]研究中的初級超聲醫師對婦科超聲的經驗較少,這可能導致初級超聲醫師對O-RADS 的預測效能相對較低。Wu等[32]研究數據顯示,即使是經驗不足的超聲醫師應用O-RADS 系統評估AMs 時仍然可以獲得較高的靈敏度(0.906~0.969)和陰性預測值(0.964~0.990)。這說明在臨床上超聲診斷為O-RADS≤3 的附件腫物中,惡性病變較少,避免漏診卵巢癌。而O-RADS 的特異度(0.626~0.826)和陽性預測值(0.411~0.608)相對較低。
有學者認為常規超聲O-RADS 分類系統與超聲造影(contrast enhanced ultrasound,CEUS)相結合有助于提高附件腫物定性診斷的準確度,尤其在O-RADS 4~5 類病灶的定性診斷中,CEUS 具有較高的價值。武佳薇等[33]研究發現常規O-RADS 分類診斷O-RADS 4~5類附件病灶良惡性的AUC 為0.72,聯合CEUS 后調整O-RADS 分類的AUC 為0.85,差異有統計學意義(Z=3.660,P<0.001)。
O-RADS不僅能用于定性診斷卵巢腫瘤,且對于不同病理類型卵巢腫瘤的診斷效能亦較好,盧穎瀾等[34]研究得出O-RADS 分類鑒別卵巢良、惡性腫瘤的靈敏度為96.73%(237/245),特異度為86.29%(510/591),AUC 為0.962;鑒別良、惡性上皮-間葉腫瘤、生殖細胞腫瘤及性索-間質腫瘤的靈敏度分別為97.25%(212/218)、90.00%(9/10)及93.33%(14/15),特異度分別為84.96%(339/399)、86.46%(83/96)及85.00%(34/40),AUC分別為0.963、0.926及0.923。
Guo 等[24]、武佳薇等[33]、盧穎瀾等[34]研究發現,ORADS 與RMI4、IOTA LR2、IOTA SR、GI-RADS、ADNEX等診斷系統相比,O-RADS 靈敏度最高,且其最佳截斷值為O-RADS>3 類。當O-RADS 聯合CA125、HE4 進行診斷AMs 時,能顯著提高特異度和靈敏度;與CEUS相結合能極大的提高附件腫物定性診斷的準確度。因此,O-RADS 能有效彌補初級超聲醫師在診斷惡性病變方面的不足,并給超聲醫師在臨床診斷中提供行之有效的工具和標準,具有極高的臨床應用價值。
Yang 等[35]前瞻性地研究了620 例AMs 患者,采用Kappa 統計量評估2 位不同年資超聲醫師對病灶類別、實性病灶的外部輪廓、囊性病灶內部是否存在乳頭狀凸起以及液體回聲等詳細特征間的一致性。高年資和低年資超聲醫師對于病灶類型及血流評分的一致性,其研究結果與Jha 等[36]相同。對于實性腫物的外輪廓,觀察者間一致性高于Jha 等[36]研究。對于有無實性成分,該研究的觀察者間一致性較Jha 等[36]差,但最終一致性也處于較高水平。雖然高年資和低年資超聲醫師對O-RADS 詞匯的解釋和對O-RADS 分類的一致性較好,而對經典良性病變的解釋和分類一致性一般。但這些O-RADS 分類的劃分差異對O-RADS 的診斷效能無明顯影響。
盡管部分研究評估了O-RADS 風險分層系統的診斷準確度和觀察者間一致性[37-40],但這些研究是回顧性的,因此容易受到患者選擇偏倚的影響,需要一項前瞻性多中心試驗來進一步驗證診斷效能,并準確衡量O-RADS 風險分層系統在各種臨床環境下對患者管理的影響[32]。
附件惡性腫瘤的患病率隨著年齡和絕經后婦女的增加而增加,此外,晚期卵巢癌在這類人群中更常見。然而,根據目前的O-RADS,不同更年期狀態的女性并沒有受到不同的對待。根據ACR O-RADS,O-RADS 4類病變的惡性風險為10%~50%[23],這是最具爭議的亞類別。由于絕經后婦女卵巢惡性腫瘤的患病率較高,絕經后年齡組的O-RADS 4 類病變需要更詳細的評估和更積極的治療[28]。
大多數研究結果均強調超聲專家的不同專業水平影響了ACR O-RADS 在評估AMs 時的可重復性和準確度。不同年資的醫師對指南中的超聲術語理解存在差異,甚至誤解,造成分類的不一致,影響了該指南在臨床的應用。因此有必要進行規范、系統指南解讀的相關培訓,尤其是針對低年資醫師和基層醫師。
總之,O-RADS 在AMs 的管理中顯示出廣闊的應用前景。探討ACR O-RADS 在AMs 評估中的可重復性和預測效能,在未來的工作中開展大規模的前瞻性研究,驗證O-RADS 在AMs 評估中的使用和準確度是極其有必要的。