何淑蓉,高 侃,王飛亮,汪夢鴿,陳榮明,戴維德,陳 嵐,劉東戈
超聲檢查時檢出的甲狀腺結節大多數為無臨床意義的良性結節[1]。超聲評估后對高危結節施行超聲引導下細針穿刺(fine needle aspiration, FNA)是術前診斷分流最常用且經濟有效的方法。Bethesda甲狀腺細胞病理學報告系統(the Bethesda system for reporting thyroid cytopathology, TBSRTC)的建立為甲狀腺FNA診斷提供了標準化的診斷術語和形態學標準[2]。三種“不確定”細胞學診斷:包括意義不明的非典型細胞/濾泡性病變(atypia of undetermined significance/ folicullar lesion of undetermined significance, AUS/FLUS)-TBSRTC Ⅲ級、濾泡性腫瘤/可疑濾泡性腫瘤(follicular neoplasm/ suspicious for a follicular neoplasm, FN/SFN)-TBSRTC Ⅳ級和可疑惡性腫瘤(suspicious for malignancy, SUS)-TBSRTC Ⅴ級,仍占所有甲狀腺FNA的20%~30%[2-3]。近年來,許多學者圍繞如何降低這部分不確定性診斷的比例開展研究,力爭在術前明確診斷,減少不必要的重復穿刺及診斷性手術[4-8]。超聲及細胞學評估操作簡便易行,不需要增加額外的醫療成本。本研究旨在確定超聲特征結合細胞學評分是否有助于對FNA診斷不確定結節的術前分流。
1.1 病例資料回顧2018年12月~2022年4月北京醫院經超聲引導下行甲狀腺FNA,按照2017版TBS診斷系統診斷為“不確定”的病例合計802例:TBSRTC Ⅲ級346例(6.2%),Ⅳ級150例(2.7%),Ⅴ級306例(5.5%),占同期甲狀腺FNA的14.3%(802/5 590)。其中行甲狀腺切除術有組織病理學隨訪結果的有119例。本研究獲得北京醫院/國家老年醫學中心/中國醫學科學院老年醫學研究院倫理委員會批準。
1.2 超聲學特征及TI-RADS分類上述病例均采用高分辨率超聲檢查,參照Kwak等[9]的TI-RADS診斷標準進行評估分類。由2名具備10年以上甲狀腺超聲檢查經驗的超聲科醫師回顧性分析超聲圖像,按照甲狀腺結節縱橫比、暈環征消失、形態不規則、微鈣化、低回聲、實性結節、結節內血流、最大徑≥4 cm和單一結節等9個特征觀察記錄,當評估不一致時協商達成共識。
1.3 細胞形態觀察及評分甲狀腺結節穿刺由超聲科醫師在超聲引導下操作,采用25G針頭常規穿刺3針,2針穿刺制成4~5張傳統涂片,前2針的針頭沖洗液及第3針穿刺物注入液基保存液(ThinPrep PreservCyt Solution)。視保存液中細胞量的多少,按需制成1~3張液基薄片。所有涂片經95%乙醇固定,行HE或巴氏染色后由2名專業細胞病理學醫師顯微鏡下確認診斷。鏡下觀察每個入組病例的涂片時,按照結構特征(乳頭狀結構、微濾泡結構及細胞重疊擁擠)和細胞核特征[包括大小(核增大)、核輪廓異常(核膜不規則、核溝和核內包涵體)及核染色質特征(核淡染)]共8個特征觀察記錄并評分,尋找有診斷價值的特征進行綜合評分。
1.4 統計學分析所有數據采用SPSS 26.0(IBM Corp. Armonk, NY, USA)軟件進行統計學分析。應用χ2檢驗或Fisher精確概率檢驗比較良性組與惡性/低危組之間9個超聲特征及8個細胞學特征的分布差異,非參數Mann-WhitneyU檢驗判斷兩組相比超聲評分及核形態評分差異。利用受試者工作特征(receiver operating characteristic curve, ROC)曲線和ROC曲線下面積(area under curve, AUC)評估兩者的診斷準確性。計算約登指數(Youden’s index),確定兩者的最佳診斷臨界值(即Cut-off值)。以此Cut-off值為基礎,通過交叉列聯表(Crosstabs)評估兩者作為診斷標志物的正確率、特異性、敏感性、陽性預測值(positive predictive value, PPV)和陰性預測值(negative predictive value, NPV)。利用Logistic回歸及ROC曲線分析比較超聲特征評分、細胞學評分及兩者聯合的診斷準確性。P<0.05為差異具有統計學意義。
2.1 臨床特征本組119例甲狀腺結節中,細胞學診斷TBSRTC Ⅲ級50例,Ⅳ級15例,Ⅴ級54例。其中女性92例,男性27例,中位年齡47歲(范圍25~75歲)。結節中位最大徑0.6 cm(范圍0.2~4.5 cm)。手術切除后組織學診斷為甲狀腺乳頭狀癌91例,惡性潛能未定的濾泡性腫瘤7例,濾泡細胞癌3例,具有甲狀腺乳頭狀癌核特征的非浸潤性濾泡性腫瘤2例,透明變梁狀腫瘤1例,未分化癌1例;腺瘤樣增生結節6例,濾泡性腺瘤2例,結節性甲狀腺腫伴乳頭狀增生2例,橋本甲狀腺炎4例。組織學診斷為惡性和低危腫瘤歸類為惡性/低危組(合計105例),其余14例歸類為良性組。
2.2 超聲學特征及TI-RADS分類良性組超聲TI-RADS分類4a類4例,4b類3例,4c類6例,5類1例。惡性/低危組超聲TI-RADS分類3類2例,4a類6例,4b類14例,4c類51例,5類32例。超聲特征評估顯示:12例良性結節縱橫比≤1,6例暈環征消失,6例呈現不規則形態,10例結節內可見血流信號;惡性/低危組中,59例結節縱橫比>1,84例暈環征消失,86例結節形態不規則,30例結節內可見血流信號,兩組相比差異有統計學意義(P=0.003、0.007、0.003和0.004)。雖然微小鈣化、低回聲、實性結節、單發及結節最大徑<4 cm更常見于惡性/低危組,但與良性組相比,差異無統計學意義(圖1~3,表1)。

圖1 A. 甲狀腺右葉中上部可見一極低回聲結節,大小2.8 mm×4.1 mm,邊界欠清,形態欠規則,縱橫比>1,結節內未見點狀強回聲;B. CDFI:結節內探及明顯血流信號。TI-RADS分類:4c。組織病理學證實為甲狀腺乳頭狀癌,濾泡亞型 圖2 A.甲狀腺左葉中上部可見一極低回聲結節,大小9.4 mm×8.1 mm,邊界尚清,形態規則,邊緣可見不規則暈環,部分暈環征消失;B. CDFI:結節內探及明顯血流信號。TI-RADS分類:4c。組織病理學證實為甲狀腺乳頭狀癌,經典型 圖3 A.甲狀腺右葉中上部可見一極低回聲結節,大小5.1 mm×7.7 mm,縱橫比>1;B. 顯示邊界不清,形態不規則。TI-RADS分類:4c。組織病理學證實為甲狀腺乳頭狀癌,濾泡亞型 圖4 A.濾泡上皮細胞部分重疊,排列成微濾泡結構,核增大,細胞學診斷為可疑濾泡性腫瘤,TBSRTC Ⅳ級,巴氏染色。組織病理學證實為具有甲狀腺乳頭狀癌核特征的非浸潤性濾泡性腫瘤;B.濾泡上皮細胞排列成片,細胞核大小不一,部分細胞核核膜不規則,可見縱行核溝,細胞學診斷為意義不明確的細胞非典型性病變,TBSRTC Ⅲ級。組織病理學證實為惡性潛能未定的濾泡性腫瘤;C.濾泡上皮細胞排列成片,細胞大小略有不同,核膜光滑,核淡染,細胞學診斷為意義不明確的細胞非典型性病變,TBSRTC Ⅲ級。組織病理學證實為甲狀腺乳頭狀癌,濾泡亞型
上述除結節最大徑≥4 cm之外的8項超聲學特征,每項計數1分,每個病例評分0~8分。統計結果顯示,惡性/低危組的超聲特征評分高于良性組(Mann-WhitneyU=356.0,Z=-3.198,P=0.001);ROC曲線分析顯示AUC為0.758(95%CI=0.637~0.879,P=0.002)。計算約登指數顯示評分的最佳Cut-off值為4.5,≥5分判定為惡性/低危,反之為良性。此時依據超聲特征評分診斷甲狀腺惡性/低危腫瘤的正確率為68.1%,敏感性為66.7%,特異性為78.6%,PPV為95.9%,NPV為23.9%(表2)。

表2 核形態、超聲特征及兩者聯合評分的診斷準確性評價
2.3 細胞學觀察與評分良性組中,8例可見細胞重疊擁擠,2例可見乳頭狀結構,4例可見微濾泡結構;惡性/低危組中,上述結構異型分別占37.1%、2.9%和10.5%,兩組相比差異無統計學意義(P>0.05)。細胞核異型包括核增大、核膜不規則、核溝、核內包涵體及核淡染,在惡性/低危組中分別占79.0%、49.5%、81.0%、37.1%和66.7%,高于良性組(64.3%、42.9%、35.7%、0、21.4%),且兩組核溝、核內包涵體及核淡染三項特征差異具有統計學意義(P=0.001、0.013、0.001,圖4,表1)。
按照簡化的核形態評分,即核大小異常(核增大),核輪廓異常(核膜不規則、核溝和核內包涵體)及核染色質異常(核淡染),每項各占1分,每例評分0~3分。統計結果顯示,惡性/低危組的簡化核形態評分高于良性組(Mann-WhitneyU=268.5,Z=-4.349,P<0.001);ROC曲線分析顯示AUC為0.817(95%CI=0.687~0.948,P<0.001)。計算約登指數顯示細胞核形態評分的最佳Cut-off值為1.5,≥2分判定為惡性/低危,反之為良性。此時依據簡化的核形態評分診斷甲狀腺惡性/低危腫瘤的正確率為93.3%,敏感性為99.1%,特異性為50%,PPV為93.7%,NPV為87.5%(表2)。
2.4 聯合超聲學特征及簡化核形態評分Logistic回歸及ROC曲線分析顯示,聯合簡化核形態及超聲特征評分,其AUC為0.873(95%CI=0.777~0.970,P<0.001),診斷正確率為87.4%,敏感性為90.5%,特異性為64.3%,PPV為95.0%,NPV為47.4%。上述結果提示兩種評分聯合診斷的準確性(0.873,95%CI=0.777~0.970)高于單獨使用核形態評分(0.817,95%CI=0.687~0.948,P=0.092),但差異無統計學意義;亦高于單獨超聲學特征評分(0.758,95%CI=0.637~0.879,P=0.047,圖5),差異有統計學意義。

圖5 簡化核形態評分,超聲評分及聯合檢測的ROC曲線圖及ROC曲線下面積
FNA診斷不確定的甲狀腺結節是臨床醫師重要的挑戰之一。行診斷性手術的TBSRTC Ⅲ、Ⅳ級結節中,術后組織病理學證實僅14.4%~32.1%為惡性,而TBSRTC V級中也有25.1%為良性[10]。近年的研究顯示分子檢測雖然能夠為診斷提供更客觀的信息,但即便是最具診斷意義的BRAF V600E突變在不確定結節中的檢出率也僅為21.3%,在TBSRTC Ⅲ、Ⅳ和Ⅴ級的檢出率分別為12.8%、3.6%和49.7%[5]。因技術特殊及設備要求高,分子檢測在很多基層醫院難以開展。采用簡單易行的分流診斷方法,是臨床及細胞病理學醫師關注的焦點。
超聲檢查作為甲狀腺結節首選的影像學檢查手段,在臨床診療決策中具有重要的應用價值。受美國放射學會乳腺影像報告和數據系統(Breast Imaging Reporting and Data System, BI-RADS)啟發,各國學者及協會相繼建立了甲狀腺的TI-RADS[9,11-14]。超聲特征與病理學的關系也受到學者們的關注。國內一項關于超聲TI-RADS的組織病理結構影響因素研究,揭示超聲表現與組織病理結構本質是一一對應的關系,間質廣泛顯著纖維化是導致超聲分類較高的最大的組織病理學影響因素[15]。北京醫院超聲科通常采用的是較早建立、參數少易于操作的Kwak等[9]的TI-RADS分類,再結合相關臨床信息及結節大小決定是否進行超聲引導下FNA。一些研究表明:重復超聲危險分層,結合細胞學分級和(或)其他如分子檢測、臨床信息等,有助于預測FNA不確定結節的惡性程度[7,16-17]。最近,意大利解剖病理細胞協會及國際病理學會意大利分會,基于一項來自41個研究、包含近30 000個甲狀腺結節的大型薈萃分析,制定了一個涉及臨床、超聲及細胞學共13個參數的CUT評分系統[8],其中超聲參數包含了縱橫比、暈環征消失、形態不規則、微鈣化、低回聲、實性結節、結節內血流、最大徑≥4 cm以及單一結節共9項特征。本研究以上述9項超聲特征為觀察指標,顯示在良性組與惡性/低危組之間存在差異,其中縱橫比>1、暈環征消失、邊界不規則、結節內血流信號4項的差異具有統計學意義。超聲的廣泛應用使得許多甲狀腺結節能夠早期被發現。國內并未限定行超聲引導下FNA結節的最大徑,僅強調“對于最大徑<5 mm,特別是位置特殊,穿刺困難的結節,FNA可由或在細針穿刺經驗豐富的醫師指導下實施”[18]。因此本組絕大部分病例結節<1.0 cm,中位最大徑0.6 cm(范圍0.2~4.5 cm),這或許是惡性/低危組中無結節內血流信號的病例占比高的原因。本研究去除了結節最大徑≥4 cm,保留了其他8項超聲特征,為了便于日常操作,采用計數法而非CUT評分的權重法進行超聲特征評分。統計結果顯示,惡性/低危組的評分高于良性組,將5分設定為臨界值,其診斷甲狀腺惡性/低危腫瘤的正確率為68.1%,具有較高的特異性(78.6%)和PPV(95.9%),但敏感性(66.7%)不高,NPV(23.9%)低,提示單獨使用超聲特征評分在FNA不確定結節中仍會漏檢部分陽性病例。
Nikiforov等[19]于2016年開發并驗證了一種簡化的核診斷評分方案。在此基礎上,其他學者也提出了類似的細胞學評分系統用于輔助診斷[20-21]。除了細胞形態的變化外,排列結構異常也是FNA診斷不確定結節的依據。2017版TBS建議使用細胞異型、結構異型等詞語對AUS/FLUS進行亞分類[2]。因此,本研究選擇了上述3項結構及5項細胞核形態共8個特征來比較兩組間的差別。結果發現:乳頭狀結構、微濾泡結構及細胞重疊擁擠這三項結構異型在兩組間差異無統計學意義,而細胞核形態的5項特征在惡性/低危組的比例高于良性組,其中核溝、核內包涵體及核淡染在兩組間差異有統計學意義,這與文獻報道結果略有不同[20-21]。幾乎所有的研究數據均提示細胞核異型對診斷惡性腫瘤更有意義,因此很多學者建議依據細胞和結構異型對TBSRTC Ⅲ、Ⅳ級劃分亞組,細胞核異型亞組的惡性危險度(risk of malignancy, ROM)更高,對其管理應較其他亞組更積極[8,22-25]。為了易于掌握和統一,本研究制定了簡化的細胞核3分制評分系統。以2分為臨界值,統計分析顯示其診斷甲狀腺惡性腫瘤的正確率為93.3%,與超聲特征評分相比,具有較高的敏感性(99.1%)和NPV(87.5%),但特異性低(50%)。雖然可以有效排除陰性病例,但單獨使用仍可能有一半良性病例被過度診治。
無論是超聲評分還是細胞核評分都簡單、易操作,兩者各有優勢,且都已包含在標準診斷檢查中,不會增加額外的醫療成本。聯合超聲特征及核形態評分,與單獨評分相比,其敏感性(90.5% ∶99.1%、66.7%)和PPV(95.0% ∶93.7%、95.9%)都保持在高水平,但特異性未提高(64.3% ∶50.0%、78.6%);診斷準確性高于超聲評分(87.4% ∶68.1%)、略低于核形態評分(87.4% ∶93.3%),后者可能是本研究惡性/低危組病例數遠多于良性組所致。ROC曲線分析顯示,兩種評分聯合診斷的準確性(AUC=0.873)高于單獨核形態評分(AUC=0.817,P=0.092)或超聲學特征評分(0.758,P=0.047),且與超聲特征評分相比差異有統計學意義。
本研究為單一機構的回顧性分析,存在一定局限性。首先,存在樣本選擇偏差,未納入未在北京醫院行手術切除的不確定結節。其次,TBSRTC Ⅲ~Ⅴ級惡性腫瘤的真實發生率未知,并非每例FNA不確定結節都有組織病理學證實。絕大部分患者采取了定期超聲隨訪觀察的策略,一部分患者更換了就診醫院,導致本研究僅14.8%病例獲得了組織學證實,這其中僅11.8%(14/119)為良性結節。兩組數據分布不均衡也會影響最終統計結果。此外,甲狀腺惡性腫瘤絕大部分為濾泡細胞腫瘤,特別是甲狀腺乳頭狀癌,因此無論是超聲還是細胞核特征研究均是針對甲狀腺濾泡細胞腫瘤,特別是甲狀腺乳頭狀癌的預測。上述評分是否適用于其他少見類型的甲狀腺腫瘤,還有待擴大樣本以及多中心數據進一步驗證。
綜上所述,聯合超聲特征及細胞核形態評分是指導不確定甲狀腺結節臨床管理的有用工具,但在特異性方面有一定的局限。因此還需要更多的研究,聯合不同參數綜合評價來提高術前診斷的準確性,實現對患者的最佳治療決策,減少患者的損傷和醫療資源的浪費。