趙新保 羅藝 李世梅 智慧 郝少云
中山大學孫逸仙紀念醫院超聲科(廣州510120)
目前,利用二維超聲征象對甲狀腺結節進行良惡性危險分層的方法有多種,自2009年起,HORVATH 等[1?3]先后提出過不同版本的甲狀腺影像報告與數據系統(TI?RADS);2015年,美國甲狀腺協會(ATA)也推出了對甲狀腺結節進行分類的臨床指南[4];2017年,美國放射學會(ACR)更是基于大規模的循證及臨床驗證提出了最新版本的TI?RADS[5]。上述甲狀腺結節危險分類的版本眾多、指標復雜而且分類標準不一致,給臨床的統一應用和一致性評估帶來困難,本研究比較了ATA和ACR分類方法的診斷價值以及不同經驗超聲醫師之間的一致性,為規范甲狀腺疾病的超聲診斷和分類提供依據。
1.1 研究對象2015年1月至2016年12月在我院發現甲狀腺結節并接受手術切除的患者410例,共454個結節,均獲得病理結果。患者年齡18~82歲,平均(46.8± 13.5)歲;腫物最大徑6.5~54 mm,平均(19.4±10.2)mm。
1.2 儀器與方法使用日立HV900超聲診斷儀,探頭頻率為7.5~13.0 MHz,行常規超聲檢查,觀察并記錄甲狀腺結節的大小、成分、回聲、形狀、縱橫比、邊緣、鈣化、血流、甲狀腺包膜以及頸部淋巴結情況等。
1.3 圖像分析454個甲狀腺結節的超聲聲像圖由10年以上甲狀腺診斷經驗的高年資醫師A操作并評估。聲像圖根據ACRTI?RADS標準進行分類時,將TI?RADS 3類與4類之間設為診斷的截點;根據ATA標準進行分類時,將低度與中度可疑惡性組之間設為診斷的截點。
隨機選取40個甲狀腺結節的典型超聲圖像,由2位有2年甲狀腺超聲診斷經驗的年輕醫師B、C分別獨立記錄每個結節的描述詞以及ACR TI?RADS和ATA分類。
1.4 統計學方法采用SPSS 16.0軟件進行統計分析,以病理結果作為金標準,構建ROC曲線,計算曲線下面積(AUC);計算ACR TI?RADS與ATA分類法判斷甲狀腺結節的敏感性、特異性、陽性預測值及陰性預測值,對各組之間的差異進行Pearson卡方檢驗,檢驗標準P<0.05為差異有統計學意義。采用Kappa檢驗評價不同經驗醫師ABC對ACR及ATA分類評估的一致性。0<κ≤0.20一致性差;0.20<κ≤0.40一致性弱;0.40<κ≤0.60中等一致;0.60<κ≤0.80一致性好;0.80<κ≤1.00一致性極好。
2.1 病理結果454個結節中,良性229個(包括結節性甲狀腺腫189個,濾泡狀腺瘤11個,慢性淋巴細胞性甲狀腺炎9個,亞急性甲狀腺炎8個,毒性結節性甲狀腺腫7個,Graves病3個,肉芽腫性甲狀腺炎1個,甲狀腺嗜酸性細胞腺瘤1個),惡性225個(包括乳頭狀癌220個,髓樣癌3個,濾泡狀癌2個)。
2.2 兩種分類標準的診斷結果本研究454個結節,根據ACR TI?RADS標準評為2類的共36個,其中惡性占5.4%;3類結節104個,惡性占1.9%;4類結節129個,惡性占40.3%;5類結節184個,惡性占91.8%。而根據2015 ATA標準,其中有29個結節無法歸類,可行分類的425個結節中,極低可疑組16個,全為良性;低度可疑組136個,惡性占2.9%;中度可疑組63個,惡性占36.5%;重度可疑組210個,惡性占88.1%。
2.3 兩種分類標準的診斷價值ACR TI?RADS法評估甲狀腺結節時,其敏感性、特異性、準確性、陽性預測值及陰性預測值分別為98.7%、59.8%、79.1%、70.1%、97.1%;ATA分類法評估甲狀腺結節時,敏感性、特異性、準確性、陽性預測值及陰性預測值分別為98.2%、64.6%、81.2%、73.1%、97.3%。兩者ROC曲線下面積分別為0.79vs0.804,見圖1。

圖1 ACR TI?RADS與ATA分類法評估甲狀腺結節的ROC曲線Fig.1 The ROC of thyroid nodules assessed by ACR TI?RADS and ATA guidline
2.4 兩種分類標準的一致性比較經Kappa檢驗,不同診斷經驗的三位超聲醫師A、B、C在對甲狀腺結節進行TI?RADS和ATA分類時,彼此之間存在一定的差異(表1)。當三位醫師使用TI?RADS進行分類時,一致性極好,κ值高達0.826;而用ATA標準進行分類時,一致性中等,κ值為0.583。不同醫師之間兩兩比較發現,使用TI?RADS進行分類時,年輕醫師與高年資醫師對結節分類的一致性尚好,κ值分別為0.71,0.757;而用ATA標準時,年輕醫師與高年資醫師的一致性中等,κ值分別為0.556,0.406。此外,在年輕醫師之間,應用TI?RADS的一致性也高于應用ATA時(0.756vs0.532)。

表1 不同醫師之間一致性(κ值)Tab.1 The consistency between different doctors
甲狀腺結節的人群患病率較高,可以達到35%[6],但惡性率比較低[7],所以在發現甲狀腺結節的基礎上鑒別良惡性,對其進危險分層非常重要。目前高頻超聲檢查是甲狀腺疾病的首選影像診斷方法,為了更系統的對結節進行分類,已經有多個研究單位借鑒ACR的乳腺影像報告與數據系統(BI?RADS),提出了各自的分類方法,本研究選擇了較權威的兩個機構所提出的分類法,對其診斷價值和應用價值進行比較。
2015年ATA甲狀腺結節診治指南針根據結節的超聲特征將甲狀腺結節分為5類:良性、極低度可疑、低度可疑、中度可疑以及高度可疑惡性,每一類對應的惡性百分比分別為<1%,<3%,5%~10%,10%~20%以及70%~90%。本研究中,中度可疑惡性組的惡性率為36.5%,高于指南范圍上限,可能原因是本研究采用的病例均為接受手術切除的患者,惡性率遠高于一般人群,會存在一定的選擇偏倚。此外,本組病例使用ATA指南分類時,有6.4%(29個)結節無法歸類,其中包括:伴有任一個惡性超聲特征的實性高回聲或等回聲結節27個;受周圍蛋殼樣鈣化聲影影響,內部回聲及成分無法顯示的結節2個(圖2)。需要注意的是,在無法歸類的29個結節中惡性占44.8%,既往XU等[8]的研究中ATA無法歸類的甲狀腺結節占5.8%,其中28.6%為惡性。所以,使用ATA指南對甲狀腺結節進行危險分層,會出現部分結節無法被歸類的情況。

圖2 周圍伴蛋殼樣鈣化的甲狀腺結節Fig.2 Thyroid nodules with eggshell calcification around
由于PARK等先后提出的多個TI?RADS彼此之間并不一致,2017年ACR綜合了美國國家癌癥研究所數據、不同專家意見以及上述既往TI?RADS的信息,推出了全新的甲狀腺影像報告與數據系統,稱之為 ACR TI?RADS。新的 TI?RADS 分類法著重評估結節的成分、回聲、形狀、邊緣、以及局灶性強回聲情況,對每一種超聲特征賦予不同的分值,相加所得總分作為最后分類的依據,所以ACR TI?RADS簡便易行,在本研究中能夠很好的將每一個結節進行歸類。本組TI?RADS2類的結節中,有2例為惡性,術后病理分別為高分化乳頭狀癌和髓樣癌(圖3)。

圖3 ACR TI?RADS2類甲狀腺結節Fig.3 Hyroid nodules of ACR TI?RADS2
在診斷效能方面,本研究結果顯示:ACR TI?RADS與ATA分類法在判斷甲狀腺結節良惡性方面敏感性、特異性、準確性等均無顯著差異,ROC曲線下面積分別為0.79和0.81,所以筆者認為這兩種方法的診斷效能相當。由于2017年ACRTI?RADS作為白皮書剛面世時間尚短,目前國內尚無已發表的研究分析兩者之間的診斷價值。國外HA等[9]的研究認為ATA判斷甲狀腺結節的敏感性較高,而ACR TI?RADS評估甲狀腺結節的特異性和準確性更高,這與本研究結果有出入,可能是兩個研究采用的診斷截點不同所致。
在不同經驗的超聲醫師診斷一致性方面,ACR TI?RADS的一致性明顯高于ATA,本研究發現,在用ATA標準進行分類時,低年資醫師與高年資醫師之間存在一定差距。在低年資醫師之間,診斷的一致性也相對較差,進一步分析原因,可能是低年資醫師對于某些超聲征象的判讀存在偏差,如混合性結節的實性部分是否偏心,以及結節的邊緣信息判斷等。PARK等[10]的研究也認為觀察者間評估甲狀腺結節邊緣一致性差。而由于ACR TI?RADS的白皮書在辭典部分就對每一種征象做出了細致的描述和分類,所以不同年資醫師之間診斷的一致性相對較高。
綜上所述,本研究認為ACR TI?RADS與ATA分類法在評估甲狀腺結節的良惡性方面診斷效能相當,不過,ACR TI?RADS可以對所有結節都進行分類,而且不同年資超聲醫師之間診斷的一致性更高,所以具有更廣闊的應用前景。