徐輝雄
甲狀腺結節診治近年來成為關注焦點,一些爭議持續存在。 部分學者認為存在過度診斷與過度治療,也有部分學者認為低估了甲狀腺癌侵襲性[1-3]。在龐大的甲狀腺結節人群中,甲狀腺癌不足5%。 如何有效地篩檢出甲狀腺癌患者,同時對甲狀腺癌侵襲性進行精確分層,是當前亟待解決的關鍵臨床和科學問題[3-4]。甲狀腺結節危險分層的主要方法包括影像學、細胞學和基因檢測。 影像學檢查中以高頻超聲最常用,細胞學檢查則多通過超聲引導細針穿刺抽吸(fine needle aspiration,FNA)獲取細胞以進一步檢查,基因檢測能對細胞學不能確定的結節或不典型結節作出準確診斷。 以上3 種方法互為補充,缺一不可,層層遞進,構成了甲狀腺結節危險分層體系的基軸[1-5]。
超聲是甲狀腺結節首選影像學檢查方法,它具有以下優勢:實時、高分辨力、無創、無輻射、性價比高、操作簡便、容易普及、準確性高。 超聲診斷甲狀腺結節主要基于超聲圖像上的可疑超聲特征,如實性腫物、低回聲(或顯著低回聲)結節、鈣化、形態不規則或分葉狀、縱橫比>1、頸部淋巴結轉移或周圍組織浸潤等。 以上征象風險不一,在用于判斷結節性質時,沒有一個征象同時具有很好的靈敏度和特異度。一項meta 分析納入31 個研究18 288 個甲狀腺結節,發現上述征象的靈敏度為26%~87%,特異度為40%~93%[6]。由此帶來一個問題,即不同年資或不同醫院的醫師診斷水平千差萬別,讓廣大患者及臨床醫師無所適從。
在此背景下,多種基于超聲影像的甲狀腺結節危險分層方法應運而生,包括2015 年美國甲狀腺學會(American Thyroid Association,ATA)發布的甲狀腺結節危險分層系統,2016 年美國臨床內分泌醫師學會(American Association of Clinical Endocrinologists,AACE)、 美 國 內 分 泌 學 院 (American College of Endocrinology,ACE)和意大利臨床內分泌協會(Associazione Medici Endocrinologia,AME)聯合發布的AACE/ACE-AME 危險分層系統,以及2017 年美國放射學院(American College of Radiology,ACR)發布的甲狀腺影像報告和數據系統(thyroid imaging reporting and data system,TI-RADS)[4,7-8]。 這些甲狀腺結節危險分層方法標準化了甲狀腺超聲術語,簡化了醫師與患者、醫師與醫師間的交流,還使甲狀腺癌風險程度及應采取的措施一目了然,在不同醫院之間也可通過應用相同的系統構建共同的溝通基礎,因而在臨床上得到了廣泛應用。
超聲甲狀腺結節危險分層方法顯著提高了診斷甲狀腺惡性結節的靈敏度,但特異度普遍較低;此外,目前并無全球統一的危險分層方法,也給實際應用及交流帶來了不便。
當具備臨床適應證時,FNA 細胞學檢查被各種甲狀腺臨床診療指南公認為最準確和性價比最高的檢查方法。 FNA 靈敏度高(88.2%~97.0%),特異度較超聲檢查有所提高,但波動范圍較大(47.0%~98.2%)。 FNA 細胞學檢查結果多采用統一的Bethesda 分 類 系 統 (Bethesda system for reporting thyroid cytopathology,BSRTC),具體如下:Ⅰ類,不能診斷;Ⅱ類,良性;Ⅲ類,意義不明的不典型或濾泡性病變(atypiao fundetermined significance/follicular lesionofunde termined significance,AUS/FLUS);Ⅳ類,濾泡性腫瘤或可疑濾泡性腫瘤;Ⅴ類,可疑惡性;Ⅵ類,惡性[4]。 根據不同中心的經驗,Ⅰ類結節發生率為20%~25%,其中有20%~30%容易惡變;Ⅲ類結節有5%~30%惡變率;Ⅳ類結節FNA 無法作出準確診斷;Ⅴ類結節中仍有部分為良性。 Ⅲ、Ⅳ、Ⅴ類結節又統稱為不確定(indeterminate)結節,發生率可高達 30%[4]。
因此,FNA 盡管有諸多優點,甚至被列為甲狀腺結節首選檢查方法,但仍存在特異性變化范圍大、部分結節不能診斷、細胞學結果不確定等問題。FNA 結果也因為不同中心、不同操作者的穿刺標本取材結果、不同經驗的病理醫師而有所不同,加強規范化培訓、 制定統一的指南可部分解決此類問題。 此外,基因檢測在此基礎上能提供更精準的解決方案。
對FNA 抽吸到的細胞同時做基因檢測,可以進一步提高診斷特異度和準確度,發現更多良性結節,從而減少不必要的手術。 目前研究較多的基因有 BRAF、RAS 基因突變以及 PET/PTC 基因重排等,其中 BRAF 基因突變在甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC)中最常見,根據人種和檢測方法不同,陽性率變化范圍在29%~83%[4]。根據同濟大學附屬第十人民醫院超聲醫學科暨上海市甲狀腺疾病研究中心的一組資料,FNA 聯合應用BRAFV600E基因檢測后,診斷PTC 的靈敏度由75.7%升高至92.3%,準確度由78.7%提高至90.6%。BRAFV600E突變在 Bethesda 分類系統Ⅰ類、 Ⅱ類、Ⅲ類、Ⅳ類、Ⅴ類、Ⅵ類結節中的檢出率分別為25%、26%、46%、20%、74%、89%[9]。 在細胞學結果良性結節中,也存在BRAFV600E基因突變陽性,此時若超聲圖像可疑征象超過2 項,仍應考慮甲狀腺切除術。BRAFV600E基因也有少數假陽性情況。BRAFV600E突變還可用于預測 PTC 患者頸部淋巴結轉移[10-11]。 最近的研究還發現HRAS/NRAS/KRAS 突變陽性的甲狀腺結節中有76%為惡性,其中濾泡型PTC 最為常見。 HRAS/NRAS/KRAS 突變陽性惡性風險分別為92%、74%、64%。
除了以上基因外,半乳糖凝集素(galectin)-3、CD44 分子、 人骨髓內皮細胞(human bone marrow endothelial cell,HBME)-1、細胞角蛋白(cytokeratin,CK)19、 中性粒細胞明膠酶相關載脂蛋白(neutrophilgelatinase-associated lipocalin,NGAL)等也有學者進行了研究[12]。
最近研究發現在侵襲性甲狀腺癌中,端粒酶逆轉錄酶(TERT)啟動子突變發生率較高,TERT 啟動子在甲狀腺癌中較為常見的突變位點是C228T。 文獻報道未分化甲狀腺癌中TERT 啟動子突變率為46.3%,低分化甲狀腺癌為37.5%,PTC 為11.7%,濾泡性甲狀腺癌為13.9%。 同濟大學附屬第十人民醫院超聲醫學科暨上海市甲狀腺疾病研究中心的一組資料發現,PTC 中TERT 啟動子陽性率為4.8%;TERT 啟動子(+)的甲狀腺癌,直徑更大、腺外侵犯更多、易累及血管、淋巴結轉移及遠期復發率高[13]。
表觀遺傳學改變(包括印跡基因印跡狀態改變)出現在腫瘤發生前,起促進作用。 對印跡基因表達原位檢測,可在細胞形態學發生改變前發現腫瘤進展,提高早期診斷率。印跡檢測方法專注于新生RNA 內含子,而不是成熟的mRNA,以顯示印跡基因的轉錄位點。 印跡基因檢測理論上能夠在細胞學和BRAF 均無法檢出時,準確地檢出惡性改變,因此具有極高的靈敏度和陰性預測值。同濟大學附屬第十人民醫院超聲醫學科暨上海市甲狀腺疾病研究中心在國內率先開展了甲狀腺印跡基因的前瞻性研究,初步結果發現印跡基因能顯著提升細胞學不典型結節的診斷性能,并且有望解決濾泡狀腺瘤和腺癌細胞學乃至病理學難以鑒別的世紀難題。
綜上,FNA 聯合基因檢測已成為甲狀腺癌個體化精準診斷和治療不可或缺的重要環節。
隨著大數據和人工智能(artificial intelligence,AI)興起,影像組學(radiomics)概念于 2012 年應運而生。 影像組學指高通量地提取大量影像信息,實現感興趣區分割、特征提取與模型建立,進一步從中提取和剝離出真正起作用的關鍵信息,用于疾病的輔助診斷、分類或分級。 影像組學多基于機器學習(machine learning,ML)和深度學習(deep learning,DL)實現。 深度學習能夠大幅提高分類或預測模型的準確性,但數據量需要傳統影像組學的10 倍或百倍以上。 近年來機器學習和深度學習有融合發展的趨勢,將深度學習網絡輸出的特征與影像組學中的經典分類器結合,能在有限的訓練數據集上,進一步提升影像組學分類或預測的準確性和可靠性[14-15]。
超聲組學(ultrasomics)是影像組學的一個重要分支。針對前述超聲影像甲狀腺結節危險分層方法的局限性,部分學者采用超聲組學做了一些有益的探索。 Ma 等[16]采用卷積神經網絡(convolutional neural network,CNN)分析了 15 000 幅超聲圖像,報道深度學習鑒別甲狀腺結節良惡性的準確度約為83.0%。Li 等[17]采用另一種 CNN 模型,靈敏度為 93.5%,特異度為 81.5%。 Akkus 等[14]的一組資料發現 CNN 診斷甲狀腺結節的靈敏度為 86%、特異度為90%。 中山大學和同濟大學團隊對1 040 個病例3 120 幅圖像進行分析,發現超聲組學和深度學習的準確性分別為66.8%和74.7%,深度學習方法具有更高的診斷效能[18]。Akkus 等[14]發現,當深度學習的靈敏度設置到最高值時,可以減少52%不必要FNA,同時不會漏診惡性甲狀腺結節,證實深度學習的應用有望改變甲狀腺結節的診療流程。
同濟大學附屬第十人民醫院超聲醫學科暨上海市甲狀腺疾病研究中心趙崇克等建立了一種機器學習與視覺融合的超聲組學方法,證實比傳統的機器學習方法和TI-RADS 具有更高的診斷效能(AUC:0.900~0.917 vs.0.770~0.789 vs.0.681~0.689);同時發現在引入剪切波彈性成像后,機器學習與視覺融合超聲組學方法的診斷效能可得到進一步提升(AUC:0.951~0.953 vs. 0.900~0.917),證實基于雙模態的機器學習方法在結節危險分層上具有重要價值,并且與TI-RADS 比較能顯著降低不必要的FNA(30.0%~37.7% vs. 4.5%~4.7%)[19]。
超聲組學在實際應用過程中仍存在不同超聲儀器、不同醫院、不同年資醫師之間圖像不一致問題,需要進一步統一儀器條件、統一圖像標準、加強醫師培訓提供標準化的圖像。 此外,需要進一步完善和標準化影像組學方法,尤其是在目前統一算法和流程尚不成熟的條件下。
由于甲狀腺腫瘤的基因異常靶點眾多,人群中存在一定異質性,因此多分子聯合檢測應運而生,以提高診斷的靈敏度和特異度。 近年來,Afirma 基因表達分類(gene expression classifier,GEC)方法廣泛用于診斷不確定細胞學檢查結果的結節,該檢測方法包括167 個差異表達基因。 有研究對49 個研究中心265 個無法判斷細胞性質的結節進行前瞻性研究,證實GEC 對不典型增生的陰性預測值達到95%,濾泡狀腺瘤達到 94%[3]。 Afirma GEC 可使 1/3不確定結節免于不必要手術[20]。
盡管Afirma GEC 方法被眾多權威團隊和指南推薦,但它對可疑結節的特異度和陽性預測值仍偏低。 近期,Afirma GEC 升級版Afirma 基因組測序分類(genomic sequencing classifier,GSC)引入臨床。 與GEC 比較,GSC 對不確定結節的陽性預測值有較大提升(57.1% vs. 36.7%)[21]。 其他多分子組合還包括Thyroseq V2(包括 14 個基因-點突變、42 種融合基因、8 個基因表達)、Thyroseq V3(共 112 個基因,包括點突變,插入缺失、融合基因,拷貝數變異、表達異常等)。有報道發現對不典型增生/濾泡狀腺瘤,術前FNA 聯合Thyroseq V2 診斷甲狀腺癌的靈敏度為 90.9%,特異度為 92.1%;另一組報道發現Thyroseq V3 的靈敏度為98.0%,特異度為81.8%,準確度達90.9%;因此,可以應用Thyroseq V2 和Thyroseq V3 來指導形成治療策略[4,12,22]。
總體看,精準醫學時代的來臨,使得根據“超聲-細胞-基因” 組學特征對甲狀腺結節進行危險分層成為可能。 針對甲狀腺結節龐大人群,早期、精確、直觀、量化、易行的診斷方法是開展甲狀腺結節危險分層所追求的目標。 “超聲-細胞-基因”組學體系的建立和不斷完善,是實現這一目標的重要途經,同時也為各種新型診療方案的選擇提供了重要依據[23-27]。