崔文靜,俞志成,陳馨,王雅杰,崔燦,仇英萍
乳腺分葉狀腫瘤(phyllodes tumors,PTs)是一種少見的乳腺纖維上皮來源的腫瘤,其發生率占所有乳腺腫瘤的1%以下[1-2],占纖維上皮來源腫瘤的2%~3%[3-4]。分葉狀腫瘤首次于1838年被正式提出并命名為“葉狀囊肉瘤”,源于其分葉狀生長的方式及惡性腫瘤內部的囊變特征。然而經過長期臨床研究發現,分葉狀腫瘤多表現出良性腫瘤的生物學行為,惡性僅占25%~30%,且惡性中僅有約1/4發生轉移[5]。目前廣泛認可及采用的是世界衛生組織(WHO)制定的3級分類標準,即將其劃分為3級:G1級為良性,G2級為交界性,G3級為惡性。外科手術治療是其根本的治療方式,然而手術方式的選擇與腫瘤的分級密切相關。對于G2/G3級的分葉狀腫瘤,常常需要接受局部擴大切除甚至全乳切除手術[6-7]。
乳腺X線成像是國際指南推薦的乳腺癌篩查的首選檢查方法,臨床上廣泛應用于乳腺良惡性疾患的檢查及評估當中,其相對于超聲及磁共振成像而言,具有簡便快捷,受操作者水平影響小,可保留完成的疾病影像資料及價格低廉等優點,臨床普及率高,實用性強[8-9]。以往有很多學者試圖將其應用于分葉狀腫瘤的良惡性鑒別當中,但效果均欠理想。近年來,隨著大數據時代的到來,計算機輔助紋理分析技術及影像組學陸續被用于腫瘤的良惡性的診斷、腫瘤的分級、分期及治療反應和預后評估當中[10-13],筆者也致力于這方面的研究并發現影像組學技術能顯著提高乳腺X成像對于分葉狀腫瘤分級的鑒別診斷效能[14]。通過研究及閱讀對于乳腺X線成像影像組學方面文獻時發現,由于乳腺X線檢查具有兩個投照體位,因此對于病灶特征提取的方法也很多,不同的影像組學特征提取視角對于鑒別診斷必然產生影響[10-13],因此本文對文獻中常用的幾種方法進行對照,擬找出最佳的方案,以供大家參考。
1.研究對象
本研究搜集2010年5月-2017年12月于本院手術的80例經手術病理證實的乳腺分葉狀腫瘤患者的乳腺X線影像及病理資料,本研究經過了江蘇省中醫院倫理委員會的批準,并獲得了患者的書面知情同意。參與研究的80例患者均為女性,年齡25~70歲,平均(46.58±9.54)歲。納入標準如下:①患者必須為經過手術病理證實的乳腺分葉狀腫瘤;②在接受外科手術治療前未經過諸如介入、放療、化療等形式的治療;③患者在術前接受過完善的乳腺X線檢查,包括雙側乳腺的軸位(CC位)及內外斜位(MLO位)且攝片野內包含全部病灶及同側腋窩;④病灶行乳腺X線檢查時未經過穿刺或局部切除活檢;⑤病灶必須在乳腺X線檢查影像上清晰可見。最終有35名患者不符合納入標準而被排除,其中30名患者因術前乳腺X檢查不合格而被淘汰,5名患者因腫瘤在乳腺X線檢查影像上為陰性被淘汰。最后共45名患者被納入本次研究當中。
2.病理分級標準
本研究依據2012版乳腺腫瘤WHO分類標準將乳腺分葉狀腫瘤根據腫瘤基質的富于細胞性、細胞異形性、核分裂相、腫瘤分葉狀形態及基質過度增生的情況劃分為良性、交界性與惡性(表1)。45例中,根據分級標準分為G1級14例,G2級24例, G3級11例。

表1 乳腺分葉狀腫瘤的病理分級標準
3.影像組學研究方法
①病例的篩選及病灶圖像的分割:選取上述45例符合納入標準的患者的乳腺X線影像,由兩名從事乳腺X線診斷工作10年以上的影像醫師分別對CC位及MLO位中腫瘤的邊界進行判定,使用開源軟件ITK-SNAP(version 3.6.0,https://www.itksnap.org)分別進行興趣區(ROI)的勾畫及分割(圖1、2)。將兩名醫生分別勾畫的ROI圖像進行分割后保存。
勾畫邊界的定義:由于分葉狀腫瘤的境界大多較為清晰,“暈環征”(即腫瘤推壓周圍腺體形成的環繞腫瘤的脂質低密度環)顯示率高,本組45例病例中有41例表現出“暈環征”,高達91.11%,因此本組病例均以“暈環征”作為腫瘤邊界勾勒的基線(圖1)。對于無法清晰顯示"暈環征"的區域用平滑的弧線相連接。
②影像組學特征的提取:采用GE Artificial Intelligent Kit-A.K.軟件進行紋理信息的提取。包括直方圖(Histogram)、灰度區域大小矩陣(GLSZM)、形態學參數(Formfactor)、灰度共生矩陣(GLCM)及游程矩陣(RLM)共計396個參數(圖3)。
③視角的選取:CC位單視角選取:僅對CC位的病灶提取396個特征納入到數據分析當中。MLO位單視角選取:僅對MLO位的病灶提取396個特征納入到數據分析當中。人工干預的單視角方法:由兩名放射學專家共同商議,每一個病灶僅選一張CC位或MLO位能更充分表現病變異質性的影像,提取396個特征納入到數據分析當中。
CC位及MLO位雙視角的方法:分別對CC位及MLO位各提取396個特征,將共計792個特征納入到數據分析當中。
④組間及組內一致性分析:為了評估醫生A與醫生B手動分割ROI一致性以及所提取得到的影像組學特征參數的穩定性與可重復性,本研究使用組間及組內相關系數的一致性進行檢驗。對于可重復性和穩定性高的影像組學特征參數(ICC>0.75)應用到最終的特征篩選當中。由一名從事乳腺影像診斷工作10年的主治醫師在不知道患者基本信息及病理結果的情況下獨立勾畫45例患者cc位ROI 45個、MLO位ROI 45個。另一名從事乳腺影像診斷工作13年副主任醫師在相同條件下獨立勾畫的患者cc位ROI 45個、MLO位ROI 45個。1個月后重復上述操作,將兩位研究者的分割結果分別提取組學特征參數。將醫生A前后兩次分割的結果進行組內一致性分析,將兩名醫生第一次分割的結果進行組間一致性分析,本研究最終采用了醫生A第2次分割得到的ROI所提取的紋理特征參數。
⑤特征的降維:降低原始特征的冗余度,用盡可能少的特征來表征盡可能多的原始信息,采用單因素分析及相關性分析的方法分別對不同視角提取的特征分別進行降維處理。
⑥分類模型的構建以及效能的評估:建立基于乳腺X線成像CC位單視角模型、MLO位單視角模型及CC&MLO位雙視角模型預測G2/G3級分葉狀腫瘤的診斷效能。
4.統計學分析
采用SPSS 22.0進行統計學分析,符合正態分布的數據采用獨立樣本t檢驗,P<0.05為差異具有統計學意義。采用相關性分析(相關系數取0.9)及logistics回歸識別對于鑒別診斷有意義的獨立組學特征,采用受試者操作特征(receiver operating characteristic,ROC)曲線確定各模型對于鑒別診斷的敏感度及特異度及曲線下面積(area under the curve,AUC)。
基于CC位單視角方法的影像組學特征共同參與G1級與G2/G3級分葉狀腫瘤鑒別診斷的AUC為0.694(95%可信區間:0.531~0.856)(圖4a),基于MLO位單視角方法的影像組學特征共同參與G1級與G2/G3級分葉狀腫瘤鑒別診斷的AUC為0.676(95%可信區間:0.516~0.837)(圖4b),預測效能均較差。而以往應用較多的人工干預的混合單視角方法鑒別的AUC為0.730(95%可信區間:0.213~0.936)[14],效能有所提高。CC位及MLO位雙視角模型的對應的AUC為0.850(95%可信區間:0.732~0.977)(圖4c),敏感度為87.1%,特異度為78.6%,明顯優于其余幾種提取視角。
其中CC&MLO位雙視角模型共計得到76個有意義的特征(P<0.05),經降維后最具代表性的8個組學特征在鑒別G1級與G2/G3級乳腺分葉狀腫瘤中差異均具有統計學意義(圖5),其診斷效能見圖6及表2, 8個特征中有6個為內外斜位(MLO位)中所提取的特征。8個特征中大小、灰度和及方差為直方圖參數,其對于G1與G2/G3及分葉狀腫瘤的鑒別可用直方圖表示。自相關為灰度共生矩陣(GLCM)的特征,而長游程突出、短游程灰度值突出為游程矩陣(RLM)的特征。區域百分比為灰度區域大小矩陣(GLZSM)特征。

表2 CC&MLO位雙視角模型降維后特征及其效能
自2012年影像組學的概念被提出[15-16],2016年Radiology對影像組學進行了正式命名并被用于全身各系統腫瘤的診斷、分類、分級、分期及治療反應和預后評估當中[17],為臨床診治提供了無創的、在病程任何時期都可評估且可反復評估的方法[18-21]。在乳腺良惡性疾患的鑒別診斷、淋巴結轉移、遠處轉移及新輔助化療療效預測方面取得了大量可喜的研究成果[14,22]。經研究發現一些公認的影像組學參數例如熵、球度、偏度、峰度、方差、自相關等在腫瘤良惡性鑒別及分級診斷中有重要的價值[18-22],在本研究結果中方差與自相關這兩個參數仍然在分葉狀腫瘤良惡性鑒別中發揮重要作用,與文獻報道吻合。
隨著研究的深入及所能提取的參數的不斷增加,研究者們更關注的是整個組學模型的穩定性,模型的穩定是機器學習從研究轉化到臨床應用的關鍵。本文的研究者曾將影像組學技術應用到乳腺分葉狀腫瘤的分級當中,取得了良好效果的同時也引發了對于一些問題的思考。乳腺X線成像中每一側乳腺有兩個標準投照體位,因此在對于病灶特征提取的時候視角的選擇也很多,總結下來主要有以下四種選取方法:①CC位單視角選取方法:僅對CC位的病灶提取紋理特征納入到數據分析當中;②MLO位單視角選取方法:僅對MLO位的病灶提取紋理特征納入到數據分析當中;③人工干預的單視角方法:由兩名放射學專家共同商議,每一個病灶僅選一張CC位或MLO位能更充分表現病變完整性及異質性的影像,提取其紋理特征納入到數據分析當中;④CC位及MLO位雙視角的方法:分別對CC位及MLO位各提取紋理特征,將兩部分特征全部納入到數據分析當中。目前文獻中采用最多的是人工干預的混合單視角的方法[18-24],可能與人們習慣于先人工篩選后機器幫忙的解決問題模式有關,那么此種人為干預的方法到底是不是最好的方法,實際上并沒有證據來證實,因此筆者緊接著上一個研究,做了上述方法學的比較,最終證實人工干預并不是最佳的方案,實際上不摻雜任何人為干預,能將CC位及MLO位所有影像內病灶信息都囊括進研究中的雙視角選取的方法能獲得更好的效果。這一點其實不難理解,人工篩選的過程中筆者為了獲得某種因子,必然后或多或少的失去一些因子,而每一個因子的存在對于最終結果都是會產生影響的。同時將本研究中得到的有意義的組學參數與文獻中有關乳腺良惡性疾患的影像組學參數的做比較。我們發現共同的參數,例如直方圖參數中的方差,灰度共振矩陣中(GLCM)的自相關與游程矩陣(RLM)中的長游程突出、短游程灰度值突出均被證明在乳腺良惡性疾患的鑒別中存在重要價值,而筆者所進行的分級的研究實際上也是一種良惡性鑒別的研究。這也從另一方面證實本研究的可信度及重復性仍然是比較高的,而由這一組組學參數構成的預測模型也是相對穩定的。本研究一定程度上彌補了乳腺X線影像組學研究中有關視角選取研究這一方面的空缺。通過以分葉狀腫瘤為例的研究顯示雙視角模型的診斷效能優于任意單視角模型,可以引起今后從事類似研究的人員對該問題的重視。為了降低不良因素的影響,今后我們仍會進一步在其他樣本量更大的研究中測試該結論的普適性。
基于乳腺X線成像影像組學特征提取方法能有效鑒別G1級與G2/G3級分葉狀腫瘤,其中CC位及MLO位雙視角方法效能最高。