胡雨舟,李佳偉,郭 翌,汪源源,余錦華,常 才
1.復旦大學電子工程系,上海 200433;
2.復旦大學附屬腫瘤醫院超聲科,復旦大學上海醫學院腫瘤學系,上海 200032
乳腺癌嚴重威脅女性健康,其發病率位居女性惡性腫瘤的首位,且發病年齡趨于年輕化[1]。術前明確診斷淋巴結轉移可輔助臨床醫師決定手術方式,因此早期檢查和診斷淋巴結是否轉移至關重要。本研究基于影像組學理念,從浸潤性乳腺癌患者的乳腺超聲圖像出發,首先提取基于乳腺影像報告與數據系統(Breast Imaging Reporting and Data System,BI-RADS)[2]的高通量特征、基于尺度不變特征轉換(scale-invariant feature transform,SIFT)[3]的特征和基于卷積神經網絡(convolutional neural network,CNN)的特征,并結合患者臨床信息,形成一套相應的特征體系。其次,在特征篩選部分,利用十折法bootstrap 100次,先用t檢驗進行單因素分析,再用最小化絕對值收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)[4]回歸模型進行多因素分析,最后按特征出現頻次選擇最優特征組合,使用基于十倍交叉驗證的線性核支持向量機(support vector machine,SVM)分類器[5]對乳腺腫瘤同側腋窩淋巴結轉移進行預測。
本研究主要包括2個數據集,記為數據集A和數據集B,均來自復旦大學附屬腫瘤醫院,且2個數據集中的數據不重復。數據集A是400幅乳腺超聲圖像,僅用來訓練提取CNN特征所用的全卷積神經網絡(fully convolutional neural network,FCN)。數據集B是380例女性乳腺癌患者的超聲圖像,用來研究乳腺超聲圖像特征與淋巴結轉移之間的相關性。數據集B的采集時間為2014年4月—2016年6月,患者年齡23~83歲(平均年齡52.03歲,方差11.06歲)。所有患者經病理學檢查確診為浸潤性乳腺癌,均通過手術治療。每例患者都有若干幅乳腺超聲圖像,選擇其中最具代表性的1幅圖像進行分析。根據術中淋巴結冷凍切片檢查結果及術后石蠟包埋切片病理學檢查結果判斷淋巴結轉移:前哨淋巴結和腋窩淋巴結兩者之一發生轉移即視為腋窩淋巴結轉移。380例患者中,發生淋巴結轉移146例,未轉移234例。所有圖像均由經驗豐富的超聲科醫師進行手動分割,后續特征所需要的腫瘤區域界定基于該手動分割結果。
1.2.1 基于BI-RADS的高通量特征
美國放射學會(American College of Radiology,ACR)開發了BI-RADS來標準化乳腺腫瘤的超聲描述。BI-RADS采用7個描述符來幫助分類,其中有5個描述符描述腫塊部分,分別是形狀、方向、邊緣、回聲特性和后方回聲特性[2]。
根據描述符設計460個基于BI-RADS的高通量特征,以量化和評估腫瘤,具體特征及其與BI-RADS描述符的對應關系詳見文獻[6]。形態特征用于描述腫瘤的幾何特征,包括BI-RADS中的形狀、方向和邊緣,共15個。灰度特征反映原始乳腺超聲圖像中腫瘤區域的灰度級和直方圖分布,共16個。紋理特征反映圖像中詳細的、不可見的灰度變化和聯系。以下選擇6種紋理特征來顯示不同的腫瘤紋理特性:① 基于邊界的紋理特征表示腫瘤區域內部與周圍區域灰度的區別,共15個。② 基于感興趣區(region of interest,ROI)的紋理特征描述整個ROI中灰度級的分布,共6個。 ③ 灰度共生矩陣(gray-level cooccurrence matrix,GLCM)紋理特征描述在一定范圍內的兩個灰度級強度頻率之間的指定空間線性關系,共23個。④ 灰度游程矩陣(gray-level run-length matrix,GLRLM) 紋理特征計算在給定方向上具有相同灰度的1組連續的共線圖像點的游程來表征紋理的粗糙度,共13個。⑤ 灰度區域矩陣(gray-level size zone matrix,GLSZM)紋理特征反映小像素群的均勻性,共13個。⑥ 鄰域灰度差分矩陣(neighborhood gray-tone difference matrix,NGTDM)紋理特征衡量每個圖像像素的灰度與其鄰域灰度之間的差異,共5個。小波特征是應用小波分解后的系數來表征不能被灰度和紋理特征直接反映的信息。離散小波變換將二維圖像分解成近似、水平、垂直和對角這4組分量,每組分量計算灰度和紋理特征。每組分量計算89個特征,共有356個小波特征。
1.2.2 基于SIFT的特征
SIFT算法是一種在尺度空間中尋找極值點,并提取其有關大小和方向描述子的方法[3]。SIFT特征是圖像的局部特征,與圖像大小和方向無關,對噪聲的容忍度好,且信息量豐富,區分度好[3]。本研究中,SIFT特征是基于乳腺腫瘤超聲圖像中ROI提取的。
SIFT特征的數據量很大,對1個極值點使用常見的4×4個種子點來描述,1個極值點就可產生128維的SIFT特征向量,而1幅圖像中存在很多個極值點,這樣整個特征的數量將十分龐大。為解決SIFT特征數據量過大的問題,采用計算機視覺領域常用的特征壓縮的方法。先使用高斯混合模型(Gaussian mixture model,GMM)[7]將原始SIFT特征用8個高斯分布函數去近似估計,再使用費舍爾向量(Fisher vector)根據GMM中的參數對SIFT特征進行特征壓縮[7-8]。GMM對樣本的概率密度分布進行估計,而估計采用的模型是幾個高斯模型的加權和[8]。每個高斯模型代表1個類,對樣本中的數據分別在幾個高斯模型上進行投影,就分別得到在各個類上的概率,本研究采用了8個類。使用費舍爾向量壓縮后,每幅圖像的SIFT特征維度相同,為2 048維。
1.2.3 基于CNN的特征
近年來,CNN研究吸引了很多學者的關注。在醫學圖像研究領域,CNN被廣泛用于實現圖像的自動分割[9-10]。根據相關研究,CNN中的特征圖代表圖像中的有用信息,是一種新型的有效特征[11]。FCN[12]是CNN在圖像分割中的一種經典運用,是一種端到端的網絡結構,可對每個像素點進行有效分割。
本研究基于經典的VGG-16網絡設計了一個FCN來對數據集A中的圖像進行訓練,網絡的輸入為乳腺超聲灰度圖像,標簽為手動分割結果。網絡結構見圖1,圖1B是圖1A中Block的具體結構。Conv代表卷積層,M×N×H表示卷積層的卷積核為M×N,特征圖數為H。Deconv是反卷積層,K代表該反卷積實現了K倍上采樣。Max pooling代表最大池化層,該網絡中最大池化層的窗口大小為2×2,步長為2。BN為批量標準化(batch normalization)層,ReLU為修正線性單元(rectified linear unit),Sum是累加層,Dropout是隨機丟棄層。對該網絡,隨機初始化各層的參數,學習率0.000 1,衰減率0.000 1,批大小20,動量0.9,訓練了1 000個循環。
對訓練后的網絡,將數據集B中380例患者的ROI圖像輸入FCN。根據文獻[11],較深卷積層的特征圖可提取更深層、更有效的信息。本研究選擇Block 13中卷積層的512個特征圖,使用類似2.2.2中的方法,將原始的512個特征圖采用8個高斯分布函數去近似估計,并使用費舍爾向量對GMM中的參數進行壓縮,最后每個圖像提取了8 192個CNN特征。
1.2.4 臨床信息
經與醫師討論,加入3個重要的患者臨床信息,即年齡、腫瘤大小和腫瘤位置。腫瘤大小是將超聲圖像中的像素點數乘以采樣時顯示使用的圖像尺度。腫瘤位置根據實際超聲檢查時腫瘤是否在乳房的外上象限來判定。本研究將這些易獲取且重要的臨床信息也視為特征,來進行后續的特征篩選與分類預測。
提取完所有特征后,每例患者共得到10 703個特征,從不同方面描述乳腺腫瘤特性。但這個特征集的維度極其巨大,有些特征與淋巴結轉移的關系并不密切。為選擇相關性最大的特征來進行分類預測,特征篩選必不可少。為使特征篩選更具有普適性,篩選時使用十折bootstrap的方法。每次bootstrap將樣本隨機分成10等份,依次使用其中的9份進行特征篩選,因此每次bootstrap依次使用342例樣本進行10次特征篩選。本研究進行了100次bootstrap,共進行了1 000次特征篩選,記錄下每個特征出現的次數。
具體特征篩選包括單因素分析和多因素分析兩部分。首先,對特征集使用t檢驗方法進行單因素分析,計算每個特征與淋巴結轉移之間的相關性,篩選出其中P<0.05(差異有統計學意義)的特征[13]。其次,采用LASSO回歸模型對特征進行多因素分析[4]。LASSO回歸模型通過在最小化計算中加入1個L1范數作為懲罰項來調整復雜度,從而得到1個較為精煉的模型,使得某些系數收縮到零。復雜度調整程度由參數λ來控制,λ越大,對變量較多的線性模型的懲罰力度越大,最終模型中的變量就越少。本研究通過十倍交叉驗證法得到最優λ值。最后,獲取最優λ值對應的權重,其中非零權重對應的特征即為篩選出的最相關特征。
對篩選后的特征集,采用1個十倍交叉驗證的線性核SVM分類器來構建預測系統[5]。每次將380例患者的數據分成10等份,342例用于訓練,38例用于測試,進行十折遍歷。采用受試者工作特征(receiver operating characteristic,ROC)曲線的曲線下面積(area under curve,AUC)、準確率、靈敏度和特異度來衡量模型的優劣[14]。整個方法的流程圖如圖2所示。

圖2 整體流程圖
圖3A、3B分別是1幅已選取ROI的乳腺超聲圖像的醫師手動分割結果和計算機提取的SIFT特征的描述子分布,紅色線條表示SIFT描述子的位置、大小和方向。由圖3可見,腫瘤內部的紅色線條數遠少于腫瘤外部,表明腫瘤內部的SIFT描述子數量遠少于腫瘤外部。腫瘤內部灰度不均勻區域也會出現大量SIFT描述子。同時,SIFT描述子的方向和大小對腫瘤周圍區域的灰度變化也很敏感。因此,SIFT描述子在表征腫瘤內部均勻程度、腫瘤邊界位置、腫瘤周邊區域灰度分布等方面都有不錯的效果。

圖3 SIFT描述子的作用
圖4展示了bootstrap中某一次LASSO模型中不同 λ值下模型的均方誤差(mean squared er-ror,MSE),其中紅色的點為MSE均值,上下的灰色區域代表置信區間。置信區間越大,表明MSE可能值的范圍越大,MSE的結果越不穩定。從圖4中可以看到,λ 較大(0.01< λ <0.1)時,即選取的特征較少時,模型的性能相近,MSE較低且較置信區間小,表明模型的效果較好且較穩定。隨著 λ 值不斷變小,MSE的均值和置信區間隨之增大,表明隨著懲罰力度變小,相關性相對較小的特征降低了模型的性能。選取保證MSE最小所需特征時的 λ 值,在圖4中用實線標出。
在數據集B中,對于100次使用十折法bootstrap的特征篩選結果,按特征出現次數將其進行排序,出現次數越多的特征對模型的作用越大,排序越靠前。表1展示了利用排序前N個特征建立的使用十折法線性核SVM分類器的分類結果。可以看到,使用特征數為50~150個時建立的分類器效果相近。特征數較少時,分類器的效果不佳,表明僅使用某幾個特征預測淋巴結轉移的效果并不理想。而特征數過多時,特征的冗余則降低了分類的準確率。選取AUC最大時的特征數,為100個。

圖4 不同 λ值下LASSO模型的MSE

表1 不同特征數下分類器的分類效果

表2 加入CNN特征與不加CNN特征的分類結果比較
表2比較了加入CNN特征與不加入CNN特征時最優的分類結果。由表2可見,加入CNN特征后,使用100個特征構成的預測結果比不加入CNN特征時有明顯提升。表明CNN特征的加入能有效地提高分類的準確率,對淋巴結轉移的預測有幫助。
對于數據集B中的380例患者,圖5使用100個特征的十倍交叉驗證線性核SVM分類器模型的ROC曲線。該線性核SVM分類器的AUC為0.903,準確率為82.6%,靈敏度為90.6%,特異度為69.9%。
乳腺癌嚴重危害女性健康。根據中國國家癌癥研究所統計,2015年確診患乳腺癌的中國女性約為268 600人,占全部女性新發癌癥人數的15.09%[15]。淋巴結是否轉移是影響乳腺癌預后的重要指標,無淋巴結轉移者5年生存率可達90.5%,反之僅為53.6%[16]。原發乳腺癌在局部生長擴散的同時,可通過淋巴系統轉移至腋窩淋巴結(axillary lymph node,ALN)。前哨淋巴結(sentinel lymph node,SLN)是原發腫瘤發生淋巴結轉移必經的第一批淋巴結。如果前哨淋巴結發生轉移,腋窩淋巴結也極有可能發生轉移[17]。因此,術前明確淋巴結是否轉移非常重要。
超聲檢查由于非侵入性、無輻射性和實時性的優點,是診斷乳腺癌最普遍和最有效的方法[18],不但能對乳腺癌原發灶進行定性和定位,還可檢測腋窩淋巴結狀態。但由于大部分腋窩淋巴結的超聲特征不典型,超聲檢查并不能明確診斷。此外,由于腋窩的結構較深,某些較小的淋巴結易漏診。如果能根據乳腺癌原發灶的超聲圖像特征,找到其與淋巴結轉移之間的聯系,實現對淋巴結轉移的預測,從而對高風險患者進行重點排查,這對提高腋窩淋巴結檢查的效率和準確率均有一定意義。
利用乳腺癌病灶超聲圖像預測腋窩淋巴結轉移在臨床上引起了關注。李燕等[19]對95例浸潤性乳腺癌患者進行分析,利用肉眼觀察提取了乳腺腫瘤超聲圖像的5個定性特征,最后取得AUC為0.783 8、準確率為70.79%、靈敏度為81.82%、特異度為64.29%的結果。時兆婷等[20]回顧性分析335例浸潤性乳腺癌患者的臨床病理及超聲資料,認為年齡、腫瘤大小、組織學分級和邊緣成角數為影響腋窩淋巴結轉移的危險因素。但以上研究均基于醫師觀察,特征不夠豐富,預測的準確率也有待提高。
針對乳腺腫瘤超聲檢查時腋窩淋巴結體積小、特征不典型和容易漏診的情況,本研究提出基于乳腺超聲圖像特征預測乳腺腫瘤腋窩淋巴結轉移的方法。由表2結果可見,分類器的AUC為0.903,準確率為82.6%,靈敏度為90.6%,特異度為69.9%。與文獻[19]相比,在更大量的數據上實現了更好的分類結果。同時,CNN特征的使用較好地提高了分類器的分類性能。最后使用的100個特征包括46個CNN特征、42個SIFT特征、10個BI-RADS特征和2個臨床信息。2個臨床信息是腫瘤位置和大小。10個BI-RADS特征分別為2個形態特征、1個紋理特征和7個小波特征,其中2個形態特征是描述腫瘤邊緣粗糙程度,1個紋理特征是描述腫瘤內部回聲特性。從最后篩選的特征結果來看,腫瘤邊緣粗糙程度、內部回聲特性、位置是否在外上象限及腫瘤大小都是臨床醫師在實際檢查中可關注的問題。分類器模型效果良好,經過篩選后的特征對乳腺腫瘤腋窩淋巴結轉移有較好的區分作用,表明篩選出的乳腺腫瘤超聲圖像特征與腋窩淋巴結轉移之間有一定的關聯。本研究能為超聲科醫師在進行淋巴結超聲檢查時提供轉移可能性的參考,幫助他們對患者進行更準確、更有針對性的檢查。
為實現基于乳腺超聲圖像特征預測乳腺腫瘤腋窩淋巴結轉移,本研究基于乳腺腫瘤超聲圖像特點和重要的患者信息設計了相應的特征體系,并對特征進行基于單因素分析和多因素分析的特征篩選,將篩選后的特征集在1個使用十倍交叉驗證法的線性核分類器中實現了AUC=0.903的效果,表明該方法是有效的,能為臨床醫師進行乳腺腫瘤淋巴結檢查提供轉移可能性的參考。本研究的主要貢獻有4點:一是結合乳腺超聲圖像特征和臨床信息,設計了乳腺超聲圖像特征體系,且特征易獲取;二是提出了利用CNN特征描述乳腺腫瘤超聲圖像的方法,并證明了該特征對分類結果有較大幫助;三是在特征數量眾多的情況下,實現了嚴格而有效的特征篩選;四是在一定程度上實現了對乳腺腫瘤腋窩淋巴結轉移的預測。