汪 娟,劉 哲,宋余慶,陳香遠
1.江蘇大學 計算機科學與通信工程學院 醫學圖像處理實驗室,江蘇 鎮江 212013
2.江蘇大學 醫學院,江蘇 鎮江 212013
甲狀腺疾病是臨床上最為常見的內分泌疾病,從病例數據來看,一般女性多于男性。目前我國甲狀腺疾病總患病率近20%,約每5人中就有1人患甲狀腺疾病,發病率高。影像學檢查是甲狀腺癌疾病的主要診斷及預后評價方法,包括CT、MRI、超聲、核素顯像、PET等,其中MRI檢查有良好的軟組織對比度,能顯示CT不能顯示的小腫瘤,可確定腫瘤的侵犯范圍及有無淋巴結轉移。但是診斷主要依賴于檢查醫師的水平和經驗,存在一定的主觀性,易造成漏診和誤診[1]。因此,術前診斷對患者治療有重要的意義。
紋理分析在圖像處理和模式識別領域占有重要地位,反映了圖像本身的屬性,是圖像分析的重點[2-3]。紋理特征在甲狀腺圖像的病變區域和正常區域中存在較大的差異,可用來區分甲狀腺感興趣區域有無病變。本文旨在研究提取甲狀腺MRI感興趣區域的紋理特征并病變可能性預測。目前該領域多是利用GLCM[4-7]、LBP[8]、Gabor小波變換[9-10]等紋理特征算法。在這些方法中,由Haralick[11]提出的GLCM紋理描述特征,被廣泛地應用于醫學領域,很多學者用來輔助診斷甲狀腺的病變研究。該算法是聯合兩個位置的像素灰度的概率密度來定義的,反映了影像中具有同樣亮度或相近亮度的像素之間的位置分布特性,是有關影像亮度變化的二階統計特征。但存在計算量大,細節信息丟失等問題。對于幾種常見的甲狀腺病變圖像而言,其紋理大多復雜多變、隨機性大,且存在明顯的邊緣信息。使用傳統GLCM來描述紋理特征缺少對圖像梯度信息的描述,降低特征的可區分性;傳統GLCM方法選取固定窗口尺寸來進行圖像的分類,選取的窗口不同也會影響分類的結果。為此,國外很多學者改進的方法層出不窮。Rajkovi?等[12]對乳腺癌圖像建立了分形和灰度共生矩陣紋理分析算法的預后能力,首次發現腫瘤組織學的紋理分析的預后價值主要依賴于由共生矩陣特征計算的像素灰度值的空間分布。劉大鵬等[2]提出一種增強的基于GLCM的特征表達方法,實現對TI加權對比度增強MRI(CEMRI)腦腫瘤圖像的自動分類,實驗證實其方法對腦部腫瘤圖像分類的有效性。Torheim等[13]用GLCM特征對宮頸癌的治療結果進行預測,預測精度達到75%。Nagarajan等人[14]通過提取GLCM、直方圖和灰度行程長度矩陣(GLRLM)紋理特征將甲狀腺超聲圖像分為兩類。該方法準確率達到89.74%、靈敏度為89.89%,特異度為91.67%,結果表明所提出的方法對分類效果很好。Huang等[15]使用3-D乳腺MRI形態特征評估其區分乳腺良惡性病變的價值。實驗基于95例乳腺實性腫塊MRI(良性44例,惡性51例)進行腫瘤惡性可能性的分析,提取其GLCM,形態特征和橢圓擬合特征獲得88.42%的準確率,88.24%的敏感度和88.6%的特異度。
針對目前GLCM紋理特征提取方法存在的問題,提出GLCM的改進算法來表征甲狀腺ROI的紋理特性。該算法充分考慮了圖像紋理的梯度信息,是一種基于紋理和灰度互補的特征,對鑒別病理和正常組織效果顯著[16]。首先提取同一病例甲狀腺MR圖像的正常和病變ROIs,對尺寸不同的ROIs進行尺寸歸一化和上采樣操作;基于HOG特征算子理論檢測圖像的梯度信息,采取滑動窗口自適應方法提取GLCM紋理特征;為抑制噪聲的影響取四個方向(0°,45°,90°,135°)的共生矩陣均值為最終GLCM;最后計算GLCM的紋理特征參數。實驗使用Logistic回歸模型對ROIs紋理特征進行分析,評估本文方法對甲狀腺MR圖像的分類精確度。
灰度共生矩陣是描述圖像灰度級空間分布的二階紋理信息,它為一個行數和列數等于原始圖像中的灰度等級數的方陣。假定一幅M×N圖像灰度級數量為L,那么圖像的GLCM是一個L×L的矩陣,灰度i和 j的一對像素點,其位置方向為θ,距離為d的概率為P(i,j,d,θ),一般 θ有四種情況:0°,45°,90°,135°。像素對I(k,l)=i和I(m,n)=j。在這四個方向上的出現概率如式(1)、(2)、(3)、(4):

其中,#表示在該集合中元素的數目,再對每個灰度共生矩陣所有元素進行歸一化處理,使得歸一化后的矩陣所有元素和為1,然后計算五個相互獨立的二階統計紋理特征:相關、能量、對比、逆差矩和熵。基于給定的5個GLCM特征參數計算每個特征的均值和標準差作為最終的特征向量。
共生矩陣并不能直接反映圖像的紋理特征,本文利用下面常用的五個統計量來描述灰度共生矩陣P的紋理特征[6]:
(1)相關(COR)

相關度量空間灰度共生矩陣元素在行或列方向上的相似程度,反映了圖像中局部灰度相關性。當矩陣元素值均勻相等時,COR越大;反之亦然。
(2)能量(ENG)

能量是灰度共生矩陣各元素的平方和,也稱角二階矩(ASM)。它主要反映圖像紋理灰度級分布的均勻性和紋理的粗細程度。ENG越大,紋理越均勻且粗壯;反之,則紋理越不規則且細致。
(3)對比(CON)

對比也稱慣性矩,反映了圖像的清晰度和紋理溝紋的深淺度。其取值范圍在0~(L-1)2之間,為圖像的灰度等級。CON越大表示紋理溝紋越深,視覺效果越清晰;反之,則溝紋淺,圖像視覺較模糊,紋理效果不明顯。
(4)逆差矩(HOM)

逆差矩又稱局部平穩,是對圖像紋理局部變化的度量,反映了紋理的平滑度。圖像中紋理越規律越平滑,則HOM值越大。
(5)熵(ENT)(假設 0×ln(0)=0)

熵代表圖像所具有的信息量,表示了圖像紋理的均勻度或復雜度。ENT越大,表示圖像內容越隨機,紋理越復雜且密度越不均勻。當ENT為0時,表明圖像沒有紋理。
目前紋理特征提取方法眾多,反映圖像灰度模式的空間分布,同時兼顧了圖像的宏觀信息與微觀結構。為解決傳統GLCM方法固定窗口和噪聲抑制對圖像分類的影響問題。在這個階段,結合梯度信息,采用自適應的滑動窗口大小方法獲得GLCM,提取甲狀腺ROIs的紋理特性。實驗算法流程圖如圖1所示。
如圖1所示,對甲狀腺原圖像中提取的甲狀腺ROIs不同尺度的圖像采用最鄰近插值算法調整圖像大小,保持所有ROIs尺寸的一致;然后進行上采樣操作,對圖像進行放大處理,以便增加圖像梯度信息;再將每個圖像劃分為2×2的子圖,使得更均勻地提取圖像內部梯度信息。
HOG特征算子其核心思想是統計圖像局部目標區域的梯度方向信息作為該局部圖像區域表象和形狀的表征。通過梯度信息來描述圖像中物體的邊緣、輪廓、形狀等紋理信息。趙順廷[17]在低場強MRI對甲狀腺腫瘤的診斷和鑒別的研究中,主要研究了四種甲狀腺疾病,分別是:結節性甲狀腺腫、甲狀腺囊腫、甲狀腺癌和甲狀腺瘤。而大部分甲狀腺病灶區域內部紋理會有明顯的變化且病灶區域邊界較清晰。因此可通過HOG特征檢測甲狀腺ROI區域梯度信息,以便采用滑動窗口自適應進行GLCM紋理特征提取。具體步驟如下:
步驟1對圖像進行預處理,采用Gamma校正法對輸入的圖像進行標準化處理,目的是調節圖像的對比度,抑制噪聲的干擾。
步驟2將圖像劃分成連通區域(稱為細胞單元);再采集細胞單元中各像素點的梯度的方向值,即通過計算圖像橫坐標和縱坐標方向的梯度獲得每個像素位置的梯度方向值。實驗采用模板[?1,0,1]計算圖像的梯度以及方向,通過梯度模板計算水平和垂直方向的梯度,設圖像中像素點為(x,y),計算其梯度的公式如下:

式中Gx(x,y),Gy(x,y)分別表示輸入圖像中像素點(x,y)處的水平方向梯度、垂直方向梯度。像素點(x,y)處的幅值G(x,y)和梯度α(x,y)方向公式分別為式(11)和式(12):


圖1 甲狀腺MR圖像病變和正常區域識別流程
步驟3求所有像素點的幅值和梯度方向,通過圖像中所有過零像素點進行梯度檢測,即G(x,y)的過零點。
為了有效地對ROIs進行分類,最重要的是提取區分甲狀腺病變和正常ROIs的有效特征集。本文基于傳統GLCM由HOG特征啟示捕獲圖像的梯度分布來查找甲狀腺病變區域的邊緣,進行灰度共生矩陣的改進算法紋理特征提取,如圖1所示,本文算法流程分為以下幾個部分:
步驟1圖像預處理,對提取的正常和病變ROI圖像進行尺度歸一化、上采樣以及灰度級量化,并劃分成2×2的連通區域。
步驟2梯度計算,計算所有區域的每個像素位置的梯度(包括大小和方向),即計算所有像素點的幅值和梯度方向,即G(x,y)。
步驟3檢測梯度,即求G(x,y)的過零點。當G(x,y)的過零點時,滑動窗口取較小窗口,否則取較大窗口。
步驟4計算圖像不同窗口下的GLCM,如若滑動未完成,則繼續步驟3。
步驟5為抑制噪聲的影響并體現圖像灰度的離散程度,取四個方向共生矩陣的均值作為最終的共生矩陣,并提取特征參數相關、能量、慣性矩、逆差矩和熵的均值和方差,構成10維的特征向量T(t1~t10)。
步驟6特征向量歸一化,由于各個參數間差異很大,故在對其分析前進行數據歸一化處理。
步驟7使用Logistic回歸模型分析,評估甲狀腺圖像的分類準確度。
實驗設定滑動窗口大小為w(取值奇數),當檢測梯度時,為保留目標圖像的細節,w取較小值,否則取較大值。窗口的尺寸大小以及步長對GLCM計算結果影響最大,因而針對不同的圖像應通過實驗選擇合適的值,以獲得最好的結果。實驗發現設置滑動窗口大小較小的為5×5,較大的為17×17時效果最佳。為了抑制方向分量使得提取的紋理特征與方向無關[18],取四個方向的共生矩陣的均值Pm(i,j,d)作為最終的共生矩陣,計算公式如式(13),然后提取共生矩陣的特征參數。

最后計算五個相互獨立的二階統計紋理特征:相關、能量、對比、熵和慣性矩,基于這5個GLCM特征參數計算每個特征的均值和標準差作為最終的特征向量。
本文選取江蘇大學附屬醫院的47例甲狀腺MRI病例,其圖像格式為DICOM格式,分辨率為512×512。由于圖像像素灰度級較大,需要對圖像進行灰度級量化。原始圖像包含感興趣區域和大部分非感興趣區域,需要對其進行ROI提取。具體操作是參照醫生所勾畫的病變區域,運用ImageJ軟件從甲狀腺患者MR圖像中手動分割出正常和病變區域兩組圖像各47例,并以DICOM格式存儲。圖2所示為醫生已勾畫出病變區域的甲狀腺MR圖像切片圖,圖2(b)為(a)中白色輪廓勾畫區域,即提取的病變ROI。

Logistic回歸模型在醫學中主要用來預測某疾病發生的概率。二分類Logistic回歸分析在醫學研究領域已經得到廣泛應用,其中包括對疾病的預測和判別。為了驗證提出算法的有效性,實驗對94例甲狀腺MR圖像(47例病變,47例正常)進行紋理特征提取。Logistic回歸賦值以金標準診斷結果為依據,以提取的紋理特征參數作為協變量建立Logistic回歸模型,獲得靈敏度、特異度、準確率,計算漏診率、誤診率以及ROC曲線下面積AUC。靈敏度(Sensitive,Sen)指實際有病而被正確診斷的百分比,其公式為式(14);漏診率為診斷沒有檢出的病例,漏診率 =1-Sen;特異度(Specificity,Spe)反映了診斷實驗排除非病例的能力,其公式為式(15);誤診率為診斷實驗沒有排除的非病例比例,誤診率=1-Spe;準確率(Accuracy,Acc)反映正確診斷正常和病變的能力,公式如式(16)。

另一個評價指標ROC曲線下面積AUC,計算公式如式(17),其中TPrate=Sen,FPrate=1-Spe。當AUC取值0.5~0.7,表示診斷價值較低;0.7~0.9表示診斷價值中等;0.9以上時表示診斷價值較高。通過以上6個評價指標來判別甲狀腺有無病變的性能。據以上規則,采用二分類Logistic回歸模型分析和ROC曲線分析本文算法各個參數的顯著性即 p值,當 p<0.05時有臨床意義。評估本文方法對甲狀腺圖像分類的準確率,AUC值越大臨床意義就越大,特異性和敏感性越高診斷漏診的概率就越小。
實驗分別選取基本GLCM、LOG-GLCM[18]與本文方法進行對比實驗與分析,采用二分類Logistic回歸模型分析病變可能的預準確率、靈敏度、特異度、漏診率、誤診率和ROC曲線下面積AUC。本文提出方法涉及三個參數:量化級數L,步長d,以及滑動窗口尺寸w。Clausi等[19]證實不同灰度級的GLCM會對最后的分類結果產生較大的影響。灰度級較大時,圖像中紋理信息能夠得到更細致的描述,同時也易受到噪聲的影響,且計算量會顯著變大。步長較小時,能夠捕獲圖像細微的結構,而較大時能夠描述粗紋理[14]。滑動窗口的大小對共生矩陣的影響最大,大尺度的窗口會嚴重損害目標圖像的紋理特性,較小窗口尺寸可以保留目標圖像的細節[19]。當窗口過大時,窗口內包含的信息越復雜,會影響計算的結果,而窗口過小甚至小于目標尺寸,計算的結果也不可靠。當計算窗口的尺寸由小取到大時,在紋理圖像中,其邊緣會變得越來越模糊化。因此,本文通過上采樣增強圖像的邊緣信息,再自適應調整滑動窗口的尺寸。在梯度處選擇較小滑動窗口,否則選擇較大滑動窗口。針對本組實驗數據ROI尺寸自適應調整窗口范圍在3×3~23×23之間。為了得到灰度級L,步距d和滑動窗口尺度w的最優參數組合,分別選取如表1所示的各參數設置,進行多次實驗。通過多組實驗驗證,針對本組實驗數據:邊緣處窗口尺寸設定為3×3,非邊緣處設定為17×17時,目標內部既沒有小窗口那么復雜,邊緣信息也保存得較好[20]。灰度級為32,步距為1時,圖像梯度信息和紋理細節保持最好。

圖3 甲狀腺病變(“1”)和正常(“0”)ROIs的特征參數均值散點圖

表1 紋理特征提取算法各參數設置
實驗分別對病變和正常區域進行灰度共生矩陣的改進算法的紋理特征提取,獲得特征向量:ENG、ENT、HOM、CON和COR的均值和方差。表2展示本文算法特征參數ENG、ENT、HOM、CON和COR的均值和方差的P值和AUC值,很明顯本文方法提取的參數P值均小于0.000 1具有臨床診斷意義。由ROC曲線并對照表2中AUC值可知,能量、熵、對比以及慣性矩對應的AUC值較高,相關的AUC值相對較低。圖3的散點圖為使用本文方法提取病變和正常甲狀腺ROIs的特征參數(能量、熵、對比、相關和慣性矩)均值比較,其中橫坐標為狀態標量,分別用“1”和“0”表示病變和正常圖像,縱坐標為各個參數取值范圍。顯然,能量、熵、對比和慣性矩對本實驗甲狀腺圖像的判別診斷意義比相關更大。能量均值近似范圍區間:正常甲狀腺在0.06~0.14,病變在0.01~0.05;同樣地,熵均值:正常在2.2~3.3,病變在3.3~5.4;對比均值:正常在0.1~0.6,病變在2~8上下波動;相關均值:病變在0~0.2;慣性矩均值:正常在0.7~0.95,病變在0.4~0.6上下波動。綜合分析,能量、熵、對比以及慣性矩對甲狀腺圖像預測分類的意義和診斷價值較相關更好。

表2 GLCM改進算法特征參數P值和AUC值

圖4 本文提出改進方法的各個特征參數的ROC曲線圖
圖4 為本文提取的10個特征向量ROC曲線圖,ROC曲線離參考線越遠,AUC值越高,其預分類精確度越高。左邊為狀態變量輸入1的ROC曲線,右邊為狀態變量輸入0下的ROC曲線。由圖可知,病變ROIs的ENTMEAN、ENTVAR、CONMEAN、CONVAR、HOMVAR、CORVAR均高于正常ROIs,正常ROIs的ENGMEAN、ENGVAR、HOMMEAN、CORMEAN均高于病變ROIs。參照各個參數的物理意義,并對照圖5(a)中正常區域和圖5(b)中甲狀腺病變的圖像,分析各個參數的ROC曲線和AUC值可知:大部分甲狀腺病變圖像內部紋理結構更隨機、復雜多變,且密度分布不均勻,大多紋理溝紋更深,局部紋理呈現不規律,病變圖像的灰度分布離散程度更大;而正常甲狀腺圖像紋理灰度分布更均勻且粗壯,局部平穩性高,規律性較強。

圖5 甲狀腺MR病變和正常區域的ROI樣本圖
表3給出傳統GLCM、DBC、Uniform-LBP、LOGGLCM與本文方法的分類結果,其中最佳臨界點p=0.5,標準誤差為0.033 6。從表3可以看出,這五個方法的分類準確率分別為75%,63.8%,88.8%和79.6%,本文方法的預分類準確率相比原始GLCM、DBC、ULBP和LOGGLCM分別提高了21.8%、15.8%、8%和17.2%,本文方法的靈敏度為97.9%,特異度為95.7%,漏診率為2.1%,誤診率為4.3%,并得出一個接近0.968的AUC。LOGGLCM在提取圖像邊緣時,雖然降低了噪聲但是細節損失較大,梯度定位精度也較低,存在噪聲抑制能力與梯度定位能力相矛盾的問題,因而影響在實際梯度檢測中的效果。而本文方法基于圖像上采樣和分塊處理提取梯度信息,解決LOG-GLCM方法中梯度細節丟失的問題,在有效地消除噪聲的同時又較好地保存了圖像的梯度信息。本文提出方法相比其他方法,結合圖像梯度信息,同時兼顧甲狀腺圖像內部紋理宏觀信息和局部結構信息,并考慮參數的影響,選擇最佳特征參數組合,在特征提取時采取區域劃分的方法也能進一步提高分類準確率,增強本文算法的實用性,為臨床醫生更好地進行甲狀腺病變的預測提供幫助。由表3可知,本文算法所有指標均高于其他方法,對甲狀腺MR有無病變的判別效果較其他算法更好,對病變和正常的識別率更高,提高預分類準確率,并輔助醫生診斷治療。
為了進一步提高甲狀腺MR圖像病變和正常區域的預分類準確率,本文提出了改進GLCM的窗口自適應紋理特征提取算法。結合圖像的梯度信息和GLCM的統計紋理特征提取算法,分別在感興趣區域無邊界處和病變區域有邊界處采用窗口自適應的灰度共生矩陣算法提取甲狀腺MR圖像的紋理特征,采用Logistic回歸模型對病變和正常區域的紋理特征進行分析,獲得預分類精確率。
實驗結果證明,本文算法準確率為96.8%,較其他方法有更好的預測分類結果。其中提取的能量、熵、對比和慣性矩具有較好的診斷價值,這些特征能有效地區分正常和病變的甲狀腺區域。本實驗在提取紋理特征時,考慮了病變區域的梯度信息,因此不需要精確地分割出病變區域,方便對自動化檢測甲狀腺病變系統地進一步研究和設計;通過實驗分析可知,不同病變類型的甲狀腺內部紋理存在一定的差異,比如:紋理規律和紋理溝紋等方面。對此,還需進一步研究;由于臨床獲取的MR圖像存在噪聲嚴重、病變種類多樣化、結節形態不規則及對比度不明顯等問題。因此,在臨床上輔助醫生診斷僅依靠紋理特征還不夠,為提高輔助診斷的準確率,在后期研究中可考慮其形態、密度等特征以及選擇更好的分類器。

表3 二分類Logistic回歸模型分類表(最佳臨界點p=0.5)