【關鍵詞】自編碼卷積神經網絡;前列腺TRUS圖像;圖像分割;特征提取;醫學圖像處理
隨著醫療技術的不斷進步,前列腺TRUS圖像已成為前列腺疾病診斷與治療的重要工具。經直腸前列腺TRUS圖像因無創性、實時性和低成本等優勢,在前列腺疾病檢查中廣泛應用。然而,其解讀與分析常依賴醫生經驗,主觀性強且存在誤差。因此,開發自動、準確的前列腺TRUS圖像分割方法,對提升診斷精度、減輕醫生負擔至關重要。
但前列腺TRUS圖像分割面臨諸多挑戰。前列腺形態和大小個體差異大,且受周圍組織影響,使得分割任務復雜。此外,TRUS圖像存在噪聲.偽影和對比度低等問題,進一步增加分割難度。前列腺疾病多樣,單一分割方法難以適應所有情況,需開發泛化能力更強的算法。
目前,多種圖像分割方法已應用于前列腺TRUS圖像。文獻[1]通過多期相CT數據融合增強器官表現,精確分割多個器官,但高度依賴高質量CT數據。文獻[2]研究基于U-net改進的前列腺TRUS圖像分割方法,優化網絡結構,提高分割精度,但結構復雜,可能導致訓練時間長且需大數據集避免過擬合。
針對上述問題,本文提出基于自編碼卷積神經網絡的前列腺TRUS圖像分割方法,旨在提高分割精度。
(一)前列腺TRUS圖像灰度均衡化處理
前列腺TRUS圖像的初始形態一般呈現為圓形,同時伴有一個較大且較為昏暗的背景區域。為了增強后續網絡訓練的效果,同時提升最終圖像分割的精確度,本文對這些圖像進行了灰度均衡化的預處理工作。
針對前列腺TRUS圖像,進行了灰度均衡化處理。首先,對于每個灰度級別,計算圖像有效區域(ROI)內的像素數量。根據ROI中的像素總數n,計算每個灰度級別在ROI中出現的概率。基于這些概率值,計算好h(a)的累積分布函數,其中f(a)=∑f,取值范圍從0到i。依據直方圖均衡化的公式(如方程(1)所示),對原圖像進行了預處理,從而得到了灰度分布更加均衡的圖像。

針對前列腺TRUS圖像的灰度均衡化處理,使用上述公式進行計算。其中,是原始圖像灰度值的上限,為固定的值,用于界定圖像中灰度級別的最大范圍。則為經過灰度均衡化處理后,圖像所達到的新的灰度上限值。這一值的變化,直接反映了灰度均衡化對圖像對比度改善的效果。m為圖像中像素的總數。對于計算灰度級別的概率分布至關重要。f為累積分布函數的最小值,確保灰度級別的重新分配不會使得圖像的某些細節丟失,從而保證了處理后圖像的完整性和準確性。
(二)基于自編碼卷積神經網絡的圖像特征展平
基于自編碼卷積神經網絡的圖像特征提取,采用UNet模型的結構。這一模型精心設計6個特征提取模塊和6個特征解碼模塊,確保圖像信息在提取和重構的過程中得到充分地利用。在這些模塊之間,存在著巧妙的連接結構,使得圖像信息在傳遞過程中能夠保持連續性和完整性。
在特征提取過程中,每個模塊都會對輸入矩陣的大小和通道數進行調整。每個特征提取模塊內部都進行卷積操作。添加一個新的卷積層,并在其上應用3個卷積核進行進一步的特征提取。利用卷積操作捕捉圖像中的局部模式和結構信息。
完成卷積操作后,通過另一個卷積層將兩個卷積層的輸出進行整合,從而得到更加豐富和全面的特征表示。隨著特征提取模塊的逐層深入,獲得從低級到高級的不同層次的特征信息。表示從原始圖像中提取出了64種不同的特征,并輸出了768個通道的特征圖,特征圖包含了圖像中最為關鍵和抽象的信息。通過三個全連接層進行進一步的處理,并將矩陣變換器模塊中的矩陣V、Q與K做矩陣乘法:
在上述公式中,d為多頭自注意力中頭的數目,最終解碼模塊的輸出圖像特征由分割結果產生的類別確定。
(三)實現前列腺TRUS圖像分割
前列腺TRUS圖像分割流程如圖1所示。
數據輸入:開始時,將前列腺TRUS圖像作為輸入數據。
圖像預處理:對輸入的TRUS圖像進行灰度化,將其轉換為灰度圖像。應用灰度均衡化處理,以改善圖像的對比度,使圖像中的不同組織或結構更加清晰可辨。
自編碼卷積神經網絡模型:將預處理后的圖像輸入基于自編碼的卷積神經網絡模型中。該模型由編碼器和解碼器兩部分組成。編碼器用于提取圖像的特征,解碼器用于根據這些特征重構圖像。
特征提取:在編碼器中,逐層提取圖像的特征。包括前列腺的形狀、邊界、紋理信息。

特征展平:在編碼器的最后階段,通常會有一個展平層(Flatten layer),將提取到的多維特征圖轉換為一維的特征向量。包含圖像中關鍵信息的壓縮表示,便于后續的分類或分割任務。
解碼與重構:解碼器根據展平后的特征向量,通過反卷積等操作,嘗試重構出原始的圖像。有助于模型更好地理解和學習圖像中的結構和特征。
圖像分割:在解碼器的輸出端,可以添加一個分割層(如全卷積層),用于對圖像進行像素級別的分類或分割。
通過這個分割層,可以區分出前列腺區域和其他組織區域。
結果輸出:輸出分割后的前列腺TRUS圖像,其中前列腺區域被清晰地標記出來。前列腺TRUS圖像分割結果如圖2所示。
為了驗證基于自編碼卷積神經網絡的前列腺TRUS圖像分割方法的有效性,進行了對比實驗,設置文獻[1]和文獻[2]方法為對照組,對三種方法實驗結果進行對比。
(一)實驗準備
在基于自編碼卷積神經網絡的前列腺TRUS圖像分割方法對比實驗中,采用一組TRUS圖像數據集來驗證不同網絡結構的性能。此次實驗共收集了6820張前列腺TRUS圖像,按照8:2的比例進行劃分,其中5456張圖像作為訓練集,剩余的1364張圖像作為測試集。為每張圖像準備相應的專家標注圖像,以用于后續的分割性能評估。
考慮到前列腺TRUS圖像的特點,即前列腺的形態、大小以及位置在圖像中可能存在一定的變化,采用數據增強技術來豐富訓練樣本的多樣性。除了水平、垂直翻轉外,增加旋轉、裁剪以及亮度、對比度調整。提升模型對圖像變化的魯棒性。
本次實驗環境配置編程語言為Python 3.8,所有程序均在Python環境中運行。為了確保實驗結果的公正性和可比性,所有對比實驗的配置均保持一致。

在網絡參數設置方面,調整輸入圖像的大小為512×512像素,以提供更豐富的細節信息給網絡。迭代次數(即訓練輪數)設定為150次,以增加模型對數據的擬合程度。同時,Batch_size(即每批次處理的樣本數)設置為16,以加速訓練過程并減少訓練時間。初始學習率(即模型訓練初期的步長)設置為0.001,以在訓練初期給予模型較大的更新幅度。
實驗過程中,分別對文獻方法[1](傳統方法1)文獻方法[2](傳統方法2)和本文方法進行訓練,并在相同的測試集上進行性能評估。通過對比不同模型在前列腺TRUS圖像分割任務上的召回率指標,分析不同方法的分割效果。
本實驗使用召回率作為前列腺TRUS圖像分割方法的評估指標,評價指標的具體定義如下:
其中,TP為被正確分割的像素個數,稱為真陽性,FN為被錯誤分割為背景區域的像素個數,稱為假陰性。
表1顯示了三種分割方法召回率結果。
(二)對比實驗
從實驗結果可以看出,本文設計方法在召回率上表現最好,平均達到了92.4%。實驗結果表明本文能夠更準確地識別并分割出前列腺區域,減少了將前列腺像素錯誤分割為背景區域的情況。
本文詳細介紹了基于自編碼卷積神經網絡的前列腺TRUS圖像分割方法,旨在提高前列腺疾病的診斷精度和效率。通過引入自編碼器的結構,實現對前列腺TRUS圖像特征的自動提取和編碼,從而提升了分割算法的泛化能力。優化后的網絡結構和損失函數使得算法在處理圖像的細節和邊緣信息時更為出色,進一步提高了分割的精度。