高學田
(福建星網銳捷通訊股份有限公司,福建 福州 350000)
在建設“智慧醫院”背景下,將醫學影像處理技術和數據挖掘技術相結合,從海量醫學影像數據中提取出符合醫學診斷需要或表示疾病類型的信息,可以達到輔助決策診斷的效果。在設計輔助診斷系統時,可選擇的數據處理算法有多種,例如BP 神經網絡算法、粗糙集算法等,但是在實際應用中均存在一定缺陷,例如收斂速度慢、全域檢索能力差等。RBF(徑向基函數)神經網絡具有最優逼近、全局逼近的特點,基于該數據挖掘算法構建輔助診斷系統,將提高影像數據的分析速度和利用效率,從而在輔助醫師診斷方面發揮更為離線的效果。
神經網絡被廣泛應用在模式識別、數據挖掘等方面。面對海量化數據和高標準的處理要求,單層神經網絡由于只能解決線性可分問題,實際應用效果大打折扣。構建多層前饋神經網絡、提升分類能力成為增強神經網絡學習能力和應用價值的一種有效手段。多層前饋神經網絡的結構如圖1 所示。

圖1 神經網絡系統結構
結合圖1 可知,該系統共有3 部分,即輸入部分、訓練部分、輸出部分。采集到的樣本進入到輸入部分,完成篩選、預處理后,通過訓練部分進行網絡的權系數(W)調整,最后輸出結果。期望的輸出信號可以作為參照信號,再返回與實際輸出進行對比,根據兩者之間的誤差(e)重新修改權系數,直到實際輸出符合預期輸出。但是神經網絡系統在數據挖掘中也存在缺點,例如每輸入一個新的樣本,就必須修改一次權值,大幅度增加了訓練成本,而徑向基函數神經網絡系統則規避了這一問題。
徑向基函數神經網絡算法的機理是利用徑向基函數作為隱單元的“基”,在此基礎上構建隱含層。在確定了徑向基函數的中心后,相應的映射關系也被確定下來。在隱含層與輸出層之間建立實線性的映射關系,多個隱單元輸出的權值線性相加,即可得到該神經網絡的總輸出。徑向基函數神經網絡的結構如圖2 所示。

圖2 徑向基函數神經網絡結構
輸入層包含n 個神經元,與輸入矢量維數(x∈Rn)相等;同樣的,輸出層包含m 個神經元,與輸出矢量維數(y∈Rn)相等。輸入層與隱含層之間、隱含層與輸出層的神經元,均采用線性連接。隱含層中各個單元(即隱單元)的作用函數是徑向基函數,輸入單元到隱單元的權值統一設定為1,隱單元到輸出單元的權值支持靈活調節。理論上來說,只要保證隱單元數量合適,即可將非線性可分問題轉化為線性可分問題,并使用線性單元求解,從而加快了神經網絡的學習速度,在數據挖掘與處理中有更加出色的表現。
圖像在轉換、傳輸階段很容易受到噪聲干擾,降低圖像的利用價值。因此,在設計輔助診斷系統時,必須要對醫學影像進行去噪處理。中值平滑濾波器具有邊界保持的特性,是一種常用的圖像去噪工具。其去噪機理為:將需要處理的像素作為中心,生成一個尺寸為m×m 的模板,則模板中共有m2個數,并按照從大到小的順序重新排序。從該模板中選擇第k 個與待處理像素的灰度差為最小的像素,然后將k 個像素的灰度中值替換待處理的像素值,達到降噪效果。
常用的圖像增強方法有頻域法、空域法、粗糙集法等幾種。頻域法計算量較大,空域法普適性差,綜合對比后本文選擇粗糙集法。基于粗糙集理論的圖像增強流程為:首先對二維醫學影像(U)的子圖進行劃分,分別得到一個較亮的子圖A1 和較暗的子圖A2。對兩個子圖做不同的變換處理,其中A1 為正切變換,A2 為正弦變換,在圖像增強的基礎上還可以調節器明暗對比度。正切變換算法為:

基于正切函數的圖像變換,通過降低中間灰度集處的對比度,使得圖像中亮處和暗處的對比更加明顯。該灰度集函數在中間部分的斜率<1,在靠近兩端處的斜率>1。參數α決定點運算效果。正弦變換算法的計算公式為:

基于正弦函數的圖像變換,通過降低影像中較亮或較暗物體的對比度,達到加強灰度集處中間范圍物體的對比度。其中,灰度級范圍[0,Dm],參數α 越大,則上述效果越明顯。
本文選擇基于區域增長的圖像分割技術,具體方法為:醫師在觀察病例X 照片的基礎上,確定腫瘤的大體位置,并使用鼠標在該位置標記一個像素點,作為“種子點”。對于腫瘤所在區域中的任意一點,如果與它周圍4 個相鄰點p(i,j)滿足以下條件:

則將該點加入到區域中,反之則將其排除。上式中Fmax和Fmin分別表示該區域內最大和最小像素值,τ 為閾值,取值范圍[0,1]。重復上述判斷過程,一直到不存在滿足上述條件的相鄰像素點為止,這樣就可以勾畫出腫瘤邊緣線,從而實現了圖像分割。在此基礎上使用基于緊湊度的形狀特征提取,公式如下:

式(4)中P 表示區域邊界的周長,A 表示該區域的面積,C 為緊湊度。在計算中,P 的取值為邊界點數量,A 的取值為區域內所含像素點的數量。C 值越大,表明區域邊緣的粗糙度越高,形狀特性不明顯。因此需要調節P 與A 的數值,使C盡可能的小,以便于從圖像中提取到腫瘤特征信息,為下一步的分類診斷提供必要的支持。
本文設計了一種用于乳腺腫瘤細胞的智能輔助診斷系統,預期功能包括圖像預處理、腫瘤邊緣分割、腫瘤特征提取等。該系統使用徑向基函數神經網絡進行數據挖掘、使用粗糙集算法設計數據分類器,可以實現腫瘤醫學圖像紋理特征的自動提取、精準分類,為輔助醫師診斷病患乳腺部位有無腫瘤,以及腫瘤是良性還是惡性等提供了依據。
智能化輔助診斷系統的運行流程如圖3 所示。

圖3 系統診斷流程
醫師進入乳腺癌輔助診斷系統后,從“文件”中選擇對應的文件夾并導入患者的醫學診斷影像,作為原始圖像。然后對該圖像進行預處理,包括圖片反色、圖片去噪、圖片均衡變換,同時在預處理結束后自動得到物體區圖片和背景區圖片。選中某一副圖片后,從任務欄中點擊“圖片操作”一項,在彈出的對話框中選擇紋理特征提取,從選中的圖片中提取出有價值的信息。然后再從任務欄中點擊“有無腫瘤分類器”,對提取到的信息進行檢測,并判斷有無異常。如無異常,則結束本次診斷;如有異常,再從任務欄中點擊“良惡分類器”,在彈出的對話框中進行腫瘤邊緣分割,并提取腫瘤形狀特征信息。根據提取到的信息進行良性或惡性的判斷,如果檢測結果為良性,則結束本次診斷;如果檢測結果為惡性,則做進一步的活體檢測并使用“最后確診分類器”做最終的診斷。
智能化乳腺癌輔助診斷系統設計完成后,為了提高圖像處理效率、特征提取精度以及確保診斷結果的可靠性,還必須進行大量的數據樣本訓練,系統訓練流程如圖4 所示。

圖4 系統訓練流程
該系統的訓練模塊包含3 種類型的分類器,由于其功能各不相同,因此需要分別進行訓練。對于正常/異常分類器,功能是對患者的乳腺X 照片圖像進行預處理,包括圖像去噪、圖像增強等。該分類器是基于灰度共生矩陣生成,訓練前將采集到的海量醫學圖像紋理特征存入到數據庫中,有該分類器調用并進行訓練。完成訓練后,該分類器可以自動從新的醫學影像圖片中提取特征信息并做出病例正常或異常的判斷。對于良性/惡性分類器,功能是基于徑向基函數神經網絡,對提取到的腫瘤圖像做邊緣分割處理,并將分割后的腫瘤邊緣特征存入到數據庫中,分類器調用該數據進行訓練。完成訓練后,該分類器可以自動完成腫瘤良性或惡性的判斷。對于最后確診分類器,則是收集生理組織切片數據并存入數據庫中,以供分類器訓練。完成訓練后該分類器可以對病例做最終診斷。
智能化乳腺癌輔助診斷系統基于Windows 10 操作系統開發,使用開發語言為Delphi 8.0,數據庫系統為SQL Server 2018;運行環境同上。該系統界面簡潔,人機交互效果好,并且具有較好的可擴展性,可根據醫院診斷需要進行新功能的開發,提高診斷系統的兼容性。功能方面,經過大量的樣本數據訓練后,該系統可實現對乳腺X 影像圖片的去噪、增強等處理,并且勾畫腫瘤輪廓,自動完成腫瘤邊緣分割,以及提取邊緣特征信息。利用不同的分類器對提取到的特征信息做差異化處理,包括對病例的正常或異常診斷,以及對病例腫瘤的良性或惡性診斷,對病例生理切片數據的最終診斷。整個輔助診斷過程用時短、操作少、結果可靠度高,不僅極大減輕了醫師的工作量,而且對提高醫師診斷結果的精確性有積極幫助。
在醫院信息化建設過程中,輔助診斷系統逐漸在各個科室得到了普及應用。該系統的工作原理是在海量樣本數據訓練的基礎上,自動從新病例的醫學影像中提取特征信息,得出判斷結果,以便于醫師在診斷中加以參考?;趶较蚧瘮瞪窦壘W絡設計分類器,配合使用基于粗糙集理論的數據挖掘算法,可以做到對圖像去噪、增強處理,在此基礎上提取特征信息并使用分類器做出判斷,讓輔助診斷系統的診斷效率更高、診斷結果更加可靠,具有推廣應用價值。