王素英 張慧芝 丁華新*
(寧波市臨床病理診斷中心,浙江 寧波 315000)
近年來,使用數字掃描儀創建病理組織的切片圖像(全切片數字化成像,Whole Slide Image, WSI),使病理醫生的閱片可以不受顯微鏡的限制,極大地提高了病理教學、病例討論等方面的效率,也使得遠程會診、開發病理人工智能等成為可能,全切片數字化成像(WSI)的使用因此越來越廣泛。但是在使用過程中,也產生了一些問題,比如在載玻片的制備過程中,不可避免地會出現一些偽影(折疊、氣泡、劃痕、壓縮等)[1]、染色不均、染色劑濃度差異和染色劑批次更換造成的差異;在載玻片的掃描過程中,不同的設備商可能采用不同的掃描方式進行載玻片的數字化,掃描儀的不同選擇也可能會影響圖像的質量,出現圖片模糊、對比度低等情況[2]。造成差異的來源可能是不同因素或多種因素疊加,從而導致數字病理圖像的呈現不同的實質性差異,這種差異制約了WSI 的臨床病理應用。
從臨床上看,由于制片掃片質量原因而被舍棄的載玻片在很大程度上拖累了臨床病理工作流程,因為這些載玻片均需要重新制作或重新掃描,從而導致延長病理診斷的時間,造成人力、物力的浪費,也會加重病人的醫療費用[3,4]。從研究角度看,以偽影為代表的諸多噪聲會對疾病檢測、診斷和預后等任務的分類器的開發和驗證造成不利的影響,這一點對于基于深度學習和機器學習來說尤為明顯[5,6]。目前,大多數臨床和研究應用的質量控制都是通過手動執行的,這使得數字圖片質量控制過程主觀、費時、費力且容易出錯。因此,我們研究了一種自動化的數字病理圖像質量控制方法,通過一系列的數字圖像處理技術,針對病理圖像的存在的噪聲進行識別和剔除,從而達到對病理圖像的自動化質量控制的目的,大大提高了病理工作者的工作效率,也為基于病理圖像的醫學研究提供可靠的數據源保障。
圖像分割是自動識別圖像中目標的基礎,由于數字病理圖像本身的組織特征復雜而豐富,噪點和模糊呈現的形式多樣,因此一般的分割流程難以是有效分割出病理圖像中的可用組織區域。本文的將多種圖像預處理方法和分割方法相結合,形成一套完整的質量控制流程,所包含的處理模塊流程如圖1 所示。

圖1 質量控制流程圖
首先,應用數字掃描儀掃面制作完畢的玻璃切片,讀取數字病理圖像,然后進行病理組織區域提取。由于內存的限制,一般難以直接處理具有數億像素規模的WSI,即使能處理,也是一項非常耗時、繁瑣的工作,為了快速獲得初步的WSI 組織區域,本文利用圖像處理中的多分辨率金字塔結構[7]和OTSU 算法[8]提取WSI 中的組織區域。具體做法如下:首先利用Openslide 對WSI進行下采樣獲得低分辨率下的數字病理圖像,由于在HSV 顏色空間中分析顏色值分布更加方便,因此我們將病理圖像從RGB顏色空間轉換為HSV 顏色空間;然后利用基于Otsu’s 的閾值分割方法生成二進制的分割掩碼,并通過適當的形態學操作以獲得最佳的分割掩碼;最后再利用多級映射將分割掩碼還原到WSI 上,從而提取出對應的組織區域,流程如圖2 所示。

圖2 基于多級映射的WSI 組織區域提取流程
污跡區域的檢測內容主要包括裂痕、褶皺、層疊、氣泡、劃痕、壓縮等噪聲。對上一步獲得的組織區域進行Canny 邊緣檢測[9],獲得污跡的邊緣輪廓;然后在污跡輪廓內做填充,并與原始的組織區域做交集運算,獲得剔除污跡的組織區域。
由于沒有準確對焦造成病理圖像產生模糊區域,通常處理模糊區域一般使用聚焦評價函數以獲得圖像的模糊狀態的分布情況。常見的聚集評價算子有以下幾種:
灰度方差算子, 方差用來描述一組數據偏離平均值的程度。一幅聚焦清晰的圖像要比一幅離焦的圖像有更豐富的灰度變換,即方差結果越大[10,11]。所以用圖像的灰度變化的平均程度即方差來衡量圖像的聚集程度。
梯度算子,聚焦清晰的圖像具有很強的邊緣特征信息,由于梯度算子 ?f(x,y)具有各項同性和旋轉不變性,可以把圖像中各異走向別的邊緣和線條突出,聚焦程度越高,圖像邊緣銳化程度越高,所以圖像的聚焦程度也可以用灰度梯度來評價,公式如下:

其中Wn×n是(x,y)像素點為中心,大小為n× n 的正方形鄰域,f(x,y)是像素點(x,y)的灰度值。
上述的聚焦評價算子均是以一階導數為基礎的梯度函數,本文為了得到更加準確的模糊區域,采用以二階導數為基礎的拉普拉斯算子,其原因是二階導數相比于一階導數能夠進一步放大函數值的變化,對高頻分量的提取更加準確[12]。由于在拉普拉斯算子的原始形式中,對x 方向和對y 方向的二階偏導數會存在符號相反,相互抵消的現象,從而使得圖像的聚焦產生偏差。因此選用改進的拉普拉斯算子進行計算,其計算公式如下:

根據改進拉普拉斯算子計算出模糊區域狀態的熱力散點分布圖,從而按照熱力圖閾值過濾出大于閾值的模糊區域分布,并對其進行高斯濾波,獲取模糊區域的掩碼。最后將原始組織區域與模糊區域掩碼取差集,即可獲得可用組織區域。
本研究采用任意的兩張WSI 作為測試對象,測試結果如圖3 所示。

圖3 測試結果
從測試結果來看,無論是污跡區域還是模糊區域,本文中所研究的病理圖像的質量控制方法能夠很好的剔除噪聲區域,只保留有效可用的組織區域,從而驗證了本自動化的數字病理圖像質量控制方法的有效性和可行性。
WSI 是數字病理學領域研究的基礎,WSI 的質量控制是數字病理發展的重要一環。本文介紹的自動化數字病理圖像質量控制方法,首先讀取數字病理圖像。利用圖像處理中的多分辨率金字塔結構和OTSU 算法提取WSI 中的組織區域。檢測污跡區域,利用Canny 邊緣檢測獲得污跡的邊緣輪廓,填充污跡輪廓內,與原始的組織區域做交集運算,獲得剔除污跡的組織區域。采用以二階導數為基礎的拉普拉斯算子檢測模糊區域,計算出模糊區域狀態的熱力散點分布圖,按照熱力圖閾值過濾出大于閾值的模糊區域分布,對其進行高斯濾波,獲取模糊區域的掩碼,最后將原始組織區域與模糊區域掩碼取差集,最終利用分割掩碼進行多次差集運算,獲得有效可用的組織區域。通過兩次實驗結果,驗證了本文質量控制方法的正確性和可行性,有助于提高病理醫生的診斷效率以及提供了可靠有效的高質量數字病理圖像。