岳棟,鄭苗
1.濟寧醫學院附屬醫院泌尿外科,山東濟寧 272000;2.濟寧醫學院附屬醫院手術室,山東濟寧 272000
膀胱腫瘤是泌尿外科最常見的腫瘤,2018年全球報告了549 393例新發病例[1]。根據WHO2016年病理分級標準,膀胱腫瘤分為乳頭狀瘤、低度惡性潛能乳頭狀瘤、低級別尿路上皮癌、高級別尿路上皮癌[2]。大約25%的尿路上皮癌被診斷為肌層浸潤性膀胱癌(MIBC),預后較差[3]。高級別尿路上皮癌的治療方式為經尿道膀胱腫瘤電切(TURBT)+放療+化療的三聯療法或根治性全膀胱切除聯合化療,嚴重影響患者生活質量[4]。膀胱鏡檢查對于膀胱腫瘤的診斷、治療方式的選擇以及復查非常重要,但是膀胱鏡檢查的診斷準確性因醫生的技能和經驗而有所不同,因此帶有一定的主觀性[5]。
當前人工智能在計算機領域發展迅速,人工智能的核心是以卷積神經網絡(CNN)為代表的深度學習,雖然利用卷積神經網絡進行影像診斷已越來越多的應用于醫學領域,但其在泌尿外科內鏡下影像診斷領域的應用尚處于起步階段[6-7]。
該研究收集了濟寧醫學院附屬醫院2019年4月—2020年4月收治的138例患者的713張圖像構建深度學習數據集,通過卷積神經網絡模型對膀胱鏡圖像訓練,從而提高了膀胱腫瘤病理分級圖像識別能力,有助于提升膀胱鏡檢查的客觀性,為下一步手術治療方式的選擇提供依據,現報道如下。
138例膀胱腫瘤標本來源于濟寧醫學院附屬醫院門診膀胱鏡檢查患者,其中男性113例,女性25例;年齡25~89歲,平均64.2歲。按膀胱腫瘤病理分級:乳頭狀瘤組34例,132張圖像;低度惡性潛能乳頭狀瘤組11例,66張圖像;低級別尿路上皮癌組36例,192張圖像;高級別尿路上皮癌組57例,323張圖像。9例行膀胱全切,1例行膀胱部分切除術,其余患者行膀胱腫瘤電切術。標本取活檢后,用10%福爾馬林固定后送至該院病理科行石蠟切片及免疫組化診斷。
根據病理結果將膀胱腫瘤圖像數據集分成4組文件夾進行歸一化。處理過程使用python3.7.1,圖像設置:像素大小為100×100,格式為“jpg”。將圖像轉換成數組后根據文件名提取圖像標簽:乳頭狀瘤圖像文件名前“0-”、低度惡性潛能乳頭狀瘤“1-”、低級別尿路上皮癌“2-”、高級別尿路上皮癌“3-”。
在python3.7.1通過Keras、TensorFlow構建類似于VGG模型的卷積神經網絡。包括輸入層、卷積層、池化層、全連接層、輸出層。引入代碼如下:from keras.utils import np_utils;from keras.models import Sequential;from keras.layers.core import Dense,Dropout,Activation,Flatten;from keras.optimizers import SGD,RMSprop,Adam;from keras.layers import Conv2D,MaxPooling2D。
基本參數如下:激活函數“ReLU”,輸出層激活函數“softmax”,優化器算法采用“SGD”,損失函數“categorical_crossentropy”,指標列表設置為metrics=['accuracy'],采用梯度下降法,迭代“Batch_Size=10”、“epochs=10”。
訓練并保存權重文件,測試數據集結果以損失函數、準確度顯示。
膀胱乳頭狀瘤或低度惡性潛能乳頭狀瘤多呈濾泡樣或水草樣,瘤體上無血流或血流很少,帶蒂、蒂窄;低級別尿路上皮癌呈葡萄樣,蒂較寬,血流較豐富;高級別尿路上皮癌呈乳頭樣或塊狀,瘤體表面常有壞死,一般無蒂,血流豐富,常有粗大血管與瘤體相連。見圖1。

圖1 A:乳頭狀瘤;B:低度惡性潛能乳頭狀瘤;C:低級別尿路上皮癌;D:高級別尿路上皮癌
將所有膀胱鏡圖像歸一化為計算機能夠識別的像素大小100×100,格式為“jpg”。見圖2。
搭建類似于VGG模型的卷積神經網絡,圖像經過卷積、池化、全連接層后輸出。見圖3。

圖3 將膀胱腫瘤圖像輸入類似于VGG模型的卷積神經網絡
膀胱腫瘤作為泌尿系統最常見的腫瘤,從發病機制、診斷及治療上都是研究的熱點[8-11]。膀胱腫瘤治療方式大部分為外科手術,但是采用何種手術方式,最主要的決策依據就是膀胱鏡檢查結果,對于低級別尿路上皮癌或乳頭狀瘤考慮行經尿道膀胱腫瘤電切術,高級別尿路上皮癌一般建議行新輔助化療聯合根治性膀胱切除術[12-13]。目前膀胱癌免疫治療尤其是以PD1/PDL1免疫檢查點抑制劑開始應用于臨床[14-15]。對于膀胱腫瘤,再行膀胱鏡檢查時有時因為活檢取的標本表淺造成對惡性程度低估,電切后發現實際惡性程度較高,短期內造成腫瘤復發、轉移,給患者及臨床醫師帶來很大困擾。為了盡可能對膀胱腫瘤進行病理分級準確判斷,該研究中引入了卷積神經網絡模型,通過在570個膀胱腫瘤圖像訓練數據集上進行深度學習后進行測試,正確識別膀胱腫瘤病理分級的準確率49%,相比較日本筑波大學學者采用GoogLeNet卷積神經網絡模型對腫瘤的良惡性進行分類的結果并通過ROC曲線對采用卷積神經網絡進行效果評價,在測試數據集中的敏感性為89.7%,特異性為94.0%。造成這種情況的原因首先日本學者均采用最新型號奧林巴斯鏡頭,圖像清晰度明顯優于該研究,其次該研究的測試結果不僅判斷膀胱腫瘤良惡性,還要對惡性程度分級,這就造成該研究的測試數據集準確度低于國外同行。
2012年Krizhevsky等提出的卷積神經網絡AlexNet在ImageNet的訓練集上取得了圖像分類的冠軍,使得卷積神經網絡成為計算機視覺中的重點研究對象。2014年牛津大學提出VGG模型,獲得當年ILSVRC (ImageNet large scale visual recognition challenge)競賽的亞軍[16-17]。由于VGG模型在遷移學習及從圖像中提取CNN特征中的表現要優于冠軍googLeNet,而且VGG模型采用3×3的小卷積核以及2×2的小池化核能夠專注于訓練特征本身,從而大大減少了計算時間和內存需求。
卷積神經網絡在醫學領域尤其是影像學方面廣泛應用,其原因在于圖像數據集獲取相對便利,如臨床中大量使用的CT、MRI以及神經成像和胸腹部成像均可建立數據集,最近有學者嘗試將卷積神經網絡模型應用于前列腺癌的診斷和放療部位的預測,取得良好的效果;國外有學者利用卷積神經網絡模型對胸部CT圖像進行自動分析,對肺炎進行早期、快速診斷[18];對于內鏡診斷方面,日本有學者將CNN模型與67名胃鏡醫師對140例患者2 940張圖像進行了診斷能力比較,發現CNN的敏感性為58.4%,特異性為87.3%,67名胃鏡檢查人員中,分別為31.9%、97.2%,CNN的敏感度明顯高于胃鏡醫師。
該研究的優勢在于不僅能夠區分膀胱腫瘤良惡性,而且能夠對惡性程度進行病理分級,有利于克服主觀因素,由于該研究的測試結果不僅判斷膀胱腫瘤良惡性,還要對惡性程度分級,所以造成該研究的測試數據集準確度低于國外同行,但考慮到卷積神經網絡模型預測結果快速,一般幾分鐘,而包含免疫組化的病理診斷需要3~5 d,這就為臨床醫師手術方案的選擇提供更早的決策,因此對指導臨床有很大意義。然而,這項研究有局限性:首先,卷積神經網絡的訓練數據集一般有百萬級別的圖像供計算機訓練識別,而該研究的訓練樣本數少,而且膀胱鏡下如果出血或尿液混濁,成像質量會受影響,建立的CNN模型可靠性較低,另外在該研究中,用于訓練和測試數據集的只有靜態圖像,如果使用opencv采集視頻圖像可能更有利于提高CNN的診斷識別能力。該文下一步準備擴大樣本量,對膀胱鏡圖像采集盡量建立統一標準,提高圖像清晰度,減少計算機識別中的誤差,另外,該研究針對腎癌、腎盂癌等泌尿外科手術視頻圖像進行研究,采用計算機視覺分析模式,以便更好地增強術者術中判斷識別能力,為術中臨床決策提供依據。
綜上所述,該研究為膀胱腫瘤提供了一種基于卷積神經網絡模型的診斷方法,對膀胱腫瘤病理分級具有一定的準確性,為臨床治療方式的選擇提供依據。