圣文順 孫艷文



摘? 要:隨著醫學成像技術的不斷發展,病理識別在醫學診斷過程中的作用越來越重要。人工智能領域的機器學習可以幫助完成醫學圖像診斷的自動識別,數字化地輔助醫學診斷過程,同時降低醫務工作者的工作量。卷積神經網絡(CNN)是近年發展起來的一種非常有效的機器學習方法,屬于深度學習的范疇,它能夠完整地模擬人類的圖像識別過程,并且已經在圖像識別領域取得了優異的成績。本文將卷積神經網絡應用于病理圖像的識別中,同時對病理圖片進行了采集、整理和智能學習,完成并分析了算法對比實驗,最終實現了對病理圖像的優化識別,提高了病理圖像的識別率,驗證了算法的有效性。
關鍵詞:卷積神經網絡;病理圖像;深度學習;醫學成像
中圖分類號:TP391.4? ? ?文獻標識碼:A
Application of Convolutional Neural Network in Image Recognition
SHENG Wenshun,SUN Yanwen
(Pujiang Institute,Nanjing Tech University,Nanjing 211222,China)
Abstract:With the continuous development of medical imaging technology,pathological identification plays an increasingly important role in the process of medical diagnosis.Machine learning in the field of artificial intelligence can help complete the automatic recognition of medical image diagnosis,digitally assisting the process of medical diagnosis,and reducing the workload of medical workers.Convolutional neural network (CNN) is a very effective machine learning method developed in recent years.It belongs to the category of deep learning.It can completely simulate the human image recognition process,and has achieved excellent results in the field of image recognition.In this paper,the convolutional neural network is applied to the recognition of pathological images.At the same time,the pathological images are collected,sorted and intelligently learned.The comparative experiments of the algorithms are completed and analyzed.Finally,the optimal recognition of pathological images is realized,the recognition rate of pathological images is improved,and the validity of the algorithm is verified.
Keywords:convolution neural network;pathological image;deep learning;medical imaging
1? ?引言(Introduction)
圖像識別技術是人工智能的一個重要領域。在導航、地圖與地形配準、自然資源分析、天氣預報、環境監測、生理病變研究等許多領域有著重要的研究和應用價值。
醫生以前通過自己的肉眼來觀察病人的病理圖像,消耗人力、財力,再加上外界因素的影響,判斷的準確性也會受到影響。隨著計算機的數據吞吐能力與計算能力不斷增長,科研工作者對人類視覺模式的研究不斷深入。依靠高效的算法設計,借助大量數據進行學習訓練,因此將機器學習算法與病理圖像結合成為可能。自從深度學習算法的提出后,給圖像識別帶來了新活力。卷積神經網絡的研究及其在圖像識別領域的應用,就是將卷積神經網絡應用于病理圖像識別[1]中,以期望能夠通過機器學習的方式自動化識別,從而減少病理醫生的任務量,同時為臨床醫生提供更加客觀的分析結果。
2? ?相關理論(Correlated theory)
在圖像識別中,對圖像的處理尤為關鍵。采用深度學習算法[2],可以減少人為因素的影響。卷積神經網絡(Convolutional Neural Network,簡稱CNN)作為深度學習算法的代表之一,結構較為簡單,適用性比較強。在這幾年的發展中,應用范圍較廣,尤其在圖像處理和模式識別中。
圖像識別的常用方法有:貝葉斯分類法、模板匹配法、核方法等。這幾種方法在處理圖像時會帶來不同的麻煩。自引進深度學習算法之后,使復雜的特征提取工作簡單化、抽象化,具有學習速度快、耗時小、識別率高的優點。
3? ?卷積神經網絡原理(CNN principle)
卷積神經網絡是對貓的視覺皮層電生理研究啟發而開始的一個研究,由Hubel和Wiesel最早在實驗中發現。這幾年來,卷積神經網絡作為最重要的網絡模型之一,已經在多個領域被廣泛應用,比如光學字符識別、人臉識別、圖像分類、身份識別、交通標志識別、飛行器圖像識別甚至圖譜特征分析等。
相對于淺層網絡,卷積神經網絡屬于深層結構,其基本組成包括輸入層、卷積層、池化層、全連接層,其中卷積層、池化層、全連接層可以是多個,如圖1所示。
3.1? ?輸入層
卷積神經網絡的輸入層可以直接處理多維數據。它的主要任務是讀取圖像信息,該層的神經元個數與圖像的維度[3]緊密相關。與其他神經網絡算法類似,卷積神經網絡的輸入特征需要進行標準化處理。輸入特征的標準化可以提高算法的運行效率和學習表現。
3.2? ?卷積層
卷積層在卷積神經網絡中用于特征提取。由于卷積神經網絡是通過每次對圖像中的一個特征首先進行局部感知,然后更高層次地對局部特征進行綜合的操作,從而得到想要的全局信息。卷積神經網絡中的卷積層是由多個卷積單元組成的,目的就是為了實現卷積操作。
同時為了提高計算效率,卷積神經網絡引入了局部感知和參數共享兩個操作。
(1)局部感知
局部感知就是網絡的部分連通。每個神經元只與上一層的部分神經元相連,只感知局部,而不是整幅圖像。局部像素關系密切,較遠像素相關性弱。因此只需要局部感知,在更高層將局部信息綜合起來就得到了全局的信息。
(2)權值共享
權值共享[5]即是從一個局部區域學習到的信息,應用到圖像的其他地方去。即用一個相同的卷積核去卷積整幅圖像,相當于對圖像做一個全圖濾波。一個卷積核對應的特征比如邊緣,那么用該卷積核去對圖像做全圖濾波,即使將圖像各個位置的邊緣都濾出來。不同的特征靠不同的卷積核實現。
3.3? ?池化層
對輸入的特征圖進行壓縮,一方面使特征圖變小,簡化網絡計算復雜度;一方面進行特征壓縮,提取主要特征。在某些方面,比如:平移、旋轉、尺度,可以保持某種特征不變。常用的有mean-pooling和max-pooling。池化層的輸入來源于卷積層,該操作即可減少數據量,同時也能保留有效信息,減少計算時間。
例如對一小塊取最大值,假設pooling的窗大小為2×2的,如果對不重疊的4個2×2區域分別max-pooling,則運算過程如圖3所示。
3.4? ?全連接層
在CNN結構中,經過多個卷積層和池化層后,連接著1個或1個以上的全鏈接層。全連接層中的每個神經元與其前一層的所有神經元進行全連接。全連接層可以整合卷積層或者池化層具有類別區分性的局部信息。全連接層是連接所有特征,將輸出值送給分類器[6](如softmax分類器),如圖4所示。
其中,x1、x2、x3為全連接層的輸入,a1、a2、a3為輸出,則全連接層的核心運算就是矩陣向量乘積:
a1=W11*x1+W12*x2+W13*x3+b1? ? ? ? ?(2)
a2=W21*x1+W22*x2+W23*x3+b2? ? ? ? ?(3)
a3=W31*x1+W32*x2+W33*x3+b3? ? ? ? ?(4)
4? ?實驗數據分析(Experimental data analysis)
4.1? ?實驗數據
在進行此次實驗前,為了有一個標準的訓練及檢測數據集,且本實驗的應用背景是將深度學習算法應用于病理醫學中,所以提前在醫院完成了采集甲狀腺淋巴結轉移癌癥病理樣本工作。全部圖像為全掃描文件,全部數據都為顯微鏡下40倍數據,并且將樣本分為正常和癌變細胞兩類。如圖5和圖6所示。
本文運用卷積神經網絡的算法,實現圖像的識別。在處理過程中,通過讀取圖片、樣本隨機分配、網絡設計、訓練和驗證四個步驟實現該算法。
pool4=tf.layers.max_pooling2d(inputs=conv4,pool_size=[2,2],strides=2)
re1=tf.reshape(pool4,[-1,6*6*128])
dense1=tf.layers.dense(inputs=re1,units=1024,activation=tf.nn.relu,
kernel_initializer=tf.truncated_normal_initializer(stddev=0.01),
kernel_regularizer=tf.contrib.layers.l2_regularizer(0.003))
dense2=tf.layers.dense(inputs=dense1,units=512,activation=tf.nn.relu,
kernel_initializer=tf.truncated_normal_initializer(stddev=0.01),kernel_regularizer=tf.contrib.layers.l2_regularizer(0.003))
logits=tf.layers.dense(inputs=dense2,units=2,activation=None,
kernel_initializer=tf.truncated_normal_initializer(stddev=0.01),kernel_regularizer=tf.contrib.layers.l2_regularizer(0.003))
4.2? ?數據結果與分析
本次實驗的實驗環境為Ubuntu系統[7]+TensorFlow+
python3.6+Anaconda+spyder,為了體現卷積神經網絡的有效性,所以引用了同為深度學習算法的深度置信網絡算法(DBN)進行了對比試驗。在實驗中,兩種算法的層數一致,并分別做了10次實驗取平均值作為實驗結果,如表1所示。
通過對比實驗,可以看出卷積神經網絡的識別性能高于深度置信網絡算法,顯示了算法的優越性。因此采用卷積神經網絡算法應用于病理醫學的圖像處理中。
5? ?結論(Conclusion)
在此次實驗中,運用卷積神經網絡在圖像中的識別功能,對病理醫學圖像進行有效的處理。通過研究表明,只要通過大量的數據學習訓練,卷積神經網絡對病理圖像的識別效率高,準確度高。
本文針對病理醫學圖像處理效率過低,采用了卷積神經網絡進行病理特征的判斷,且準確率與效率高于傳統方法的平均準確率和平均效率。本文對卷積神經網絡的原理進行了深入的研究,對網絡的參數進行了深刻的學習,并將其應用于甲狀腺的病理圖像識別中。由于時間有限,本文只是完成了卷積神經網絡的基礎研究,后續期望能夠對卷積神經網絡進行改進,并能夠進一步提高網絡的識別率。
參考文獻(References)
[1] 薛迪秀.基于卷積神經網絡的醫學圖像癌變識別研究[D].合肥:中國科學技術大學,2017.
[2] 蔣濤.深度學習在醫學圖像分析中的應用[D].成都:電子科技大學,2017.
[3] 魏存超.基于卷積神經網絡的醫學圖像分類的研究[D].哈爾濱:哈爾濱工業大學,2017.
[4] H Chen,Q Dou,X Wang.Mitosis Detection in Breast Cancer Histology Images via Deep Cascaded Networks[C].Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence 2016:1160-1166.
[5] Janowczyk A,Doyle S,Gilmore H,et al.A resolution adaptive deep hierarchical learning scheme applied to nuclear segmentation of digital pathology images[J].Computer Methods in Biomechanics and Biomedical Engineering:Imaging & Visualization,2016:1-7.
[6] Janowczyk A,Madabhushi A.Deep learning for digital pathology image analysis:A comprehensive tutorial with selected use cases[J].Journal of Pathology Informatics,2016,7(1):29.
[7] 李雪燕.緊耦合Ubuntu系統的衛星導航接收機設計[D].石家莊:河北科技大學,2016.