基于卷積神經網絡的眼球血絲診斷

2016-05-14 21:31:20吳聰黃中勇殷浩劉罡

軟件導刊 2016年5期

吳聰黃中勇殷浩劉罡

摘要：卷積神經網絡在圖像識別方面性能出眾，其特有的多層感知器可以提取多類圖片的隱式特征。提出一種基于卷積神經網絡的眼球血絲診斷方法：將3類共1 500幅分辨率為32×32的眼球血絲圖都轉換成1 500組數值矩陣，1 200組作為訓練集輸入網絡訓練，300組作為驗證集進行測試。實驗表明，該應用算法可達到93.19%的訓練準確率和87.57%的測試準確率。

關鍵詞：卷積神經網絡；共享權值；眼球血絲診斷

DOIDOI：10.11907/rjdk.1511613

中圖分類號：TP319

文獻標識碼：A 文章編號：1672-7800（2016）005-0140-03

0 引言

目前，眼球血絲診斷主要依靠人工完成，不僅耗時費力，也會因醫生經驗不足導致誤診情況發生。如今許多醫生都會結合數字化的診斷系統來進行病情診斷、分析并給出結果，然而眼球血絲診斷數字化尚處于發展期，沒有進入實際應用。眼球血絲診斷的數字化研究有著良好的應用前景，不僅可以為臨床診斷提供客觀標準，也可以為建立中醫遠程診斷系統發揮作用[1]。病人可以用特定的設備拍攝自己眼部圖像，再通過網絡傳遞給數據中心進行處理而得出結果；醫生可以借助診療輔助軟件，極大地減輕自己的工作負擔，提高醫療效率。

由于眼球血絲形狀千變萬化，加之取圖設備和操作環境的不同，故圖片難以分類研究。鑒于卷積神經網絡[2]（Convolutional Neural Network，CNN）對復雜的幾何形變具有較強的不變性且對圖像處理只需較小的計算代價等優點，本文提出了一種基于CNN的眼球血絲診斷方法，克服了傳統的診斷需要進行人工提取分類特征的缺點，將原始圖像轉變為數據作為輸入，進而學習相應特征并實現精確分類。

1 理論依據

1.1 卷積神經網絡

卷積神經網絡歸屬于人工神經網絡，是接近于實際的生物神經網絡系統，有輸入層、卷積層、下采樣層、全連接層和特征輸出[3]，整體結構如圖1所示。CNN的輸入層可直接接收如二維圖像的二維視覺模式，可不需要過多的人為參與去計算原始圖像的合適特征，自動從輸入數據中提取特征和分類學習。實際應用中，輸入層數據較為靈活，可為如彩色圖像的多通道圖像或者直接為圖像的灰度值。

卷積層與下采樣層同屬于中間層。其中卷積層為特征抽取層，每層中含有多個卷積神經元（稱為C元）；下采樣層為特征映射層，每層中可含有多個抽樣神經元（稱為S元）。卷積層和下采樣層中每個神經元的輸入與前一層的相應區域連接，檢測出相應區域特征后將特征的相應位置傳輸于下一層。CNN可以設定多層卷積層和下采樣層，卷積層擁有多個特征平面，每個平面都由共享相同連接權值的神經元組成，并且神經元只接受對應感受野所傳遞的信號。因為輸入樣本在卷積層中進行特征提取并得到高維特征映射，但此映射不可直接作為CNN最后輸出的分類特征，因此要在下采樣層進行降維。下采樣層上的每一個神經元也和卷積層相似，是共享相同連接權重的。相對于卷積層的神經元數目，由于下采樣層是對上一卷積層相應的感受進行取均值、最值等操作，因而下采樣層所需的神經元數目大量減少。全連接層可充分挖掘輸出類別標簽和網絡最后抽取特征之間的映射關系，可連接對應問題的分類數目。CNN通過共享權值大幅縮少了需要訓練的權值數量，進而對訓練樣本的需求大大減少。文獻[4]和[5]更加詳細地介紹了卷積神經網絡。

卷積神經網絡作為圖像識別領域的研究方向，已成為研究者們關注的重點。在一些領域，如模式分類，CNN優勢非常明顯。該算法可以使原始圖像簡單處理后直接輸入，避免了繁雜的圖像預處理。最初提出CNN的是Hubel和Wiesel[6]，他們在對動物腦皮層進行研究后，發現了可以有效降低反饋神經網絡復雜性的結構，故而提出卷積神經網絡。而第一個實現神經網絡的是K.Fukushima在1980年提出的新識別機。之后，該網絡得到更多研究者的改進。2012年Dan Ciresan在Yann LeCun、Sven Behnke、Patrice Simard等學者的研究基礎上，使卷積神經網絡識別多個圖像數據得到進一步的改良發展。目前，卷積神經網絡發展非常迅速，孫曄等[7]利用卷積神經網絡開發出了一種車標識別的方法；賈世杰等[8]將CNN應用于商品圖像精細分類；呂剛[9]在對Simard網絡加以改進后，大大提高了CNN多字體字符識別成功率；Jiang Qing-Ling[10]的基于CNN彩色圖像邊緣檢測優于傳統檢測方法。

1.2 眼球血絲與疾病

眼球血絲與人體疾病有著非常大的關系，血絲的顏色、走向等對應著人體某個部位的病變程度，身體部位的疾病在眼球相應位置上都有反應[11]，如圖2所示為典型的習慣性便秘眼血絲圖。宋寧[12]在診斷慢性胃炎時發現，97.43%的慢性胃炎有兩眼出現血絲脈絡粗大，呈深紅等癥狀。李珪等[13]發現89.4%的高血壓病人眼球血絲脈絡根部增粗、彎曲成螺旋狀。龔梅芳[14]發現頭痛患者眼球血絲微血管分布紊亂，血管周圍有滲出或水腫現象。

由于眼球血絲沒有皮膚遮蓋，最能直接反應人體內臟患病情況，所以一般無假象。醫生通過觀察可以知道身體情況和變化，從而進行疾病的診斷和治療。傳統中醫可以利用影像醫學技術成果，使歷史悠久的臨床醫學技術實現現代化發展。在這一趨勢下，基于卷積神經網絡的眼球血絲診斷具有一定意義。

2 實驗分析

基于CNN的眼球血絲診斷是指輸入病人的眼球圖像來確定所患病癥的過程。它在醫療輔助和醫療自動化等領域都有著非常大的實用價值，而且是CNN和模式識別等領域的關注課題。由于眼球的特殊性，例如性別、人種、年齡的不同，或者有受傷、手術等不確定因素，以及眼球成像的曝光、聚焦等問題，基于卷積神經網絡的眼球血絲診斷依然具有較高的挑戰性。

2.1 算法將卷積神經網絡應用于眼球血絲診斷識別的方法是本文著重介紹的內容。CNN具有能提取表征力強參數的優點，故應用于血絲病癥的識別是個較好的選擇，具體步驟與算法如下：

對于輸入層樣本，每幅眼球血絲圖像都經初步處理（見圖3）：首先分割出具有明顯反映病癥特征的血絲所在區域，統一設定為32×32大小，再將分割出的血絲圖進行灰度化處理，最終將每幅灰度圖“數值化”處理為一個32×32的二維矩陣（“數值化”操作是對每幅灰度圖共計1 024個像素分別除255.000而得出的數值）。

CNN通過結構上的局部連接、共享權值和下采樣等，不僅網絡規模控制得很好，而且特征能準確識別。如圖4所示，對于眼球血絲識別任務，首先獲取輸入眼球血絲圖像的局部特征，再將這些特征做多輪迭代處理以獲取更高級的特征，這樣最終的特征被處理成一個一維向量，該向量就是眼球血絲圖像的表征，本文正是用此表征來有訓練CNN。

2.2 實驗

從醫院獲取3類眼球血絲圖，包括胃病癥、肺疾病和腸雜病這3類；初步分割處理后得到全部血絲圖共1 500張（圖5展示了部分血絲），經過灰度化處理，并“數值化”成1 500組二維數組，其中1 200組為訓練組，300組為測試組。繼而將訓練組和測試組全部輸入到網絡中運行，同時進行訓練和測試。關于程序的主要函數、函數參數及說明如表2所示。

卷積神經網絡的權值是經過梯度下降運算得出，通過多次迭代運算繼而得到理想參數。由表3分析可知，在迭代次數較少時，神經網絡學習不夠充分，訓練所得模型不理想，因此測試準確率較低。當迭代次數達到一定程度時，網絡參數得到充分訓練，測試準確率上升到一個定值。然而，隨著迭代次數的繼續增加，測試準確率反而下降。

3 結語

本文將卷積神經網絡應用于眼球血絲診斷，通過對網絡的持續訓練，找到眼球血絲圖的最優參數，進而將參數應用于病癥識別。在提升效率上，優先對圖進行處理——將圖轉換成數值矩陣，這樣可大大減少網絡訓練時間，整個算法的訓練準確率達93.19%，測試準確率達87.57%。但本文所提出的方法也存在一些不足：分類的病癥稍少，針對更多種類的病癥診斷尚有待研究，因此眼球血絲圖還需完善，數量和種類也需豐富。

參考文獻：

[1]朱貴冬.中醫“望目辨證”的數字化技術研究[D].北京：中國科學院研究生院，2006.

[2]ZEILER M D，FERGUS R.Visualizing and understanding convolutional neural networks[J].Arxiv Preprint Arxiv，2013（24）：818-833.

[3]謝劍斌，興軍亮，張立寧，等.視覺機器學習20講[M].北京：清華大學出版社，2015.

[4]LECUN Y，BOTTOU L，BENGIO Y，et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE，1998，86（11）：2278-2324.

[5]LAWRENCE S，GILES C L，TSOI A C，et al.Face recognition：a convolutional neural-network approach[J].Neural Networks，IEEE Transactions on，1997，8（1）：98-113.

[6]HUBEL D H，WIESEL T N.Receptive fields of single neurones in the cat's striate cortex[J].The Journal of Physiology，1959，148（3）：574-591.

[7]孫曄，吳銳文.基于卷積神經網絡的車標識別[J].現代計算機，2015，503（11）：84-87.

[8]賈世杰，楊東坡，劉金環.基于卷積神經網絡的商品圖像精細分類[J].山東科技大學學報，2014，33（6）：91-95.

[9]呂剛.基于卷積神經網絡的多字體字符識別[J].浙江師范大學學報：自然科學版，2011，34（4）：425-428.

[10]JIANG QING-LING.Edge detection for color image based on CNN[J].Engineering Village，2015，2（1）：11-12.

[11]宋寧.壯醫目診診斷慢性胃炎350例觀察[J].云南中醫學院學報，2006（S1）：92-93.

[12]李珪，黃莉.高血壓病在壯醫目診的征象觀察[J].中國民族醫藥雜志，2007（4）：65.

[13]龔梅芳，鄒季，胡世芬，等.84例頭痛患者球結膜微循環和甲襞微循環研究[J].中國微循環，2002，6（4）：230-231.

[14]王今覺.望目辨證診斷學[M].北京：中國中醫藥出版社，2013.

（責任編輯：孫娟）

軟件導刊2016年5期

軟件導刊的其它文章: 基于Big6模式的微課移動學習系統設計; 微課在C語言公共課中的應用; 微課資源開發及應用探究; 大數據環境下《管理信息系統》課程國際化教學研究; 基于Kolb學習風格的微課內容風格化設計; 微課程本土化發展及棋盤式微課程教學法研究