朱婷婷,李春芳
(中南民族大學 電子信息工程學院,湖北 武漢 430074)
圖像重建是光學CT技術的核心內容。在CT應用中,先是已知待測圖像在幾個方向上的投影,然后由這些投影數據重建出該圖像。常用的算法主要有代數迭代法(ART)、濾波反投影(FBP)、最大熵法等。這些算法在投影數據比較多的情況下重建結果還比較理想,但在投影方向受限(如4~5個)的情況下,重建精度就很低[1,2]。
針對稀疏視角不完全投影圖像重建的特點和難點,本文利用神經網絡具有處理高維高度非線性和不確定問題的優勢,提出了一種基于神經網絡的圖像重建方法。該方法充分利用神經網絡具有強大的自適應學習和聯想綜合能力,故而可以實現所需的由已知投影值的視角區域到未知視角區域的彌補[3],并且選用最簡單的神經網絡結構和有效的學習樣本,從而在有限的條件下更有效地重建出高質量的圖像。
在各類神經網絡中,BP神經網絡是一種算法成熟且易于實現的網絡類型。本文選用三層神經網絡,即包含輸入層、隱含層和輸出層。
其中,輸入層和輸出層分別對應原始圖像和重建圖像的投影數據,神經元的個數為投影數據的個數。隱含層代表重建圖像,神經元的個數為重建圖像像素的個數[4]。在網絡訓練過程中,輸入層至隱含層的權值W隨誤差的反向傳播不斷調整,隱含層至輸出層的權值M在網絡訓練前事先初始化,并保持不變。根據CT圖像重建理論,隱含層和輸出層神經元之間的權值即為第i條投影射線穿過第j個像素的長度ri,j,故權值矩陣M即為投影系數矩陣R。筆者采用文獻[5]新方法求取投影系數矩陣,從而確定權值矩陣M。
2.2.1 改進Sigmoid函數
在確定網絡的訓練數據和拓撲結構之后,總的誤差函數E就由傳遞函數f給定,因此Sigmoid函數用于梯度學習,對于網絡收斂具有十分重要的意義。實驗表明:標準形式的Sigmoid函數不利于網絡的收斂。為了解決這個問題,采用以下形式的Sigmoid函數[6]:

其中,β的作用是調節Sigmoid函數的形狀。較大的β值使Sigmoid函數逼近線性閾值函數,而較小的β值將導致一個變化較為平坦的Sigmoid函數。在相同的初始條件下,通過調整β值,可尋求一個最佳形狀的Sigmoid函數,使網絡的學習次數達到最小。
經過多次選取不同的β值實驗,發現當β取較大值(大于0.1)時,網絡趨向于產生輸出的分類,收斂效果很不好,重建圖像誤差很大;當β取較小值時,網絡收斂效果較好,重建圖像誤差大大減小。通過對比選取不同β值的重建效果,本文最終選定β=0.045。
2.2.2 在線調整學習速率
對于一個特定的問題,要選擇適當的學習速率不是件容易的事情,通常是憑借經驗或實驗獲取。況且,對訓練初期效果好的學習速率,并不一定就對后來的訓練合適,故最佳方法是能根據訓練的需要自動調整學習速率的大小。即當誤差降低時,可適當增大學習速率,加速網絡收斂,如誤差增大,說明產生了過調,就應當減小學習速率。下式給出了一種在線自適應調整學習速率的經驗公式,其中,lr為學習速率,E為均方誤差:

學習速率對收斂速度的影響很大,通過對它的在線調整,可以大大提高收斂速度。
令ai為輸入層第i個神經元的輸出,Wji為神經元i與神經元j之間的連接權值,則隱含層神經元j的輸出yj為:

uj為隱含層第j個神經元的輸入。則輸出層第k個神經元的輸出為:

BP算法的基本原理是采用梯度下降法使權值的改變總是朝著誤差減小的方向,最終達到最小誤差。則輸入層與隱含層之間的權值修正公式為[7]:

(1)初始化網絡連接權值。計算投影系數矩陣R,確定隱含層和輸出層之間的連接權值,并將輸入層和隱含層之間的權值初始化為(0,1)之間的隨機數。
(2)確定網絡輸入和輸出。將原始圖像在確定角度下的投影數據作為網絡輸入,網絡輸出數據和輸入數據相同。
(3)計算隱含層輸出。根據Sigmoid傳遞函數計算隱含層每個神經元的輸出。
(4)計算輸出層實際輸出。根據已確定的權值計算輸出層的實際輸出。
(5)計算誤差,調整權值。利用式(8)調整權值的大小。
(6)判斷網絡訓練終止條件。當誤差小于預設精度或學習次數達到設定的最大次數時,算法終止,否則返回第3步,進入下一輪學習。
本文選擇Sheep-Logan模型并使用 Matlab7.8.0編程進行計算機模擬重建。待重建圖像大小為20×20,采用5個角度方向上的投影(9°,45°,81°,117°,153°),分別利用改進前后的BP神經網絡對模型進行重建,重建結果如圖1所示。
通過仿真結果發現,傳遞函數對網絡的收斂有很大的影響,通過在線調整學習速率雖然增加了網絡的運算量,但仍能有效地加快網絡收斂,提高收斂精度。如表1所示,其中,和eave和emax分別表示重建圖像的平均誤差和最大誤差,t表示網絡收斂時間。由圖1可以看出,網絡改進后,圖像的重建精度有了很大提高。

表1 不同情況下圖像重建結果

圖1 實驗結果
圖像重建是光學CT技術的核心內容,重建圖像質量和重建時間是圖像重建的關鍵要素。本文利用BP神經網絡實現了對不完全投影數據的圖像重建,并通過對神經網絡進行改進,顯著縮短了重建時間,提高了重建精度。因此,本文提出的方法對于不完全投影數據重建提供了一個有效的解決方案。后續可以繼續對重建圖像做進一步處理,如進行分塊重建、重建后加中值濾波等。另外,對BP神經網絡的改進可以從不同的角度出發,本文只做了部分改進,今后的研究可以朝著進一步改進神經網絡的方向進行。
[1]Nakao Z,Chen Yenwei,Kina Y.ART estimation of color images from projections[C].Joint Technical Conference on Circuits/Systems,Computers and Communications.Kumamoto,1995:217~220.
[2]孫毅剛,魏立新,張紅穎.基于神經網絡的CT圖像重建方法研究[J].中國民航大學學報,2009,27(1):1~3.
[3]Paschalis P,Giokaris N D,Karabarbounis A,et al.Tomographic image reconstruction using Artificial Neural Networks[J].Nuclear Instruments and Methods in Physics Research Section A,2004,527(1):211~215.
[4]Ohkawa I,Nakao Z,Chen Yenwei,Tobaru S.Reconstruction of CT Images by the Back-Propagation Algorithm[C].Second International Conference on Knowledge-Based Intelligent Electronic Systems.Adelaide,Australia,1998:150~154.
[5]周 林,李春芳,陳方強.一種改進的光學CT掃描測量方法[J].計算機工程與應用,2008,44(28):193~194.
[6]吳小培,費勤云.一種提高BP算法學習速度的有效途徑[J].安徽大學學報:自然科學版,1998,22(3):64~67.
[7]Nakao Z,Ali F E A F,Chen Yenwei.CT image reconstruction byback propagation[C].First International Conference on Knowledge-Based Intelligent Electronic Systems.Adelaide,Australia,1997.