盧潁霞, 王如彬
(上海華東理工大學 認知神經動力研究所, 上海 200237)
稀疏性是一個令人感興趣的內容,部分是因為它為后期的處理提供一個簡單的編碼。早期雖然有皮層稀疏編碼(對于作用于同一刺激的神經元集群來說,并不是所有的神經元都被激活,只有少數神經元被激活)的實驗結果[1-6],但同時也有許多神經元同時發放的實驗[8]。
所以沒有一個絕對的標準去評價皮層神經元的相對稀疏性。神經生理研究已表明:初級視皮層中單個神經元僅對處于其感受野中的刺激作出反應,其空間感受野被描述為具有局部性、方向性和帶通特性的信號編碼濾波器。而每個神經元對這些刺激的表達則采用了稀疏編碼原則,將圖像在邊緣,端點,條紋等方面的特性以稀疏編碼的形式進行描述。
自然圖像的稀疏編碼算法能夠準確預測視皮層神經元的特點,從而我們可以通過計算自然圖像的稀疏表達來研究V1區簡單細胞的感受野。Olshausen等[9-10]建立了一些自然圖像的稀疏編碼模型,但缺點是缺乏局部突觸可塑性的生理學依據,無法全面的說明初級視皮層V1區神經細胞采用稀疏編碼的形式來有效表示自然場景。
生物神經網絡中存在一種競爭現象,即一個神經細胞興奮后,通過它的分支會抑制周圍其它細胞的發放,這種抑制作用使細胞之間出現競爭。模型表明由于競爭學習,齒狀回的發放活動是稀疏的,但是該模型沒有研究競爭學習對V1區簡單細胞發放活動的影響[11]。
STDP(Spike Trigger Dependent Plastic)是一個簡單有效的學習規則[13-14],并且在我們大腦神經元的連接方式的改變中扮演著重要的角色[12]。STDP是一個突觸學習規則,只與突觸前神經和突觸后神經有關,突觸前神經元和突觸后神經元之間的動作電位的相對時間決定了突觸可塑性的強度。最近Clopath等[15]利用了STDP的一種形式,但是沒有發現和V1區類似的Gabor類感受野。Rehn等[16]建立的SSC(Sparse-Set Coding)模型,雖然通過STDP和發放神經元來研究V1區簡單細胞的感受野,但沒有進一步討論網絡中細胞數量對網絡稀疏表達的影響,而在大多數神經網絡中,興奮細胞和抑制細胞的數量比約為4∶1[19]。
為了改進以上模型,我們利用STDP的一種學習規則,基于局部競爭的生理學現象建立了一個整合發放LIF(Leaky Intergate-and-Fire)的神經網絡動力學模型。通過我們的模型得到了和獼猴V1區簡單細胞類似的Gabor類感受野,并且利用細胞脈沖光柵圖給出了細胞在不同時間步的稀疏發放活動。由于在大多數神經網絡中,興奮性細胞和抑制性細胞的數量比約為4∶1,從而我們考慮了不同數量的興奮性細胞和抑制性細胞對網絡稀疏表達的影響,發現由于細胞間的競爭學習,隨著細胞數量的增加,細胞的抑制連接權重增加。模型中細胞的脈沖輸出構成了圖像的稀疏表示,并且利用它們的線性組合可以實現圖像重構,通過對重構殘差的討論,發現在細胞數量比為4∶1的情況下,可以利用較少的細胞實現圖像重構。
首先介紹一下簡化的整合發放神經元的電路圖(見圖1),其中Iinput代表輸入電流,電容器模擬膜電壓,當電壓超過閾值θi時,二極管打開,發放一個脈沖或動作電位,R模擬膜電阻,Vout模擬輸出。

圖1 簡化的整合發放神經元的電路圖Fig.1 Diagram of simplified integration of neurons
我們的模型由156個興奮性細胞和40個抑制性細胞兩部分組成,其中細胞之間是全連接,所有的細胞接收自然場景的白化的10×10像素(每個圖像塊)的圖像(Olshausen, Field, 1996)輸入,這些細胞的脈沖輸出構成圖像的稀疏表示,見圖2。


圖2 新的整合發放神經元網絡模型Fig.2 New integrated release of the neural network model
對于每個時間步t,每個神經元i的狀態按下面的規則變化:
(1)



式中:p(c)表示c類神經元的目標平均發放率,對于每個時間單位p(E)=0.02,p(I)=0.04,τ(E)=1,τ(I)=0.5。
興奮性細胞和抑制性細胞的權重變化依據赫布可塑性規則[23]。圖像對于細胞的權重變化W(in→E/I)根據赫布規則“HO(Hebbian-Oja)”,興奮性細胞對興奮性細胞W(E→E)和興奮性細胞對抑制性細胞W(E→I)的權重變化根據相關度準則“CM(Correlation Measuring)”,即:

方程中xj代表突觸前神經元j的發放率,yi代表突觸后神經元i的發放率。
當10 000個訓練樣本的權重的RMS不再下降即ΔWij=0,網絡達到平衡狀態:
式中:nj和mk分別代表興奮性細胞j和抑制性細胞k關于短時間窗Δt的輸出脈沖。
利用我們的模型不僅可以得到V1區簡單細胞的稀疏編碼以及細胞數量對網絡稀疏表達的影響,而且討論了興奮性細胞和抑制性細胞的數量對重構殘差的影響。
在推理階段,LIF神經元接收外界白化的圖像刺激,這個時期網絡的細胞脈沖輸出構成圖像的稀疏表示,該階段的推理主要通過脈沖進行,當神經元發放一個脈沖時,在下個時間步,它抑制或興奮突觸后神經元。在學習階段,神經元權重的更新主要是根據相關度準則(CM),只跟突觸前神經元和突觸后神經元的發放活動有關。
圖3(a)是獼猴的感受野[24],圖3(b)是我們得到的156個興奮性細胞的感受野,每個方塊代表一個神經元的感受野,其中灰色代表零,亮色代表正值,暗色代表負值,從圖中可以看出,模型得到的簡單細胞的感受野和獼猴初級視皮層簡單細胞的感受野類似(見附錄),具有空間局部性,方向性和頻域的帶通性。

圖3 我們的模型得到的初級視皮層簡單細胞的感受野和獼猴初級視皮層簡單細胞的感受野Fig.3 Our model obtained by the primary visual cortex of simple cells of the receptive field and the rhesus monkey primary visual cortex of simple cells of the receptive field
當網絡的所有細胞接收同一ZCA白化的自然圖像的輸入時,神經元的發放活動由圖4給出,從圖中我們可以看到并不是所有的細胞在任何時間都是發放的即細胞的發放是稀疏的。

圖4 細胞脈沖光柵圖。圖中的每一行都表示不同的細胞IDFig.4 Cell pulse grating. Each row in the figure represents a different cell ID, green indicates excitatory cells, and red indicates inhibition of cells
細胞的脈沖輸出構成了圖像的稀疏表示,并且利用它們的線性組合可以實現圖像的重構,圖5(a),從Olshausen和Field中選取的圖像,圖5(b),模型得到的以(a)作為輸入的重構圖像,可以看出我們得到的重構圖像和原圖像類似。

圖5 模型得到的細胞的發放活動可以實現網絡的圖像重構Fig.5 Model of the cell release activities can be achieved on the network image reconstruction
由于在大多數神經網絡中,興奮性細胞和抑制性細胞的數量比約為4∶1,從而我們考慮了不同數量的興奮性細胞和抑制性細胞對網絡稀疏表達的影響。圖6(a),對于10×10的圖像塊輸入,改變興奮性細胞和抑制性細胞的數量時,重構誤差的變化。從圖(b)中可以看出增加興奮性細胞,重構誤差是先減小后增大,并且繼續增加細胞的數量時,誤差沒有出現減少的現象。圖6(b),改變興奮性細胞和抑制性細胞數量時,細胞抑制連接權重的變化,發現由于細胞間的競爭學習,隨著細胞數量的增加,細胞的抑制連接權重增加,其結果具有一定的生理學依據,即細胞之間的競爭學習能夠抑制V1區細胞的發放,進而增加了細胞的稀疏性質。
我們的模型主要是通過細胞之間的競爭學習形成稀疏編碼。圖6(a)給出了不同數量的興奮性細胞和抑制性細胞對重構誤差和細胞抑制連接權重的影響。當興奮性細胞為156個,抑制細胞為40個時(此時興奮性細胞和抑制性細胞的比例大約為4∶1),圖像的重構誤差達到最小。圖6(c)是繼續增加細胞的數量時,抑制性細胞開始出現冗余的現象(粗實線標出)。從圖6(b),我們可以看出發現由于細胞間的競爭學習,隨著細胞數量的增加,細胞的抑制連接權重增加。

圖6改變興奮性細胞和抑制性細胞的數量時,重構誤差,細胞抑制連接權重和抑制細胞感受野的變化Fig.6 When changing the number of excitatory and inhibitory cells, changes in the reconstructed errors, the cell-dependent link weights, the plots of the RF of the I cells
圖7給出了模型的網絡動力學行為,粗實線代表細胞的抑制反饋,細實線代表細胞的發放率,水平虛線代表平均值。網絡接收圖像輸入(橫坐標表示網絡輸入),當達到閾值時,細胞開始發放(細實線),此時細胞之間的抑制作用增加(粗實線)。從圖中可以看出,只有達到一定閾值時,細胞才開始發放。其中對于細胞的圖像輸入形成高斯分布(虛線)。

圖7 網絡動力學Fig.7 Network dynamics
本文利用細胞之間的競爭學習,使網絡的動力學行為表達在性質上具有稀疏性。
結論如下:
(1) 首先通過Matlab仿真得到了和獼猴初級視皮層簡單細胞類似的Gabor類感受野,并且利用細胞脈沖光柵圖給出了細胞在不同時間步的稀疏發放活動。
(2)其次討論了不同數量的興奮性細胞和抑制性細胞對網絡稀疏表達的影響,發現由于細胞間的競爭學習,隨著細胞數量的增加,細胞的抑制連接權重增加,即細胞之間的競爭學習能夠抑制V1區細胞的發放,進而增加了細胞的稀疏性質[20]。
(3)最后通過稀疏重構系數,討論了不同數量的興奮性細胞和抑制性細胞對重構殘差的影響,發現我們可以利用較少的細胞數量實現圖像的重構。此時興奮性細胞和抑制性細胞的比例接近4∶1。
我們模型中權重的變化不同于以前的模型[26-28],它依據突觸可塑性準則,只與到達當前突觸的脈沖數和突觸后神經元生成的脈沖數有關。盡管模型比較簡單,但是利用該模型可以發現V1區神經元的許多特點,例如細胞的競爭學習、神經元的稀疏發放、突觸可塑性。我們希望這些發現可以幫助揭示視皮層的一些編碼準則。