管彩霞,胡 楊,錢宜剛,沈海平
(復旦大學工程與應用技術研究院超越照明研究所,上海 200438)
在照明領域,國際照明委員會(CIE)于20世紀20年代基于對多名觀察者心理物理學實驗結果所建立起來的光度學體系一直沿用至今,心理物理學實驗也是至今照明研究最常用的方法。但是,經常出現的一個問題是,其研究結果往往只適用于其開展實驗的特定照明應用場景,通用性不強,比如室內眩光模型UGR不適用于戶外眩光評價,閾值增量TI也不合適對室內眩光進行評估。
生理學和神經科學的發展使得人類對自身的認識越來越深入,隨著人眼視覺神經通路及視覺形成機制的深入研究,視覺計算模型逐漸成為研究熱點,并在圖像處理、機器視覺等領域得到應用。視網膜層是人類視覺信息獲取和處理的第一步也是最重要的一步,視覺系統的許多功能都在視網膜層上實現,例如視錐細胞和視桿細胞對亮度的適應[1-3],降噪、顏色識別[4, 5]、視覺信息壓縮[6]和對比度增強等,因此視覺計算模型研究一般多集中在視網膜層面,本文研究也是針對視網膜視覺功能形成機制的建模。
視網膜模型可以很好地描述人眼的整個視覺感知過程,不僅有助于人們從機理層認識和理解人眼視覺的形成機制,而且對各種光環境都適用,因此對照明研究提供了一種全新的研究方法和思路,具有極高的研究價值。已經有部分科學家開始采用視網膜模型來進行光度學研究[7, 8],但其模型仍存在與心理物理學實驗結果偏差較大的問題。
本文擬建立一套更高精度的用于光度學計算的視網膜模型,可對視網膜上的視覺形成過程進行理論模擬。該過程涉及視錐細胞和視桿細胞響應的自適應、時空處理、雙極細胞的增益控制等。即使在具有不同特點的照明應用場景,模型也能很好地描述人眼的視覺感知反應。對該模型的研究不僅有利于更好地了解人類視覺感知的形成機理,填補照明應用研究中的理論空白,而且對今后的照明應用和測試研究同樣具有重要價值。
在對視網膜進行建模之前我們必須首先了解視網膜的細胞結構,尤其是視覺信號的傳輸通路,如圖1所示。視網膜是一種分層的神經結構[9],它將光線輸入首先轉換成電信號,然后將電信號逐層進行處理并最終通過神經傳送到大腦皮層。
圖1 視網膜的層狀結構Fig.1 Bedded structure of the retina
實現光電轉換的細胞是視錐細胞和視桿細胞。視錐細胞分為三種類型:L錐對可見光譜的紅色部分敏感(長波長),M錐對綠色部分敏感(中等波長),S錐對藍色部分敏感(短波長)。視桿細胞只有一種類型。視桿細胞的信號可以通過神經突觸耦合入視錐細胞的信號通路。視桿細胞和視錐細胞在視野中的位置也不同。在中央凹,只有L和M錐體存在。它們的密度很高,并且隨著偏心量的增加而迅速減小。S錐細胞的數量要少得多,它們的密度在整個視網膜上幾乎是恒定的。中央凹沒有視桿細胞。它們的密度在距視覺中心約20°左右達到最大值。眼睛的光譜靈敏度不僅取決于光的強度(明視覺、暗視覺、中間視覺),還取決于觀察點在視場上的位置,即對應像點在視網膜上的位置。
水平細胞通過樹突或軸突與視桿細胞與視錐細胞相連,使光感細胞間形成橫向聯系,可以對光感細胞輸出的視覺信號進行亮度調節,實現視覺的亮度適應。
雙極細胞和神經節細胞構成了后續視覺信號的直接通路,各自分為兩類:小型雙極細胞和彌散型雙極細胞,小型(P型)神經節細胞和彌散型(M型)神經節細胞。小型雙極細胞主要和P型神經節細胞相連,形成小細胞通路(PC通路)。彌散型雙極細胞主要和M型神經節細胞相連,形成大細胞通路(MC通路)。
基于前人在視神經模型方面的研究成果,我們建立了如圖2所示的視網膜模型,來模擬不同光環境條件下PC和MC通路中視錐和視桿細胞信號的處理。
模型的第一階段是在外叢狀層(OPL)進行的信號處理。從生理上講,OPL是視網膜中突觸的第一層。它是光感細胞、水平細胞和視網膜與突觸相互作用的地方。該階段被建模為一個簡單的時空線性濾波器。我們使用一個簡單的線性濾波器對OPL中的處理過程進行建模,將在第2.1節詳細介紹此部分。這種濾波器產生眾所周知的視網膜處理的中心環繞結構。此外,我們的模型在OPL水平上引入了另一種視網膜功能:亮度適應,包括細胞對持續刺激的緩慢化學適應和快速神經適應模型,將在第2.2節詳細介紹。
圖2 視網膜模型示意圖Fig.2 Schematic diagram of the retinal model
模型的第二階段將模擬內網狀層(IPL)的突觸相互作用,它主要涉及小型雙極細胞和彌漫型雙極細胞的處理。從水平細胞傳輸到雙極細胞的信號是中心-環繞結構,第一階段視錐細胞的權重耦合信號作為中心信號,水平細胞信號經過時空濾波器處理作為環繞信號,然后傳輸到雙極細胞進行增益控制等進一步的信號處理。
視網膜的層次結構意味著它是一個連續的時空模型,它將光輸入轉換成電信號,并在將它們發送到大腦之前進行處理。我們將視網膜上的入射光描述為亮度時空分布圖L(x,y,t)的形式。類似的,細胞的每一層或細胞之間的突觸相互作用被認為是由特定微分方程驅動的時空連續體。
當視網膜細胞整合來自突觸前層細胞的信號時,它將在時間和空間上對其突觸前的輸入信號作平均運算。就時間而言,平均是由于突觸延遲造成的,每個神經節細胞起著低通電容的作用。在空間上,平均發生的第一個原因是細胞可能經歷樹突擴散,這意味著每個細胞都整合了來自其周圍突觸前細胞的信號傳導。第二個原因是,每個細胞通過神經縫隙與同一層中的相鄰細胞相耦合,導致相鄰細胞電位的局部均勻化。
低通信號每次傳輸到新的細胞層在視網膜的功能中起著非常重要的作用,在OPL中,它形成了視網膜的中心-環繞結構。我們使用如下時空濾波器來描述信號的低通過濾:
Kσ,τ(x,y,t)=Gσ(x,y)exp(-t/τ)/τ
(1)
其中τ是時間常數。Kσ,τ(x,y,t)是一個在時間和空間上可分離的低通濾波器,其中空間濾波器Gσ(x,y)是標準差為σ的二維歸一化高斯分布函數,如圖3所示。
圖3 視網膜模型中的空間過濾器Fig.3 Spatial filters in the retina model
人眼具有很高的光環境亮度調適動態范圍,從很弱的星光到很強的太陽光它都能適應,適應狀態受瞳孔大小、視網膜色素漂白和再生、神經適應的控制。模型第一個階段還要同時模擬這一視覺適應機制。前人研究中已經有較多關于視網膜適應模型的成果,這些成果主要都是來源于對視網膜的神經學和心理物理學的測量[10, 11],其中Pattanaik[12]的模型同時考慮了神經適應和化學適應(色素漂白)。
人在觀看自然場景時,視覺系統不斷適應不同的亮度級別。視覺適應狀態是許多視網膜模型的關鍵參數。瞳孔大小可以忽略不計,因為它的影響很小。每種機制都有其時間行為。光感色素漂白(化學適應)機制較慢,神經適應較快。無論哪種機制,視桿細胞的速度都比視錐細胞的速度慢,這也是為什么人從亮環境換到暗環境中的適應時間要比反過來的慢的原因。
我們將σb定義為色素漂白引起的化學適應,σc定義為慢速神經適應,σn定義為快速神經適應。那么視網膜模型的適應值σ的由下式給出:
σ=σb*σc*σn
(2)
化學適應和神經適應的時間變化曲線如圖4所示。人眼在亮度從L0變為La后,化學適應即色素的漂白和再生的過程遵循以下規律:
(3)
p(L)=I0/(L+I0)
(4)
I0=104cd/m2
(5)
σb=1/p(L)
(6)
圖4 神經適應(紅線)和化學適應(藍線)Fig.4 Neural adaptation (red line) and chemical adaptation (blue line)
在黑暗中p(La)=1,在明亮的環境中p(La)<1,色素漂白比色素再生發生得更快。p(La)是完全適應La的未漂白色素的分數。時間常數t0對于視錐細胞一般設110 s,對于視桿細胞是400 s。在穩態時,p(L)的值遵循方程。
對于神經適應,我們使用指數衰減函數來描述其時間演化過程:
(7)
與化學適應不同,神經適應是對稱的。我們將視錐細胞的神經適應時間常數t0設為0.08 s,將視桿細胞時間設為0.15 s。至此,對于視錐細胞,其神經適應值σn和σc分別為:
(8)
(9)
對于視桿細胞,其神經適應值σn和σc分別為:
(10)
(11)
在給定的適應值水平下,光感細胞對亮度的響應遵循S型曲線,可以用Naka-Rushton方程來描述[13]。細胞的響應信號可以表示為:
(12)
其中I是亮度刺激,對于視錐細胞使用V(λ)計算,對于視桿細胞使用V′(λ)計算,B是光漂白曲線的幅度,σ即視網膜模型的適應值,它定義了曲線的水平位置,n是靈敏度控制。視錐和視桿細胞的亮度響應圖分別如圖5和圖6所示。
圖5 亮度刺激變化時的視錐細胞響應圖Fig.5 Cone cell response vs luminance stimulus change
圖6 亮度刺激變化時的視桿細胞響應圖Fig.6 Rod cell response vs luminance stimulus change
我們將視桿細胞的最大響應設置為0.8,將視錐細胞的最大響應設置為1。對于在中間視覺條件下開始飽和而在明視覺條件下完全飽和的桿細胞,響應范圍的減小尤為明顯。這種由B因子表示的壓縮也適用于視錐模型,但只在高亮度環境下才有影響。
視桿細胞的信號通過神經縫隙與視錐細胞信號耦合,連接到視錐細胞的視桿細胞數取決于其在視網膜上的密度,而密度與其偏心角即光感細胞離中央凹中心的角距離有關。圖7顯示了視錐細胞的密度分布圖。在中央凹中心這塊極小的區域,視錐細胞密度很高,平均值達到了19.9萬個/mm2。離開中央凹后,在偏心角3.33°的位置視錐細胞密度急劇下降,這種密度降低的現象隨著偏心角的變大而減緩。圖8是視桿細胞的密度分布圖,中央凹內有一塊很小的橢圓形的無視桿細胞區,離中央凹中心100~200 μm處才開始出現視桿細胞,此后視桿細胞密度向周邊急劇增加,在偏心角約27°左右的環區達到最大。
圖7 視錐細胞密度分布圖Fig.7 Cone cell density distribution
圖8 視桿細胞密度分布圖Fig.8 Rod cell density distribution
我們將式(12)得到的視錐細胞和視桿細胞的響應值R分別與其所對應的歸一化密度值進行加權求和,然后發送至水平細胞和雙極細胞進行第二階段處理。
雙極細胞的感受野是中心-環繞結構,中心輸入由視錐細胞提供,周圍拮抗由水平細胞提供。我們參考了Fleet和Richter提出的時空中心環繞算子(CS)來對該結構的信號處理過程進行建模。CS算子本質上是一種時空高斯差分算子,它描述了神經節細胞的一些感受野特征,但忽略了視網膜處理早期的非線性傳導和適應。CS運算核K(x,y,t)表達如下,包括高斯運算符G(x,y,σ)和指數時間低通濾波器E(t,τ):
(13)
(14)
K(x,y,t)=αc·G[(x,y,σc(x,y)]·E[t,τc]-
αs·G[(x,y,σs(x,y)]·E[t,τs]
(15)
其中σc和σs分別表示感受野中心和周圍的高斯寬度,τc和τs分別表示中心和周圍的時間常數,用αc和αs分別表示中心和周圍的相對權重。
MC通路的特點是細胞對視覺信號中的瞬時信號有強烈的反應,而PC通路對高的空間頻率信號更敏感,但對于高的時間頻率不敏感。為簡化起見,我們在模型中假設水平細胞信號延遲僅在彌散型雙極細胞中顯著,而在小型雙極細胞中為零。
雙極細胞層還有一套增益控制和飽和非線性處理機制,我們用arctangent函數來對此進行建模,其中小型雙極細胞的輸出信號如下:
BPmidget[r,t]=BPsat(cone[r,t]-
horz[r,t])K(t;τmidget)
(16)
(17)
其中K(t;τmidget)代表與式(14)相同的時間低通濾波器,cone[r,t]和horz[r,t]是視錐細胞和水平細胞的信號,BPsat(x)為飽和運算子,kBPmidget為增益放大系數,在我們的模型中kBPmidget取值為0.027。
對于彌散型雙極細胞,輸出信號如下:
BPdiffuse[r,t]=BPsat(center[r,t]-
surround[r,t])K(t;τdiffuse)
(18)
(19)
τdelay]*G(r;3σhorz[r,t])
(20)
與小型雙極細胞不同的是,彌散型雙極細胞的飽和運算子中的輸入是center[r,t] 和surround[r,t] 之差,其中center[r,t] 是由9個臨近視錐細胞輸出的平均值,surround[r,t] 是延遲的水平細胞信號,延遲時間τdelay設置為3 ms,σhorz[r,t]是水平細胞的控制大小,增益放大系數kBPdiffuse取值0.015,τdiffuse設置為5 ms。
圖9給出了模型計算結果的一個示例,我們用一張簡單的方形高動態灰階圖像作為輸入,分別計算了錐狀細胞(權重耦合)、水平細胞、小型雙極細胞和彌散型雙極細胞隨時間變化的輸出信號。圖像中所設參數為:視場角度為2°,刺激亮度為1 cd/m2,背景亮度為0.01 cd/m2,兩者都是中間視覺亮度級別。當t<0 s時,視網膜模型適應背景亮度,當t>0 s時,模型開始顯示圖像。
圖9 簡單圖像的計算結果Fig.9 Calculation results of a simplified image
從圖9可以看到,水平細胞的輸出比視錐細胞的輸出更模糊,這主要是水平細胞層中的高斯擴散產生的。同時PC通路只接受中央凹內一個視錐的輸入,小型雙極細胞的輸出主要由視錐細胞與水平細胞的輸出之間的差值決定。MC通路接收來自幾個錐體的輸入,因此從視覺上看,彌散型雙極細胞的輸出更加模糊,空間分辨率較小型雙極細胞的低。
本文基于前人在視覺神經模型領域的研究成果,建立了一套視網膜計算理論模型。該模型以高動態圖像為輸入,仿真模擬了視覺信號從視錐視桿細胞到水平細胞、雙極細胞和神經節細胞這個傳遞和轉化的過程,初步展現了視網膜對簡單場景的時空響應。有了這個視網膜模型,我們便可對各種實際的復雜場景進行光度計算,從響應圖中獲得比現場測試豐富得多也更精確的信息,從而為進一步深入的視覺分析研究工作奠定基礎。
本文所搭建的模型尚比較初步,一些過程作了簡化處理,大部分參數都是從參考文獻中獲得,模型的精確度即其計算結果與人眼真實感受的匹配度還有待驗證。在下一步的研究工作中,我們將以中間視覺模型為對象,將標準心理物理學模型與本文模型進行比對,以此檢驗本文模型的精確度。