文/薛卓群 席志紅
當進入相機的光線超過圖像傳感器能 接收到的動態范圍時,獲取的圖像就會發生過度曝光現象,簡稱過曝光。色彩和紋理等有用信息會因圖像產生的過曝光現象而無法獲取,因而準確的檢測出過曝光區域,可以精確的對圖像進行處理恢復,從而減少計算量提升圖像重構重建速度。
為了滿足過曝光圖像后期恢復與重建的要求,提出一種融合了多種特征的L2 正則化邏輯非線性回歸(FLA)算法作為改進算法,該算法在HSV 和Lab 色彩空間中應用,引進了圖像區域的修正飽和度特征、亮顏特征和邊界鄰域特征,對過曝光圖像訓練樣本進行特征提取,并使用L2 正則化邏輯非線性回歸算法,通過訓練得到分類器模型,用以實現對圖像過曝光的檢測。
采用基于全局對比度的LC 顯著性檢測算法。LC 算法計算了某個像素在整個圖像上的全局對比度,即該像素與圖像中其他所有像素在顏色上的距離之和作為該像素的顯著值。
圖像I 中某個像素IK的顯著值計算如下:

其中Ii的取值范圍為[0,255],即為灰度值。
上式等于:

N 表示圖像中像素的數量。
給定一張圖像,每個像素IK的顏色值已知。假定IK=am,上式可優化為:

其中,fn表示圖像中第n 個像素的頻數,以直方圖的形式表示。
本文擬給出的融合多種特征的L2 正則化邏輯非線性回歸算法,就是在HSV 和Lab 色彩空間處理的。即引入了圖像過曝光區域的修正飽和度特征、亮顏特征和邊界鄰域特征,使用L2 正則化邏輯非線性回歸算法,對過曝光圖像訓練樣本進行特征提取,并通過訓練得到分類器模型,用以實現對圖像過曝光的檢測。

圖1:過曝光圖像檢測算法流程

圖2:中心點及其鄰域
具體算法設計分為兩步:
第一步是基于機器學習的分類器訓練算法。訓練樣本由LC 算法生成,訓練圖像的所有過曝光點都被標記為0。首先將訓練圖像轉換到CIE-Lab 彩色空間。其中L 分量圖像代表灰度信息,a 分量和b 分量均代表顏色信息。然后提取圖像的特征并歸一化處理后用FLA算法訓練,求出分類器模型的參數。
第二步是用之前得到的分類器模型對需檢測的圖像中過曝光點和非過曝光點進行分類和標記,最后完成圖像中過曝光區域的檢測。過曝光區域檢測的整體算法流程如圖1所示。
最后選擇一定數量的圖片進行試驗,找出適合該算法的最佳參數,并對比分析三種算法檢測結果的性能。
1.2.1 特征提取
曝光區域的識別需要圖像的四個特征:顏色特征、修正飽和度特征、亮顏特征和邊界鄰域特征。
(1)顏色特征

圖3:花圖原始圖像

圖4:花圖LC 檢測算法(閾值為0.82)

圖5:葉圖原始圖像

圖6:葉圖FLA 檢測算法(閾值為0.8)
(2)修正飽和度特征。利用高斯混合模型處理HSV 顏色空間中的H 和V 通道,然后用新算出的H’和V’通道的值估算新的飽和度S’,作為被提取的特征。H’、V’和S’的公式為:

(3)圖像的亮顏特征是像素的顏色特征與亮度特征的乘積。表示為

(4)邊界鄰域特征,是基于某中心像素點鄰域內各像素點(包括中心像素點)的亮度特征的平均值。特征的提取描述如下:假設在鄰域窗口為3×3 的情況下,設中心像素點P0的鄰域如圖2所示。
邊界鄰域特征值表示為:

1.2.2 分類器模型
用邏輯回歸算法訓練歸一化后的特征值。過程是:面對一個回歸或者分類問題,建立代價函數,然后通過優化方法迭代求解出最優的模型參數,然后測試驗證這個求解的模型的好壞。
定義代價函數??紤]加入對邏輯回歸模型系數的懲罰項,得到L2正則化的代價函數。

其中λ 為正則化因子,它可以控制模型參數θ 的懲罰力度,以防訓練數據發生過擬合。數據中四種特征相關聯,L2正則化會同時保留這四個特征,只是減小特征的權重,使預測更準確。最后得到最佳的分類回歸模型hθ(Xi)。當hθ(Xi)大于某個閾值時,可以認定圖像中相應的像素點為過曝光點。
仿真實驗共采用5 幅圖片。實驗在Intel Core i75557U,4GB,Windows10,Matlab R2017b 環境下進行。
首先用LC 訓練算法獲得分類器模型。如圖3、4 所示。
該花圖作為訓練樣本,總共樣本數為50416 個。LC 檢測算法檢測圖像依賴于閾值設置和參數分配,每一張圖片的標記效果以人眼視覺效果為標準,人工改正標記圖像,最后選定檢測閾值為0.82。將標記好的花圖通過邏輯回歸算法進行訓練,窗口大小暫選3×3,正則化系數λ=1,獲得FLA 算法的模型參數θ=[-3.0527 1.8449 -1.7975 1.9286 2.2166]
以另一張葉圖檢測分類器模型的準確度,如圖5、6 所示。
將曝光的區域標記為黑色,可以看出,該分類器基本可以實現過曝光區域的檢測。
另一組實驗結果如圖7所示。
實驗結果顯示,FLA 算法檢測出的過曝光區域既保持空間連通性和整體性,也沒有出現標注不當的問題,而亮度閾值法出現了欠標注的問題。此外,加入了修正飽和度的FLA算法適用于各種不用場景和顏色類別多的圖像,但亮度閾值法需要對每副圖像重新設置閾值,操作麻煩。

圖7:針對葉圖的三種算法對比
選擇在夜晚背景下對車輛與路燈進行過曝光檢測。取λ=3,夜晚訓練樣本點數為54924 個。車輛檢測結果如圖8所示。
路燈的訓練樣本點數為166500 個,檢測結果如圖9所示。
實驗結果顯示,FLA 算法對夜晚車輛和路燈的過曝光現象檢測可以實現,且標記出的過曝光區域連通性很好,基本沒有單獨無用的過曝光點。

圖8:夜間車輛過曝光檢測原圖(左)與FLA 算法(右)

圖9:夜間路燈過曝光檢測原圖(左)與FLA 算法(右)
本文基于融合顏色特征、亮顏特征和邊界鄰域特征的FLA 算法基礎上新加入了修正的飽和度特征,利用邏輯回歸算法分類,得出了一種圖像過曝光檢測算法。該算法相比于亮度閾值法和LC 算法,對圖像區域的檢測結果更加緊實,形成了連通完整的過曝光區域,有更少的單個過曝光點,符合人眼對曝光區域的感知習慣。且經過試驗,認為正則化系數λ=3,窗口大小選擇5×5 時能獲得最好的檢測效果。