劉 亞, 張團善, 王恩芝
(西安工程大學 機電工程學院, 陜西 西安 710613)
灰度圖像可以用最基本的信息表示原圖像,反映其重要特征,并且空間占用少,運算量小,系統處理效率高;由于其具有處理操作步驟少、可視化快和成本低等優點,促使研究人員投入對彩色圖像到灰度圖像轉換的研究。彩色圖像的灰度化在機器視覺、文字識別、指紋識別、光學條紋識別、細胞識別,和軍事上的自動目標識別等領域有著更廣泛地應用。
圖像的灰度化是將3個通道的彩色圖像轉換成符合人眼視覺的單通道圖像,并且使得轉換后的圖像保持原有圖像的特征、輪廓、邊緣和紋理等。由于圖像灰度化是一個信息壓縮的過程,不可避免地會丟失或削弱[1]圖像原有的特征,如色度、邊緣信息等,且穩定性較差。如何最大化的利用灰度的有限范圍來準確地呈現彩色圖像的對比度及細節特征,確保灰度圖像更符合人眼的感知,仍是圖像灰度化研究中的重要課題。
根據目前已有算法中映射函數是否可以作用于整幅圖像的所有像素,彩色圖像灰度化算法可分為全局映射法和局部映射法2類[2]。全局映射法著眼于整體顏色分布差異,對所有像素采用同一映射函數,因此具有全局一致性。如Gooch等[3]提出了“color2gray”的彩色圖像灰度化算法,引入了像素對之間的顏色對比度,結合相鄰像素之間的亮度與色度差去建立相鄰像素間的顏色差,最后使用迭代法求目標函數的最優解;Kim等[4]采用了非線性參數模型,將顏色與灰度圖像之間的梯度差作為目標函數,通過最小化梯度差來求解映射函數中的參數;陳廣秋等[5]由3個通道與對比度圖之間的結構信息相似度直接求取映射函數權重系數,輸出灰度圖像,但由于整幅圖像所有的像素均采用同一映射函數,結果使輸出圖像變得平滑,造成原彩色圖像的局部特征不明顯。局部映射法著眼于局部顏色分布差異,根據局部分布差異調整局部空間的像素強度,能夠精確地保留局部特征信息,如Smith等[6]結合H-K顏色效應和全局映射確定顏色排序,然后使用拉普拉斯金字塔來進行局部對比度的調整,增強不明顯的局部邊緣;盧紅陽等[7]在目標函數中引入原始圖像梯度的權重系數實現最大化,并且在原彩色通道梯度中用高斯加權系數表示,保留原彩色圖像中對比度不明顯的區域;顧梅花等[8]將彩色圖像灰度化為保留RGB的3通道單色圖像特征的多尺度融合問題,采用梯度域導向圖像濾波去除由于多尺度圖像融合而造成的偽影,但這種類型的算法強調局部特征信息,忽視全局信息,對整體圖像造成不同程度的信息損失,容易產生暈輪、噪聲增強等問題。
為了得到最優灰度圖像,同時兼顧準確性、魯棒性以及高效率,將彩色圖像中顏色對比信息最大范圍的映射到輸出灰度圖中,得到符合人眼視覺感受的優化灰度圖。課題組綜合全局映射法和局部映射法的優點,從不同像素間梯度信息產生的邊緣輪廓入手,提出一種基于高效邊緣檢測的彩色圖像灰度化算法,通過計算備選灰度圖像的邊界點數來估計權重系數,使用像素差異網絡[9]對離散權重空間后得到的備選灰度圖像進行邊緣檢測,邊緣圖像與原彩色圖像的輪廓重合度最高的灰度圖為最優選項。
用顏色通道的線性組合來表示灰度輸出:
g=ωrIr+ωgIg+ωbIb。
式中:Ir,Ig,Ib是輸入圖像的R,G,B通道;ωr,ωg,ωb是R,G,B通道中要優化的參數,ω={ωr,ωg,ωb}稱為權重空間。
進一步在權重上執行一個正約束和一個能量守恒約束,以使灰度圖像在[0, 1]。這2個約束為:
ωr+ωg+ωb=1。
根據實驗可知,稍微改變權重ωr,ωg,ωb時,灰度外觀并沒有明顯的變化,而且步長選取的越小,備選的灰度圖像就會越多,后續處理時間也會隨之增加。經過大量實驗對比,綜合考慮灰度轉換效果與效率,課題組選取步長St=0.1。此離散方法,可得到66個備選灰度圖像。
傳統的邊緣檢測如Sobel算子,信息利用率不高,沒有側重于梯度信息;而基于卷積神經網絡(convolutional neural network, CNN)的邊緣檢測算法檢測性能高,學習能力強,但是需要對大規模數據集進行模型預訓練,占用大量內存和能量,使得計算成本高、運行效率低、吞吐量低和標簽效率低。
像素差值網絡是一種簡單、輕量級并且有效的框架。課題組采用了像素差值卷積(pixel difference convolution, PDC)計算圖像中的像素差,然后與卷積核權重相乘獲得輸出特征如圖1所示。像素差值卷積不依賴于傳統邊緣檢測Canny算法[10]輔助卷積神經網絡模型進行邊緣信息檢測,而是直接將梯度信息提取過程整合到卷積運算中,使卷積運算更加緊湊、可學習性更強;像素差值卷積只有1個主干結構,使用了1個簡單的捷徑分支(shortcut)[11]作為卷積塊的第2分支;并且像素差值卷積使用了可學習的濾波器,可更加通用和靈活地捕捉豐富的梯度信息用于邊緣檢測。

圖1 像素差值網絡框架
像素差值卷積與普通卷積的區別僅在于像素差值卷積是對像素對的差值做卷積,而普通卷積對單個像素值做卷積。
普通卷積公式:
像素差值卷積公式:

像素差值卷積是將擴展的局部二值模式(elongated local binary pattern, ELBP)算法與卷積神經網絡相結合,得到圖2的3種像素差值卷積的計算方式:中心像素差值卷積(central pixel difference convolution, CPDC),角度像素差值卷積(angular pixel difference convolution, APDC)和徑向像素差值卷積(radial pixel difference convolution, RPDC)。像素差值卷積可以幫助PiDiNet有效捕捉更多有用的邊界,提取豐富的梯度信息,便于邊緣檢測。

圖2 3種像素差值卷積實例

式中:yi是像素為i的邊緣概率值;η是預定義的閾值,在計算損失時,如果被標記為正的像素少于η,則該像素將被忽略且不被視為樣本;為避免混淆,β是負像素樣本的百分比,且α=λ·(1-β),則總損失函數:
圖像的邊緣可以很大程度上體現彩色圖像的基本特征。若提取的邊緣對原彩色圖像的輪廓復原度越高,那就說明此灰度圖像在越大程度上保留了彩色圖像的特征信息。所以對66個備選灰度圖像提取邊界,對邊界點數進行統計。邊界點數最多的灰度圖像對應的權重系數就是最優的投影方向。
2.1.1 彩色圖像邊緣提取


圖3 彩色圖像的邊緣提取圖
2.1.2 彩色圖像灰度化


圖圖像集和BSDS500圖像集彩色圖像灰度化結果
圖4中Gooch算法和Smith算法損失了部分色彩對比信息,沒有突出原彩色圖像中的重要特征,對邊緣輪廓比較分明的圖像產生的灰度圖比較平緩;而GcsDecolor算法不能很好的轉化一些低飽和度的圖像,結果出現空圖;Rgb2gray算法產生了過度擬合的效果;筆者提出的算法整體亮度較高,不僅特征保留的較好,彩色圖像中的特征在灰度圖像中仍然是可分辨的,而且排序保留良好,在彩色到灰度的轉換中可以保留所需的顏色排序。
2.2.1 不同灰度化算法的客觀評價分析
灰度化圖像間差別不大時,人眼視覺做出的主觀評價并不是唯一評判標準,需要引入客觀評價方法對灰度化圖像進行定量分析。課題組采用Lu等[14]提出的顏色對比度保持率(color contrast preserving ratio, CCPR)進行定量分析。顏色對比度保持率RCCP度量指標是基于一種人類對顏色的感知現象,但當彩色圖像中2個像素點x,y的歐式距離δ小于閾值τ時,RCCP值在人類視覺中幾乎是不可見的。因此,顏色對比度保持率的任務是保持人類可感知的顏色變化。
式中:Ω為原始圖像梯度δx,y≥τ的子像素對集合;‖Ω‖表示Ω中的像素對數量;gx-gy為灰度圖像像素梯度值;#{(x,y)|(x,y)∈Ω,|gx-gy|≥τ}為集合Ω中經過灰度化處理后還存在像素間差異的個數。
RCCP表征的是灰度圖像中對比度與輸入顏色的相似程度,RCCP越接近1,代表灰度化效果越好。
平均顏色對比保持率(average color contrast preserving ratio ,ACCPR)的公式如下:
平均顏色對比保持率越大表示灰度圖像與輸入彩色圖像的相似程度越高。引入參數平均顏色對比保持率可以更好地研究每幅圖像的性能。
在客觀評價中,分別度量不同算法灰度化后顏色對比度保持率RCCP及τ的值為1~ 15時RCCP的均值RACCP,結果如表1和圖5所示。從表1可以看出筆者提出算法得到的灰度圖像RCCP值比Gooch,Smith,Rgb2gray和GcsDecolor算法得到的RCCP值大,RACCP值也是如此,充分體現了筆者提出算法的優勢。由圖5可以看出5種算法的RCCP值都比較接近,但筆者提出的算法在不同的閾值水平上均優于其他的算法,并且更加穩定。圖4也顯示筆者提出算法得到的圖更加清透,符合人眼視覺感知。綜上所述,筆者提出算法將可見的顏色變化映射到灰度變化方面效果較好,更好地反映了彩色和灰度圖像之間的結構相似性。

表圖像集的CCPR

圖5 BSDS500圖像集的RCCP值
2.2.2 不同灰度化算法的主觀評價分析
借鑒文獻[7]中的實驗模式進行用戶主觀對比實驗。使用具有代表性的13幅圖像, 將筆者提出算法和Gooch,Smith,Rgb2gray和GcsDecolor算法進行用戶選擇性實驗和準確性實驗,我們邀請30位年齡在20~50歲的參與者, 他們沒有視覺缺陷并且從事不同行業。圖6所示為參與者年齡、職業及有無相關學科研究經歷等情況分布。

圖6 參與者信息情況分布
選擇性實驗:在沒有提前接觸相關彩色實驗圖像的基礎上,用戶每次從2幅灰度圖像中選擇他們認為相對較好的圖像 (一幅是筆者提出算法得到的灰度圖像, 另一幅是按照順序依次提供4種算法得到的灰度圖像),每位參與者均進行4次選擇實驗。
準確性實驗:給用戶提供原彩色圖像及Gooch,Smith,Rgb2gray,GcsDecolor算法和筆者提出算法得到的結果圖,用戶選擇出最能表示原始彩色圖像的一幅結果圖,每位參與者只進行1次選擇實驗。
實驗結果顯示準確性實驗耗時相對于選擇性實驗較長。用戶主觀對比實驗統計結果如圖7和圖8所示。從實驗結果來看, 筆者提出算法相對于另外4種算法結果效果要好。由圖7~8可以看出用戶對筆者提出算法的結果圖有較優先的選擇,可知筆者提出算法的灰度化效果相對其他4種算法有較好的視覺效果。

圖7 選擇性實驗結果

圖8 準確性實驗結果
