徐方卉,王子頡,周宏茗 ,周小麗,劉木清
(1.復旦大學光源與照明工程系,上海 200433;2.復旦大學先進照明技術教育部工程研究中心,上海 200433)
模擬霧環境下目標識別的影響研究
徐方卉1,2,王子頡1,2,周宏茗1,2,周小麗1,2,劉木清1,2
(1.復旦大學光源與照明工程系,上海 200433;2.復旦大學先進照明技術教育部工程研究中心,上海 200433)
霧環境不僅導致人眼的視覺可見度下降,而且也會對目標識別能力造成影響,使應用于交通行業的圖像監控系統無法準確有效地識別各類標識和牌照信息。我國《城市道路照明設計標準》(CJJ 45—2015)和IESNA、CIE等組織的相應規范標準也并沒有對此進行說明與補充。本文在實驗室人工造霧,研究不同濃度的霧環境對目標識別準確率的影響情況。此研究可為霧條件下相關交通標識字符尺寸的設計要求以及圖像采集設備的精度要求提供依據。實驗也為后續系統研究霧環境對目標識別準確率的影響打下基礎。
霧;光學字符識別;透射率;道路照明;照明設計
近年來,環境污染導致的霧天氣逐漸成為人們關注的焦點。霧對人們的生活與生產具有多方面的影響。其中,霧對OCR(Optical Character Recognition,光學字符識別)識別系統目標識別能力的影響是本文的關注重點。霧環境不僅導致人眼的視覺可見度下降,而且也對OCR 識別系統的的目標識別能力造成影響,使應用于交通行業的圖像監控系統無法準確有效地識別各類標識和牌照信息。而我國《城市道路照明設計標準》(CJJ 45—2015)和IESNA、CIE 等組織的相應規范標準也并沒有對此進行說明與補充。本文在實驗室人工造霧,研究不同濃度的霧環境對OCR 目標識別準確率的影響情況。此研究可為霧條件下相關交通標識字符尺寸的設計要求以及圖像采集設備的精度要求提供依據。實驗也為后續系統研究霧環境對目標識別準確率的影響打下基礎。
霧的成因主要是由于空氣中所含的水汽多于一定溫度條件下的飽和水汽量,多余的水汽就會凝結出來從而形成霧。霧主要形成條件有冷卻、加濕、凝結三種。本文主要利用加濕的方法進行造霧。
本實驗的造霧設備是使用純凈水的超聲波加濕器。根據電光源在霧氣中的視覺可見度實驗研究,自然界中的霧氣粒子半徑大約為(1~10)μm,超聲波加濕器噴出的水霧粒子半徑大約在(0.25~3)μm,基本在實際霧粒子尺寸要求范圍內[1]。
本實驗的研究對象是不同霧濃度條件下對目標物拍攝的圖片,不希望引入背景亮度、對比度等其他變量,因此將實驗設置在長寬高為3 m×0.65 m×1.2 m的黑色暗箱內。實驗裝置如圖1所示。暗箱的支架為木結構,表面貼有避免反光的黑色泡沫塑料板。作為識別目標的白色塑料燈片設置在暗箱一端,印有識別目標的定制燈片背后是外接在暗箱之外的密閉小木箱,其外尺寸為36.7 cm×84.7 cm×21.3 cm,內尺寸為33.8 cm×81.7 cm×19.8 cm。木箱中垂直裝有兩根直管熒光燈,熒光燈與燈片之間(即小木箱與大暗箱的拼接處)嵌入擴散板,因此熒光燈可以給燈片提供均勻的背光源。與燈箱相對的另一端是帶有視覺窗口的黑色活動擋板。擋板關閉時用照度計測得暗箱內照度為0.000,說明可以忽略背景亮度和對比度對測量結果的影響。

圖1 實驗裝置Fig.1 Experimental apparatus
暗箱長邊側壁的頂端打了4個圓孔,均勻分布在暗箱兩側,每側各兩個,用洗衣機進水管分別連接了四臺加濕器。圓孔的直徑約為3 cm。此處設定燈箱所處的一端為箱子前端。左前洞與箱子前端距離為49.5 cm,距地面114 cm;左后洞與箱子前端距離為147.5 cm,距地面高度為113.5 m;右前洞與箱子前端距離為45 cm,距地面114 cm;右后洞與箱子前端距離為147 cm,距地面高度為114 m。洗衣機進水管均與箱壁近似垂直,出口略微朝上偏,因此霧氣入箱后有一個上拋的過程,避免暗箱頂端中線的霧氣濃度過低。加濕器與進水管的連接處用密封膠密封,加濕器與箱壁的連接處用硅膠密封,減少霧氣的泄漏,以免影響加濕效果。
本實驗選用2根飛利浦1 050 lm的T8直觀熒光燈對識別目標圖樣進行背光照明,選用650 nm、5 mW的洪都電激勵式可見連續半導體激光二極管進行霧濃度標定。
本實驗中選用了點狀光斑的激光二極管代替參考文獻[1]和[2]中所使用的白熾燈,作為霧濃度標定光源。與白熾燈相比較而言,激光二極管的優點在于光路定向性很好,能量密度高,穿過濃霧仍可以在探頭上形成照度足夠的光斑,同時對光傳播路徑以外的人眼或圖像采集設備造成的影響極小。
以確定霧濃度為例,將照度計作為測量工具,以激光二極管作為標準光源,通過光源的透射率T來定義霧的濃度百分比。光的透射率由以下公式定義:
式中T為光源的透射率(%);E′為有霧氣條件下的照度值(lx);E為無霧氣條件下的照度值(lx),也稱為初始照度值。
則霧濃度百分比P(%)的表達式為
即通過標定激光二極管的照度透射率數值能夠獲得對應霧氣箱里霧的濃度。
本實驗中選用的激光二極管自帶透鏡,3米處成像為直徑約10 mm的圓點。激光二極管用支架固定在暗箱前端燈片左下方接近地面的位置,調整角度使其光路平行于地面和暗箱側壁。在支架旁的箱壁泡沫塑料板上打一個小孔,引出電源線,再用膠帶將電源線中段固定在箱壁上,避免在箱外控制電源時扯動電源線,使支架角度發生變化。
本實驗中使用的觀測目標如圖2所示,包含11 組不同尺寸的中英文字符。每組字符的高度見圖中右側的標注。其中,(1)(8)(11)行三組字符是無規律的純數字內容(實際為圓周率節選);(2)(6)行兩組字符是純漢字內容;(3)(7)(9)(10)行是符合英文語法的純英文單詞或短語;(4)(5)行混合了中英文字符和阿拉伯數字。

圖2 識別目標區域劃分方式及其字符尺寸Fig.2 The area division and character size of recognizable object
本實驗的研究目標之一是為室外的監控攝像頭(包括交通監控攝像頭)相關設計提供數據支持,因此在選取識別目標時,優先選取了一些交通標志和車輛牌照相關的中英文字符。字符從上到下尺寸依次下降,提供了不同尺寸的識別目標。其中車牌照圖案的字體為公安交警部門專用的防偽字體,無法獲取字體文件,因此采用的是經程序處理的高清車牌照圖片;其余字符的字體均選用了交通標志通用的大黑字體。
實驗中通過統計OCR 識別結果中識別正確字符的個數與識別區域內總字符個數的比值,來衡量OCR 識別的準確程度。在無霧的理想情況下,這11 組數據的OCR 目標識別準確率均可達到100%。
數據與圖像處理操作詳細步驟如下:
1)將一輪實驗中手機連拍獲得的照度計示數變化整理為Excel 文檔,根據預設的連拍時間間隔,標注每個照度值的序號和時間點。根據公式(2)計算出霧濃度。
2)整理出一輪實驗的全部圖片,根據記錄的拍照時間點,將照片與拍攝時的霧濃度數據一一對應。
3)將一輪實驗的圖片放在單獨的文件夾里,在Photoshop 中打開最后拍攝的一張清晰度最高的圖片,使用“錄制動作”的功能記錄裁剪圖片中一組字符的操作,再使用“批處理”功能裁剪該文件夾中的全部圖片,以此確保同一組字符在進行OCR 識別時選區范圍是相同的,排除區域選擇帶來的識別準確率差異。
4)將經過裁剪的圖片(圖3)導入手機上的OCR 識別程序Text Grabber 中,根據該組字符的語種選擇適當的識別語種,識別范圍設置為整張圖片,讀取OCR 識別結果,并統計其準確率。準確率計算方法為OCR 識別結果中識別正確字符的個數與識別區域內總字符個數的比值[3]。圖3為實驗時在模擬霧環境下拍攝的照片。

圖3 實驗時模擬霧環境下識別目標經裁剪后的照片Fig.3 The clipped photo of target in simulated fog environment
暗箱后端的活動擋板上,開有一個38.3 cm×23.2 cm的視覺窗口。窗口下邊緣距隔板底邊62.7 cm,其上邊緣距隔板上端25.3 cm,即其中心位于隔板的中偏上位置。視覺窗口上配制一塊45 cm×30 cm的防霧玻璃,可以將視覺窗口完全覆蓋住。暗箱向后延伸大約1 m的側壁和頂棚,遮擋外部的光照,避免數碼相機在視覺窗口附近對箱內圖像的拍攝受側方向的眩光影響。數碼相機安裝在三腳架上,三腳架緊貼活動擋板外側,使數碼相機與燈片的垂直距離近似為3 m。數碼相機的安裝高度可根據拍攝目標的位置進行調整,從合適的角度清晰完整地拍攝觀測目標。
1)在暗箱干燥的狀態下接通熒光燈和激光二極管的電源,預熱50 分鐘以上。補充加濕器中的純凈水。確認激光二極管的光斑準確地投射在照度計探頭上。關閉活動隔板。
2)確認本輪實驗需拍攝的目標圖像位置,調節相機三腳架使鏡頭捕獲合適的畫面。調整并記錄相機倍率以及其他參數,確保本輪拍攝過程中使用同樣的相機設置。
3)熒光燈和激光二極管預熱完畢后,打開照度計并觀察示數,確認照度計讀數維持在一個穩定值附近,記錄照度計的初始示數。
4)打開手機上連拍照片的應用軟件Fast Camera,設定連拍時間間隔為5 秒,將手機放置在照度計上方合適的拍攝位置,以便實驗過程中自動定時記錄照度計示數。
5)打開4臺加濕器最大檔位,充霧約8 分鐘,直到從視覺窗口觀察時幾乎觀測不到燈箱和激光二極管的光,且隔板空隙處溢出少量的霧。
6)關閉加濕器,同時操作手機開始自動連拍,注意聽清連拍軟件的快門音效并計數,進入箱體后端的箱壁遮擋區域,操作數碼相機按一定的時間間隔與箱外的快門音同步拍攝觀測目標。使用屏幕亮度調低的便攜式平板電腦記錄每張圖像所對應的快門音效序數,以便在后續數據處理中為每張圖像找到對應的照度計示數。
7)圖片的拍攝速度應參考由肉眼輔助觀測的識別目標清晰度上升速度,以免產生大量冗余數據,增加處理的工作量。
8)當箱內的霧逐漸消散,肉眼輔助觀測的識別目標清晰度接近無霧狀態時,停止圖像拍攝,保持對快門音效的計數,至箱外停止手機的連拍。將默數的連拍數量與手機軟件內連拍照度計示數的數量進行核對,以防由于計數錯誤產生偏差。
9)確認各項圖像數據采集無誤后,結束實驗。
10)拉開活動隔板,用玻璃水擦拭視覺窗口處的玻璃。用電風扇對箱內吹風,協助空氣流通。靜置2~3小時,待箱內的霧完全散盡后,方可進行下一輪實驗。
注意事項:裁剪圖像選擇識別區域時,應選取在程序中實測識別準確率盡可能高的裁剪方式。經多次嘗試發現,選區時在字符段落的左右兩側留白,上下方向緊貼字符裁剪,可獲得相對較高的識別準確率。但由于實驗操作時的誤差,實驗中獲得的同一組圖像之中仍會有細微的位置浮動,此時應該酌情適當放寬裁剪區域。若批量裁剪后發現個別選區中有字符不完整,應重新統一選擇該批圖像的選區范圍。
2.2.1 數據處理與處理方式
根據文獻[4]和[5],常用的OCR 光學字符識別技術包括統計特征字符識別技術、結構字符識別技術和基于人工神經網絡的識別技術。在識別內容為有意義的短語或句子,符合某一語種的語法的情況下,OCR 識別的準確率不僅受圖像質量影響,還會由于程序內置的識別字典以及自組織性、自適應性、學習能力、聯想功能和容錯性能得到很大的提升。換而言之,對于有意義的識別對象,當圖像質量使OCR 識別程序足以辨明其中的部分字符時,程序的聯想容錯能力即可使該幅圖像的OCR 識別準確率得到極大的提高。因此,在數據分析的過程中,我們引入“識別目標字符內容的語種及其是否有意義,符合語法”這一參量,用于分析不同組數據性質之間的差異。
使用MATLAB R2017a中的曲線擬合工具(Curve Fitting Toolbox)擬合OCR 字符識別準確度數據,由于R2是整個模型擬合效果的衡量。但R2不能像假設檢驗那樣給出一個臨界值,大到什么程度模型算好,可以使用;小到什么程度算差,不能使用,沒有一個嚴格的標準具有很大的主觀隨意性。要對模型進行整體檢驗,必須構造出分布已知的統計量。F值越大,回歸平方和越大,殘差平方和越小,表明X對Y的解釋能力越強[6]。MATLAB提供兩種最小二乘法的穩定算法,①最小絕對殘差法(LAR),使擬合曲線與數據表的殘差絕對值為最小,而不是殘差的平方為最小值,從而以減少數據的極值對擬合的影響;②雙平方加權法(Bisquare weights),每點的權值與偏離擬合曲線的程度有關。該算法認為,擬合曲線附近點的權值不變;減少遠離擬合曲線的數據點處的權值,甚至將隨機產生的極值點處的權值置為零。大多數情況下,因為Bisquare weights算法既能得到好的擬合曲線,又能減少離群值的影響,其效果要優于LAR算法。根據文獻[7]里的算法,選擇模型使得擬合R2盡可能大,均方誤差(MSE)和均方根誤差(RMSE)盡可能小的模型進行擬合。
表1為所有字符組的結果數據。H為識別目標字符實際高度;a為識別目標字符所占視角;R2為擬合函數擬合優度;S1為實驗記錄中準確率數值首次超過50%時的霧濃度;內容表示識別目標字符內容的語種及其是否有意義,符合語法;擬合質量表示綜合R2數值以及函數圖像趨勢判斷所得的擬合函數是否符合期望。

表1 所有字符組的結果數據Table 1 All groups of characters’ resulting data
下面依次進行分析,在圖5~圖13中,橫坐標為霧濃度百分比,縱坐標為識別準確率百分比。
a)字符組1、2。圖片處理過程中發現,識別對象圖樣的前2 行字符串過短,程序識別時難以將它識別為字符。嘗試在Photoshop 中將圖片均勻地連續復制,拼合為一長串字符,并在兩段留白,符合程序慣用的識別模式。然而這兩行字符的位置處于燈箱頂端,亮度的均勻度較低,拍攝圖片的背景有明顯的漸變,經批量復制后形成了連續的“鋸齒狀”亮度變化(如圖4所示,該圖片經過了增強對比度、連續復制、添加左右寬邊的處理),因此識別結果中出現了許多多余的“I”字符。經考慮決定舍棄這兩行的圖片數據。
圖4 被舍棄的字符組1、2
Fig.4 The first and second groups of characters which are deserted
b)字符組3。該組字符的內容為英文“stop”雖然是有意義的單詞,但缺少上下文,程度并不能直接根據語法或其他跡象推測出其實際內容,較為依賴圖像質量,因此擬合曲線的質量較好(如圖5所示)。
c)字符組4。該組字符內容為“出口EXIT”,中英文夾雜,且互為譯文,可推測程度略高于前一組字符,但仍舊屬于短單詞,缺少上下文。擬合函數曲線質量可以接受。OCR識別結果出現的主要誤差在于將字母“I”誤識別為數字“1”或小寫字母“i”。由此可以看出OCR識別的準確率也受到相近形狀的字符的影響(圖6)。
d)字符組5。該組字符是兩張車牌照圖像。由于對比度不同,圖像質量有差異,上方車牌照的識別準確率略高于下方車牌照。統計數據時將兩個車牌照內容的準確率相加(圖7)。
由于我國車牌照字體為公安交警部門專用的防偽字體,難以獲得矢量字體文件,因此該組識別內容選用的是經過Photoshop預處理的高清車牌照位圖圖片。印刷成品的圖像質量較好,無明顯鋸齒狀邊緣,可視為與其余字符質量近似的識別目標。導入OCR軟件識別之前,該組圖片增加了一道反色工序,使字樣變為白(灰)底黑字,與其余字符統一形式,符合正常印刷書寫習慣,以免引入其他變量。
車牌照內容僅為一組編碼,無可供聯想推測的上下文信息,因此識別準確率變化趨勢較均勻。然而,由于該組內容夾雜中英文字符,軟件識別判斷的范圍較廣,其同等霧濃度下的識別準確率相較前幾組有所下降。
e)字符組6。該組字符是一行漢字交通標識用語“禁止機動車通行”,是具有明確含義的日常用語。OCR程序處理此類識別目標時明顯受益于其智能聯想類比功能,一旦可以模糊分辨內容(譬如識別出里面的一兩個字),很容易將結果矯正為正確的短語(圖8)。

圖5 字符組3 霧濃度-識別準確率擬合函數Fig.5 The fitting function between fog density and discernment accuracy in third groups of characters

圖7 字符組5 霧濃度-識別準確率擬合函數Fig.7 The fitting function between fog density and discernment accuracy in fifth groups of characters
f)字符組7。該組字符是一句英文句子,有明確的含義和語法。函數圖像相較前幾組圖像質量較好的原因,是由于從該組字符開始,增加了取樣點,數據點之間的跨度更小了,而且由于字號減小,取樣的字符數更多,正確率百分比變化的跨度也更小。然而從圖像切線斜率來看,該組字符識別準確率的變化也是比較迅速的,符合之前關于有意義內容識別率變化趨勢的預期(圖9)。
g)字符組8。在準備實驗數據時,我們將圓周率數字視為無規律無意義不存在于識別字典的字符串。從數據結果看,不能排除“圓周率前80位也是眾所周知的常用數據,被收錄進了識別庫”這一可能性。但我更傾向于認為識別率的高變化率是由于該組字符排版非常整齊,易于切分。根據文獻[4],在單字識別技術越來越成熟的今天,正確的圖像切分方式可以大幅提高OCR識別的準確率,而像該組數字一樣排版整齊行列對齊的字符,是最容易找到正確劃分方式的(圖10)。

圖8 字符組6 霧濃度-識別準確率擬合函數Fig.8 The Fitting Function between fog density and discernment accuracy in sixth groups of characters

圖9 字符組7 霧濃度-識別準確率擬合函數Fig.9 The Fitting Function between fog density and discernment accuracy in seventh groups of characters

圖10 字符組8 霧濃度-識別準確率擬合函數Fig.10 The Fitting Function between fog density and discernment accuracy in eighth groups of characters
h)字符組9。該組字符是有明確意義的名詞性質的純大寫字母英文短語。從擬合函數圖像來看似乎質量尚可,然而觀察采樣點分布,識別準確率的變化趨勢也很陡峭(圖11)。
i)字符組10。該組字符是一句完整的英文句子。字號小,字符數多使得準確率百分比變化跨度小,擬合函數圖像質量尚可。并且由于燈片上本身字符尺寸的限制,該組字符很難拍攝出高質量的圖片,因此準確率增加幅度也就沒有前幾組數據那么大(圖12)。
j)字符組11。該組字符又是典型的“識別準確率變化過大導致函數擬合失敗”的例子,與第9組的情況類似,由于字號極小,即使無霧的情況下也難以拍出高清圖片,因此擬合圖像質量比第9組稍高一點(圖13)。

圖11 字符組9 霧濃度-識別準確率擬合函數Fig.11 The fitting function between fog density and discernment accuracy in ninth groups of characters

圖12 字符組10 霧濃度-識別準確率擬合函數Fig.12 The fitting function between fog density and discernment accuracy in tenth groups of characters

圖13 字符組11 霧濃度-識別準確率擬合函數Fig.13 The fitting function between fog density and discernment accuracy in eleventh groups of characters
本實驗在室內人工模擬的霧環境下,通過激光二極管的透射率確定霧濃度,保持照明條件不變,研究不同的霧濃度對OCR目標識別準確率的影響。使用加濕器對實驗暗箱內充霧達到較大值之后,在箱內平穩散霧的過程中使用數碼相機拍攝識別目標的圖像,再用統一的操作步驟對圖像進行批量處理,獲得不同種類的識別目標在霧濃度單一變量變化的條件下識別準確率的變化趨勢。
通過分析數據得出結論:OCR目標識別的準確率與霧濃度之間呈負相關,若在無霧情況下針對一組字符的拍攝分析可以達到100%的識別準確率,那么,當霧濃度低于70%,其余條件相同時,該組字符的OCR識別確率可以超過50%。霧濃度越高,無論字符大小,識別準確率百分比均趨近于1;而霧濃度越低,無論字符大小,識別準確率百分比趨近于0。
除此之外,以下幾種情況下,使用商用OCR程序所得目標識別的結果會更高:
①識別前已明確了解該識別目標為單一語種;
②識別目標內容具有明確意義、遵循語法規律;
③識別目標字符排版整齊且字與字之間間隙明顯,易于找到正確的劃分方式。
④字符較大,視角較大。
[1] 關雪峰.中間視覺條件下電光源在介質中的視覺可見度與穿透力實驗研究[D].深圳:深圳大學,2011.
[2] KURNIAWAN B A,NAKASHIMA Y,TAKAMATSU M,et al.Visual Perception of Color LED Light in Dense Fog[J].Journal of Light & Visual Environment,2007,31:152-154.
[3] 臧國全.文本數字化圖像OCR識別的準確度測度實驗與提高[J].圖書情報知識,2010(3):62-67.
[4] 孫羽菲.低質量文本圖像OCR技術的研究[D].北京:中國科學院計算技術研究所,2005.
[5] 吳兌.霾與霧的識別和資料分析處理[J].環境化學,2008,27(3):327-330.
[6] 沈根祥.計量經濟學[M].上海:上海格致出版社,2010.
[7] 賈志剛.計算機數據與圖形處理[M].北京:化學工業出版社,2005.
StudyontheInfluenceofTargetRecognitioninSimulatedFogEnvironment
XU Fanghui1,WANG Zijie1,2,ZHOU Hongming1,2,ZHOU Xiaoli1,2,LIU Muqing1,2
(1.DepartmentofLightSourceandIlluminatingEngineering,FudanUniversity,Shanghai200433,China;2.EngineeringResearchCentreofAdvancedLightingTechnology,MinistryofEducation,Shanghai200433,China)
The haze environment not only causes the decline of visual visibility,but also affects the target recognition ability,so that the Image Monitor System applied to the traffic field can’t identify all kinds of identification and license plate information accurately and effectively.China’sUrbanRoadLightingDesignStandards(CJJ 45—2015) and IESNA,CIE and other organizations of the corresponding standards have not been explained and added.In this paper,the influence of different concentrations of fog environment on target recognition accuracy was studied.This study can provide some basic theory for the design requirements of traffic-related signs and the accuracy requirements of image acquisition equipment under haze conditions.The experiment also laid the foundation for the follow-up system to study the effect of haze environment on the accuracy of target recognition.
fog;optical character recognition(OCR);transmittance;road lighting;lighting design
TM923
A
10.3969/j.issn.1004-440X.2017.06.023