華迦睿
(江蘇省南通市第二中學 江蘇南通 226000)
近年來,隨著人工智能的發展,機器視覺技術逐漸滲透到生活的各個方面。機器視覺是一種利用光電成像系統采集圖像信息,然后在計算機或專用圖像處理器上運行軟件對圖像信息進行處理的技術,最后通過識別和分析來判斷目標物體的形狀和大小。機器視覺也可以稱為計算機視覺,它借助計算機實現人體的視覺功能,即用機器代替人眼進行判斷。機器視覺是一種利用光電成像系統采集圖像信息,然后在計算機或專用圖像處理器上運行軟件對圖像信息進行處理的技術,最后對目標對象的形狀和大小進行識別和分析[1]。
而對于外形相似的書籍識別與分類的領域,機器視覺卻應用較少[2]。隨著人們對知識的渴求越來越強烈,各種各樣的教輔書、材料書、休閑書層出不窮[3-5]。許多人也因為書籍太多而很難去將它們分類整理,日后需要時卻又很難找到[6-7]。對于傳統的書籍分類,都是需要人類的眼睛大腦進行判斷區分,然后再用雙手將它們分類[8-9]。這樣非常耗費時間與精力,并且也可能會因身體疲勞或大腦錯辨等因素而出錯。
基于這種常見問題,筆者提出了一種機器視覺的書籍分類整理智能識別系統。其原理是通過VS與OpenCv開發的智能書籍分類識別算法,對獲取到的書籍圖像進行一系列的預處理,得到書籍特的二值化圖像。筆者提出了一種基于形態學邊緣檢測提取書籍特征信息和分類的算法[10],從而實現對不同學科不同專業的書籍特征信息的檢測和識別。筆者所設計的書籍分類系統很好地完成了對書籍的識別實驗,達到了書籍分類整理自動化的要求。其在快速識別與自動分類的基礎上,大大減少了人們為此所花費的時間精力,促使人們有序整理,高效學習,有較大實用價值。
從下面的圖中可以看得出,書籍分類系統包含了硬件和軟件和PC端,一共3個部分。具體各個部分的處理流程和功能如下圖。

圖1 系統拓撲圖
根據書籍封面是平面,并且不是動態物體的特點,獲取書籍圖像的硬件的型號,筆者選取的是MER-531-20GM/C-P的530的攝像頭,次攝像頭獲取書籍圖像的速度大小是20fps,具體結構圖如下圖。

圖2 MER-531-20GM/C-P
下面的圖顯示的是該系統所選取的攝像頭對不同顏色的光的敏感程度曲線。

圖3 MER-531-20GM/C-P的敏感程度曲線
同樣在獲取書籍圖像的過程中,配合攝像頭使用的鏡頭也是非常重要的。筆者根據實際需求選取鏡頭為OPI-C0420-2M,其獲取圖像的理論大小可表示為200萬像素。

圖4 200像素定焦鏡頭
實際上,書籍的顏色有多種多樣,筆者選用型號為OPTLI10810的條形白光光源來配合圖像采集。其消耗功率小,燈帶角度90°,避免了單色光對拍攝書籍封面時產生錯誤的色光。

圖5 條形光源
在系統中個傳感硬件都是非常重要的,筆者將個傳感硬件的具體參數進行了列表分析。

表1 硬件型號與參數
由環形光源照射書籍的封面。采集到的圖像通過預處理部分進行形態學處理、圖像去噪、轉化為二值化圖像和邊緣檢測一系列處理。最后,由軟件的識別檢測部分對書籍封面信息進行識別檢測,得出并顯示結果。

圖6 系統軟件交互圖
筆者所提出的機器視覺的書籍分類整理智能識別系統,包含硬件部分和軟件部分。根據系統的設計要求,筆者利用軟件開發平臺VS2010軟件開發平臺設計開發了軟件系統的界面。如下圖所示為系統的主功能界面,主要分為圖像顯示窗口、識別結果顯示窗口,系統開始功能按鈕,系統停止按鈕功能鍵。

圖7 系統功能界面圖
考慮到書籍封面是膠裝封面或銅板紙且表面光滑會反光,并且不同學科、不同專業的學籍的書名不一樣,中文與英文書籍的書名也不一樣。因此,為了驗證系統的可靠性,筆者進行了相關實驗。采用系統分別識別2批數量相同的書籍圖像,記錄系統識別2組所用的時間,識別正確率。實驗結果如下表。

表2 試驗結果
從表格中可以看出,系統識別檢測2組書籍所用的時間在230s以內,識別速度快,誤檢率在8%以內,識別準確率較高。
從上面的測試結果中可以看得出,筆者設計的識別系統所用的時間基本上都在230s以內,識別速度快,誤檢率在8%以內,識別準確率較高。因此,其基本上實現了獨立對不同學科、不同類型的數據的識別和檢測,有較大的圖書識別推薦價值。