李淑玉 呂爭



摘 要: 結合先進的激光技術和圖像處理技術,利用三邊檢測原理判斷手動按鍵,開發出一套基于機器視覺的虛擬機關鍵盤,相較于其他模型,該鍵盤具有靈敏度高、成像效果好、識別精確等優點。同時,虛擬鍵盤具有概念新穎、成本低廉、噪聲低、嚴格防水等優點,適合在高強度作業和水汽較重的工控環境下使用。
關鍵詞: 計算機視覺方式; 圖像識別; 視覺處理算法; 三角測距原理; LLP技術
中圖分類號: TP 39 文獻標志碼: A 文章編號: 1671-2153(2015)06-0079-04
1 問題的提出
隨著信息化技術的發展,輕便、舒適、靈活已經成為鍵盤設計的最優目標,而傳統的鍵盤功能單一且攜帶麻煩。在這樣的背景下,本文擬設計了一種高性能的便攜式虛擬激光鍵盤[1]。它將運用移動電源、功放、超聲波技術實現額外功能,同時具有無菌無噪聲等功能。本研究將放棄傳統的供電方式,采用當前先進的移動電源技術供電,增強了鍵盤的可移動性和續航能力。設計的便攜式虛擬激光鍵盤將為人們外出旅游、辦公和從事無菌無噪聲科研等帶來了極大的方便。另外,由于在國內該技術上處于空缺狀態,所以本項目具有很好的市場前景。
2 系統方案
2.1 系統框圖
本研究基于視覺處理算法,全息投影技術,借用三角測距原理和LLP技術,采用了傳感器技術、無線通信技術、控制技術、數據庫技術、GUI系統UI元素碰撞技術、紅外技術、激光掃描技術、攝像頭處理技術、空間三維坐標處理技術、光學原理、濾波原理及鏡面反射技術,以MATLAB仿真為手段和采用OpenCV數據處理來加速視覺運算代碼的開發[2],用PC處理來設計的低成本、高性能的虛擬激光鍵盤,如圖1所示。軟件流程如圖2所示。
2.2 激光虛擬鍵盤模型結構
本文設計的激光虛擬鍵盤主要由線性不可見激光發射器、攝像頭采集器、鍵盤投影模組三部分組成,模型架構如圖3所示。
本研究的工作流程,首先鍵盤投影磨具投影出虛擬鍵盤模型,通過紅外不可見光發送定位光束,當用戶敲擊鍵盤瞬間,攝像頭采集圖像參數,并對圖像和目標進行識別[4]。通過識別轉換成坐標,系統識別坐標后調用坐標映射函數并發送按鍵命令[5],系統具體工作流程如圖4所示。
3 功能與指標
(1) 攝像頭模塊功能。采用USB接口,視角120度以上的CMOS攝像頭,可用于互動投影,多點觸摸。除了鏡頭有要求外,其他無特殊要求。本研究采用150°廣角攝像頭,具有極強的視角。
(2) 投射鍵盤畫面的激光器模塊功能。激光器模塊鍵盤大小要求要120度,650 nm激光組件。在實際使用過程中,激光組建應當使得鍵盤平整,按鍵的大小均勻,以減少系統的誤判。
(3) 一字線激光模塊功能。本研究采用的一字線激光器是紅外波段,波長為808 nm,主要是為了濾掉可見光的干擾[6]。為減低其功率,提高鍵盤的可靠性,激光模塊采用的工作功率為50 W。本文采用直徑12 mm,長度40 mm,線發射角度為120度、60度、35度可選,激光類型為線裝。
(4) 紅外帶通濾光片。采用800~1100 nm高透,與紅外激光器配合測距可避免可見光的干擾,可使可見光400~760 nm截止。濾波片厚度2mm,配合廣角鏡頭合理使用,避免出現曝光和弱光現象,否則會使鍵盤亂踩點或者檢測不到點[7]。
(5) 功放模塊功能。系統集成mp3模塊。面板尺寸為寬80 mm,高40 mm,內深50 mm,中心孔距為60 mm。其中功放為BTL輸出,還有FM功能,但需接一根天線,并切換MODE模式,其中AUX顯示當前工作狀態,FM顯示當前收聽電臺。
(6) 移動電源模塊功能。采用帶有雙USB的5 V升壓板。5 V恒壓電源可作為充電輸入電源,電路板內置鋰電池IC保護,具有過壓、過流、欠壓保護等。還自帶手電功能,連按兩下開關鍵即可啟動,再連按兩下開關鍵即可關閉。移動電源進入工作狀態時,藍色背光源被點亮,15 s后熄滅,按輕觸開關(on/off)一次,藍色背光源再次被點亮15 s,方便查看LCD顯示屏。
4 實施原理及過程
4.1 鍵盤功能的實現
4.1.1 鍵盤輸入事件的識別
虛擬鍵盤是基于三角測距原理,通過投射激光對目標物體進行檢測。測距過程中,通過一束激光照射目標物體,反射光被攝像頭捕捉到,利用三角測距原理[8],求出目標物體中被線激光照亮部分的坐標信息。在線性激光測距中,通過三角關系,容易求出被激光照亮部分,相對于激光發射口為原點、位于線激光組成平面內的坐標P(x,y)。在本系統中,激光組成的平面可以等效于與桌面平行,故可以認為坐標點P(x,y)是位于桌面平面的,如圖5所示。
4.1.2 按鍵事件的判斷與產生
在虛擬鍵盤中,所有UI元素均對應屏幕的坐標值。系統周期性判斷當前鼠標指針位置是否產生光斑。相較于UI系統,在數據庫中需要建立投射鍵盤圖案中每個按鍵的坐標信息,然后查找指尖按下的坐標,從而判斷出坐標信息,其示意圖如圖6所示。
上述鍵盤功能實現過程需要涉及到兩個步驟:
(1) 通過三遍測距算出指尖按下的坐標,記為P(x,y)。
(2) 將映射點P(x,y)與數據庫中的坐標值進行對比,求出P(x,y)對應的按鍵值。
4.2 虛擬鍵盤視覺方式與算法的具體實現
由于本研究的視覺處理部分都在PC上進行,因此使用了OpenCV庫來加速視覺運算代碼的開發。
4.2.1 攝像采集器鏡頭扭曲矯正
在本系統中,實際使用為廣角攝像頭,與普通攝像頭相比,廣角攝像頭采集圖像具有中心偏大,兩側偏小的特征,如圖7所示。
為了使得圖像坐標信息具有線性變化的特點,需要對采集的圖像進行處理,通常采用的高斯模型降噪[9],在程序中調用OpenCV庫函數對實際圖像進一步優化,以達到攝像頭扭曲矯正的效果。
4.2.2 圖像興趣點提取
通過調用OpenCV庫函數中的cvFindCountours,對攝像頭中的光斑進行提取,通過提取光斑獲取圖像的興趣點,由于環境中光線的變化,因此存在高斯噪點,可以通過增加權重的方式來減少誤判,提高系統識別圖像興趣點的精度。
4.2.3 手指坐標計算和校正
通過手指光斑的相對位置,調用三邊測距算法,求得手指的具體相對位置P(x,y)。通過三次測距得知P點,通過P點的旋轉90°知道P的逆矩陣。同時通過上述介紹的公式算出逆矩陣與原來矩陣的誤差精度,再通過平滑取值抹除誤差較大的點,得到手指的正確坐標,即是手指在桌面投影的實際坐標,如圖8所示。
5 特色與創新點
(1) 本研究在設計的原理上具有創新性:采用基于計算機視覺方式識別、判斷和產生鍵盤事件。
(2) 相對傳統鍵盤,該鍵盤無菌,方便用于無菌場合,且噪音少,可廣泛用于公共場合,該鍵盤工作穩定、便于調試,可方便使用在工作環境條件差(例如化工生產)的場合。
(3) 本研究采用當前先進的移動電源技術供電,增強了鍵盤的可移動性和續航能力。
(4) 線激光測距的采用,提高了按鍵事件的判斷和效率。
(5) 集合了視覺算法、三角測距、LLP技術多點觸摸定位、功放、升壓、超聲波等技術,具有廣泛的應用價值。
(6) 該鍵盤可以測出手指對桌面的“壓力”,在繪畫板產生不同粗細的圖像。
(7) 采用的線激光測距,有利于檢測指尖的位置和判斷是否產生鍵盤事件。
6 結 論
基于機器視覺的虛擬激光鍵盤,結合機器視覺處理的OpenCV庫,以及三點定位算法,實現了虛擬鍵盤的模型建造。在研究虛擬鍵盤過程中,預先通過MATLAB仿真,對設計過程中遇到的問題進行了提前模擬,有效的指導了模型的建造過程,本系統具有成本低廉,識別精確度高等優點,其模型具有推廣價值。
參考文獻:
[1] 陳士凱.自制低成本3D激光掃描測距儀(3D激光雷達),第一部分[J/OL]. (2012-02-06)[2015-07-20]. http://www.hobbypress.cn/bencandy.php?fid-182-id-7309-page-1.htm.
[2] 布拉德斯基. 學習opencv[M]. 北京:清華大學出版社,2009.
[3] 譚浩強. C++程序設計[M]. 北京:清華大學出版社,2010.
[4] 張國云,郭龍源,吳健輝. 計算機視覺與圖像識別[M]. 北京:科學出版社,2012.
[5] 張岳,郝麗,柳華,等. 激光顯示的原理與實現 [J]. 光學精密工程,2006,14(3);402-405.
[6] 劉慶祥,蔣天發. 彩色與灰度圖像間轉換算法的研究[J]. 武漢理工大學學報(交通科學與工程版),2003,27(3):344-346.
[7] 王紅梅,李言俊,張科.基于極值檢測的圖像濾波算法[J]. 激光與紅外,2007,37(10):1117-1119.
[8] 梁華為. 直接從雙峰直方圖確定二值化閾值[J]. 模式識別與人工智能,2002,15(2):253-256.
[9] 王慧峰,戰桂禮,羅曉明. 基于數學形態學的邊緣檢測算法研究及應用[J]. 計算機工程與應用,2009,45(9):223-226.
Abstract: This work combines advanced laser technology and image processing technology, the use of manual key trilateral detection principle is determined to develop a machine vision-based virtual organ keyboard, compared to other models, the keyboard has a high sensitivity, good imaging results. , recognition accuracy and so on. at the same time, the concept of virtual keyboard with a new, low cost, low noise, strict waterproof and suitable for use in high-intensity operations and moisture heavy industrial environments.
Key words: computer vision methods; image recognition; visual processing algorithms; triangulation principle; LLP technology
(責任編輯:徐興華)