劉正全,鄧亮
(常州星宇車燈股份有限公司,江蘇常州 213000)
目前人車交互方式以機械按鍵、旋鈕以及電容觸摸屏為主。這些輸入設(shè)備都存在一定的不足,輸入習(xí)慣和人本身的自然交流習(xí)慣存在差異。基于視覺的手勢輸入可以克服上述問題,該技術(shù)的人車交互方式更自然更便捷,其次采用視頻輸入的形式可以進行遠距離和非接觸的控制。作者將闡述關(guān)于TOF(Time of Flight,飛行時間)技術(shù)[1]在人車手勢交互的具體應(yīng)用,同時與二維和三維視覺技術(shù)的手勢識別進行綜合性能比較。
基于TOF的手勢識別技術(shù)是利用調(diào)制近紅外激光光源照亮手勢識別區(qū)域,成像陣列傳感器通過測量手勢照明和反射之間的相移并將其轉(zhuǎn)換成為手勢識別的距離深度信息。 圖1說明了TOF手勢識別的基本工作原理。照明光源由固態(tài)激光器或工作在近紅外(850 nm)的LED提供,該波長在人眼可視光譜范圍之外。成像陣列傳感器可以對該波長范圍的反射光進行效應(yīng),同時將光量轉(zhuǎn)換為電能。進入成像陣列傳感器的光線包含兩部分:環(huán)境分量和反射分量。手勢識別的距離深度信息主要依靠反射分量體現(xiàn)。 因此,環(huán)境分量過高會降低信噪比。

圖1 TOF手勢識別的基本工作原理
為了在車內(nèi)更好地檢測照明和反射光之間的相移,需要對連續(xù)方波光源進行調(diào)制[2]。在這種方式下每次測量4個樣本,每個樣本之間相位間隔90°,利用照明和反射之間的相位角φ計算手勢識別的距離深度d,如圖2所示。
(1)
(2)
其中:c為光速;Q1、Q2、Q3和Q4為成像陣列傳感器采樣得到的電荷量。

圖2 連續(xù)方波光源調(diào)制檢測手勢識別的距離深度
基于TOF的手勢識別技術(shù)所提供的距離測量精度會直接對最終的識別正確率造成影響,所以需要對影響距離測量精度的因素進行分析。成像陣列傳感器上像素點獲得的反射光亮度為L,偏移量為S,那么,連續(xù)方波光源調(diào)制檢測手勢識別的距離測量方差可以表示為式(3),其中cd為調(diào)制對比度,描述了成像陣列傳感器分離和收集光電子的能力。反射光亮度L是光功率的函數(shù)。 偏移量S是環(huán)境光和系統(tǒng)偏移量的函數(shù)。 從式(3)中可以推斷出反射光亮度、調(diào)制頻率和調(diào)制對比度是影響距離測量精度三大因素。
(3)
(4)
(5)
根據(jù)公式(3),增大反射光亮度、調(diào)制頻率和調(diào)制對比度三者的數(shù)值可以明顯提高手勢識別的距離測量精度,而環(huán)境光和系統(tǒng)偏移量會導(dǎo)致飽和并降低準確性。在高頻下,由于硅的物理屬性,會使調(diào)制對比度衰減,所以調(diào)制頻率具有實際的上限[3]。如圖3所示,在TOF手勢識別人車交互系統(tǒng)中,采用多頻技術(shù)來兼顧測量精度和測量距離問題,使得在足夠的測量距離條件下獲得最佳的檢測精度。多頻技術(shù)是通過添加一個或多個調(diào)制頻率來工作,調(diào)制頻率低,測量距離較遠測量精度較低;調(diào)制頻率高,測量距離較近測量精度較高。 每個調(diào)制頻率都將計算得到相應(yīng)的測量距離,實際手勢深度位置是由不同頻率的測量距離共同決定。

圖3 多調(diào)制頻率手勢距離深度測量原理
TOF技術(shù)應(yīng)用在手勢識別人車交互中,成像陣列傳感器可以提供每個像素點距離深度信息,并以灰度形式展現(xiàn),灰度值越高,手勢越接近成像陣列傳感器。目前多數(shù)手勢識別的機器視覺系統(tǒng)都是二維的,是一種經(jīng)濟高效的方法,圖像處理算法提取關(guān)鍵特征參數(shù),與數(shù)據(jù)庫進行對比判斷。 但汽車車內(nèi)的照明條件比較復(fù)雜,手勢在不同的照明下陰影差異會使識別困難、正確率顯著降低,使用TOF成像陣列傳感器數(shù)據(jù)在很大程度上不受陰影的影響,因為照明調(diào)制紅外激光光源提供,距離深度信息是從相位測量中提取的,而不是圖像亮度本身。
三維視覺可以克服二維視覺手勢識別的許多問題,因為距離深度可以分離前景和背景。三維視覺手勢識別通常使用兩個間隔一定距離的相機,可以計算每個圖像中的手勢位置。其中主要問題是在一幅圖像中給出一個點,如何在另一個相機中找到匹配的點,對應(yīng)關(guān)系的建立會直接影響手勢識別的可靠性。 解決對應(yīng)問題首先要涉及復(fù)雜的計算密集型算法,用于特征提取和匹配;其次, 特征提取和匹配需要顏色變化和足夠的亮度以獲得穩(wěn)健的相關(guān)性:所以這也就限制了在人車交互場景中的應(yīng)用。 TOF手勢識別沒有這個限制,因為它不依賴于顏色或紋理來測量距離。TOF成像陣列傳感器使用距離作為特征,可以將臉部、手部和手指與圖像的其余部分分割開,因此可以實現(xiàn)手勢識別較高置信度。3種視覺系統(tǒng)在手勢識別應(yīng)用中的性能比較如表1所示。

表1 3種視覺系統(tǒng)在手勢識別應(yīng)用中的性能比較
基于TOF技術(shù),利用多頻調(diào)制紅外激光光源和成像陣列傳感器系統(tǒng),通過測量手勢照明和反射之間的相移并將其轉(zhuǎn)換成為距離深度信息,顯著提高了人車交互手勢識別的置信度。與二維和三維視覺技術(shù)別相比,TOF的手勢識別在系統(tǒng)整體成本上比較適中,集成度較高,結(jié)構(gòu)很緊湊,由識別算法所帶來的計算強度可以在嵌入式系統(tǒng)中實現(xiàn),同時在車內(nèi)環(huán)境下兼顧了檢測距離和測量精度兩個要求,并且靈活可調(diào),可以很好地來適應(yīng)不同應(yīng)用場景的需要,響應(yīng)時間也是3種視覺系統(tǒng)中最快的。另外,由于TOF的手勢識別系統(tǒng)具備自主式光源照明,距離深度信息是從相位測量中提取的,所以在弱光和強光環(huán)境下手勢識別的正確率均比二維和三維視覺要高。綜上所述,TOF技術(shù)在手勢識別人車交互應(yīng)用中具有獨特的優(yōu)勢與良好的發(fā)展前景。