劉 堯,李亞楠
(中國(guó)汽車技術(shù)研究中心有限公司,天津 300380)
隨著通信技術(shù)、傳感技術(shù)、人工智能、互聯(lián)網(wǎng)大數(shù)據(jù)分析等新科技的進(jìn)步與發(fā)展,汽車市場(chǎng)的定義也開(kāi)始產(chǎn)生了變化。智能化、網(wǎng)聯(lián)化、電動(dòng)化、共享化是如今電動(dòng)汽車產(chǎn)業(yè)發(fā)展的主流方向。電動(dòng)汽車也正在逐步地由單純的機(jī)械交通工具,過(guò)渡為個(gè)性化的智慧終端。在汽車新四化趨勢(shì)下,用戶體驗(yàn)成為現(xiàn)在汽車產(chǎn)業(yè)轉(zhuǎn)型的重要發(fā)力點(diǎn)。而汽車智能座艙內(nèi)智能性、情感性、高效性等方面的用戶體驗(yàn)必將成為用戶選擇汽車品牌的重要依據(jù)。調(diào)查研究表明,在我國(guó)消費(fèi)者購(gòu)車的關(guān)鍵因素中,座艙智能技術(shù)是僅次于汽車安全配置的第二大指標(biāo),重要程度甚至高于汽車動(dòng)力性、經(jīng)濟(jì)性等因素[1]。
智能座艙,是指搭載了高度智慧與網(wǎng)聯(lián)化科技的車輛產(chǎn)品,是基于使用要求和使用環(huán)境,能自主洞察和感知,從而形成的一個(gè)智能的移動(dòng)交互環(huán)境和體驗(yàn)空間。智能座艙可以實(shí)現(xiàn)人、車、路之間的互動(dòng)交流,是人車關(guān)系從工具使用向情感溝通的重要紐帶和關(guān)鍵場(chǎng)所。智能座艙以其在帶給用戶最直觀的愉悅、舒適、方便體驗(yàn)方面的優(yōu)勢(shì),已逐步成為汽車發(fā)展重點(diǎn)探索的領(lǐng)域之一。作為智能座艙的核心技術(shù),多模態(tài)交互技術(shù)實(shí)現(xiàn)了聲音、手勢(shì)、眼神捕捉等多種模態(tài)的融合,未來(lái)必將取代單一的語(yǔ)音交互模式[2]。
在世界汽車工業(yè) 100多年的發(fā)展歷史中,汽車座艙經(jīng)過(guò)了機(jī)械化時(shí)期和電子化時(shí)代,正在走向智能信息化時(shí)代。機(jī)械化時(shí)代的汽車座艙,主要使用機(jī)械式和簡(jiǎn)易物理裝置進(jìn)行單一功能和基本信息地獲??;電子化時(shí)代,音響、小型液晶顯示屏等開(kāi)始廣泛使用,以及具有高度娛樂(lè)性的播放影片、音樂(lè)和離線導(dǎo)航等基本功能。目前,信息化與智能化的時(shí)代,互聯(lián)網(wǎng)加人工智能、大數(shù)據(jù)一起進(jìn)入汽車領(lǐng)域,進(jìn)入了汽車座艙,帶動(dòng)汽車走進(jìn)智能網(wǎng)聯(lián)化時(shí)代,座艙開(kāi)始成為駕乘人員可以發(fā)號(hào)施令的自主舒適智能移動(dòng)空間。這個(gè)自主舒適移動(dòng)空間,現(xiàn)在一般稱作智能座艙。
“座艙”不是汽車的正規(guī)用語(yǔ),汽車行業(yè)有二個(gè)相關(guān)術(shù)語(yǔ)描述座艙這個(gè)空間:一個(gè)是“客艙”,“供乘員利用的地區(qū),即司機(jī)區(qū)和乘務(wù)員區(qū)的統(tǒng)稱”,出自《汽車車身用語(yǔ)》(GB/T 4780—2020);還有一種是“乘員艙”,“由頂罩、天花板、側(cè)圍、門窗、單玻窗和前圍、后圍或后座靠背支承板,和避免乘員觸及帶電部分的電氣防護(hù)遮欄、外殼等圍成的,承載著乘員的空間”,來(lái)自《電動(dòng)汽車術(shù)語(yǔ)》(GB/T 19596—2017)。兩項(xiàng)標(biāo)準(zhǔn)中規(guī)定的客艙或乘員艙就是汽車座艙,一個(gè)帶沙發(fā)的金屬房間,讓駕駛員和乘客享受相對(duì)安全、舒適和便捷的駕乘體驗(yàn),設(shè)備多傾向于機(jī)械式,滿足的功能相對(duì)單一,駕乘人員手動(dòng)操作發(fā)出指令,能做的提升也相對(duì)有限。
智能座艙就是汽車由機(jī)械化、電子化時(shí)代進(jìn)入信息化、智能化大數(shù)據(jù)時(shí)代的必然產(chǎn)物。關(guān)于智能座艙方面的術(shù)語(yǔ)、定義還需在新時(shí)代標(biāo)準(zhǔn)化工作中不斷補(bǔ)充完善。
智能座艙是在保持原有傳統(tǒng)的駕駛艙所具備的安全、舒適和便捷性基礎(chǔ)上,以液晶顯示屏取代了普通物理按鈕,人機(jī)交互手段便利多元,自動(dòng)化、網(wǎng)聯(lián)化水平大大提高。智能座艙的基礎(chǔ)是人機(jī)交互技術(shù),但人機(jī)交互目前主要是利用語(yǔ)言交互技術(shù)來(lái)實(shí)現(xiàn),駕駛者可以專心于行車視覺(jué)上,而不需通過(guò)聽(tīng)覺(jué)即可實(shí)現(xiàn)要求、通過(guò)說(shuō)話完成非駕駛動(dòng)作的需求。不過(guò),當(dāng)前智能座艙的語(yǔ)言通訊系統(tǒng),在情感性、多輪對(duì)話、喚醒或打斷等方面仍有一定困難,特別是不能領(lǐng)會(huì)命令實(shí)質(zhì)。而多模態(tài)交互技術(shù)能夠使人機(jī)交互整個(gè)過(guò)程更加立體、高效和低誤差,必將成為未來(lái)智能座艙發(fā)展最為核心的技術(shù)之一。
近年來(lái),智能、網(wǎng)聯(lián)、大數(shù)據(jù)功能不斷滲入汽車領(lǐng)域,且成本逐年降低,智能座艙逐步成為中高端品牌車型的必備選項(xiàng)。它給駕乘人員提供了立體化人機(jī)交互智能、舒適、情感體驗(yàn)的移動(dòng)空間,這其中最早使用的技術(shù)是語(yǔ)音交互技術(shù),也就是人機(jī)對(duì)話。
語(yǔ)音交互技術(shù)是相對(duì)簡(jiǎn)單的技術(shù),主要包括語(yǔ)音識(shí)別技術(shù)(Automatic Speech Recognition,ASR)、自然語(yǔ)言處理技術(shù)(Natural Language Processing, NLP)、語(yǔ)音合成技術(shù)(Text To Speech,TTS)等,也就是通過(guò)聲音識(shí)別、聲音處理生成指令要求[3]。
汽車是一個(gè)各種噪音的組合體,包括輪胎噪聲、風(fēng)阻噪聲等,極易干擾語(yǔ)音交互系統(tǒng)的工作,除去噪聲干擾需要一些技術(shù)處理工作。語(yǔ)音識(shí)別技術(shù)(ASR)是將聲音轉(zhuǎn)化為文本信號(hào),通過(guò)聲音模型數(shù)據(jù)庫(kù)和文本模型數(shù)據(jù)庫(kù)進(jìn)行相應(yīng)的比對(duì)和識(shí)別。自然語(yǔ)言理解(Natural Language Understanding, NLU)通過(guò)文本分析、分類、檢索、信息抽取、文字校對(duì)等流程將聲音轉(zhuǎn)化為信息化指令。對(duì)話管理(Dialogue Management, DM)通過(guò)分析對(duì)話產(chǎn)生系統(tǒng)決策。語(yǔ)音合成(TTS)是將自然語(yǔ)言生成(Natural Language Generation, NLG)所生成的文本通過(guò)文本處理和音色頻率處理,最終通過(guò)語(yǔ)音庫(kù)進(jìn)行語(yǔ)音合成。具體語(yǔ)音交互技術(shù)流程如圖1所示。

圖1 語(yǔ)音交互技術(shù)流程
如圖1所示,當(dāng)乘員用語(yǔ)言發(fā)出需求指令時(shí),車輛通過(guò)預(yù)處理找出乘員發(fā)出語(yǔ)音指令的聲音,通過(guò)聲音識(shí)別對(duì)聲音進(jìn)行信息轉(zhuǎn)化,通過(guò)功能轉(zhuǎn)化篩選出乘員需要的相關(guān)服務(wù)功能需求,在對(duì)話管理中將聲音轉(zhuǎn)換所生成的指令進(jìn)行回應(yīng)。最終通過(guò)聲音生成和聲音合成組合模式,以對(duì)話的形式回復(fù)乘員,最終形成語(yǔ)音交互行為。
近年來(lái)隨著人工智能、芯片、大數(shù)據(jù)、傳感等技術(shù)逐漸興起,語(yǔ)音交互技術(shù)已在手機(jī)等很多領(lǐng)域廣泛應(yīng)用。汽車作為新的終端用戶,使用這個(gè)技術(shù)可以給乘客更安全、高效、簡(jiǎn)單的駕駛體驗(yàn),所以語(yǔ)音交互已是智能座艙的最重要的組成部分,是智能座艙生態(tài)系統(tǒng)的核心環(huán)節(jié)和首選。
根據(jù)文獻(xiàn)[4],每個(gè)人的發(fā)音特色都不相同,聲紋和指紋一樣,都是每個(gè)人的獨(dú)特標(biāo)志。一個(gè)人成年之后,他的聲紋基本是固定的,很難變化。聲紋識(shí)別術(shù)就是基于這種特性可以利用每個(gè)人的說(shuō)話聲來(lái)確定不同人的身份。在現(xiàn)在的智能座艙領(lǐng)域,聲紋識(shí)別技術(shù)在語(yǔ)音交互中正處于起步研究與測(cè)試標(biāo)定階段。它通過(guò)提取錄入使用者的一定時(shí)間內(nèi)的有效聲音,辨識(shí)出有效聲紋特色,錄入聲紋數(shù)據(jù)庫(kù)。當(dāng)車輛用戶再發(fā)出語(yǔ)音指令時(shí),可首先通過(guò)數(shù)據(jù)庫(kù)進(jìn)行比對(duì)。智能座艙人機(jī)交互系統(tǒng)可以聽(tīng)音辨人,為車上每個(gè)用戶提供個(gè)性化服務(wù)。這個(gè)技術(shù)也利于車輛安全,用戶也可更容易地控制車輛[5]。
車與駕駛?cè)说慕换ピ谲囕v行進(jìn)過(guò)程中一直存在。車輛向駕駛?cè)嘶虺藛T提供各種信息,同時(shí)駕駛?cè)烁鶕?jù)相關(guān)信息做出必要的合理反應(yīng),這就是信息交互。隨著電子、傳感器等技術(shù)的不斷發(fā)展,汽車已經(jīng)是一個(gè)比較智能的“機(jī)器人”,傳統(tǒng)的交互方式已經(jīng)不適合現(xiàn)在的技術(shù)背景下用戶對(duì)于汽車智能座艙的智能性、舒適性、情感性的需求,多模態(tài)交互技術(shù)成為智能座艙設(shè)計(jì)的核心技術(shù)之一,融合了觸摸交互、手勢(shì)交互、凝視與頭部姿態(tài)交互、語(yǔ)音交互等多個(gè)模態(tài),其表達(dá)效率和表達(dá)的信息豐富和立體程度都遠(yuǎn)遠(yuǎn)優(yōu)于單一的語(yǔ)音交互模式。
智能座艙多模態(tài)交互技術(shù)在不斷的發(fā)展中,目前比較主流的技術(shù)有信息識(shí)別、車載多維人機(jī)界面系統(tǒng)和新興汽車智能單元三個(gè)領(lǐng)域。
汽車人機(jī)交互指令信息辨識(shí)技術(shù),一般有觸覺(jué)辨別、動(dòng)作辨別、凝視辨別、頭部姿勢(shì)辨識(shí)和語(yǔ)音識(shí)別等。從目前汽車行業(yè)人機(jī)交互界面的發(fā)展?fàn)顩r分析,未來(lái)汽車行業(yè)人機(jī)交互方法將越來(lái)越多樣化,更多的人機(jī)界面設(shè)計(jì)都將偏向于把視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等多種感覺(jué)通道進(jìn)行綜合設(shè)計(jì),達(dá)到信息識(shí)別的最優(yōu)化。
3.1.1 觸摸識(shí)別
智能座艙內(nèi)的顯示觸摸屏,觸摸識(shí)別類似過(guò)去的按鈕,但功能遠(yuǎn)超按鈕。其包含的關(guān)鍵技術(shù)涉及觸覺(jué)傳感器、電容式觸覺(jué)傳感、接近感應(yīng)和觸覺(jué)反饋。其中,技術(shù)核心是高性能的觸覺(jué)傳感器。這種依托于材料科學(xué)、柔性電子技術(shù)、納米技術(shù)的高性能觸覺(jué)傳感器顯著提升了智能座艙內(nèi)觸摸屏可觸摸識(shí)別功能板塊的分辨率和靈敏度,在未來(lái)有望實(shí)現(xiàn)進(jìn)一步的功能和場(chǎng)景突破。
3.1.2 手勢(shì)識(shí)別
手勢(shì)識(shí)別這種最基本的人類肢體語(yǔ)言能夠區(qū)分二維手勢(shì)辨識(shí)和三維手勢(shì)辨識(shí)。二維動(dòng)作識(shí)別即靜止手勢(shì),如點(diǎn)贊、用手去比劃數(shù)字等。一些復(fù)雜手勢(shì)需要通過(guò) 3D攝像頭和先進(jìn)的車載傳感器結(jié)合進(jìn)行檢測(cè)。由于車艙內(nèi)攝像頭數(shù)量逐漸增加,再加上多模態(tài)混合技術(shù)和人工智能技術(shù)(Artificial Intelligence, AI)算法的提升,各種優(yōu)秀的車載感應(yīng)器的性價(jià)比將提高,手勢(shì)識(shí)別裝置也會(huì)在提升手勢(shì)識(shí)別信息庫(kù)的豐富程度、識(shí)別時(shí)間和高效可用性等方面有所突破。
3.1.3 視線識(shí)別
人眼狀態(tài)是駕駛員發(fā)出的重要信息,駕駛員在駕駛過(guò)程中視線處于哪個(gè)位置、短暫凝視狀態(tài),都是有用信息。特別是車上有語(yǔ)言、行為障礙的用戶,這是一種相對(duì)簡(jiǎn)單、直接的交互方式。它需要眼球追蹤器和遠(yuǎn)紅外光線模組進(jìn)行視線捕捉、追蹤。頭部位置識(shí)別相對(duì)淺顯易懂,如簡(jiǎn)單的點(diǎn)頭、搖頭動(dòng)作??膳c視線識(shí)別進(jìn)行融合。
3.1.4 語(yǔ)音識(shí)別
在多模態(tài)交互技術(shù)中,語(yǔ)音交互也是第一核心技術(shù)。智能座艙中的大部分功能場(chǎng)景,如導(dǎo)航、打電話、調(diào)節(jié)車內(nèi)溫度、聽(tīng)音樂(lè)都可通過(guò)語(yǔ)音交互來(lái)完成,語(yǔ)音交互功能可依靠深度學(xué)習(xí)軟件不斷提高識(shí)別水平。
科大訊飛在目前智能語(yǔ)音助手行業(yè)占有重要份額。在智能座艙領(lǐng)域,科大訊飛與絕大多數(shù)國(guó)內(nèi)自主品牌車企、合資品牌車企合作開(kāi)發(fā)語(yǔ)音助手??拼笥嶏w率先推出的聲源定位技術(shù)、窄波束定向識(shí)別技術(shù)、全雙工立體聲回聲消除技術(shù)定義了如今智能座艙內(nèi)語(yǔ)音交互的主流技術(shù)。
汽車人機(jī)交互界面作為人和車輛之間交互頻率很高的重要區(qū)域,以集成的多界面、多模態(tài)和多區(qū)域的新形態(tài),向汽車多維人機(jī)界面方向發(fā)展。
3.2.1 智能多模態(tài)交互人機(jī)界面
智能多模態(tài)交互人機(jī)界面目前逐漸成為智能座艙行業(yè)研究和發(fā)展的熱點(diǎn)。與之前交互人機(jī)界面相比,它更有直觀性和高效性,適應(yīng)了智能座艙日趨復(fù)雜的情景要求。智能多模態(tài)人機(jī)交互界面結(jié)合了語(yǔ)音交互、手勢(shì)交互、視線交互、頭部位置交互、觸摸屏交互等交互方式,也融合了提取人體生理信號(hào)、聲紋識(shí)別和臉部微表情變化等特征提取與特征融合技術(shù)。這些交互方式取長(zhǎng)補(bǔ)短,避開(kāi)了各自在單一交互模式上的局限性,能滿足用戶更大的需求,未來(lái)的想象空間也更大。各種感官交互可以自由組合,完成一次多模態(tài)交互,最常見(jiàn)的就是基于聽(tīng)覺(jué)的語(yǔ)音交互與基于觸覺(jué)的觸摸屏交互以及手勢(shì)識(shí)別交互。如用戶最基礎(chǔ)的需求之一,控制座艙內(nèi)溫度,通過(guò)語(yǔ)音發(fā)出指令“我有點(diǎn)熱”,座艙內(nèi)空調(diào)會(huì)打開(kāi),通過(guò)手勢(shì)識(shí)別調(diào)節(jié)溫度,如果需要調(diào)節(jié)到具體溫度,則需通過(guò)觸摸屏交互完成。
1.無(wú)障礙信息交互
殘障人士由于感官和認(rèn)知能力上的不足,不能完成正常的交互。多模態(tài)交互將幫助殘障人士以及廣義上的應(yīng)幫扶弱勢(shì)群體完成信息無(wú)障礙交互。如基于計(jì)算機(jī)視覺(jué)的道路識(shí)別技術(shù)通過(guò)立體聲或震動(dòng)反饋為視力障礙用戶指引方向。運(yùn)動(dòng)能力障礙用戶可通過(guò)手勢(shì)交互和視線交互完成想要的功能指令。目前的自動(dòng)駕駛汽車,更是可以通過(guò)方向盤與觸覺(jué)識(shí)別的結(jié)合,協(xié)助視力障礙用戶控制車輛的轉(zhuǎn)向。
2.人車協(xié)同控制
智能輔助駕駛系統(tǒng)可以在人車之間發(fā)生危險(xiǎn)時(shí)發(fā)出警告甚至強(qiáng)制執(zhí)行制動(dòng)或轉(zhuǎn)向來(lái)避免危險(xiǎn)。人車協(xié)同控制技術(shù)則是從“互聯(lián)互通、雙向協(xié)同”的角度實(shí)現(xiàn)人車協(xié)同。如未來(lái)的自動(dòng)駕駛汽車,人可以通過(guò)多模態(tài)人機(jī)交互界面向汽車提出駕駛請(qǐng)求,車也可以通過(guò)多模態(tài)人機(jī)交互界面向人提出接管駕駛的請(qǐng)求。人的駕駛觀點(diǎn)也可以與車通過(guò)多模態(tài)交互進(jìn)行交流互動(dòng),不僅利于人車協(xié)同控制情況下保證安全和合規(guī),也利于車企更直接地收集用戶意見(jiàn)和用戶需求。目前已有相關(guān)學(xué)者研究開(kāi)展多模態(tài)下人車控制權(quán)移交的完整流程[6]。
根據(jù)李明俊博士的研究[7],要實(shí)現(xiàn)人機(jī)協(xié)同控制,首先就是駕駛意圖判斷,駕駛意圖判斷需通過(guò)仿真實(shí)驗(yàn)平臺(tái)采集駕駛意圖數(shù)據(jù),采集后的數(shù)據(jù)用于建立駕駛意圖方向的數(shù)據(jù)庫(kù)。再通過(guò)駕駛意圖數(shù)據(jù)庫(kù)所生成的關(guān)于駕駛環(huán)境危險(xiǎn)評(píng)估、表現(xiàn)評(píng)估、路徑跟隨的參數(shù),再結(jié)合模糊控制理論,建立出結(jié)合人機(jī)協(xié)同控制的模糊控制器和協(xié)同控制策略。通過(guò)駕駛員意圖識(shí)別和駕駛環(huán)境信息采集形成的駕駛危險(xiǎn)評(píng)估,再通過(guò)路徑更新所生成的路徑控制器共同生成人機(jī)控制權(quán)分配策略。具體人車協(xié)同控制流程如圖2所示。

圖2 人車協(xié)同控制流程
3.2.2 空間立體交互
空間立體交互即用戶在三維空間內(nèi)完成交互,它有一個(gè)核心理念,就是讓數(shù)據(jù)、功能出現(xiàn)在它最該出現(xiàn)的位置,而不是集合在相近的位置。如理想L9實(shí)現(xiàn)的五屏交互,這是最直觀的空間立體交互,如圖 3所示。未來(lái)的三維空間更多依賴于AR虛擬現(xiàn)實(shí)技術(shù)、3D顯示技術(shù)、虛擬投影技術(shù)。多模態(tài)交互空間不再局限于中控儀表這些傳統(tǒng)界面。特別是AR虛擬現(xiàn)實(shí)技術(shù),能夠?qū)F(xiàn)實(shí)和虛擬世界結(jié)合在一起。在導(dǎo)航上,將實(shí)際路面信息與導(dǎo)航信息相疊加呈現(xiàn)出來(lái),增強(qiáng)時(shí)空信息呈現(xiàn)效果。AR導(dǎo)航提供給用戶駕駛中應(yīng)掌握的全部信息,如距離前車多少米、車道線信息、對(duì)駕駛安全造成隱患的信息等等,提供完整的車輛情景和非機(jī)動(dòng)車、行人等弱勢(shì)道路使用者的信息,增強(qiáng)了用戶對(duì)整體的把握能力,實(shí)現(xiàn)安全、準(zhǔn)確、愉悅的駕駛。

圖3 空間立體交互
智能表面是多模態(tài)交互中的重要組成部分,在未來(lái)將成為智能座艙多模態(tài)交互最重要的載體,未來(lái)智能座艙內(nèi)每一個(gè)表面都能成為智能表面。從觀賞性的角度,未來(lái)它也會(huì)被注入更多的美觀甚至藝術(shù)氣息,但在用戶使用的時(shí)候,它甚至可以在未來(lái)慢慢取代車內(nèi)的幾塊大屏的作用,完成溫度控制、座椅調(diào)節(jié)、音樂(lè)播放、光線調(diào)節(jié)等功能多模態(tài)交互。智能表面又名模內(nèi)電子,它是將模內(nèi)裝飾和柔性印制電路結(jié)合到一起,它比傳統(tǒng)人機(jī)接口(Human Machine Interface, HMI)設(shè)計(jì)更加輕巧,使用更加便利。未來(lái)在智能表面上完成的多模態(tài)交互,設(shè)計(jì)者不再受限于龐大的電路要求完成設(shè)計(jì),智能座艙內(nèi)的多模態(tài)交互真正做到無(wú)處不在和無(wú)孔不入。在技術(shù)上,智能表面很多技術(shù)都與智能手機(jī)相同,也可發(fā)展薄膜材料與納米技術(shù)的結(jié)合、電鍍技術(shù),再融合電子功能。通過(guò)慣性傳感器、紅外傳感器、雷達(dá)系統(tǒng)、眼動(dòng)追蹤、力感應(yīng)等多個(gè)傳感器,智能表面將了解你目前具體所處的情景。如智能表面感知到你因寒冷身體發(fā)抖,就會(huì)打開(kāi)空調(diào)暖風(fēng)和座椅加熱;感知到你駕駛非常不熟練,就會(huì)強(qiáng)制關(guān)閉音樂(lè)等可能對(duì)你造成干擾的聲音;感知到你在高速上車速過(guò)快,自動(dòng)掛斷電話來(lái)保證你的駕駛安全。智能座艙未來(lái)必定在美學(xué)上和交互立體感和全面性上有更高的要求,智能表面將會(huì)越來(lái)越重要。
個(gè)人智能助理主要與智能輔助系統(tǒng)結(jié)合,以智能機(jī)器人、智能專家等形式出現(xiàn)。用于提供出行各方面信息、提供娛樂(lè)需求和情感陪伴。如寶馬所推出的“寶馬(Bayerische Motoren Werke,BMW)個(gè)人助理”,用戶對(duì)它提出的要求都能得到解答,會(huì)調(diào)動(dòng)座艙內(nèi)可調(diào)動(dòng)的功能滿足用戶的需求,想用戶所想。未來(lái)智能表面與智能助手相結(jié)合,全方位滿足用戶對(duì)多模態(tài)交互高效性、立體感、情感性方面的需求。
本文詳細(xì)論述了智能座艙之于汽車的重要性和多模態(tài)交互技術(shù)之于智能座艙的重要性。雖然“智能座艙”這個(gè)概念雖已被廣大用戶所熟知,但是各大車企之間存在著孤島效應(yīng),互聯(lián)互通能力的缺失無(wú)法讓車企之間的智能座艙實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ)。同時(shí),多模態(tài)交互還沒(méi)有發(fā)展成熟,更多的技術(shù)應(yīng)被融入到多模態(tài)人機(jī)交互中。基于此,本文給出一些發(fā)展建議。
智能座艙的標(biāo)準(zhǔn)化評(píng)估機(jī)制有待進(jìn)一步建立完善,行業(yè)內(nèi)尚未完整、統(tǒng)一的評(píng)價(jià)方法。未來(lái),行業(yè)主管部門應(yīng)聯(lián)合行業(yè)相關(guān)標(biāo)準(zhǔn)化組織,如汽車標(biāo)準(zhǔn)化技術(shù)委員會(huì),進(jìn)一步完善智能座艙新領(lǐng)域的標(biāo)準(zhǔn)化工作,統(tǒng)一術(shù)語(yǔ)定義,規(guī)范試驗(yàn)方法,在多模態(tài)交互技術(shù)方面更多的盡快形成統(tǒng)一的評(píng)判標(biāo)準(zhǔn)。
目前,智能座艙主要針對(duì)中高端車,成本問(wèn)題不容忽視。為推動(dòng)智能座艙的大規(guī)模應(yīng)用,國(guó)家工信部已出面聯(lián)合地方政府營(yíng)造良好的應(yīng)用環(huán)境,不斷創(chuàng)造條件以鼓勵(lì)研發(fā)、示范運(yùn)營(yíng),直至市場(chǎng)化運(yùn)行,引導(dǎo)消費(fèi)者對(duì)此類產(chǎn)品的了解和選購(gòu),降低由此帶來(lái)的研發(fā)成本,不斷推動(dòng)智能座艙等先進(jìn)智能化、網(wǎng)聯(lián)化技術(shù)的研發(fā)和應(yīng)用。各大車企智能座艙產(chǎn)品的聯(lián)系與相互借鑒也日漸增多。如目前中汽數(shù)據(jù)牽頭成立的2022中汽數(shù)據(jù)智能聯(lián)盟創(chuàng)新發(fā)展聯(lián)盟,致力于解決各大車企互聯(lián)互通方面的問(wèn)題。
在多模態(tài)人機(jī)交互技術(shù)真正大規(guī)模應(yīng)用于智能座艙之前,語(yǔ)音人機(jī)交互功能依然是目前智能座艙人機(jī)交互的主導(dǎo),但當(dāng)前的語(yǔ)音人機(jī)交互功能,在情感化、多輪對(duì)話、提醒/打斷方面,仍亟待改善。未來(lái),語(yǔ)音研發(fā)科研企業(yè)或單位應(yīng)進(jìn)一步完善語(yǔ)音交互功能,實(shí)現(xiàn)智能座艙的語(yǔ)言交互系統(tǒng)能夠比較精準(zhǔn)地辨別用戶的日常用語(yǔ)、方言甚至是一些專業(yè)術(shù)語(yǔ)。科大訊飛未來(lái)在技術(shù)領(lǐng)域的探索將給各大車企智能座艙提供更多技術(shù)支撐。
聲紋技術(shù)可以為不同的駕乘人員提供差別化服務(wù)。相對(duì)于智能座艙中普遍采用的語(yǔ)言交互,聲紋識(shí)別技術(shù)是一項(xiàng)科技門檻相對(duì)更高的領(lǐng)域,在汽車行業(yè)中的應(yīng)用也還處在起步階段。聲紋識(shí)別可進(jìn)行更精確的使用信息習(xí)慣收集,改善車內(nèi)互動(dòng)感受,從而提高汽車安全防護(hù)。
智能表面是指座艙內(nèi)任何一個(gè)部分都可以完成多模態(tài)交互,智能助理相當(dāng)于用戶一個(gè)智能化的車機(jī)助手,能主動(dòng)根據(jù)用戶學(xué)習(xí)思考用戶的需求。兩者結(jié)合將對(duì)提升汽車座艙智能化水平起到合力推動(dòng)作用,相關(guān)供應(yīng)商企業(yè)或科研單位應(yīng)注重此類技術(shù)的研發(fā),以提供多元化的駕乘體驗(yàn)。