馮世杰,劉鵬飛,靳 兵
(海馬汽車有限公司,河南 鄭州 450016)
從語音識別技術(shù)的智能化程度來講,車載語音發(fā)展可粗略地劃分為3個階段[1]。第1個階段為發(fā)展期 (2000~2010年),最早搭載語音交互功能的車是通用的OnStar系統(tǒng),可以通過駕駛員在車內(nèi)進(jìn)行語音激活,根據(jù)需求提供實時交通與路況信息、天氣、新聞等。這時的語音技術(shù)為條目式語音交互,網(wǎng)絡(luò)狀態(tài)為本地識別,產(chǎn)品識別率低,用戶體驗比較差;第2個階段為普及期 (2010~2015年),這個階段自然語言技術(shù)開始應(yīng)用,車聯(lián)網(wǎng)汽車加入了網(wǎng)聯(lián)服務(wù)和云端識別,產(chǎn)品表現(xiàn)上識別率得到了較大的提升;第3個階段為成熟期(2015~至今),自然語言技術(shù)和4G網(wǎng)絡(luò)成為主流,產(chǎn)品的識別準(zhǔn)確率超過90%,新車型的搭載也達(dá)到100%。
目前車載語音功能[2]大致可以分為這幾類:語音導(dǎo)航、收音機(jī)及在線音樂等音頻控制、藍(lán)牙電話及短信控制、車輛狀態(tài)信息查詢、生活服務(wù)信息查詢以及車輛智能語音控制。本文涉及的車載語音功能設(shè)計為車載智能語音控制,控制的車載功能主要有空調(diào)控制、全景天窗控制、燈光雨刮洗滌控制、座椅加熱控制、外后視鏡及氛圍燈控制、車載智能場景控制等,具體場景功能見表1。
語音功能的實現(xiàn)路徑見圖1。

圖1 車載語音功能實現(xiàn)過程
駕駛員喚醒車載語音系統(tǒng)之后,發(fā)出自然語言指令,車載麥克風(fēng)接收語音進(jìn)行前段信號處理,并將其傳遞給音響主機(jī),音響主機(jī)對接收到的語音數(shù)據(jù)進(jìn)行語音識別和語音理解,將其轉(zhuǎn)換為CAN網(wǎng)絡(luò)報文信號傳遞給執(zhí)行控制器,控制器接收到相關(guān)的報文信號后驅(qū)動執(zhí)行機(jī)構(gòu),實現(xiàn)語音控制功能,并把功能實現(xiàn)后的狀態(tài)反饋給音響主機(jī)。
CAN總線[3]為本文項目的基礎(chǔ)車載網(wǎng)絡(luò)通信技術(shù),負(fù)責(zé)各個CAN控制器節(jié)點(diǎn)功能信號傳輸,所以基于CAN總線進(jìn)行車載語音功能的設(shè)計,具備傳輸性能可靠成熟、報文信號定義簡便、開發(fā)周期短及開發(fā)成本低等優(yōu)點(diǎn),詳細(xì)的語音功能總線信號設(shè)計見表2。

表1 語音車控功能列表

表2 語音功能網(wǎng)絡(luò)通信設(shè)計

表2 (續(xù))

表2 (續(xù))
在整車網(wǎng)絡(luò)通信系統(tǒng)中,以ASR(Automatic Speech Recognition)開頭命名的信號為車載語音功能專有信號,信號名稱中后綴的“X”U為該信號占用的字節(jié)位數(shù)。
本文中描述的車載語音功能設(shè)計與實現(xiàn)已經(jīng)完成了設(shè)計與測試工作,并在海馬汽車某車型上量產(chǎn)發(fā)布。在后續(xù)的車載語音控制功能中還可以擴(kuò)展:主副駕座椅調(diào)整、記憶及迎賓功能,外后視鏡打開與折疊功能,五門開啟與關(guān)閉功能,360全景界面切換功能等車輛輔助駕駛設(shè)置與控制。
在未來車載語音[4]數(shù)據(jù)的收集與分析將會成為車載語音系統(tǒng)競爭的關(guān)鍵要素,一方面可以通過持續(xù)的數(shù)據(jù)積累提升語音識別準(zhǔn)確率與語義理解能力,另一方面豐富的數(shù)據(jù)將會為整個產(chǎn)業(yè)帶來巨大的變現(xiàn)潛力。
從車載語音技術(shù)上講,被動式的語音交互將會朝向主動式語音發(fā)展,車載語音系統(tǒng)將會根據(jù)當(dāng)前的時間、外部環(huán)境、車況及交通狀況,結(jié)合用戶的使用習(xí)慣和日常出行等數(shù)據(jù),分析可能存在的需求,主動推送和詢問。同時,在自動駕駛和汽車共享的推動下,車載語音系統(tǒng)的個性化服務(wù)也將迎來新的發(fā)展機(jī)遇。