李婷
車載語音交互平臺的競爭開始從引擎能力競爭,向數據和計算能力+資源整合能力的下半場轉戰。
互聯網汽車成為無人駕駛能夠真正落地商業化生產前的最優選擇,畢竟讓汽車更懂人的需求,比顛覆駕駛方式和交通環境來得更加容易。
冬天坐上汽車座位,說聲“好冷啊”,“懂事”的汽車就會將你所在位置的空調打開;看到天氣不好,說聲“下雨了”,雨刷便開始了工作……
不管是在導航、聽音樂、打電話等特定場景下的車載應用,還是各種車內硬件裝置設備,要想讓汽車變得更有溫度,開始“說人話”,用戶在駕駛中可以“能動嘴,絕不動手”,人機交互少不了對話。而語音則是車載系統不可或缺的操作入口。
已經有大批的巨頭在智能語音交互車載上做出了相應的布局。目前,車載語音交互平臺的競爭,開始從自然語言處理(NLP)+自然語言理解(NLU)引擎能力的競爭,向數據和計算能力+資源整合能力的下半場博弈。而車載語音交互帶給用戶的體驗也在演進,從“毫無感情”的固定單項輸出播報,到能聽清關鍵詞進行語音輸入,再升級成能聽懂和進行個性化交互。
場景驅動 服務找人
阿里的云棲大會一向受技術圈關注。去年七月的那一場因為一款車而變得與眾不同,那是在阿里云棲小鎮的一場發布會上,阿里巴巴集團CEO張勇駕駛著一輛榮威RX5上場,副駕上坐的是是阿里的CTO王堅,而后座上聊著天的是阿里巴巴董事局主席馬云和上汽集團董事長陳虹。當時馬云不但親自為榮威RX5的首發站臺,還捧場說要買幾臺送朋友。
這個榮威RX5是一款互聯網汽車,由上汽集團與阿里巴巴合資成立的斑馬網絡技術有限公司(簡稱斑馬網絡)打造的。它的不同之處在于,搭載了一款以阿里的OS為基礎,經過三年打磨,研發出了能讓車實時在線的AliOS操作系統。
斑馬網絡CEO施雪松認為,它是一款能解決“人、車和服務”在線問題的互聯網汽車。
互聯網汽車的核心要屬智能語音控制系統,它需要經過語音識別、語義理解、聯動執行及反饋用戶這幾個步驟。自然語言處理(NLP)+自然語言理解(NLU)引擎的搭建,能夠讓車載系統聽清并聽懂大部分的語音,但是因為周圍環境的干擾、用戶口音的變化、句子本身的歧義等等,都讓智能語音系統需要數據燃料的加持,進行自我學習。
語音技術的不斷完善,也離不開CPU的計算能力、儲存性能、傳感能力等基礎設施。斑馬技術依靠著阿里,攜手上汽可以更加容易從數據、算法和其他服務資源等進行整合和對接,打造的互聯網汽車AliOS系統也有了技術支持和試錯空間。
據施雪松介紹,車載系統已經升級到了2.0版本,目前使用阿里的語音系統可以把車內的語音識別和類似天貓精靈的語音系統完全融合。比如用戶還在家里就可以對音箱說“我要去上班”,這時車載系統就能收到信息做好出發準備。
此外,斑馬網絡提供的“斑馬智行系統”里,能直接連接其他終端運用,比如和支付寶賬戶打通,通過分析屬于用戶的衣食住行的數據,推測用戶需要得到的服務,然后主動進行語音服務推介,降低手動操作的危險性。當用戶在淘票票上買了一張電影票,這個信息也會被同步到斑馬平臺。車主上車后,平臺會基于一套人工智能驅動的UE(用戶體驗)引擎,自動彈出4~5個連貫的場景,比如去電影院的路線、停車場信息等等。
“2.0系統最本質的變化在于平臺端使用基于數據的人工智能技術,實現場景化應用,上車以后是‘場景驅動,服務找人,這也是我們兩年前提出的價值主張。” 施雪松說道,今年搭載斑馬網絡的互聯網汽車數量超過了25萬,到年底能接近40萬輛左右,隨著和神龍用車的合作以及更多的汽車品牌的加入,明年在100萬輛左右。
智能語音車載多頭之戰
除了榮威RX5,科大訊飛與奇瑞自2015年起深入合作,今年11月發布了面向汽車后市場的三款語音新品——飛魚UI,飛魚語音助理和飛魚慧眼。另外,大眾、福特、現代、寶馬等公司也均以不同深度的嘗試引用亞馬遜Alexa的語音服務運用。百度和騰訊也紛紛加大了入局的籌碼。
騰訊今年提出“AI in Car生態系統”概念后,和廣汽集團自主研發了iSPACE智聯電動概念車。兩者達成在車聯網服務、智能駕駛、云平臺、大數據等領域的合作意愿。其中騰訊叮當在語音方面的深耕,讓這款汽車實現 “能聽清、能聽懂、能滿足、會反饋”的服務和功能。
在今年的百度世界大會上,百度也推出了小度車載系統,它是百度面向車機場景定義的人車AI交互系統。百度官方稱小度車載系統一次性開放了包括智能語音助手在內的七大AI核心能力。一方面,基于百度云的計算能力,車載語音交互產品可以實現實時更改與聆聽,速度提升多倍。另一方面,百度豐富的數據資源也能提升車載語音平臺解決問題的能力。
這樣看來,BAT都在以“內容+服務輔以基礎性的AI能力”加持語音車載系統,積累車內的場景數據來提升產品力。小度車載系統加上阿波羅自動駕駛平臺,已經和金龍客車、北汽等簽下了量產合作協議;而騰訊的強社交性和產品內容生產會更加凸顯。但在施雪松看來,騰訊以超級APP的打法很難覆蓋到所有的功能和場景, AliOS系統的優勢在于它的平臺屬性和云端一體化的數據共享能力。
地平線創始人黃暢認為,語音識別、語義理解的精準度已經很高了,過分看中技術本身的能力,而忽視產品交互環節和特性上的設計是不對的,最終給用戶的應該是完整的體驗,技術只是其中的角色之一。
“現在智能車載的痛點是線下數據的線上化。如何把基于聲音的各種感知和語義信息通過提取、歸結、整理,然后送入云端進行合成處理和分析才是重點。物理世界通過數字化變成虛擬世界,在物理世界中很多約束和限制,包括時間和空間會被打破,圍繞它的操作都會變得便捷。”黃暢說。
車聯網從最初圍繞呼叫中心導航等功能,到后來的前裝+后裝“亂戰階段”,現在正處于車廠、開源技術商、平臺服務商等全方位整合資源的時期,在實際使用層面讓產品和服務更落地。
不管是谷歌、蘋果、微軟、亞馬遜還是阿里巴巴、百度、騰訊、360等,依托各自已有的技術支持和市場人氣,從電動車到無人駕駛,從車載智能到車載聯網,都在以不同的打法建立汽車生態鏈。語音在其中賦能了汽車“耳朵和嘴巴”的感知和交互能力,拼揍的是未來智能汽車的部分大腦。
最終汽車是一個狀態,對人的生活和出行帶來了多大的改變,還需要時間的檢驗。