陳孝良
2月16日,百度宣布全資收購渡鴉科技。百度集團總裁和首席運營官陸奇表示,憑借其語音與對話技術(shù)的優(yōu)勢,百度在引領(lǐng)新一代人機交互平臺上擁有巨大的機會。同一天,彭博社報道稱,華為正計劃開發(fā)自主語音助手服務(wù),瞄準Siri、Alexa和谷歌助手,涉足語音助手市場。顯然,隨著亞馬遜、Google相繼在語音交互設(shè)備上發(fā)力,市場已經(jīng)看到了這一領(lǐng)域的無限潛力。
智能語音助手成火爆話題
說到語音交互,這其實并不是什么新東西。在中國手機市場上,若干年前就出現(xiàn)過一些簡單的語音操控工具比如用戶可以對著手機說話,進行發(fā)送短信、撥打電話、點播歌曲等操作,但是這些產(chǎn)品并不屬于智能語音助手。真正的智能語音助手主要是基于人工智能、機器學習等技術(shù),它們能夠理解用戶的日程安排和興趣愛好能夠提供各種信息和服務(wù),甚至能夠智能分析兩人的聊天對話,從而給出快速答復的建議。
近年來,隨著人工智能技術(shù)的不斷發(fā)展,基于人工智能技術(shù)的智能語音助手也得到了人們的關(guān)注。從亞馬遜的Echo開始,這種外形簡潔美觀,看上去只是一個藍牙音箱,但卻因為具備智能語音助理能力而內(nèi)藏乾坤的小玩意兒就成為了熱點。除了前文說到的百度和華為,幾乎國內(nèi)外所有IT巨頭都相繼進入了智能語音交互市場。
去年10月,英特爾與科大訊飛簽署合作備忘錄。根據(jù)英特爾內(nèi)部消息,英特爾將與科大訊飛合作共同研發(fā)AI芯片,該芯片將麥克風陣列、遠場語音識別等功能集成到SoC當中,以形成完整的遠場語音交互鏈條。此次合作也正式宣告英特爾將進入智能語音交互市場。除了英特爾,三星同樣在語音助手領(lǐng)域的積極布局。三星于去年10月份收購了致力于打造開放式人工智能助理平臺的初創(chuàng)公司Viv Labs,同時以80億美元收購哈曼國際,隨后又聯(lián)合GPU巨頭英偉達投資SoundHound。SoundHound是一家致力于語音識別與搜索的初創(chuàng)科技公司,最初SoundHound的主要服務(wù)是提供和音樂有關(guān)的信息。
Facebook創(chuàng)始人扎克伯格也在2016年花費100小時完成了AI管家Jarvis的開發(fā)。扎克伯格及家人可Z用語音向手機或計算機下達指令實現(xiàn)燈光、溫度、電器、音樂和安防設(shè)備的控制操作。Jarvis系統(tǒng)具備的學習功能可使其識別主人的偏好模式、學習新詞匯與相關(guān)概念。
更有甚者,微軟在Build 2016大會上幾乎完全放棄了實際的產(chǎn)品,而主講人工智能和它可以覆蓋到的那些服務(wù);Google CEO桑達爾-皮查伊在Google I/O 2016開發(fā)者大會上重復得最多的詞語也是自然語言處理、人工智能和機器學習。
隨著亞馬遜、谷歌、微軟相繼在語音交互設(shè)備上發(fā)力,市場已經(jīng)看到了這一領(lǐng)域的無限潛力。語音作為人類交流最自然的方式,比文字和圖像更具天然的優(yōu)勢。尤其是亞馬遜Echo的成功,把人們帶到了無屏時代的門前。智能語音助手也因此成為了非常火爆的話題,幾乎掀起了全行業(yè)研究亞馬遜Echo的熱潮。
為何智能語音交互市場如此火爆?
VoiceLabs近日發(fā)布了《2017年語音報告》(The 2017 Voice Report)。報告對亞馬遜Alexa和谷歌Google Home的開發(fā)者和消費者進行了調(diào)查,總結(jié)了目前的智能語音市場,并對2017年的趨勢做出預測。該報告預測,2017年語音產(chǎn)業(yè)結(jié)構(gòu)將按照硬件產(chǎn)品、AI軟件、語音應(yīng)用App、生態(tài)系統(tǒng)服務(wù)相結(jié)合的架構(gòu)繼續(xù)向前發(fā)展。預計2450萬臺以語音為主要交互方式的智能硬件產(chǎn)品發(fā)貨,市場總量將達到3300萬臺,市場規(guī)模超過200億美元。而對各種智能語音助手以及語音交互App而言,競爭將更加激烈。
亞馬遜于2014年底推出智能音箱Echo如今已成為美國使用最廣的智能家居產(chǎn)品,根據(jù)CIRP的報告,自2014年11月發(fā)布到2017年1月,亞馬遜Echo系列(包括Echo、EchoDot和Tap)用戶已達到820萬,同比增長2倍,較2016年11月時的數(shù)據(jù)增長60%。而亞馬遜公司2017年的銷量目標是1000萬,銷量激增的背后是Echo正迅速從早期用戶的小眾圈子進入大眾市場。
從產(chǎn)品銷量、技術(shù)進展,到相關(guān)創(chuàng)業(yè)公司的興起以及資本市場的頻繁運作,種種跡象表明,智能語音交互市場的趨勢已經(jīng)明朗,語音是AI領(lǐng)域中最先落地的應(yīng)用之_。這從電子技術(shù)發(fā)展歷程中也可參考類比,以語音為核心的電話是20世紀最偉大的發(fā)明之一,而其后相當長的時間才出現(xiàn)以視頻為主的電視,移動電話同樣遵循了這個規(guī)律。從物理層面來看,語音信號無論是從數(shù)據(jù)量還是計算量方面都低于視頻信號,這在趨勢剛興起的時候,更容易適用于遠未標準化的硬件體系,但是隨著技術(shù)的發(fā)展,多傳感的融合仍然是根本趨勢。
語音交互市場的全球競爭態(tài)勢初顯
VoiceLabs預測,亞馬遜或Google今年會通過類似手機上的推送通知來加強新應(yīng)用的分發(fā),并試圖解決用戶留存率低的問題,而2017年也將是語音應(yīng)用貨幣化的起步元年D當智能語音助手充分了解“主人需求之后,應(yīng)有能力在合適的時間主動提示合適的應(yīng)用,既提高用戶的使用價值,又解決了語音應(yīng)用的分發(fā)留存問題。
從全球來看,亞馬遜Echo最有競爭力的對手當屬GoogleHome。Google Home自2016年推出以來一直與Echo明爭暗斗,爭搶智能家居中樞的角色。通過亞馬遜和Google在美國“超級碗”投放的電視廣告就能體會到這種競爭的激烈,兩家不約而同地打出了溫馨家庭“懶生活”牌,突出產(chǎn)品智能管家的功能。
美國市場調(diào)查機構(gòu)Slice Intelligence近日發(fā)布的一份報告,對在線購買Echo消費者的性別、年齡、購物習慣等特征進行了統(tǒng)計。某種層面上,這意味著Echo在消費者眼中不再是只有極客和技術(shù)控才感興趣的“玩意兒”,而是獲得廣泛認同的大眾消費品。當電子消費品獲得了女性用戶的認可,并且呈現(xiàn)出女性消費者占據(jù)市場購買主導優(yōu)勢后,產(chǎn)品將逐漸成為成熟品類,并迅速出現(xiàn)銷量攀升態(tài)勢。Google已經(jīng)意識到與亞馬遜的差距,正盡力通過收購等方式快速彌補這種差距。2017年1月初,Google宣布收購LimesAudio并表示將會把Limes Audio集成到自己的視頻會議解決方案中,為客戶提供低成本、高質(zhì)量的音頻體驗。此外,微軟、蘋果等公司也在不斷強化自家的智能語音助手。
反觀國內(nèi),類似Echo的產(chǎn)品始終沒有吸引到消費者的眼球。一般來說,國內(nèi)相比國外市場有6-18個月的延后,但是以國內(nèi)的技術(shù)水平來看,可能需要的時間更長一些,國內(nèi)在語音助手方面的布局略顯不足。科大訊_飛雖然在技術(shù)鏈條上最為完善,也推出了類似Echo的叮咚產(chǎn)品,但是市場反響一直沒有達到預期。百度、阿里、騰訊、360也加大投入做了布局,但是技術(shù)鏈條仍不完善,產(chǎn)品和服務(wù)始終沒有很好的落地。即便在技術(shù)環(huán)節(jié),國內(nèi)活躍的創(chuàng)業(yè)公司相比國外也少了很多,語音識別領(lǐng)域主要還是云知聲和思必馳,NLP領(lǐng)域主要是三角獸、驀然、竹簡等,顯然技術(shù)也制約了國內(nèi)智能語音交互市場的發(fā)展。
可見,在智能語音交互的全球競爭之中,國內(nèi)的AI巨頭似乎才剛剛蘇醒。