
到2013年,大量的應用開發商、終端移動設備和用戶都將開始向語音和人機交互的生活領域遷徙。
在街頭如果想起了好友,你可以對著手機說“動態消息”,那么它會幫你打開所有動態新聞鏈接;如果說“附近的朋友”,那么它會告訴哪些好友在你的附近;如果你說“朋友的音樂”,那么它會為你播放你最近和好友分享的音樂,總之包括朗讀新的訂閱消息、短信息、日程安排、更新自己的狀態、查看在線好友、查看附近的人等等,你可以聽一切Facebook上的內容——這是最近在都柏林網絡峰會上發布的一款應用WonderVoice。盡管這款應用仍然無法讓手機理解諸如“我的朋友現在在干什么?”之類的具體問句,但是面向社交網站的語音應用卻讓人耳目一新,對于年輕人來說,用語言進行交流,聽到朋友的聲音比看簡單的文字更有趣。
自從2010年,Siri這個由蘋果與全球最大的語音識別廠商Nuance合作整合的語音助理推出之后,短短兩年時間里,Siri已經成為最炙手可熱的技術產品,Siri代表的語音控制和人工智能就被科技界備加推崇。去年10月蘋果公司在iPhone 4S上推出Siri這款語音控制應用之后,今年最新推出的IOS6.0中進一步升級了Siri,在其支持的15個國家和地區語音中,特別增加了中國普通話、粵語和閩南話。
科技巨頭們早已發現了語音助理背后的商機。Siri的價值遠遠超過一個語音識別軟件,作為用戶的私人生活助手,讓用戶通過手機讀短信、詢問天氣、語音設置鬧鐘等,還可以通過Siri搜索餐廳、電影院等生活信息,直接收看各種相關評論,并且進行預定,而且隨著Siri越來越智能,針對用戶詢問給出的回答,不斷學習心得聲音和語調,Siri將會繞過搜索,掌握用戶的更多瀏覽行為數據以及與siri相關無限量應用都顯示出未來將迎來爆炸性的增長。
事實上,語音已經成為今年最熱的技術趨勢之一?!哆B線》雜志在評選siri為2011年5大具有深遠影響科技事件之一,而其創始人凱文·凱利在公開演講中把語音和手勢這樣的互動在科技中的應用看作是影響未來20年網絡世界的重要趨勢。
語音是人類社會最基本最自然的交流工具之一,也是創造人類的一個拐點,語音將我們的思想轉化為符號,并指導和控制我們的行為。當電腦誕生之后的相當一段時期里,人們都是運用手指敲入符號來與機器交流, Siri與iPhone 4S整合給業界帶來了很大的驚喜,電腦終于可以通過自然的語音與人類互動了,而今對于移動互聯網和智能手機而言,語音將是人類進行互動的效率更高更自然的工具,仿佛讓機器也具有了生命。
也許,對于很多技術人來講,語音產品仍然是美麗的陷阱,從上世紀90年代末IBM公司發布的ViaVoice 98 連續語音識別產品, 到2006年比爾.蓋茨預言未來將在操作系統中實現自然語音的人機交互,并支持微軟收購了TeLLME,掀起的語音熱潮,無數實驗室和技術人員前赴后繼地投入到語音控制與人工智能的幻象之中,語音控制一直沒有真正步入人們的互聯網生活。不過今天,日益成熟的移動互聯網環境、云計算和大規模數據的積累,以及大量智能終端的普及都讓語音的世界真正臨近爆發。不久前,IBM超級計算機“沃森”(Watson)在智力競答節目《危機邊緣》對海量數據信息迅速完成分析的能力,iOS系統的風行,各種語音應用的崛起都讓人不禁對語音和人工智能軟件嵌入到流行電子消費產品后的前景充滿期待——2013年大量的應用開發商、終端移動設備和用戶都將開始向語音和人機交互的生活領域遷徙。
爭奪入口
Yelp的聯合創始人兼CEO杰瑞米·斯托普爾曼(Jeremy Stoppelman)是蘋果各種活動的常客,在外界看來,消費者點評網站Yelp已經成為蘋果對抗谷歌的重要武器。蘋果在Siri后端鏈接了知識引擎Wolfram Alpha并集成了餐館點評網站Yelp、電影點評網站Rotten Tomatoes和餐館預訂服務OpenTable等大型消費內容網站,讓用戶可以使用Siri直接搜索所需要的餐館、酒店等生活信息,查詢附近的餐館時,幫助用戶做出最便捷的選擇。
而Yelp也同樣借助Siri成為美國,最有價值的消費內容網站。從2010年開始,Yelp開始加速擴張,覆蓋位于美國本土的20多個地區和加拿大、歐洲等地區,商家服務范疇也從餐飲、購物擴展到包括牙醫、機械師、水管工等家庭生活服務的各個領域。人們通過Siri隨意搜索,就能快速查找到這些日常信息,這也是繞過谷歌這些傳統搜索引擎,也分食谷歌的核心業務的廣告收入?!疤O果采取不同的策略,專注于搜索宇宙中的一個子集,與谷歌的競爭的不是關鍵字,而是爭奪細化執行每天數以百萬計的搜索算法?!眮嗰R遜搜索部門前高管,風險投資家David Tennenhouse說,“餐館,電影,體育,商家信息,地圖和位置 ——這些垂直行業的搜索最理想的方法是快速,易消化的結果,而不是谷歌?!?/p>
很快谷歌就意識到了Siri的威脅,谷歌執行董事長埃里克施密特(Eric Schmidt)公開表示出蘋果的語音助理服務Siri有可能威脅谷歌的搜索業務。谷歌仍然是搜索引擎的霸主,谷歌每月的搜索量高達1000億次,但是不能夠清楚地理解你的意思并且能夠給出最想要的結果,用戶將會最終拋棄谷歌而選擇其他入口,這也是谷歌隨后推出Google now的動力。今年谷歌也面向移動領域推出了足夠令業界震撼的Google Now語音識別搜索服務,這是谷歌繼Google Voice Search之后面向移動互聯網的又一戰略性產品。另外,谷歌在語音導航服務上也與蘋果決裂,蘋果不得不在iOS 6中放棄體驗更好的谷歌地圖而使用自家地圖服務,此前,蘋果希望在iOS 6中提供免費的語音導航服務,而谷歌則堅持,語音駕駛導航將是移動版地圖服務中一項少見的可以收費的項目,施密特要讓蘋果看到語音導航絕對是未來爭奪用戶一爭高下的“殺手锏”。
同樣,微軟也在Win8和最新的Surface平板電腦中整合了語音識別技術的全新系統,希望借助Kinect軟件開發包作為微軟明年最重要的利潤增長點之一。不久前,微軟首席執行官鮑爾默表示,微軟從來沒有放松對語音和人工智能的研究和巨資投入,微軟未來的重點是開發一種全新的觸摸、手勢和語音的自然操作方式,接下來Kinect系統將支持Win8系統,PC和移動設備都將呈現幾乎與Siri類似的體驗,更不要說微軟正在全力支持的搜索“必應”。就連三星、聯想等終端廠商也開始推出類似Siri的語音輔助軟件,顯然語音已經是各大平臺公司集結的戰場。
如果說語音幫助蘋果繞開谷歌和傳統的關鍵字搜索,不如說語音作為一種輸入和控制的自然工具將是未來搜索的重要裝備,將掌控未來移動互聯網的入口?!斑@個入口可以是用戶開啟自己的手機終端的入口,也可以是遨游移動互聯網的統一入口?!卑俣裙矩撠煻嗝襟w業務的余凱博士解釋說,比如就單機而言,用戶通過聲紋登錄自己的手機,用戶的聲音和設置的語言就是雙重密碼,用戶也可以直接通過語音直接調用手機中的聯系人信息,以及手機中的視頻文件等。
而在移動互聯網入口上,百度把語音看做是是跨領域資源整合的紐帶。比如,最近百度歌曲搜索已在公司內部開始測試,這也被認為是百度在語音識別搜索領域,首次進行嘗試和探索。在未來的語音搜索中,如果你聽到一首好聽的歌曲,卻不知道歌曲名稱,完全可以對著電腦哼唱一段歌曲就搜索到,或者系統會自動搜索含有相關歌曲曲調的文件提供給用戶;如果這個文件或者應用時來自互聯網和其他公司的資源也可以進行調用,或者由語音直接導入相關第三方App,如同余博士所說,百度通過把語音加入到全面開放的云平臺,來聚集更多第三方開發者利用這些免費提供語音技術進行開發,也就是圍繞語音建立了一個生態系統,后臺整合足夠的本土資源,才能超越蘋果和谷歌。
“在百度即搜即用的概念下,所有服務都將有一個語音的外殼,等待語音的鑰匙開啟”。余凱博士說,語音是百度未來最重要的技術高地之一,在廣義的語音移動搜索、垂直搜索、語音輸入法等多個產品領域進行基礎應用開發外,還將重點發展語音指令和框搜索。這將是百度實質性掌握語音入口的關鍵。
終端誘惑
最近應用開發商Viper對smartstart智能汽車控制應用進行更新,加入了對Siri語音指令平臺的集成,用戶可以在搭載iOS 6的iPhone 4S或者iPhone 5手機上,直接通過Siri平臺來啟動SmartStart應用程序。在啟動應用之后,汽車也就會被啟動,同時還可以對車門進行鎖定或者解鎖操作。想象一下,如果他人尤其是家中的小孩,因為失誤或者調皮啟動了停在車庫中的汽車,那么用戶就可以利用SmartStart的遠程控制功能,對汽車進行鎖定或者解鎖操作,天冷時,駕駛員完全可以在出門前5分鐘提前啟動汽車,如果遇到緊急情況需要提前離開,用戶完全可以將車停留在停車場,并且不需要把鑰匙寄存在第三方的手中,其他人只需要利用手機來控制汽車,就可以把車開走。作為駕駛員和汽車的信息交換平臺,smartstart給用戶增加了獨特的價值,用戶只要用智能手機和語音就可以輕松完成對愛車的遠程控制。
語音對于汽車的誘惑更多來自于導航,有了語音導航,就相當于給路癡們提供了一個道路向導,一個與汽車融合的語音系統可以比單獨電子導航儀更好地操控汽車。因此,大部分汽車企業都在自有語音導航領域投入了相當大的開發費用,比如,寶馬的前期投入巨大,寶馬的“語音控制系統”最多可識別500個預設詞條,可操控電話、空調、導航和音響系統等功能。免提麥克風既可收音,還可以過濾掉背景噪音,這項技術已經成為寶馬少數幾款高端車的奢華配置;福特的語音導航系統也以服務免費,升級方便,可擴展性強等特性作為殺手锏,而榮威的InkarNet也借助科大訊飛的語音技術搭建了一套獨特的語音導航系統在汽車領域一枝獨秀。
事實上,移動互聯網時代需要通過按鍵或者觸屏的傳統方式完成的操作開始偏向于更為方便的語言控制化,類似于Siri這樣的語音助手功能已經開始普及,越來越多的應用程序也都開始加入語音平臺指令集,而未來的手機、汽車、電視每個終端都可以通過聲音進行各種個性化的操作,不少國內終端廠商已經把寶壓在了語音上。
此前,聯想集團CEO楊元慶在聯想移動互聯戰略發布會上表示,他非??春貌⒖粗卣Z音功能,聯想在中文語音交互領域,將不會落后于其他廠商。聯想集團幾年前就已經開始語音技術的研發,聯想最新推出的樂Phone系列智能手機已經具備簡單的語音命令功能,未來會在各種核心應用上完善語音控制。
而家電廠商方面,“內置Ciri語音智能交互”的語音電視就是今年長虹公司的重頭戲。據介紹,語音智能電視不用遙控器,僅憑語音指令就能完成換臺、電視節目查詢、網絡瀏覽/搜索、文字輸入等各種操作。用戶只需告訴語音電視要做什么,電視就可以快速地為用戶切換到相應的應用界面,徹底解放用戶的手腳。長虹在科大訊飛的語音識別系統上面研發的語音交互系統,讓語音電視還可以辨別男女不同的嗓音,根據聲音判斷用戶的年齡,與各年齡段的用戶“貼心”交談,還特別搭配了東北話、重慶話、湖南話、粵語等地方方言,讓電視更準確地理解用戶的需求。
押寶在智能電視,而不再追尋日韓企業在屏幕畫質上面做文章是需要魄力的。長虹就認為,電視機的大屏幕,高畫質是其他的終端無法替代的,要想提高電視作為終端的吸引力必須要實現人機交互,必須改變電視作為終端的封閉和單向,被動式傳播方式。因此,現在越來越多的彩電企業把關注點從屏幕轉移到應用上,更多智能電視終端廠商投靠谷歌,而語音、智能、人機交互功能將為彩電行業將迎來用戶體驗時代。
顯而易見,在未來科技公司圍繞系統、硬件、服務器和云的平臺戰爭中,語音正是未來平臺競爭的重要一局。