張曉潔
隨著排在美國第五大道的火車站店門外和蜂擁到蘋果官網預購iPhone5的人群再次搶購一空,全新的iOS6.0系統也被蘋果粉絲們熱烈追捧。其中最受到關注的就是iOS6.0中Siri支持的15個國家和地區語音中,特別增加了中國普通話,粵語和閩南語。自從去年10月蘋果公司在iPhone4S上推出Siri這款語音控制應用之后,Siri代表的語音控制和人工智能就被科技界備加推崇。事實上,Siri的價值遠遠超過一個語音識別軟件,而是用戶的私人生活助手,用戶可以通過手機讀短信、詢問天氣、語音設置鬧鐘等,還可以通過Siri搜索餐廳、電影院等生活信息,直接收看各種相關評論,并且進行預定,而且Siri越來越智能,針對用戶詢問給出的回答,不斷學習心得聲音和語調,Siri的巨大提升以及Siri的無限量應用都顯示出未來將迎來爆炸性的增長。
無獨有偶,今年谷歌也面向移動領域推出了足夠令業界震撼的Google Now語音識別搜索服務,這是谷歌繼Google Voice Search之后面向移動互聯網的又一戰略性產品,而微軟也在Win8中整合了語音識別技術的全新系統,希望借助Kinect軟件開發包作為微軟明年最重要的利潤增長點之一。就連三星、聯想等終端廠商也開始推出類似Siri的語音輔助軟件,顯然語音已經是各大平臺公司集結的戰場,而語音戰爭的逐漸升溫不僅是因為語音將掌控未來移動互聯網的入口,更重要的是語音所代表的人機交互將讓人們未來的移動生活變得無限可能。
科技公司對語音的探索可以追溯到上世紀90年代末IBM公司發布的ViaVoice 98 連續語音識別產品,利用突破性的技術達到返璞歸真的目的,使個人使用電腦更加簡便, 而比爾.蓋茨在2006年也提出過未來將在操作系統中實現自然語音的人機交互,微軟還收購了TeLLMEe,平臺每年執行110億次以上語音識別的請求。但是由于計算機硬件條件和網絡條件的限制,語音的控制僅限于單個計算機和實驗室概念,無法真正步入人們的互聯網生活。不過今天,日益成熟的移動互聯網環境、云計算和大規模數據的積累,以及大量智能終端的普及都讓語音的世界真正臨近爆發。不久前,IBM超級計算機“沃森”(Watson)在智力競答節目《危機邊緣》中擊敗了人類對手,沃森在競答節目中對海量數據信息迅速完成分析的能力,讓人不禁對語音和人工智能軟件嵌入到流行電子消費產品后的前景充滿期待。
“隨著今年新一代iPhone正式發布,Google 開始推動語音云技術;加上百度、騰訊等互聯網廠商推出相關產品,用戶教育過程會很快。到明年上半年,最遲明年年中,哪個手機沒有語音交互的功能,就會很奇怪了”,科大訊飛副總裁江濤的樂觀代表了很大一部分業內人士的想法。
事實上,基于語音的產品已經成為今年最火熱的產品,不管是Siri、語音搜索還是語音的應用,這些產品都將語言交流的特性或者聲音識別技術都巧妙地融入超越了簡單的問答卻產生意外的效果,比如,日本運營商NTT DoCoMo已經為用戶提供自動語言翻譯服務的手機,用戶對手機說話就能立刻轉成翻譯好的文字顯現在手機屏幕上,受到了出國旅行游客的歡迎,而在國內微信用語音替代了文本的短信,用短短一年時間就輕松地吸引了超過1億用戶,像唱吧這樣利用語音和聲波識別技術開發相關應用也成為今年最受歡迎的產品之一。
語音新紀元也在給未來的創業公司提供無限想象空間,當更多的中國科技企業和創業公司在語音這條路上面進行開發延展之旅,人們的移動生活將會更加隨心所欲,語音和智能機器人不再是實驗室和娛樂概念,而未來的手機、汽車、電視每個終端都可以通過聲音進行各種個性化的操作。