本質上來說,語音也是一種入口,就像瀏覽器、搜索引擎、微信一樣。互聯網大佬們都深信一點,既然在PC端發了財的都是把握住入口的公司,那么把這一點移植到移動互聯網上一定也行得通。
在做游戲語音工具的YY成功上市,并且股價一路飆升的情況下,語音的重要性就是傻子都知道的了。以前認為語音沒必要做的人算錯了一點:在某些特定的情境下,語音是比文字或視頻更方便的溝通方式。比如當用戶醉心于游戲時,再比如在移動互聯網世界。
觸摸屏的廣泛普及讓在手機上打字變得不舒服,而移動網絡帶寬的拓展又讓實時信息傳輸速度變得更快,兩相比較之下,語音的效率確實比文字更高。
而作為一個入口,語音識別技術也是必不可少的。信息真正的價值在它被服務器解析之后,計算機顯然是無法直接理解音頻的,這時將聲音變成文字再轉化成代碼就是必不可少的一步。
再者,單獨的語音技術可能沒有太多可用之處。但當它與LBS、人工智能、廣告結合起來的時候,就像發生了化學反應一樣,會突然成為新技術中不可或缺的一環。相信微信的成功已經讓用戶感受到了語音的力量。
跟搜索結合之后,就是語音搜索;跟LBS結合,就可能做成車載語音導航;跟廣告結合就成了VoiceAds。其巨大的想象空間在未來有多大發展令人神往。
單說其中的車載語音導航,因為解放了用戶的手和眼,又可以將數據實時轉化成文字,一旦連入移動互聯網,那么將為未來的汽車行業帶來巨大革命性創新可能。
這就是所謂的兵家必爭之地。目前國內主要的玩家是科大訊飛的靈犀、搜狗語音助手、智能360、蟲洞、盛大前不久剛發布的“百靈語音助手”。
科大訊飛的主營業務其實是to B的,營收的主要來源是國家安全應用等業務。難怪科大訊飛董事長劉慶峰在接受采訪時笑稱,工信部對于微信中的一些信息有安全方面的擔心,要馬化騰聯系科大訊飛。其旗下的軟件“訊飛語點”與“訊飛語音助手”、和中移動聯合發布的“靈犀”隸屬于科大訊飛的“移動互聯網事業部”。該事業部是科大訊飛旗下六大事業部中唯一參與To C業務的,也是科大訊飛最年輕的事業部。
這樣半官方的背景使得科大訊飛一直被認為是“慢吞吞”的科技公司,科大訊飛主攻語音識別和語義處理,缺乏人工智能分析能力。
百度和搜狗則是后起之秀。語音識別是一項難度非常大,對技術積累要求很高的技術。但兩者憑著多年的搜索數據積累以及服務數據積累建立了自己的優勢:搜索引擎起家的語音識別技術能夠引入許多開放的數據,比如天氣預報、航班信息、美食數據等。再者,多年對用戶使用習慣的分析能夠使廠商建立自己的知識圖譜系統,做到精準演化推算。這一點連Siri也做不到。
而沖動、智能360和盛大語音、云知聲則是完全的新秀。
盛大語音和云知聲更多投入在前端的語音識別上,羅永浩的錘子ROM演示時使用的就是云知聲的技術,從演示效果來看,雖然受到ROM不穩定造成的干擾,但其表現仍然亮眼。而蟲洞和智能360則更多在后端發力。
縱觀這幾家語音識別技術公司,科大訊飛雖然憑借多年的技術優勢取得了一定優勢,但互聯網各大公司都頗不愿意將這么重要的新業務假手外人。騰訊之前就曾澄清,為微信提供技術支持的并不是科大訊飛。
搜狗和百度熟悉用戶市場,長期面向一線用戶的經驗讓他們更容易開發出直接面向用戶的產品。再者,百度地圖和語音識別技術的結合已經開始,后續能夠產生多大能量還有待時間驗證。