999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

風中飄來“語音云”

2012-12-31 00:00:00匡冬芳
IT經理世界 2012年8期

一則榮威車主“調戲”iVoka的視頻在網上流傳甚廣——iVoka是榮威350上裝配的語音云駕駛系統——當車主對著iVoka說“我愛你”的時候,iVoka不無醋意地表示“這句話你也對Siri說過吧”,車主只好無奈認栽。

事實上,對于iVoka這種全新的智能語音人機交互裝置,逗趣嘮嗑只是其“副業”,連接豆瓣點播音樂、查天氣、查股票、查航班、查實時新聞資訊等等,才是它的正經功能——在這一應用背后,是一家叫科大訊飛的公司所提供的語音技術。

2012年3月22日,北京國家會議中心,科大訊飛“新一代語音云平臺”發布會現場。科大訊飛CEO劉慶峰拿出一部智能手機,開始演示公司開發的新應用“訊飛語點”。他用自己的聲音命令手機發短信、安排日程、查找餐館,還不忘調侃手機:“你能做什么”?手機回答道:“我正在反思自己的不足。”現場立刻笑聲一片。

一切都像極了當年由喬布斯掌控的蘋果產品發布會現場。

蘋果公司的Siri大熱,將語音技術的消費應用提到了日程上,各行各業都在挖掘自己和語音的結合點;而像科大訊飛這樣的語音技術提供商則希望在更廣泛的消費應用方面和不同的開發商合作,找到更廣闊的天地。

移動引爆語音

人們對下一代語音交互方式的美好暢想,從來就沒有停止過。不過,在很長一段時間內,語音技術被看成是雞肋:棄之可惜,食之無味。微軟、谷歌、IBM,這些世界級的IT巨頭,一直在語音技術商用方面努力探索。然而,前景雖然很美好,語音技術卻始終無法實現大規模民用。

“我當年在微軟工作的時候,曾聽到比爾·蓋茨說: ‘語音技術在5年后將改變世界。’5年之后,我又聽到他說了一次;到了第三個5年,比爾·蓋茨有一次提起語音,他說:‘這話我過去說了兩次。’”創新工場CEO李開復所講述的這件往事,折射出語音技術當時所面臨的尷尬前景。

而前谷歌中國的高級研究員、《浪潮之巔》的作者吳軍最近在微博里調侃道:“語音識別(在產品上)忽悠人從上世紀90年代開始,大約每10年一個周期,最后的結果相同,就是大家發現這是個玩具,而不是工具……如此反復。不過我相信最后有一次不再是忽悠人,但是不是現在這一次?”

至少,在撲面而來的移動互聯網和云計算大潮中,想象從來沒有像這一次這么像真的:決定語音識別技術精確度的關鍵性因素在于語料庫的豐富程度。

在過去,語料庫的建立,主要是通過人工采集聲音信號來完成,需要花費大量的時間和精力,語料庫的增量非常有限,這也意味著語音技術的精確度提升速度非常低。而在移動互聯網時代,語音交互的終端和應用在不斷涌現;另一方面,云計算能夠處理比以往更海量的用戶語音交互數據,云端的服務器能夠不斷收集、處理這些數據,在不斷反饋訓練中持續進化語音理解能力。

并且,隨著移動用戶和多種移動終端的爆發式增長,人們對語音應用的需求前所未有的強烈:移動終端設備鍵盤與屏幕尺寸小,用手指輸入并不方便,尤其是在移動的應用場景中,眼忙手忙,語音輸入作為信息交互最自然、便捷的手段,更能發揮它先天性的作用。

而蘋果公司所推出的Siri功能在全球所引發的瘋狂,則成為語音技術在移動互聯網上被引爆的直接導火索,也讓一直苦于找不到語音賣點的廠商茅塞頓開。蘋果的高明之處,在于將Siri的語音技術與蘋果封閉系統內的各行各業的信息服務、應用進行了無縫的對接,并且整合了三大數據庫:Yelp、維基百科、Wolfram Alpha,這就意味著Siri不僅僅是一個被人“調戲”的玩具,而是在某種程度上可以幫人們解決實際問題:查找餐館、地圖、翻譯……

盡管在目前看來,Siri的實用性依然有限,但隨著用戶越來越多,建立的語料數據庫就越豐富,就越能通過數據的不斷糾正變得越來越“聰明”,這就有了“人工智能”的意味。

在這個橫跨手機、平板電腦、汽車、電視、 導航設備、音樂播放器、個人電腦等領域的絕大市場商機面前,谷歌、微軟等國際巨頭都加快了將語音技術向消費級市場商用的腳步:谷歌計劃今年上半年發布平板電腦Google Nexus,并將搭載Majel網絡語音識別技術;而微軟于2007年收購語音技術公司TellMe之后,計劃今年將TellMe技術用于Windows 8及下一代Windows Phone系統中;此外,國際語音巨頭Nuance已經將語音生意做到了全球,且來勢兇猛:今年1月份,Nuance收購了競爭對手 Vlingo,期望整合雙方各自的技術優勢,在全球迅速膨脹的移動語音消費市場,瓜分更大的蛋糕。

平臺機會

隨著Siri在全球的大熱,人們不禁紛紛發出這樣的疑問:誰是中國的下一個Siri?作為國內最大的智能語音技術提供商,原本低調隱匿在背后的科大訊飛就這樣站在了舞臺的正中央。

在過去,科大訊飛的生意模式更多的是面向B2B市場,主要為電信、金融、教育等企業和各種行業提供語音支撐軟件或語音應用系統。盡管也推出了諸如“訊飛口訊”這樣的消費層面的應用,但始終是扮演著技術提供商的角色,其業務增長穩健而緩慢。“調戲Siri和Siri的人工智能其實只是目前語音相對簡單的部分,我們之前做得不夠好的地方可能是,我們一直重視產品本身在技術層面的不斷精進,卻忽視了這些有趣的東西可以給消費者帶來更多的樂趣。” 科大訊飛信息科技股份有限公司研究院執行院長胡郁表示。

當Siri推出不久之后,科大訊飛迅速判斷出語音在移動消費級應用上的市場價值,曾經與蘋果公司進行過接洽,希望與之合作,開發中文版的Siri。不過,卻遭到了蘋果的拒絕。“蘋果太傲慢了,我們也不會接受。”科大訊飛副總裁江濤說。

在這種情況下,應對國際巨頭最好的辦法,就是將自己的語音技術、數據庫和語音云計算能力開放出去,做“語音云”平臺服務。江濤將這比喻成一場應對國際語音巨頭的“人民戰爭”。“我們不是孤軍奮戰,而是把平臺開放出去,讓有激情、有智慧的創業者,還有產業鏈的合作伙伴更好的應用。我相信一定會比一個封閉系統能提供的東西更加豐富。” 他說。他將科大訊飛角色描述成“移動互聯網時代能力的基礎設備”,也就是為各種各樣的移動互聯設備提供交互的能力。

顯然,一旦語音真正成為下一代人機交互核心手段,當各種各樣的語音應用百花齊放之時,作為平臺級公司的價值,肯定比提供單個語音應用的公司,在產業鏈上的話語權更為強勢。

事實上,這家公司在最近短短的一年時間內,發展速度突飛猛進:在2010年科大訊飛首次提出要做“語音云開放平臺”之時,由于當時移動互聯網市場還沒有呈現爆發式增長,Siri還不太為人所知,用戶對語音應用的需求遠不如現在強烈,當時業內反響并不是很大。到2011年6月以前,科大訊飛語音云平臺上的用戶規模一直沒有超過100萬,然而,這一數據在Siri發布之后的2011年下半年,迅速飆升到1000萬,而從1000萬到現在的3300萬,只用了3個月。

而平臺級公司的出現,對于整個語音產業大規模商用所做的推進,也不言而喻。在李開復看來,過去一直困擾語音技術大規模商用的瓶頸之一,在于缺乏豐富的語音應用。“一小批語音專家拍腦袋來找應用不是辦法,而訊飛語音平臺的推出,意味著幾千、甚至幾十萬位開發者都來試一試,盡管成功的幾率少,但是摸索到成功應用的概率會增加。”李開復說。

語音生態圈

生于1986年的李傳峰是智能360的聯合創始人之一。李傳峰的夢想,是站在像科大訊飛這樣的“巨人的肩膀”上,開發出跟蘋果Siri一樣牛的中文版的“Siri”。

智能360是去年11月份在安卓平臺上線的一款類Siri的中文應用。盡管看起來略顯“山寨”,但這款應用目前頗受歡迎,已經獲得了150萬的用戶。智能360采用了科大訊飛所開放的“語音識別”和“語音合成”技術,也就是采用了將用戶聲音輸入轉化成文字,以及將文字輸出成語音這兩種技術。

而智能360的“自然語言處理部分”的技術,也就是將文字進行理解,轉化成各種指令,與底層的各種應用進行對接并執行的部分,是由自己的團隊開發的。而國內另一款由貴州大學的大學生團隊iTiTa開發的 Airi,采用的也是科大訊飛的語音引擎。

“瓦力短信”是一款幫助用戶實現個性化短信功能的應用。去年11月,瓦力短信新發布的 Android 3.0版首次采用了科大訊飛的語音技術,讓用戶能夠將聲音轉化成短信,下載量很快就翻了一番。

對于小型語音創業團隊來說,現在是最好的時代。原因就在于各種資源的“開放”。一方面,谷歌、Nuance、科大訊飛這樣的大公司已經或即將開放自己的語音接口,幫助開發者解決語音平臺海量數據庫和技術方面的門檻;另一方面,在應用層面,像百度百科、大眾點評這樣的平臺,也樂于向開發者開放自己的信息服務和各種數據。“我們需要做的,就是將各種資源整合過來,我們是站在巨人的肩膀上去做事情。”李傳峰說。

除了像智能360這樣的將語音作為“品牌”的應用,一些大公司則選擇將語音技術作為應用中的插件,在不同的情境下,為用戶提供更為便捷的選擇。比如,新浪微博、搜狐微博、UC瀏覽器、大眾點評等應用目前都已經采用了科大訊飛的語音技術,推出了語音的插件功能。

不過,盡管有如此多的大公司也參與了語音應用,在科大訊飛目前所擁有的3300萬用戶中,真正活躍的用戶有多少,依然是一個疑問。一個比較典型的案例就是:盡管新浪、搜狐等都推出了語音發微博的功能,但用戶的使用習慣并沒有被真正“挑逗”起來。

如果不能真正吸納到大量有價值的活躍用戶,開發者就摸索不到清晰的商業模式,而如果開發者掙不到錢,科大訊飛也自然不能從中盈利,這就意味著整個生態圈不能真正繁榮起來。另一方面,如果沒有來自用戶的大量語音交互, 基于語音云平臺的持續的語義理解進化能力也就是空談。而“智能化”正是語音技術的終極目標。

也許是意識到了首先要培養用戶使用語音的習慣,科大訊飛自己也率先推出了一系列消費類的示范應用,如訊飛口訊、訊飛輸入法、訊飛語點等等。“智能語音交互的用戶使用習慣培養需要一個過程,尤其是東方人往往比較羞澀,不像西方人有使用電話應答機的習慣,訊飛語點定位是新一代語音云的示范應用,我們希望通過訊飛語點能夠培養用戶使用語音交互的習慣。”江濤說。

事實上,語音微博之所以叫好不叫座,除了用戶使用習慣方面的障礙,語音作為一種私密度高、解碼、收聽成本高的信息載體,并不適合微博這種媒體形式的傳播,這就決定了語音微博只能是特殊場合、特殊人群使用的形式。這給開發者所帶來的啟示就是:對于自己開發的語音應用究竟能給用戶解決什么問題,要有清晰的認識,而不能為“語音”而“語音”。

正因為親歷了語音技術長達30年的波折起伏,李開復反而對于語音應用始終持有一種“謹慎樂觀”的態度。他提醒廣大開發者如果要在應用中整合語音,一定要想清楚。在創新工場的47個投資項目中,有五六家是適合用到語音的,但他給項目負責人的建議卻是:要用語音是一個重大決定,要么不做,要做就要做到自然、驚艷。

“因為語音API和應用接口的整體優化是有難度。”李開復說。他所指的難度主要集中在“語義理解”這種相對偏智能的語音技術層面,而語音識別和語音合成這種相對淺層次的技術與應用API的對接難度更小。因此,李開復的建議是,開發者更應該將目光瞄準那些“深語音,淺語義”的應用。

對于科大訊飛本身來說,要扮演好平臺的角色,最重要的并非技術挑戰,而是角色的轉換:如何從一家面向B2B市場的軟件提供商,成功轉型成為一家移動互聯網平臺公司?作為互聯網平臺公司,更重要的是如何打造繁榮的生態圈,打造品牌,圈住用戶,幫助開發者做好營銷和服務,幫助它們尋找到清晰的商業模式;并明確自身定位,不能即作“裁判”又做“選手”,給開發者帶來安全感。軟件提供商的那一套打法,在移動互聯網上并不適用。好在,目前的科大訊飛有了一個看上去不錯的開始。

(本刊記者葉麗雅對此文亦有貢獻)

主站蜘蛛池模板: 67194亚洲无码| av尤物免费在线观看| 99精品在线看| 91色国产在线| 中文字幕在线播放不卡| 园内精品自拍视频在线播放| 国产在线精品网址你懂的| 色偷偷一区二区三区| 一级全免费视频播放| 亚洲综合色区在线播放2019| 2020极品精品国产| 欧美日本在线| 操国产美女| 性69交片免费看| 97视频在线观看免费视频| 久久香蕉国产线看观| 就去色综合| 国产精品尤物在线| 九九热精品视频在线| 一本一本大道香蕉久在线播放| 国产精品v欧美| 国产高清在线丝袜精品一区| 91精品情国产情侣高潮对白蜜| 免费在线成人网| 最新加勒比隔壁人妻| 亚洲人成日本在线观看| 四虎永久免费地址在线网站| 精品人妻一区无码视频| 九九视频免费在线观看| 欧美一级高清免费a| 亚洲第一成年免费网站| 国产精品永久免费嫩草研究院| a毛片免费观看| 国产丰满大乳无码免费播放| 亚洲最新在线| 中文成人无码国产亚洲| 手机永久AV在线播放| 一本大道无码日韩精品影视| 日韩 欧美 小说 综合网 另类| 午夜精品区| 91精品啪在线观看国产60岁 | 欧美在线一二区| 性喷潮久久久久久久久| 乱系列中文字幕在线视频 | 亚洲人成亚洲精品| 午夜久久影院| 69精品在线观看| 欧美黄网在线| 92精品国产自产在线观看| 中国毛片网| 九九热精品免费视频| 国产女人在线| 国产精品综合色区在线观看| 精品久久久无码专区中文字幕| 麻豆AV网站免费进入| 97一区二区在线播放| 国内精品小视频在线| 99热国产这里只有精品无卡顿"| 极品国产一区二区三区| 国产丝袜丝视频在线观看| 亚洲欧美日韩动漫| 久久青草免费91线频观看不卡| 国产亚洲欧美在线人成aaaa| 色哟哟色院91精品网站| 91精品小视频| 亚洲国产精品日韩av专区| 国产成人精品一区二区秒拍1o| 色香蕉网站| 伊人久久精品无码麻豆精品 | 白丝美女办公室高潮喷水视频 | 尤物视频一区| 中文字幕亚洲精品2页| 毛片在线播放网址| www.youjizz.com久久| 亚洲欧美日韩精品专区| 欧美不卡在线视频| 热伊人99re久久精品最新地| 国产第二十一页| 九九香蕉视频| 精品91自产拍在线| 免费人成视频在线观看网站| 色综合综合网|