Siri的問(wèn)世讓Google的互聯(lián)網(wǎng)搜索入口備受威脅,也讓更多的開(kāi)發(fā)者們看到了移動(dòng)語(yǔ)音的應(yīng)用機(jī)會(huì)。
與PC端相比,智能移動(dòng)終端設(shè)備由于體積越來(lái)越小,物理鍵盤(pán)或虛擬鍵盤(pán)手動(dòng)操作變得越來(lái)越不方便,特別是在駕車(chē)、走路時(shí),更是無(wú)法完成。智能語(yǔ)音識(shí)別技術(shù)在移動(dòng)設(shè)備上的應(yīng)用,解放了人們的雙手,通過(guò)語(yǔ)音命令操作設(shè)備和設(shè)備上的應(yīng)用,讓這些問(wèn)題迎刃而解。
輸入法始終是軟件公司、互聯(lián)網(wǎng)終端設(shè)備廠(chǎng)商的必爭(zhēng)之地。(iPhone到現(xiàn)在為止仍然沒(méi)有開(kāi)發(fā)中文輸入法,很多用戶(hù)甚至為了裝搜狗而越獄!)多年前,IBM的語(yǔ)音識(shí)別軟件在PC上就有不錯(cuò)的識(shí)別率。Google在這方面也早有布局,Android系統(tǒng)的Voice Action就是一項(xiàng)偉大的語(yǔ)音控制技術(shù),它提供了非常可靠的語(yǔ)音識(shí)別引擎,其高識(shí)別度令人稱(chēng)奇。語(yǔ)音識(shí)別技術(shù)公司Vlingo開(kāi)發(fā)的同名移動(dòng)應(yīng)用在各平臺(tái)上同樣表現(xiàn)不俗。但與過(guò)去所有的語(yǔ)音命令系統(tǒng)一樣,這些應(yīng)用都要求用戶(hù)說(shuō)的話(huà)具有嚴(yán)格的語(yǔ)法結(jié)構(gòu)和格式,命令和內(nèi)容有嚴(yán)格的規(guī)范,不然,系統(tǒng)將很難識(shí)別。所以Voice Action、Vlingo都沒(méi)有引發(fā)輸入法的革命,它們只是一個(gè)聲控命令軟件,并不足夠智能。
Siri的誕生讓語(yǔ)音識(shí)別的行業(yè)人士,甚至移動(dòng)應(yīng)用的行業(yè)人士有種醍醐灌頂?shù)母杏X(jué)。從表面來(lái)看,Siri可以通過(guò)iPhone讀短信、介紹餐廳、詢(xún)問(wèn)天氣、語(yǔ)音設(shè)置鬧鐘等,支持自然語(yǔ)言輸入,可調(diào)用系統(tǒng)自帶的天氣預(yù)報(bào)、日程安排、搜索資料等應(yīng)用。這些功能雖然Google Voice,Vlingo都能實(shí)現(xiàn),但是Siri與它們有著本質(zhì)的不同。Siri會(huì)結(jié)合上下文結(jié)構(gòu)理解用戶(hù)發(fā)出的語(yǔ)音指令,無(wú)論用戶(hù)的語(yǔ)言邏輯、語(yǔ)法結(jié)構(gòu)多么繁瑣混亂,Siri還會(huì)從人類(lèi)語(yǔ)言史的角度出發(fā),利用人工智能系統(tǒng)去分析,能理解許多含義模糊或引申的語(yǔ)義,在多數(shù)情況下可領(lǐng)會(huì)用戶(hù)的意思。當(dāng)然Siri的知識(shí)庫(kù)還非常有限,因此其應(yīng)用也還停留在演示或者找樂(lè)引發(fā)的口碑傳播上。
Siri的問(wèn)世讓Google的互聯(lián)網(wǎng)搜索入口備受威脅,也讓更多的開(kāi)發(fā)者們看到了移動(dòng)語(yǔ)音的應(yīng)用機(jī)會(huì)。在應(yīng)用匯上,就有很多開(kāi)發(fā)者打起了做中國(guó)安卓操作系統(tǒng)上Siri的主意。比較知名的一款應(yīng)用是蟲(chóng)洞。上傳評(píng)審時(shí)編輯就認(rèn)為很有創(chuàng)意,后來(lái)還做了專(zhuān)門(mén)的推薦。蟲(chóng)洞最初的產(chǎn)品理念是采用用戶(hù)互助和實(shí)時(shí)抓取兩種方式滿(mǎn)足用戶(hù)的即時(shí)需求,算是移動(dòng)問(wèn)答領(lǐng)域的原創(chuàng)應(yīng)用,在海外找不到產(chǎn)品模型,也因此很難獲得國(guó)內(nèi)投資者的認(rèn)同。Siri的出現(xiàn),讓蟲(chóng)洞找到了方向,借助多年積累的用戶(hù)數(shù)據(jù)迅速推出蟲(chóng)洞語(yǔ)音助手——問(wèn)不倒,并順利獲得了融資。蟲(chóng)洞的“問(wèn)不倒”同樣可以用語(yǔ)音指令打開(kāi)關(guān)閉應(yīng)用匯程序、撥打電話(huà)、發(fā)送短信等,例如,對(duì)著蟲(chóng)洞語(yǔ)音助手說(shuō)“打開(kāi)微博”,當(dāng)你手機(jī)上同時(shí)安裝了新浪微博和騰訊微博的情況下,它甚至?xí)屇氵x擇要打開(kāi)新浪微博還是騰訊微博。蟲(chóng)洞還可以用各種口音與用戶(hù)對(duì)話(huà),粵語(yǔ)、川話(huà)、東北味、臺(tái)灣腔……一秒鐘變身各系風(fēng)情萌妹,增加了使用的趣味性。智能360-語(yǔ)音助手也是非常好的一款語(yǔ)音助手應(yīng)用,可以語(yǔ)音聊天解悶、發(fā)送短信、打電話(huà)、設(shè)置備忘錄、鬧鐘提醒、查詢(xún)天氣、播放想要的音樂(lè)和視頻,還能下載應(yīng)用,管理應(yīng)用。例如,對(duì)著智能360-語(yǔ)音助手說(shuō)“下載微博”,它調(diào)用手機(jī)瀏覽器,將頁(yè)面指向了m.baidu.com的搜索“微博”安卓應(yīng)用下載列表。
以上蟲(chóng)洞問(wèn)不倒和智能360-語(yǔ)音助手都采用了科大訊飛提供的語(yǔ)音識(shí)別核心技術(shù)。訊飛是一家專(zhuān)業(yè)從事智能語(yǔ)言及語(yǔ)言技術(shù)研究的公司。早在2010年,科大訊飛就推出了語(yǔ)音云開(kāi)放平臺(tái),降低開(kāi)發(fā)者們的進(jìn)入門(mén)檻,讓開(kāi)發(fā)者們能開(kāi)發(fā)出人性化的交互應(yīng)用,共同培養(yǎng)用戶(hù)的使用習(xí)慣。經(jīng)過(guò)將近3年的發(fā)展,語(yǔ)音云已經(jīng)有幾千萬(wàn)級(jí)的用戶(hù),每天的活躍用戶(hù)百萬(wàn)以上,給開(kāi)發(fā)者帶來(lái)了大量的用戶(hù)和流量。科大訊飛憑借強(qiáng)大的自主創(chuàng)新能力以及多年的積累,在中文智能語(yǔ)音識(shí)別方面,對(duì)于中國(guó)地方方言的支持要優(yōu)于iPhone的Siri和Google Voice,具有很強(qiáng)的本地化優(yōu)勢(shì)。
越來(lái)越多的應(yīng)用已經(jīng)開(kāi)始把智能語(yǔ)音輸入作為一個(gè)基礎(chǔ)服務(wù),應(yīng)用匯上的高德導(dǎo)航、高德地圖、凱立德手機(jī)導(dǎo)航、導(dǎo)航犬等手機(jī)導(dǎo)航軟件,新浪微博、米聊等社交應(yīng)用,甚至《商業(yè)價(jià)值》的iPhone客戶(hù)端都集成了訊飛語(yǔ)音技術(shù)。但把語(yǔ)音云打造成一個(gè)基礎(chǔ)服務(wù),為上億人提供服務(wù),并與開(kāi)發(fā)者一起探索出一個(gè)可行的商業(yè)模式,還有很長(zhǎng)的路要走。
由于移動(dòng)智能設(shè)備手動(dòng)輸入的弊端,語(yǔ)音識(shí)別技術(shù)在移動(dòng)應(yīng)用上發(fā)展必將超越PC,并將大有作為。未來(lái)我們將會(huì)看到形式更多、體驗(yàn)更棒的基于語(yǔ)音識(shí)別技術(shù)的移動(dòng)應(yīng)用,這些應(yīng)用將從另一個(gè)全新的角度改變我們的生活。你甚至可以在駕車(chē)的時(shí)候通過(guò)智能手機(jī)用語(yǔ)音指揮家里的浴缸把洗澡水放好。