?
科大訊飛的人工智能探索
技術(shù)創(chuàng)新將來(lái)不會(huì)顛覆人類(lèi),而是會(huì)讓人類(lèi)生活得更幸福
2 015年12月21日,科大訊飛董事長(zhǎng)劉慶峰在公司年度發(fā)布會(huì)上,首次面向全球3000多人發(fā)表演講,他一邊演講,機(jī)器人一邊把他的語(yǔ)音轉(zhuǎn)變?yōu)閮蛇叴笃聊簧系奈淖郑ㄟ^(guò)視頻直播,所有觀眾也都可以看到機(jī)器“轉(zhuǎn)寫(xiě)”的結(jié)果。一個(gè)多小時(shí)的演講,機(jī)器“轉(zhuǎn)寫(xiě)”的準(zhǔn)確率超過(guò)95%,比速記員還高。
這讓劉慶峰十分自豪,因?yàn)橹袊?guó)企業(yè)定義了萬(wàn)物互聯(lián)時(shí)代人機(jī)語(yǔ)音交互的全新標(biāo)準(zhǔn)。
作為亞太地區(qū)最大的智能語(yǔ)音和人工智能上市公司,科大訊飛創(chuàng)立于1999年,具有語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)音翻譯等多項(xiàng)領(lǐng)先技術(shù),占有中文語(yǔ)音市場(chǎng)70%的份額。
科大訊飛以語(yǔ)言、語(yǔ)音為入口的認(rèn)知智能“訊飛超腦”,與“百度大腦”提出的感知智能,被認(rèn)為是中國(guó)人工智能的兩大風(fēng)向標(biāo)。
今年距離世界上人工智能概念的首次提出已60年。而中國(guó)人工智能的發(fā)展歷史只有30年——1986年國(guó)家863計(jì)劃中首次提出做語(yǔ)音合成。
1999年,劉慶峰與中國(guó)科大的師兄弟們一起創(chuàng)辦了科大訊飛,探索產(chǎn)學(xué)研結(jié)合的機(jī)制來(lái)發(fā)展智能語(yǔ)音產(chǎn)業(yè)。
智能語(yǔ)音是一門(mén)交叉學(xué)科,需要聲音、語(yǔ)言和計(jì)算機(jī)多學(xué)科的融合。在新的機(jī)制下,科大訊飛承擔(dān)了智能語(yǔ)音國(guó)家工程實(shí)驗(yàn)室的職能,加快整合國(guó)內(nèi)外的源頭技術(shù)資源,在清華大學(xué)、中國(guó)科學(xué)院聲學(xué)所和中國(guó)社科院語(yǔ)言所等單位,都建立了聯(lián)合實(shí)驗(yàn)室。
最初,科大訊飛開(kāi)發(fā)的是一款面向普通消費(fèi)者的智能語(yǔ)音軟件,因?yàn)樘霸獾嚼溆觯旧驷пЭ晌!S腥苏f(shuō),轉(zhuǎn)行算了;有人說(shuō),不如改做房地產(chǎn)。但劉慶峰篤信語(yǔ)音交互將成主流。
后來(lái),科大訊飛轉(zhuǎn)做B2B市場(chǎng),給華為、中興、聯(lián)想等大企業(yè),提供智能語(yǔ)音應(yīng)用的嵌入式軟件,公司經(jīng)營(yíng)好轉(zhuǎn),逐步實(shí)現(xiàn)了盈利。
劉慶峰說(shuō),之所以堅(jiān)持下來(lái),核心是對(duì)語(yǔ)音發(fā)自?xún)?nèi)心的熱愛(ài)。
“第一,我們熱愛(ài)它。第二,我們對(duì)自己有信心。第三,商業(yè)邏輯也決定了必須要做源頭創(chuàng)新,才有可能在市場(chǎng)上立足。高科技領(lǐng)域從來(lái)沒(méi)有捷徑可走,你如果不做原創(chuàng)技術(shù)創(chuàng)新,那市場(chǎng)上一定沒(méi)有你的機(jī)會(huì),很多技術(shù)產(chǎn)品只有第一、沒(méi)有第二。”劉慶峰說(shuō)。
微軟、谷歌、百度、騰訊等國(guó)內(nèi)外IT巨頭,也紛紛搶食智能語(yǔ)音產(chǎn)業(yè)的巨大商機(jī)。在與巨頭們的較量中,科大訊飛如何能突圍而出、實(shí)現(xiàn)領(lǐng)先?
除了在智能語(yǔ)音領(lǐng)域的專(zhuān)注、堅(jiān)持、努力,科大訊飛還把技術(shù)創(chuàng)新戰(zhàn)略定為“頂天立地”。
“頂天”是指技術(shù)上一定要保持國(guó)際領(lǐng)先的水平,為此不惜大量地投入;“立地”是技術(shù)要落地,服務(wù)于億萬(wàn)家庭和用戶(hù),“我們要比科學(xué)界更知道技術(shù)的發(fā)展趨勢(shì),比消費(fèi)者更知道他需要什么。一流的企業(yè)滿(mǎn)足市場(chǎng),超一流的企業(yè)創(chuàng)造市場(chǎng),訊飛要做創(chuàng)造市場(chǎng)的企業(yè)”。
過(guò)去掣肘中國(guó)科技創(chuàng)新的是機(jī)制問(wèn)題。所以科大訊飛推動(dòng)了產(chǎn)、學(xué)、研資源整合,把中國(guó)科大、中科院聲學(xué)所、中國(guó)社科院語(yǔ)言所、清華大學(xué)、新疆大學(xué)、西藏大學(xué)等相關(guān)研發(fā)資源聚攏在一起。
憑借擁有自主知識(shí)產(chǎn)權(quán)的智能語(yǔ)音技術(shù),科大訊飛推出從大型電信級(jí)應(yīng)用到小型嵌入式應(yīng)用,覆蓋從電信、金融等行業(yè)到企業(yè)和消費(fèi)者用戶(hù),從手機(jī)到車(chē)載,從家電到玩具等產(chǎn)品。
從電信、IT業(yè)起步,嵌入式智能語(yǔ)音軟件的應(yīng)用,下一步的重點(diǎn)是智能家居、智能車(chē)載及穿戴式設(shè)備方向。今年,科大訊飛與京東合作推出一款“DingDong智能音箱”。智能語(yǔ)音應(yīng)用很多,科大訊飛正在有選擇、有步驟地開(kāi)拓不同細(xì)分市場(chǎng)。目前,康佳、長(zhǎng)虹、TCL等國(guó)內(nèi)主流彩電企業(yè)均與訊飛展開(kāi)了合作。
科大訊飛已占有中文語(yǔ)音市場(chǎng)70%的份額,以訊飛為核心的中文語(yǔ)音產(chǎn)業(yè)已初具規(guī)模。隨著移動(dòng)互聯(lián)網(wǎng)的到來(lái),2010年,科大訊飛率先發(fā)布了全球首個(gè)提供移動(dòng)互聯(lián)網(wǎng)智能語(yǔ)音交互能力的“訊飛開(kāi)放平臺(tái)”,還推出了“訊飛輸入法”“靈犀”等手機(jī)應(yīng)用。
“訊飛開(kāi)放平臺(tái)”通過(guò)5年的發(fā)展,已經(jīng)開(kāi)放了語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音喚醒、語(yǔ)音評(píng)測(cè)、人臉識(shí)別、聲紋識(shí)別等10項(xiàng)核心能力,旨在構(gòu)建全新移動(dòng)互聯(lián)網(wǎng)語(yǔ)音及交互生態(tài)。目前,訊飛開(kāi)放平臺(tái)已吸引了包括QQ、高德地圖、滴滴、攜程、大眾點(diǎn)評(píng)、新浪微博等在內(nèi)的8萬(wàn)多合作伙伴,覆蓋終端用戶(hù)數(shù)超過(guò)8億。
語(yǔ)音交互技術(shù)的下一步,是人工智能,科大訊飛對(duì)此深信不疑。
未來(lái)的物聯(lián)網(wǎng)時(shí)代,由“云+端”構(gòu)成。人與各種智能終端之間進(jìn)行語(yǔ)音交互,形成的大數(shù)據(jù)反饋到后臺(tái)的云,云計(jì)算中心利用人工智能技術(shù)做出預(yù)測(cè)、判斷,再反饋到各種智能終端,讓人享受更好的產(chǎn)品和服務(wù)。
“訊飛超腦”是科大訊飛目前推出的針對(duì)人工智能領(lǐng)域的重大攻關(guān)項(xiàng)目。目標(biāo)就是要實(shí)現(xiàn)一個(gè)真正的中文的認(rèn)知智能計(jì)算引擎,未來(lái)將真正引爆在教育、客服、人機(jī)交互、醫(yī)療等領(lǐng)域的智能應(yīng)用。劉慶峰曾表示,只有掌握人工智能技術(shù),才能搶占未來(lái)科技發(fā)展的制高點(diǎn)。科大訊飛不僅要抓住“小波浪”的創(chuàng)新,更關(guān)鍵的是抓住“大波浪”的創(chuàng)新,而下一輪“大波浪”正是物聯(lián)網(wǎng)和人工智能時(shí)代。
“我們定義了萬(wàn)物互聯(lián)時(shí)代人機(jī)語(yǔ)音交互的全新標(biāo)準(zhǔn)。”劉慶峰自豪地說(shuō),萬(wàn)物互聯(lián)時(shí)代的人機(jī)交互,第一需要遠(yuǎn)場(chǎng),人對(duì)機(jī)器說(shuō)話(huà),應(yīng)該在3-5米之外也能聽(tīng)得清;第二可以隨時(shí)隨地打斷了仍能繼續(xù)進(jìn)行交互;第三是上下文要相關(guān),比如問(wèn)上海明天天氣,機(jī)器回答完,你說(shuō)合肥呢,它馬上就知道說(shuō)合肥的天氣。
“技術(shù)創(chuàng)新將來(lái)不會(huì)顛覆人類(lèi),而是會(huì)讓人類(lèi)生活得更幸福。”
作為“訊飛超腦”計(jì)劃的一部分,類(lèi)人答題機(jī)器人的研制如火如荼。科大訊飛計(jì)劃讓機(jī)器在未來(lái)三到五年,也就是2020年高考時(shí)可以考上一本。它有交互、知識(shí)管理、學(xué)習(xí)和推理三方面能力,可應(yīng)用在教育、醫(yī)療等領(lǐng)域。
一些地方高考的英語(yǔ)口語(yǔ)測(cè)試,已經(jīng)嘗試用科大訊飛的機(jī)器打分,通過(guò)應(yīng)用這套系統(tǒng),還可以提升日常師生教課和學(xué)習(xí)的效率。
而在醫(yī)療領(lǐng)域,劉慶峰說(shuō),一線的全科醫(yī)生將來(lái)很缺乏,這套系統(tǒng)也可以應(yīng)用在醫(yī)療上。未來(lái)醫(yī)生看病,可能會(huì)越來(lái)越多在網(wǎng)上進(jìn)行,病人一說(shuō)病癥,系統(tǒng)就自動(dòng)做出判斷,給醫(yī)生相應(yīng)的提示和指導(dǎo)。
訊飛超腦計(jì)劃的思路叫沿途下蛋,階段性成果要能用起來(lái)。”劉慶峰透露,訊飛已推出一個(gè)智慧學(xué)習(xí)的網(wǎng)站叫“智學(xué)網(wǎng)”。
“沿途下蛋”的過(guò)程中,如何在技術(shù)創(chuàng)新與商業(yè)收益之間平衡?劉慶峰介紹了其中的秘訣:科大訊飛有四級(jí)體系,聯(lián)合實(shí)驗(yàn)室面對(duì)5-10年甚至更長(zhǎng)遠(yuǎn)的研究;科大訊飛研究院做3-5年的研發(fā);語(yǔ)音云平臺(tái)的開(kāi)發(fā)部門(mén)把研究院的成果變成產(chǎn)品,外部的創(chuàng)業(yè)者也可以方便調(diào)用;在云平臺(tái)上,有教育業(yè)務(wù)、客服業(yè)務(wù)等各種服務(wù)。“這四級(jí)體系就可以保證我們不斷地進(jìn)行源頭技術(shù)創(chuàng)新,同時(shí)還不斷地把階段性成果輸入到市場(chǎng)上。”
(本刊記者孫玉敏根據(jù)相關(guān)資料整理)