張配豪
在接受《人民周刊》記者采訪時,戴帥湘直接對著電視語音對話,買了兩杯咖啡。通過人機對話實現購物閉環,把咖啡廳搬到了辦公室。這聽起來是有點奇幻的想法,戴帥湘和他的團隊將它徹底實現。
“我要買兩杯焦糖瑪奇朵咖啡!”
“選擇離我最近的咖啡店,越快越好!”
在接受《人民周刊》記者采訪時,戴帥湘直接對著電視語音對話,買了兩杯咖啡。通過人機對話實現購物閉環,把咖啡廳搬到了辦公室。這聽起來是有點奇幻的想法,戴帥湘和他的團隊將它徹底實現。
戴帥湘創辦的驀然認知是一家以認知計算、自然語言理解技術為核心的人工智能公司。提供信號處理+語音+語義+云端服務自動對接的一站式智能交互解決方案。
找準方向后,辭職創業
在廈門大學讀書時的戴帥湘專業是自然語言處理,當時研究的核心是自然語言理解。就職業選擇來說,在搜索引擎上走在最前列的百度是理所當然的第一志愿。在網易有道短暫停留一年后,2007年,他加入了百度。
回顧其過往的職業生涯,戴帥湘說讓他萬萬沒想到的是從互聯網時代,到移動互聯網時代,變化如此之快,自己也在快速地定位。“那時候覺得搜索引擎是很好的平臺,但我沒想到短短十年發生了這么大的變化。現在的設備越來越小,手機端的使用越來越多,未來也許盯著屏幕看的時候會越來越少。”
如果選擇一個詞語總結在百度的九年,“積累”是戴帥湘的首選?!鞍俣茸屛曳e累了很多人脈。技術型創業,需要過硬的技術。再一個是關系的積累,我一直在做的都是讓機器理解人說的話,這個過程讓我逐漸意識到什么技術是需要有門檻的,技術放入市場又會如何。我也長期在觀察,技術究竟是如何發展的,市場和技術又是怎樣的一個匹配的過程。有積累的過程,才能解決市場的剛需問題。”
作為百度主任架構師的戴帥湘與人打交道最多的經歷是在2012年,百度在全國幾所高校開設了一門自然語言處理的公開課,他是主講人,也因此結識了不少人,但交往的圈子仍然固定在老師、學者、技術人員和學生的范疇。而只在創業這一年的時間里,他微信上的好友增加了近10倍。
戴帥湘把自己所掌握的技術概括為“讓機器理解人”?!拔乙恢痹谒伎歼@個技術又有什么用呢?我逐步理清了思路,在當前的市場和積累下,我覺得可以做些事情了。三年前,我已經在做前瞻性的嘗試了。我的技術、我的圈子,怎樣切入市場,才能做有用的產品。自我的積累、市場的需求、整個社會的需求,是促使我創業的原因?!?/p>
他想做的是語義理解。按照他的判斷,在技術應用上,搜索是必要的階段,但就目前的技術走向,在搜索上繼續付出較大心力已經不是一件明智的事,況且在百度,新技術的推廣難度也在加大。
融資在離職前就敲定了。一位網易的前同事幫忙把BP交給了經緯中國的投資人,隨后他到經緯和對方當面聊了一個多小時,要做的事情和能做的事情都捋清楚,一周后兩方就簽了協議。
2016年5月4日,在百度做了9年自然語言處理的戴帥湘正式離職,第二天,他帶著10個人的技術團隊在中關村創辦了“驀然認知”。
搭載風口,瞄準場景
人機交互的發展先后經歷了互聯網普及前的桌面時代、互聯網普及后的瀏覽器時代和手機出現后的移動時代,是一個逐步解放雙手的過程,也是一個不斷智能化的過程。如今,一個全新的時代——IoT時代正在到來,戴帥湘清晰地看到,語音交互將是科技發展新風口。
驀然認知在NLP領域核心技術主要體現在三大方面:自然語音交互、自動服務對接、知識表示及推理。戴帥湘表示,驀然認知在這三方面已經取得重大突破,這也使小驀機器人在語義理解、多輪對話、上下文理解以及場景間的自由切換的能力突出,主要以語音交互的方式幫用戶便捷地完成日常生活中常用的任務,如打車、訂票、訂外賣等。事實上這些任務通常都不是用固定的語言話術提出的,也很難用一句話完成。因此,對自然語言的處理、場景下的上下文理解和多輪對話等都有較高的要求。
搭載著科技發展新風口,要想在語義交互領域得到長遠發展,關鍵還是得找到合適的應用場景。智能車載、智能家居、智能客服,是驀然認知技術落地的重點發展方向。戴帥湘認為這幾個領域,市場大,而且瓶頸很明顯。
連接接聽設備,需要集中式的交互入口,讓它做集中式控制、使用、命令。不久前,驀然認知還與暴風TV合作,以自己的語義理解技術為其提供語音交互的完整解決方案。
車載是最適合對話的語音交互場景,這是目前業界的一個基本共識。戴帥湘表示,除了行車過程中的路線考察,路線規劃,行車導航等,驀然更關注的是行車目的地,因為后者直接連接服務,對交互的影響更大。
作為CEO,戴帥湘為驀然認知定下三個大階段的構想:
第一階段,把積累的技術轉化成產品。天使輪后戴帥湘帶領團隊一步步把驀然認知從零到一打造出來。把產品樣式擺在桌子上,讓大家真切地看到團隊技術實力所在。
第二階段,把產品應用于B端。目前,戴帥湘把小驀植入B端,為B端合作伙伴商打造出更好的功能。驀然認知尚處于這一階段,目前已和四維圖新聯手鋪開車載的前裝、后裝市場。除此之外,更是與多家智能車載、家居巨頭,以及on the go場景展開接洽。
第三階段,優化小驀。通過植入B端產品,可以回收到大量的用戶反饋。這些反饋將用于產品進一步的優化升級。戴帥湘預計,今年6月份,就已經可以得到B端用戶的總體流量,獲取用戶的回饋信息。
在移動時代,App是用戶獲取信息和服務的主要手段,針對不同的需求有各式各樣的客戶端軟件,例如地圖、訂餐、看視頻、聽音樂等。但是,這種方式有很明顯的弊端,用戶需要在手機、平板等智能設備上安裝許多App,才能滿足自己多樣化的生活需求,這給他們帶來了操作上的麻煩。另一方面,移動時代的App化雖然改變了瀏覽器時代數據容易被竊取的問題,但是服務被離散化比較嚴重?;谏鲜鰡栴},需要有一個能將內容和服務聚合起來的接口,驀然認知正努力成為一個能將用戶與服務對接起來的智能交互決策引擎。
不懈努力,讓語音交互改變生活
2017年1月17日驀然認知科技宣布已完1000萬美元A輪融資,由經緯和源碼合投,襄禾跟投,其中經緯作為天使投資方繼續跟進。
能夠被資本認可,除了對其商業模式的認可之外,有賴于其靠譜的團隊。驀然認知的創始人有六個。一位市場負責人、一位法律顧問兼運營官,另外三名NLP的技術人才。在戴帥湘的眼里和他初期創業的五個伙伴都是這家公司的聯合創始人。他重視團隊的重要性:人太渺小了,靠自己的力量影響到社會非常困難。你有一個核心的想法,但需要和一幫志同道合的人把這個框架慢慢做大,才能共同實現目標。
隨著語音交互的變革,先行的語音信號處理能力和隨后的NLP技術缺一不可。戴帥湘認為雖然科大訊飛這類老牌的語音公司已聚合了足夠強的實力,但不意味著從NLP切入的初創公司沒有彎道超車的可能。
在物聯網時代真正到來時,語音交互將極大地改變人類現有的生活方式。未來,怎么讓AI可以使生活更簡單?戴帥湘說:“這個問題也很簡單,就是讓我們的用戶無論在什么時候、無論在什么地方,無論在什么情景下,都可以以最直接、最有效的交互方式和設備進行交流,讓設備提供你所需要的內容,讓它執行你所需要的操作,讓它提供給你優質的服務,簡單地說,就是要實現‘對話及應用?!眅ndprint