邢黎聞
我的人生系統(tǒng)當(dāng)中有正數(shù)的東西,但是 2015 年我敢于面對負(fù)面的現(xiàn)象和人的欲望,面對負(fù)數(shù)時(shí)候,我的系統(tǒng)更加完整。
“IOT在連接萬物,也進(jìn)行到了一個(gè)新的高度。但是互聯(lián)網(wǎng)并不激發(fā)起我內(nèi)心的驚喜。”在 GIF2016 極客公園創(chuàng)新大會 TOP GEEK 論壇上,從小熱衷于寫代碼的搜狗CEO王小川如是說道。他說,最能夠讓他興奮的還是技術(shù)本源的兩件事情——技術(shù)的“體外進(jìn)化”和 “AI 的瓶頸”。
以下內(nèi)容根據(jù)搜狗CEO王小川在GIF2016極客公園創(chuàng)新大會 TOP GEEK論壇的演講整理而成。
技術(shù)的“體外進(jìn)化”
當(dāng)我們擁有技術(shù)能力的時(shí)候,人對自己的改造不局限于對DNA 的改進(jìn),我們希望通過技術(shù)使這種進(jìn)化走到體外去。以前的人冷了會加衣服,或者長出脂肪來,今天我們懂得開空調(diào),我們有汽車,有很多科技產(chǎn)品為我們服務(wù)。
我認(rèn)為有兩個(gè)大的趨勢,我們今天提到的AR或者VR,聽覺和視覺的體外進(jìn)化,眼睛和耳朵開始得到新的延伸。人跟機(jī)器走到一塊之后,我們不要說使用設(shè)備,是我們自己的能力得到巨大的拓展,這是一個(gè)進(jìn)化的原動(dòng)力。
第二個(gè)進(jìn)化是智慧的體外進(jìn)化,我們開始接觸一個(gè)現(xiàn)實(shí)是虛擬的 IO能夠影響我們,之前大家并不認(rèn)同“人的智力被機(jī)器所驅(qū)動(dòng)”這個(gè)概念,因?yàn)槿撕苈斆鳎瑱C(jī)器做不到這樣的事情,但是最近兩年深度學(xué)習(xí)的發(fā)展帶來了顛覆性的效果。所以在人和技術(shù)的關(guān)系上,我提到視覺和聽覺的體外進(jìn)化和智慧的體外進(jìn)化是兩件讓我興奮的事情,由于有了AI 之后,產(chǎn)品會變得更加聰明和個(gè)性,一種觀點(diǎn)認(rèn)為機(jī)器很可怕,但我個(gè)人認(rèn)為未來世界,我們更享受與機(jī)器融為一體的方式,也許離開了機(jī)器我們的生活非常不自在,但跟機(jī)器在一塊兒的時(shí)候,未來是美好的。
比如搜索,原來的做法是輸入一個(gè)關(guān)鍵詞給你無數(shù)的鏈接,今天的搜索不是簡單的抓取網(wǎng)頁和信息,而在AR 時(shí)代到來之后,搜索會變形,一方面是給你提供答案,另一方面是給你提供服務(wù)。
Ticwatch的個(gè)人助理跟搜索未來的路徑是一樣的,它會變成你的個(gè)人助理,像你的老師一樣給你答案,也給你這個(gè)服務(wù)。這里面對機(jī)器的要求很高,對人工智能要求會像人一樣思考,甚至比我們想的更多。最近幾年人工智能已經(jīng)在深度學(xué)習(xí)方法下有很多演化,做了很多突破,包括語音、圖像、文字識別等很多工作。
AI 的瓶頸
所以,是不是機(jī)器已經(jīng)開始能夠取代人?我自己看到很多技術(shù)前沿的進(jìn)展,同時(shí)搜狗在做了很多人工智能工作之后,我相對處于謹(jǐn)慎的狀態(tài),AI 在今天有很多瓶頸。
給大家講個(gè)有趣的故事,就是人腦跟Google神經(jīng)網(wǎng)絡(luò)的關(guān)系,Google做人臉識別或者動(dòng)物識別的時(shí)候,做法是要求工程師或者研究人員對圖像做特征提取,就是靠人指引這個(gè)機(jī)器:什么地方是眼睛、什么地方是耳朵、或者眼睛、耳朵多大、有沒有胡子,通過人對機(jī)器指引,使得機(jī)器具有這個(gè)識別能力。
Google后來做了實(shí)驗(yàn)——“找貓”,當(dāng)時(shí)它的做法是在圖庫里面找 200萬張圖片,用16000個(gè)節(jié)點(diǎn)讓機(jī)器做計(jì)算,每張標(biāo)記上這張圖片里面有貓,這張圖片里面沒有貓,訓(xùn)練之后這個(gè)系統(tǒng)達(dá)到75%的準(zhǔn)確性,也就是說沒有經(jīng)過人工的對具體特征的干預(yù),使得機(jī)器開始基于原始大數(shù)據(jù)產(chǎn)生了簡單的智能,能夠做到基礎(chǔ)的判斷。今天的語音、圖像等等通常是在這樣的指引下做識別的。
但是,不管今天機(jī)器的速度多快,機(jī)器和人的智力水平還存有巨大的差距。所以所謂的“機(jī)器有3 歲的兒童智力”目前還遠(yuǎn)遠(yuǎn)達(dá)不到,我認(rèn)為對技術(shù)本身的認(rèn)知還不夠。人在識別貓的時(shí)候一張圖片就能搞定,但是Google用200萬張圖片才做到75%的準(zhǔn)確性。
2015年在人工智能里面有很多新的突破,包括跨場景的、在特定領(lǐng)域訓(xùn)練的結(jié)果能夠在另一個(gè)領(lǐng)域里面使用這個(gè)事情。但人工智能要像人一樣思考還有瓶頸,第一個(gè)事情,人的DNA里面寫入很多人工智能,所以我們生下來就知道去找母乳,或者說我們懂得害怕一些事情,但機(jī)器里面完全沒有這樣的能力。第二個(gè)事情,人能夠建立概念,在概念基礎(chǔ)上能夠做推理,機(jī)器在這方面做得是非常不夠,它們更多是靠數(shù)據(jù)驅(qū)動(dòng),是功能性的和機(jī)械性的去做。
Google在2015年的時(shí)候希望 95%的搜索里面能給到答案,背后充分使用的是像類似知識圖譜這樣的方式,知識圖譜它是個(gè)三元組,比如一個(gè)人或者一個(gè)物體跟另一個(gè)物體是什么樣的關(guān)系,是父子關(guān)系還是包含關(guān)系,是靠人在里面做標(biāo)記建立這個(gè)概念。
今天讓機(jī)器自動(dòng)化建立概念還沒有突破,所以機(jī)器今天只能做一些簡單的重復(fù)性的事情,而不能從復(fù)雜的環(huán)境里面學(xué)習(xí)到一個(gè)事物跟另一個(gè)事物之間的關(guān)系。無論哪個(gè)搜索引擎,做圖像搜索的時(shí)候,都需要用手圈一下,告訴它識別這個(gè)部分的圖像。而不像人一樣,人站在這個(gè)講臺上的時(shí)候,非常容易能夠把人和背景抽離開。我看到別人是怎么找出租車的,我一招手就能夠?qū)W會。所以人有概念之后一次性能夠建立推理能力,今天機(jī)器還不具有這個(gè)能力。
最后一個(gè)要點(diǎn),人本身有目的性,我們知道我們的生存意義是什么,每個(gè)人的目的有不同,而機(jī)器這方面是定義的。我們在之前VC投資里面不斷提到讓算法起作用,我們做了很多的努力,但是我們還在想怎么讓機(jī)器人的努力和人的努力結(jié)合在一起,讓機(jī)器作為輔助,以人為核心,包括我們自己做搜索引擎也是希望把人腦里面的搜索出來。所以我們得思路是做更多連接,把大腦里的智慧表達(dá)出來,我們?nèi)ジ欉@個(gè)文章是誰寫的,這個(gè)人的背景是怎么樣的。