陳莎莎
中國的小公司和個人不該妄自菲薄,人工智能真正的發(fā)展才剛剛興起,它將像當年互聯(lián)網(wǎng)的崛起一樣,打造一批新的時代巨無霸,這些新巨人可能從現(xiàn)有的巨頭進化而來,也可能從目前還名不見經(jīng)傳的小公司甚至個人創(chuàng)業(yè)者成長而來,大公司有大公司的資源優(yōu)勢,小公司也能發(fā)揮“船小好調(diào)頭”的靈活敏銳特色。畢竟,現(xiàn)在的谷歌、百度、阿里巴巴都是從當時被人看不起的“小生意”開始的。
谷歌母公司(Alphabet)用AlphaGO大勝圍棋專業(yè)九段李世石,給全球科技巨頭帶來的震撼正在迅速蔓延:各大巨頭紛紛公開宣布或秘密啟動“人工智能+”戰(zhàn)略,用人工智能改造各項產(chǎn)品和服務。
美國微軟公司在3月30日開幕的年度開發(fā)者大會上,宣布新的人工智能計劃:以“對話作為平臺”(Conversation as a platform)為理念的微軟Bot架構(gòu)。微軟首席執(zhí)行官薩蒂亞·納德拉說:“繼鍵盤、鼠標、觸摸屏之后,能理解人類語言、實現(xiàn)人機互動的人工智能自動程序,將成為下一代界面?!?/p>
3月31日,百度在京舉辦“智慧汽車”戰(zhàn)略發(fā)布會,并與長安汽車簽署戰(zhàn)略合作協(xié)議,宣布將在合作的“智慧汽車”中植入百度的車聯(lián)網(wǎng)系統(tǒng)。百度總裁張亞勤將此稱之為“社會正在從‘互聯(lián)網(wǎng)+步入‘智能+的一個標志”。
正如從單細胞到無脊椎動物的進化,互聯(lián)網(wǎng)正迅速完成跑馬圈地注重“量”的互聯(lián),下一步是向脊椎動物和高大腦容量的物種進化,人類互聯(lián)網(wǎng)的“大腦”雛形正日新月異地形成。
互聯(lián)網(wǎng)的這個“腦”就是人工智能?!皠谛恼咧稳?,勞力者治于人”,以互聯(lián)網(wǎng)為代表的人類競爭正迅速集中于“腦力”的競爭,從“互聯(lián)網(wǎng)+各個領域”向“人工智能+各個領域”快速迭代進化。
競爭格局:
百舸爭流 搶占藍海
目前,谷歌主攻機器人,百度打造自動駕駛,特斯拉也主攻自動駕駛,微軟目前發(fā)布的項目圍繞人機對話界面,F(xiàn)acebook圍繞社交軟件,IBM希望做人工智能領域的操作系統(tǒng),而它們共同的特點是:已經(jīng)、正在或即將大舉并購大量涌現(xiàn)的人工智能小公司。
如果2015年巨頭們思考打造什么項目,2016年大家可能更多思考如何用人工智能全面重構(gòu)公司。
百度高級副總裁、自動駕駛事業(yè)部總經(jīng)理王勁3月30日說,百度將用人工智能對研究院、語言、圖像等部門進行重構(gòu)?!鞍俣葘頃萌斯ぶ悄芗夹g(shù)來改造百度所有的技術(shù)。各個產(chǎn)品和技術(shù)體系,都由人工智能來規(guī)劃”。
實際上,微軟早已這么做。微軟研究院人工智能首席科學家鄧立告訴記者,他目前的主要任務是,把微軟的各項產(chǎn)品和服務全面智能化,人工智能團隊大部分進駐在各個部門,深入了解各部門產(chǎn)品的實際需求后,用人工智能的方法量身定制對應的程序。
微軟主要圍繞目前產(chǎn)品和服務的智能化。3月30日,微軟發(fā)布了一套代碼工具包和機器學習程序,微軟CEO納德拉說:“希望開發(fā)人員為每個企業(yè)和服務創(chuàng)制人工智能程序,把人工智能融入各種應用中。”微軟認為,未來的計算有3個主要的推進器—人、數(shù)字助理和機器人,未來人類與技術(shù)之間將有全新的交互方式,人與人、人與機器人、人與數(shù)字助理,甚至數(shù)字助理與機器人之間都會產(chǎn)生交集。
而百度公司在人工智能領域的投入,是全力投入自動駕駛?!霸谌斯ぶ悄芊矫?,但凡有一點資源,都應該投入到自動駕駛上面來。”王勁說,“自動駕駛汽車是百度迄今為止最大的投資項目之一,將會達數(shù)百億元人民幣?!?/p>
這是各大巨頭激烈競爭的“紅?!薄9雀璞硎?,預計首輛自駕車將于5年內(nèi)正式上路。近日美國政府已經(jīng)批準了谷歌自動駕駛汽車上路的法律申請。特斯拉CEO伊隆·馬斯克則對外表示,特斯拉用兩年的時間就可以推出全自動駕駛汽車。2015年底,百度提出自動駕駛要“3年商用,5年量產(chǎn)”。蘋果也曾透露,正在研發(fā)自動駕駛汽車。
但王勁表示,百度在許多技術(shù)上已經(jīng)超過了谷歌。在服務器方面,百度的MinWA服務器具有相當于兩個“天河一號”的超強計算能力;在數(shù)據(jù)方面,百度有萬億級的網(wǎng)頁、移動和行為數(shù)據(jù)可供分析;在深度學習方面,百度的萬億參數(shù)排在世界第一。
人工智能被Facebook作為新盈利模式轉(zhuǎn)型的主要動力。1月3日,F(xiàn)acebook創(chuàng)始人扎克伯格在他的Facebook上透露,他的2016年新年目標是打造一個人工智能管家。2015年7月,F(xiàn)acebook就在開發(fā)代號為“Moneypenny”(簡稱M)的人工智能助理項目,其負責人David Markus說:“M是一種個人數(shù)字助理,與市場上其他基于人工智能技術(shù)開發(fā)的服務相比,M真的能代替你購物、為親人送禮物、預定參觀、安排旅程等?!?/p>
對于百年老企業(yè),人工智能是“向死而生”的戰(zhàn)略反攻。曾經(jīng)制造出打敗國際象棋冠軍的“深藍”的IBM,在2014年1月斥資10億美元使Watson項目獨立,外界普遍認為這是IBM“向死而生”的新業(yè)務。IBM將其實現(xiàn)人工智能的方法稱為“認知計算(cognitive computing)”。目前,Watson主要應用集中在藥物及醫(yī)學領域,2015年4月,IBM宣布和蘋果、強生以及醫(yī)療器械公司Medtronic合作,目標是醫(yī)療系統(tǒng)中介。
IBM的戰(zhàn)略并不小:讓Watson成為如今不斷涌現(xiàn)的人工智能應用的操作系統(tǒng)。這在其一系列聲明中得以清晰展現(xiàn)。
各大巨頭正在全球?qū)で笕牍尚屡d的小公司。“摧毀一個公司最好的方式就是買下它?!币晃凰固垢4髮W教授向記者坦言。
提升技術(shù):
開源競賽 引鳳來棲
AlphaGO為何能打敗圍棋世界冠軍?它的致命法寶就是模仿人類的“深度學習”(deep learning)工作原理。
Facebook、谷歌、雅虎、百度等各大公司都在嘗試將深度學習算法運用到產(chǎn)品開發(fā)中,以期使產(chǎn)品更智能化,提升用戶體驗。
對于開發(fā)人工智能的企業(yè)來說,一個重大的機遇是,深度學習的研究領域幾乎沒有專利,全球頂尖公司正掀起開源(即免費公開使用)的競賽,各企業(yè)、研究機構(gòu)幾乎都把自己數(shù)億美元科研成果免費公開,供所有人包括競爭對手使用。
“因為需要更多用戶提供更多數(shù)據(jù)、反饋,才能提高人工智能的‘智力?!盜BM人工智能資深研究員嚴駿馳告訴記者。
實際上,全球頂尖公司正掀起開源的競賽。早一天把系統(tǒng)做成功,早一天開源,其他公司的開發(fā)者就會基于這一系統(tǒng)開發(fā)程序,“引鳳來棲”,一位人工智能領域的頂尖科學家坦言。
例如,此次AlphaGo開賽之前的半年,谷歌公司早已把AlphaGo背后的技術(shù)、算法作為論文公開。谷歌近期又推出機器學習系統(tǒng)開源工具TensorFlow,從智能手機到大型數(shù)據(jù)中心服務器都能使用。
開源讓各企業(yè)之間的競爭又變得“我中有你、你中有我”的“如膠似漆”。這次做出AlphaGo的公司Deep Mind,就是基于Facebook開源的深度學習系統(tǒng)Torch。蘋果Siri也是基于開源的系統(tǒng)。
嚴駿馳說,全球深度學習領域的研究基本沒有專利,都是開源的,這使得小公司甚至個人都有機會開發(fā)人工智能程序?!爸袊髽I(yè)想做AlphaGo也不難,方法都是公開的?!编嚵⒄f。
鄧立坦言:“技術(shù)、算法本身都顯而易見,而且即使申請了專利,也很難檢測到別人正在使用自己的技術(shù),因為目前都在云端計算,所以谷歌甚至連軟件都開源了?!?/p>
“不過,谷歌公司通過長久的演練、摸索,探索出了適合圍棋的許多具體參數(shù),其他人就沒有積累?!编嚵⒄f。
“企業(yè)需要對這些開源的方法進行二次開發(fā),以匹配自己所需的特定功能。而二次開發(fā)所需的團隊、資金還是不小的?!备瓯趧?chuàng)投合伙人徐晨向記者補充道。
“二次開發(fā)可能需要幾萬到數(shù)百萬美元,看你想要的精確度、廣度、深度,差異非常大。”卡梅隆大學專門研究深度學習在多媒體中應用的教授告訴記者。
但開源、免費也有弊端,“因為不直接產(chǎn)生收益,做起來就不一定盡心盡力,企業(yè)還是以利潤為動力的。”鄧立坦言。
比開源更進一步,人工智能技術(shù)被認為應該全人類免費共享。2015年12月12日,特斯拉CEO伊隆·馬斯克在Twitter上宣布正式啟動OpenAI,并稱OpenAI是一個非營利性的人工智能研究公司,目標是“推動數(shù)字智能的發(fā)展,同時不被財務回報所限制,從而造福整個人類”。
OpenAI強烈建議研究人員公開他們的研究成果,包括論文、博文、代碼和專利,與世界共享,通過和科研人員、企業(yè)的合作,不斷研發(fā)新技術(shù)。
盡管OpenAI只是一個非盈利組織,但其吸引的人才卻不亞于谷歌百萬年薪挖來的。OpenAI的研究總監(jiān)是來自谷歌的世界著名機器學習專家Ilya Sutskever,首席技術(shù)官是支付公司Stripe前首席技術(shù)官Greg Brockman,團隊的其他成員都是世界級的工程師和科學家,包括著名創(chuàng)業(yè)孵化器YCombinator的聯(lián)合創(chuàng)始人Trevor Blackwell等。
應用前景:
從“眼耳”到“理解和決策”
人工智能正處于哪個階段?哪些方法、應用將最有前景?
美國電子和電氣工程師協(xié)會(IEEE)首次將國際聲學、語音和信號處理大會(ICASSP)移師上海舉辦,鄧立在向全球科學家所作的《人工智能深度學習—從機器識別到機器理解》主題演講中表示,機器智能已從充當“眼耳”的語音和圖像識別功能上升到“理解和決策”功能,包括記憶、翻譯、自主學習和決定等。
他的這一判斷是對經(jīng)歷了幾十年起起落落后的人工智能的歷史趨勢的判斷。鄧立是最早將深度學習方法應用于語音識別商業(yè)應用的專家,他和同事與深度學習最著名的專家Geofferey Hinton合作,最早把深度神經(jīng)網(wǎng)絡應用于大詞匯量連續(xù)語音識別領域,把語音識別錯誤率降低了20%。
鄧立告訴記者,從本質(zhì)上說,目前人工智能(機器學習)方法,將成為各項科技的支持技術(shù)(enabling technology),使其他科技的目標得以成功實現(xiàn),它可能不是直接接觸終端用戶的界面,但界面的背后可能都是人工智能方法在控制。
也就是說,它是運籌帷幄的“王”,而不一定是沖鋒陷陣的“將軍”或“士兵”。“如果你以為人工智能只是一種科技、一種產(chǎn)品,如果你認為AlpahGo是一套特別的AlpahGo技術(shù),那你就大錯特錯了,你完全誤解了它的含義?!彼固垢4髮W數(shù)學系教授Stephen P. Boyd對記者強調(diào)說。
“人工智能是一整套思維方法,這套方法可以用來做任何事,如金融、反腐敗、醫(yī)療診斷、交通系統(tǒng)設計、自動駕駛、做手術(shù)、語音識別、圖像識別等,它們也可以用來做壞事,比如發(fā)射導彈等。當然也可以應用于下圍棋,這并沒有什么特別的?!盨tephen P. Boyd說,“它真正改變的是社會的運作原理,是背后根本的方法。理解了這套思維方法,你可以用來解決一切問題,而不僅僅是語音、圖像識別、自動駕駛、機器人寫作等。”
例如,關(guān)于“人工智能+物聯(lián)網(wǎng)”,新加坡科技研究局資訊通信研究院信號處理部部長、IEEE信號處理學會物聯(lián)網(wǎng)技術(shù)委員會主席俞榮山認為,在物聯(lián)網(wǎng)技術(shù)背后,將來物與物之間的對話、指令、自動化控制,大部分將由人工智能程序控制。
俞榮山向記者表示:“萬物相連背后的控制,大部分將由人工智能完成,物聯(lián)網(wǎng)的大部分變化都將是背后隱含的,終端用戶可能都不會感覺到它的變化。例如,當你關(guān)掉辦公室電腦,你家的電飯煲就自動開始煮飯,等你到家飯菜都自動做好了,這看起來是物聯(lián)網(wǎng),但背后的程序運用的是人工智能的方法。”
鄧立預測,未來最有前景、最值得深入挖掘的方法,將是深度無監(jiān)督學習,將深度學習與強化學習的方法結(jié)合起來配套使用。
鄧立向記者預測,未來,深度無監(jiān)督學習在金融、機器人(如自動駕駛)、大數(shù)據(jù)分析和預測、商業(yè)流程優(yōu)化、智能個性化醫(yī)療等方面最有發(fā)展前景。但鄧立認為:“我們科學家只提供方法,具體應用在哪個場景,需要由你決定,客戶比科學家更了解市場應用前景?!?
具體如何應用?大家都在摸索,還沒人知道準確答案。因為未知,所以充滿機遇,這正是各大公司夜以繼日奮力搶奪的市場焦點,用俗語來說就是,“預測未來最好的方式是創(chuàng)造未來”。
在這場市場競爭中,小企業(yè)明顯底氣不足,數(shù)據(jù)不夠、計算所需的設備不足,導致運算能力有限。在深度學習中,深度、層數(shù)是核心關(guān)鍵,如微軟研究院的系統(tǒng)甚至深達152層。
企業(yè)如何配套自己主攻項目的技術(shù)呢?鄧立對此很有經(jīng)驗:“首先,項目的市場需求要廣泛、要大;其次,對技術(shù)接下來幾年的發(fā)展要有準確的預測。”
人才稀缺:
年薪300萬美元?
人工智能技術(shù)人員是“少而精”的人群,相比于互聯(lián)網(wǎng)傳統(tǒng)的“碼農(nóng)”(人們對編碼程序員低廉收入的笑稱),人工智能尤其是深度學習的人才嚴重供不應求?!凹词乖僭黾?0倍的畢業(yè)生,市場也能吸收?!泵绹萍脊救斯ぶ悄茇撠熑烁嬖V記者。
“做深度學習的人工智能博士生,現(xiàn)在一畢業(yè)能拿到年薪200~300萬美元的offer?!眲?chuàng)新工場CEO李開復近日發(fā)言,“硅谷公司都在追捧這個方向,這是有史以來沒有發(fā)生過的。三大公司(谷歌、Facebook和微軟)在用不合理的價錢挖人?!?/p>
近日,這些主要的招聘方、招聘對象聚集在上海的ICASSP會議,會上聚集了人工智能語音處理的頂尖科學家和企業(yè)。
谷歌最主要競爭對手的一位負責人向記者透露,“250萬到300萬美元年薪,即使是包括期權(quán)、股票、獎金等的打包總收入,全球估計也只有少數(shù)幾個人,絕對不是行業(yè)常見的水平?!?/p>
亞馬遜語音識別機器人的帶頭人Jeff Adam麾下曾招聘了60位研究人員,因此對這一市場的薪水頗為熟悉,他告訴記者,“這個數(shù)字高出了10~20倍。在硅谷,剛畢業(yè)的博士生12~20萬美元年薪,有經(jīng)驗的博士能達到20~30萬美元?!?/p>
另一位美國科技企業(yè)人工智能負責人向記者透露:“一定要最最頂尖的博士生。300萬美元的總收入,我只有一次給出過,但是是分4年的,不是一年的收入。”
一位Johns Hopkins大學(被業(yè)內(nèi)認為是語音識別人才最頂尖搖籃之一)的博士生,向記者給出了這一個package(收入打包)中的具體構(gòu)成:“一般基本工資10~14萬美元,10%~15%的獎金,連續(xù)4年每年2萬美元的股票?!?/p>
“如果是做硬件的,基本工資8萬美元。如果是做軟件的,單純做算法理論就很難找到工作,一般會流到其他方向。具體流到哪個方向就很難說了,可能都不做計算機了?!彼寡?。
一位近期從微軟、谷歌回國創(chuàng)業(yè)的語音識別的技術(shù)總監(jiān)告訴記者:“博士畢業(yè)大約15~25萬美元年薪,特別優(yōu)秀的可能超過30萬美元。做技術(shù)的從來都是一樣,一個優(yōu)秀的人能頂幾個甚至很多個一般人,所以特別優(yōu)秀的人的價格可能翻番。但300萬美元年薪,確實沒聽說過。”
“在國內(nèi),人工智能相關(guān)最優(yōu)秀的博士畢業(yè)生,大約50萬元人民幣年薪,這樣的人國內(nèi)一年不超過15個吧。”這位技術(shù)總監(jiān)告訴記者。
曾經(jīng)像博士畢業(yè)生一樣求職、如今已經(jīng)在這一領域的從業(yè)者怎么說?一位語音識別首席工程師向記者透露:“加利福尼亞州(硅谷所在地)博士畢業(yè)生一般是15~25萬美元年薪,全部指的是package,大部分不是現(xiàn)金,而是股票。特別優(yōu)秀的能到35萬美元年薪,但只是極少數(shù)?!?/p>
“人工智能的研究需要靜下心來積累,如果沒有深入的興趣,很難做到頂尖,人工智能技術(shù)只要最頂尖的人才?!痹撌紫こ處熛蛴浾咛嵝选?/p>
綜上所述,年薪300萬美元的說法或許不太現(xiàn)實,但是,作為業(yè)界大佬的一家之言,這至少暗示了一種人工智能人才緊缺的趨勢。
(本文轉(zhuǎn)自《國際金融報》)