于野
2019年,有兩件事一直困擾著孫正義:軟銀的投資失敗,以及日本科技的落后。
面對媒體,孫正義痛心地說:“科技產業幾乎從日本消失了,我們正在成為一個被遺忘的國家。即將到來的AI革命,是日本重回牌桌最后的機會。”
隨著ChatGPT問世,孫正義的呼吁終于成為共識。然而,正當日本舉國動員,準備一腳油門闖入賽道時,卻發現了一個尷尬的事實:日本目前的AI研究,非常依賴以隔壁鄰居為首的老外。
RIKEN(理化學研究所)是日本唯一的國家級科研機構,頂級頭腦聚集地。湯川秀樹等日本諾獎得主,曾在這做過研究。然而,那些被收錄的RIKEN論文,近一半的作者都隸屬于國外大學,其中約一半的人來自中國。
本土無人可用,使得日本在生成式AI浪潮里,始終處于失語狀態。
然而,如若回溯歷史,會發現日本也曾是個“AI大國”。
20世紀八九十年代,日本一度是深度學習的中心。楊立昆、余凱、林元慶、賈揚清等載入科技史冊的泰斗級人物,都曾在日本的AI實驗室度過一段青蔥歲月。
曾經攥著一手好牌的日本,為何會邁向老無所依的結局?
只要在日本生活工作,你就會發現很多應用程序和軟件的迭代速度非常慢,甚至沒有迭代。不僅軟件界面的設計有著和中美歐不一樣的審美,而且速度慢、容易卡頓,隨時有宕機的風險。
究其主要原因,是軟件被視為硬件的補充,不算是創新的努力方向。“不就是0和1的不同排序嗎?”這種思維彌漫在日本“產官學”的主流,更諷刺的是,老齡少子化進一步固化了這種思維,重硬輕軟的人依舊控制著“產官學”的話語權和預算權。
20世紀80年代,正在讀大學的楊立昆,被一群“瘋子”吸引了。
彼時,深度學習是個已被證偽的技術路線。然而,仍有一小撮人在死磕,其中就包括一批日本科學家。楊立昆發現,當時大部分的深度學習論文,都是日本研究人員用英文寫的。
其中,對他影響最大的,是一位名叫福島邦彥的日本人。
1980年,福島邦彥參照貓的視覺結構,設計了一個叫做“神經認知機”的多層網絡模型。

在生物的初級視覺皮層中,存在多個神經元,每個神經元只“掌管”一小部分視野。隨后,神經元收集到的信息會統一傳輸到視覺皮層,組合成完整的視覺圖像。
受此啟發,福島邦彥給神經認知機設計了兩個神經元,分別用來“提取圖形信息”和“組成圖形信息”。然而,福島邦彥的神經認知機存在一個致命問題:太超前了。
當時,主流的神經網絡只有1層,但神經認知機有足足5層。
面對多層設計帶來的種種問題,福島邦彥一時找不到解決辦法,導致神經認知機只能處理一些極其簡單的工作。
直到1986年,辛頓提出了“反向傳播算法”,這個問題才有了標準答案。
但若向前追溯反向傳播算法,會發現其源頭仍是日本人。20世紀60年代,日本數學家甘利俊一提出的“隨機梯度下降方法”,為其提供了技術靈感。只不過囿于特定時代,甘利俊一沒有條件在計算機上進行模擬驗證。
1988年,楊立昆打造出了大名鼎鼎的卷積神經網絡。直到今天,卷積神經網絡仍是圖像識別領域最重要的算法之一。
可見,這些定義一個時代的AI研究成果,都是站在日本科學家肩膀上實現的。
同一時期,日本的產業界拉開了更為激進的歷史篇章。
彼時,日本步入極度繁榮的泡沫經濟時代。大型企業紛紛為愛發電,自掏腰包搭建中央實驗室,發力基礎科學。其中,要數NEC(日本電氣股份有限公司)最為激進:它直接切入美國科技產業腹地,將實驗室開到了普林斯頓和硅谷。
財大氣粗的NEC實驗室,很快聚集了一大批日后響當當的人物。
西安交大軟件學院院長、教授龔怡宏,是第一個加入硅谷NEC實驗室的中國科學家。在他擔任實驗室主任時期,招募了一眾青年才俊。其中既有觸發科技巨頭競拍辛頓的余凱,也有林元慶、徐偉等活躍在中國AI產業一線的技術人才。
彼時,中國計算機產業剛剛起步,吸納不了那么多人才,硅谷NEC實驗室無縫承接了這個需求,并招攬了大批立志從事AI研究的科學家。
余凱接棒硅谷NEC實驗室主任一職后,又招募來了黃暢。當時,黃暢底下有一個名叫賈揚清的實習生。在NEC實驗室期間,賈揚清展露出了高超的數學和工程代碼能力,曾讓實驗室眾人堅信其日后必有所造詣。這種薪火相傳的孵化線,在林元慶接手硅谷NEC實驗室后仍在繼續。
可以說,歷史上沒有任何一家機構,能如NEC實驗室這般,擁有此等高手如林的班底。
余凱曾在媒體專訪中如此形容NEC實驗室巔峰時期的影響力:如果你在谷歌上搜索美國NEC實驗室,頁面會立刻彈出一句話:你要不要來谷歌工作?
然而鼎盛時期風光無兩的NEC實驗室,卻早已埋下了衰敗的草蛇灰線。
2002年,楊立昆剛在普林斯頓進行了一年的研究工作,NEC就開始施壓。
管理層毫不客氣地對楊立昆講,NEC對深度學習沒有一絲興趣,并順手解雇了當時的實驗室主任。這段經歷讓楊立昆對產業界徹底失望,跑回紐約大學當了老師。
NEC突然自毀長城,有兩個不容忽視的現實原因:
一是對AI失去了信心。彼時,無論是芯片算力,還是數據豐富程度,都遠不足以讓深度學習發揮其潛力。與此同時,“第五代計算機”項目的失敗,更是雪上加霜。
“第五代計算機”項目始于20世紀80年代,目標是打造AI驅動的超級計算機。
在日本的設想中,第五代計算機將具備回答問題、知識庫管理、圖像識別、代碼生成等功能。這個“領先時代40年”的項目,一度將美國嚇得不輕,立馬掏出補貼與日本競爭。
如此一拍腦袋的項目,結局可想而知。
1992年,五代機項目宣告破產。日本不僅白白浪費了數億美金,還把其他跟風的國家給忽悠了。一怒之下,人們將責任歸咎于AI。日后很長時間里,AI研究在日本如同過街老鼠,人人喊打。
其次,日本的中央實驗室模式,此時也出了問題。
日本企業對于NEC實驗室等中央實驗室的定位,是純粹的基礎科研機構。這種模式沒有與市場和產業接軌,只是盲目追求多拿幾個諾貝爾獎。這讓科學家們非常苦悶,內部時常調侃稱“反正做的東西也用不到產品上”。
因此,當經濟泡沫消失,日本進入新的低谷,毫無實際用處的實驗室,理所當然成了第一批“挨刀”的對象。
2009-2020年間,NEC多次進行大規模裁員,并大幅縮減研發經費。
在此階段,中美科學家們紛紛選擇自主創業或另擇良木而棲。
2012年,余凱受李彥宏邀請,領導百度的AI業務。在他的號召下,此前NEC Lab的同僚,也先后加入。
日本花大力氣點燃的AI火種,最終造就了今天中國AI的沖天火光。
2018年NEC第四次大裁員后,其美國實驗室的技術中堅力量,幾乎流失殆盡……
日本AI高歌猛進的步調,隨著NEC美國實驗室的落寞戛然而止。
全球人工智能的歷史仍在繼續,就好像五代機項目從未存在過一樣;而曾經組建了全明星陣容的NEC實驗室,也漸漸被淡忘。在過去的三十年里,日本幾乎沒有在深度學習領域,留下任何痕跡。
不僅如此,日本還對深度學習留下了根深蒂固的偏見。
2016年AlphaGo擊敗了名將李世石,登上了全球科技新聞的頭版。這一年,中國誕生了528家AI企業,催生371起AI投融資。從科學家到VC,都熱情地談論著深度學習的潛力。然而,日本卻是另一番風景。
同年,日本產經省也舉辦了一場全國人工智能大會。有學者準備就深度學習提出兩個企劃案,卻被同席的學術研究者提醒,“如果名字里加上深度學習的話,估計就沒有人來聽了吧”。
這種裹足不前的態度,是日本AI如今無人可用的重要誘因。
唯一意識到問題的,正是軟銀集團的孫正義。
2017年,孫正義在推出全球最大的私募股權科技投資基金時,篤定地表示,該基金只會根據一項策略進行投資,就是AI。
接下來的幾年時間里,軟銀在AI領域的投資不可謂不激進。
光是在季度和年度報告中,孫正義提到“AI”的頻數就超過500次,并大手筆地為超過400家AI創業公司注入1 400多億美元資金。他甚至還在2020年胸有成竹地表示,史無前例的投資狂潮,將使軟銀成為主導AI革命的投資公司。
然而,孤掌難鳴。更尷尬的是,軟銀還押錯了寶。
據相關機構于2023年公開的數據,在26家估值超過10億美元的AI創業公司里,軟銀只投中了一家。
此外,孫正義雖然斥40億美元投資英偉達,卻在其股價暴漲前悉數拋掉,與近10倍的漲幅收益失之交臂。如果不是押中了ARM,孫正義的AI投資或將顆粒無收。
在ChatGPT引爆生成式AI熱潮的2023年,孫正義在股東大會上痛心疾首地表示,自2022年末以來他就一直在反省,“為自己犯了很多錯誤感到羞愧”,“哭了好幾天都停不下來”。
孫正義的眼淚,既是對軟銀頻頻押注失誤的悔恨,更是對日本AI產業的恨鐵不成鋼。
2019年時,孫正義曾不加掩飾地公開批判:在當前最重要的科技革命上,日本已變成了一個“后進國”,而使其不斷喪失競爭力的本質原因,是對進步的不貪婪。
這番言論,摻雜了不少情緒因素。實際上,這些都不是日本AI老無所依的根本原因。
深度學習從來都不是一場孤立的革命。
2012年,深度學習能夠爆發,其實有兩個先決條件:一是算力進化,當時英偉達所開發的GPU,已經初步能支撐起深度學習所需的算力;二是互聯網的全面鋪開,彌補了數據不足的問題。
集成電路、互聯網、云計算,隨著這些前置產業陸續成熟,深度學習才得以登上歷史舞臺。然而,這些產業,日本幾乎一個都沒有。
當年,在斯坦福教書的吳恩達想要進行大型圖像識別實驗,尚且有谷歌傾盡整個數據中心的算力,來成就他的The Cat Neurons項目。
然而,福島邦彥和甘利俊一卻沒有這么幸運。即便是如今的日本,也沒有任何一家民間公司,擁有訓練AI大模型所需的龐大算力。僅在政府主導的理化學研究所中,才能找到“富岳”這樣的超級計算機。
日本如果不能解決這個問題,其實發展AI的路很難走。但是這條路,和日本重硬件、輕軟件的現狀明顯相違背。這里,其實就是一個死結。