楊玄章
在人工智能這個江湖,有著太多的天才和大師,有的“為笑傲江湖而曇花一現”,有的“沉淪數十載,一鳴驚人”,有的卻“人在江湖,身不由己”。無論最終他們選擇了一個什么樣的劇本,最終都在人類探索自己智慧的道路上做出了貢獻。
在工業界,圍繞人工智能進行的技術和資本大戰來得比2016年”AlphaGo與李世石的圍棋對決有過之而無不及。谷歌早在2014年就打開了這場大戰的序幕,以4億英鎊(約合6億美元)的高價收購了英國人工智能公司DeepMind,這次的圍棋大戰的主角AlphaGo就是出自這家公司。 在這之后,與人工智能技術相關的并購高達數十次,總額達到幾百億美元。并購的主角都是些業界的大佬:谷歌、蘋果、Facebook、Twitter、Intel、Saleforce、IBM逐步走上世界舞臺的中國巨頭們也當仁不讓,華為、百度、騰訊、阿里等公司也紛紛砸巨資研究和開發自己的人工智能平臺及產品。
細心的讀者也許會發現,早在群雄進行人工智能的資本大規模混戰之前的2013年初,谷歌孤零零地收購了一個叫DNNresearch的公司。細查一下它的底細,發現雖然這是一家只有3個人的公司,但是公司創始人卻是一個叫杰佛里·辛頓(Geoffrey Hinton)的人。所有人工智能的江湖中人看到這個名字后都會為之一震,接下來會很信服地說:“谷歌真會買。這個生意做得值了。”辛頓是誰?他有什么故事?人工智能的技術江湖還有哪些大佬?我們就在這里說一說這個江湖吧。
江湖風起,祖師下山
說起這個江湖,最初應該提起的不是計算科學領域的學者,而是一位人們耳熟能詳的哲學家和文學家:伯特蘭·羅素(Bertrand Russell)。這位奇人活了近100歲,創建了邏輯分析哲學,同時在哲學的多個領域作出了卓越的貢獻。1950年,他還獲得了諾貝爾文學獎。那他跟人工智能有什么關系呢?很少有人知道,他還是一位數學家。他提出了羅素悖論,把邏輯分析和數學建立聯系。1910年他發表了《數學原理》,對于20世紀的數學基礎產生了巨大的影響。為什么要提羅素呢?因為下面提到的幾位人工智能領域的祖師爺級的人物,都和這位“達摩老祖”有緊密的關系。
首先出場的是神一樣的祖師:阿蘭·圖靈(Alan Turing),現代人工智能的思想來自于這位著名的科學家。這位大師一出場就是天才級選手,在劍橋學習的時候,他讀到了羅素的《數理哲學導論》,開始了自己在邏輯學和數學結合領域的研究。1935年,年僅23歲的圖靈就當選了劍橋大學國王學院院士。
在劍橋期間,圖靈成為羅素最器重的研究員之一。除了圖靈機以外,圖靈的另一項偉大的貢獻就是提出了著名的圖靈測試。在他1950年的論文《計算機器和智能》(Computing Machinery and Intelligence)中,他首先提出問題:“機器能思考么?”同時,他提出判定機器是否具有智能的試驗方法。在這項測試中,如果具備人工智能的設備能在5分鐘內回答由人類測試者提出的一系列問題,且其超過30%的回答讓測試者誤認為是人類所答,則可以認為這個設備可以通過測試,也就是具備人工智能。
圖靈測試在那之后的60多年里一直作為人工智能領域中標桿性的判定標準,也一直在這個領域是一座不可逾越的大山。直到2014年,才有智能設備首次通過圖靈測試。為了紀念這位偉大的科學家,專門設立了圖靈獎以表彰在計算科學領域的杰出貢獻者。這被認為是計算機界的諾貝爾獎。
第二位出場的天才級祖師:諾伯特·維納(Norbert Wiener)。維納的老爸也是哈佛教授,很小的時候就帶維納拜訪了羅素。在劍橋大學學習的時候,他就是羅素老祖的學生,18歲取得博士學位。了解維納的人都知道,他是現代控制理論的奠基人。與此同時,他還為人工智能理論作出了卓越的貢獻。維納認為計算機是一個進行信息處理和信息轉換的系統,只要這個系統能得到數據,就應該能做幾乎任何事情。他從控制論出發,特別強調反饋的作用,認為所有的智能活動都是反饋機制的結果,而反饋機制是可以用機器模擬的。維納的理論抓住了人工智能核心——反饋,因此可以被視為人工智能行為主義學派的奠基人,其對人工神經網絡的研究也影響深遠。此外,維納靠控制論名聲大噪的時候,得到了大筆的經費,邀請了一大批優秀的科學家在他的實驗室工作,這里面就包括下面這位祖師。
第三位出場的大師頗有些令狐沖式的經歷。沃爾特·皮茨(Walter Pitts)出身窮苦人家,連學都上不起。然而,天才級選手才不會受家貧的影響。他初中時讀了羅素的《數學原理》,然后就給羅素寫信。要知道,那時候羅素已經是著名的大哲學家了。看到他的見解,羅素還曾邀請12歲的皮茨同學去劍橋,可惜被皮茨的文盲父母粗暴地拒絕了。之后,上不起學的皮茨聽說羅素在芝加哥大學任教,就只身跑到那里,被安排了一個打掃衛生的工作。
他這里碰到了神經醫學教授沃倫·麥克洛奇(Warren McCulloch)。兩位一拍即合,共同展開了計算神經網絡的研究,并在1943年發表了神經網絡的奠基之作(A Logical Calculus of Ideas Immanent in Nervous Activity),開人工智能的一個流派之先河。這一年,皮茨只有20歲,主要職業仍然是掃廁所。也是在這一年,他去了波士頓,結識了上面提到的控制論之父維納。據說他在第一見維納的時候,在這位學霸級教授面前推了一黑板公式,就被破格錄取這位只有初中畢業證的大學旁聽生兼清潔工為MIT的博士。這位祖師不僅僅是神經網絡的奠基人,還精通多國語言,在植物學、化學、鳥類學、解剖學和物理等多個領域都有著大師級的貢獻。
人工智能早期的故事說到這里,這個江湖還算清凈。幾位祖師爺分別在哲學、數學、邏輯學、認知心理學等多個方面為人工智能打開了大門。更為重要的是,這些祖師爺都曾是教書先生和研究學者,為這個領域培養出一大批高手,這些人在今后的江湖混戰中各顯神通。
華山論劍,1956
1956年,人工智能領域的一次史詩級的“華山論劍”在達特茅斯學院舉行。在這次會議上,一個里程碑性的進展就是在學術界創立了人工智能方向,AI(Artificial Intelligence)就此誕生了!
關于這次會議的參加人數,一直都是個謎。有人說是只有11個人,有人說有20人之多。不管有多少人參加,這個陣容可以說是現代計算科學領域陣容最豪華的一次會議了。可以大致把他們分為三個類別:
神經網絡學派:約翰·麥卡錫,馬文·明斯基,沃倫·麥克洛奇。
符號學派:赫伯特·西蒙(也稱司馬賀),艾倫·紐厄爾。
其余道骨仙風醬油派:香農、所羅門諾夫、塞弗里奇、撒繆爾等人。
人工智能從一誕生起就分為兩派。神經網絡學派也被稱為聯結主義學派,其主要思想來自于對于人腦微結構的模擬,是一種自頂向下方法,頗似金庸筆下華山派的“劍宗”。而符號主義的主要思想是應用邏輯推演法則,主張從各個基本的“符號”出發,沿著嚴密的代數推理過程,讓機器能得出與人的理解相同的結論。這是一種自下向上的方法,重視積累和邏輯,有點像金庸筆下華山派的“氣宗”。
在一開始的人工智能界,大家公認的“名門正派”應該是“劍宗”這一派。連“人工智能”這個詞匯都是這一派的創始人約翰·麥卡錫(John McCarthy)最早提出的。這位高手雖然算不上天才級選手,但是由于資格老且活的長,確實也做出了非凡的貢獻。首先,他發明了人工智能界第一個廣泛流行的高級語言LISP,在很長一段時間里壟斷著人工智能領域的應用;他也是分時技術的發明人,使得計算機第一次能同時允許數十甚至上百用戶使用。同時,他與明斯基一起創建了MIT的人工智能實驗室,他自己后來又跑到斯坦福大學協助建立那里的人工智能實驗室。為了表彰他在AI領域的杰出貢獻,麥卡錫于1971年獲得圖靈獎。
另一位“劍宗”的掌門人馬文·明斯基(Marvin Minsky)也是高手中的高手。早在1951年,他就設計開發了世界上第一臺能夠自我學習的人工神經網絡學習機(SNARC),一舉奠定了其在神經網絡領域的創始人的地位。他創建了MIT的人工智能實驗室,并為之付出了畢生的心血。除了人工智能方面的貢獻外,他還發明了共聚焦顯微鏡(如今在生物醫學領域發揮著重要的作用)以及頭戴式顯示器(后來逐步發展為現在的頭戴VR裝置)。1969年,明斯基獲得圖靈獎。這位高手還有個過人之處,就是一直活到了2016年。到后來,大家辦點兒有影響力的人工智能的活動,都會請這位“劍宗”掌門。所以,他的名氣是這個領域里最大的。
“氣宗”的掌門赫伯特·西蒙(Herbert Simon)也是一位天才級高手,他一共有九個頂級大學的博士學位,一生在計算科學、認知心理學、公共行政、經濟學、管理學和科學哲學等多個領域都有著卓越的貢獻。他獲得了1975年的圖靈獎、1978年的諾貝爾經濟學獎、1986年的美國國家科學獎章和1993年美國心理學會的終身成就獎。這樣一位大家還是個出色的政治家,在上世紀七十年代為中美建交做出了很大的貢獻。因此,他還有一個中文名字叫司馬賀。1994年,他當選為中國科學院最早的外籍院士。
司馬賀的搭檔艾倫·紐厄爾(Allen Newell)也是這個領域響當當的人物,他們共同創建了卡耐基梅隆大學的人工智能實驗室。他發明了IPL語言,是麥卡錫的LISP語言的基礎之一。紐厄爾在1975年與司馬賀一同獲得了圖靈獎。
除了兩派的掌門人外,其他來打醬油的人也都是大師級人物。信息論的創始人香農當時已經是貝爾實驗室的老大之一。如今,那條難以逾越的“香農極限”仍然是折磨現代通信界的一道夢魘。塞弗里奇則是模式識別的開創者。還有“歸納推理機”的發明者所羅門諾夫。其他人的背景就不一一贅述了。
“劍宗”的掌門把這些“絕頂高手”湊在一起,本來是要大家在一起閉門練功兩個月,設計出第一個人工智能機器,從而開創一個學科。然而,“氣宗”的老大們并不買帳,呆了一個星期就閃人了。這也為后來兩派之間的“混戰”埋下了伏筆。不過在會上,還是明確提出了人工智能的目標:學習或者智能的任何其他特性的每一個方面都應能被精確地加以描述,使得機器可以對其進行模擬。在這之后迎來了人工智能領域的第一個春天,達特茅斯會議上的與會者成為這一時期人工智能研究的主要貢獻者。在這一時期,很多該領域的奠基之作被完成,也開辟了很多經典的研究方向。
“劍”“氣”恩怨幾多年
其實,“劍宗”和“氣宗”的較量,從人工智能誕生的時候就已經開始了。事實上,“劍宗”的老大們在組織達特茅斯會議的時候,本來是想請一群大佬來,一起做兩個月的“封閉開發”,最終見證自己的劃時代貢獻的。然而會議一開始,司馬賀和紐厄爾這兩個同門不同宗的外人卻做了個讓人刮目相看的報告,并公布了一款程序“邏輯理論家”(Logic Theorist)。這個程序可不簡單,在那個“史前時代”,可以證明祖師爺羅素的《數學原理》中命題邏輯部分的一個很大子集,當場引起了大家的關注。
“氣宗”的兩位老大也夠有個性,在那里只呆了一周,掃了個場子,賺足了眼球,也砸了“劍宗”的臺子,揚長而去。據說此后的很多年里,MIT的人工智能教授和卡耐基梅隆的人工智能教授一直沒法坐在一張桌子上,他們之間的交流只能通過研究生在私下進行。直到后來,各個大學的學生開始到對方大學當教授,這種門戶偏見才慢慢消除。由此可見,科學家也不是圣人,也會為結下的梁子耿耿于懷很久很久。
其實當時“氣宗”瞧不起“劍宗”也不無道理。畢竟,司馬賀和紐厄爾有拿得出手的“邏輯理論家”。卡耐基梅隆大學一直有腳踏實地的傳統,在這個時候顯示出很大的威力。多年之后,“劍宗”創始人明斯基也不得不承認,“邏輯理論家”是第一個也是當時唯一一個可以工作的AI程序。而當時的“劍宗”還只是空談,本來寄希望達特茅斯會議能夠開天辟地,跑馬圈地,創立自己當家的AI學科,還是被“氣宗”兩位老大攪了局。紐厄爾打心底里看不上明斯基,認為他除了“拉大旗作虎皮和稀泥”以外,沒什么真本事,而且人也太刁滑了。在紐厄爾晚年,只說是香農邀請他參加這些會議的,對明斯基和麥卡錫只字不提,可見門戶偏見有多深。
“劍宗”的劣勢很快就有了改觀,這要歸功于一位來自康奈爾大學的心理學家:弗蘭克·羅森布利特(Frank Rosenblatt)。這位神人是個實驗心理學家,在嘗試用IBM的計算機來模擬他在認知心理學上的發現的過程中,發明了一個名為“感知機”(Perceptron)的神經網絡模型。這一下引起了不小的轟動,感知機證明了單層神經網絡在處理線性可分的模式識別問題時,其實是可以收斂的。以此為基礎,羅森布利特做了若干感知機有學習能力的實驗。
感知機本來是可以讓“劍宗”翻身的發明,然而“劍宗”的掌門人明斯基卻并不買帳。因為,這位外來戶的風頭太盛了,甚至蓋過了明斯基這位AI的創始人。當時,羅森布利特拿到了國防部和海軍的大把經費,不可避免地動了MIT的蛋糕。媒體也對這位AI新貴大加贊賞,各大報紙頭版頭條都是他的新聞。羅森布利特本人也確實沒把其他“劍宗”的人放在眼里,或者說他根本就不覺得自己要加入組織的。這可讓明斯基這一派人馬惱怒不已,他們開始了自己的反擊。明斯基畢竟還是AI領域的學霸,想要踩死這個不知天高地厚的“異類”似乎易如反掌。他們動用自己的一切力量去否定感知機,明斯基甚至在自己的書中明確地說:羅森布利特的論文大多沒有科學價值。很難相信這是一位科學界泰斗可以說出的話。羅森布利特畢竟不是這個圈子的人,在“劍宗”學霸明斯基的面前,還是顯得勢單力薄了很多,最終離奇地意外死亡。
可笑的是,明斯基本人也曾是神經網絡的最大的擁護者,他的博士論文的主題就是神經網絡,他最早的發明SNARC也是一臺神經網絡學習機。那時候,他卻為了斗倒羅森布利特,連神經網絡也一并打入深淵。后來,明斯基肯定也意識到自己的做法前后矛盾,想方設法擺脫與神經網絡的干系。后來,他曾經接受采訪說:他的博士論文從來沒發表過,大概只印了三本,他自己也記不清內容了。看樣子他是想極力開脫自己和神經網絡學科的關系。
“劍宗”有了這樣的掌門,在競爭中處于弱勢肯定是不可避免了,而且這一弱就是幾十年。后來很多學者稱這一段時間為“二十年大饑荒”。直到近十年神經網絡“重出江湖”,才給羅森布利特平反,學者們也認為明斯基這樣打壓科學家的做法是不可原諒的。為了紀念羅森布利特,IEEE(美國電氣電子工程師協會)在2004年設立了羅森布利特獎,以表彰神經網絡領域的杰出科學家。2014年,這個獎項得主就是后來一統江湖的“劍宗”大師:杰佛里·辛頓。
“劍宗”暫時一統江湖
時間來到了20世紀70年代,人工智能領域碰到了第一個低潮期。由于長時間沒有可實用的研究成果出來(或者說第一批先驅有些低估了這個領域的難度),主要資助方們漸漸失去了信心,甚至有些人認為人工智能就是個永遠沒法用的“玩具”。明斯基們給人工智能開了一個很高的調子,然而在很長一段時間里在搞派系斗爭,卻拿不出可以實用的成果。在這之后的幾十年里,人工智能幾經沉浮,有過短暫的繁榮,又經歷過兩次低潮期,最終迎來了真正的爆發期。
事實上,在神經網絡的“大饑荒”時代,還是有不少人為這個領域做出了有益的貢獻。很可惜,科學家也是人,他們也需要經費來養家,養學生,養實驗室。因此,當無數人給神經網絡流派判“死刑”的時候,很多人都半途放棄了。有意思的是,神經網絡其實是信息科學和神經科學相結合的學科。在眾多科學家在斗爭中從信息科學被“趕出來”之后,一些堅持這方面研究的人就把發力點放在了神經科學方面。他們當中的佼佼者就是哈佛大學的神經生物學家胡貝爾和威瑟爾。他們的研究雖然是圍繞視網膜和視皮層展開的,使用的卻是信息處理的方法。他們因此獲得了1981年的諾貝爾醫學獎。
當所有人對于人工智能失去信心的時候,還有這樣一位“劍宗”大師,他一直在這個領域堅持了三十多年。讓我們記住這個人的名字:杰佛里·辛頓(Geoffrey Hinton)。
這是一個在人工智能領域中“風清揚”式的人物。在幾乎所有人都認為神經網絡這個流派已經走到盡頭的時候,他卻一直在堅持!完全超乎偏執地堅持!經費的短缺,使之不得不輾轉于多個大學,尋找落腳的地方。那時候他已經50多歲了,搞了三十多年被認為沒有任何前途的研究,四處求爺爺告奶奶,希望能要來點兒研究經費。
關于辛頓和他的戰友們,業界還流傳著這樣的故事。在2003年,以辛頓為首的十五名來自世界各地的神經網絡研究者們齊聚溫哥華,他們的主要目的是向加拿大先進研究院(Canadan Institue oF Advanced Research,簡稱 CIFAR)的基金申請經費。當時該基金的管理負責人Melvin Silverman問他們說:為什么CIFAR要支持他們的研究項目。
他們回答道:“因為我們有一些古怪。如果CIFAR可以跳出自己的舒適區(comfort zone),試圖尋求一個高風險,極具探索性的領域及團隊,就應當資助我們!”
最終,CIFAR同意從2004年起資助這個團隊十年,經費總額為一千萬加元。這些預算對于某些學霸來說真的不算什么。但是,對于已經山窮水盡的辛頓及其神經網絡研究團隊來說卻是彌足珍貴的。CIFAR成為當時世界上唯一支持神經網絡研究的機構。毫不夸張地說,如果沒有CIFAR的資金支持,整個人工智能領域還可能在黑暗中繼續掙扎。
拿到資金后,辛頓把神經網絡這個流派改了一個名字,這就是后來威名遠揚的深度學習(Deep Learning)。前面說的AlphaGo就是在這個基礎上進行訓練,積極“學習”圍棋知識,最終戰勝了李世石。
九十年代末,神經網絡研究遇到的困境之一就是計算的瓶頸。那時候,人們提起神經網絡的第一反應就是慢。深度學習也有同樣的瓶頸, 需要的計算資源太多。當大量的數據在復雜的網絡中進行訓練的時候,真是讓人“等得花兒已謝了”。當時有人調侃“劍宗”的研究試驗流程是:一年做一次,一次做一年。
2009年六月,斯坦福大學的華裔科學家吳恩達(Andrew Ng,現百度首席科學家)博士與別人合作發表論文:“用 GPU 大規模無監督深度學習”。論文模型里的參數總數(即各層不同神經元之間鏈接的總數)已經達到一億,與之相比,辛頓在2006年的論文里用到的參數數目只有一百七十萬。論文結果顯示,使用GPU運行速度和用傳統雙核CPU相比, 最快時要快近七十倍。在一個四層,一億個參數的深信度網絡上,使用GPU把程序運行時間從幾周降到一天。后來,吳博士在谷歌的X實驗室中,建造了當時最大的深度神經網絡,支持17億個神經元。他隨后在斯坦福大學又造了一個超大號的神經網絡,有112億個神經元之多。
至此,全世界掀起了深度學習的研究和產業化狂潮。在各個領域里,最新的人工智能紀錄不斷被刷新。谷歌將語言識別的準確度從2012年的84%提升到現如今的98%以上。經過谷歌、微軟、香港中文大學等多家研究機構的努力,圖像識別領域中的標桿工程——人臉識別的精度已經超過了99%。要知道,人類對于自然圖像序列的識別準確度也只有98%。再后來,就有了AlphaGo的故事,神經網絡的黃金時代正式到來,“劍宗”暫時一統江湖。
責任編輯:方丹敏