999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

為神經(jīng)網(wǎng)絡(luò)的通用理論建造基石

2019-04-29 07:59:48編譯韓真
世界科學(xué) 2019年4期
關(guān)鍵詞:理論

編譯 韓真

神經(jīng)網(wǎng)絡(luò)既強(qiáng)大又不可預(yù)測。現(xiàn)在,數(shù)學(xué)家開始揭示神經(jīng)網(wǎng)絡(luò)的形態(tài)如何影響其功能。

當(dāng)我們建造摩天大樓時,我們預(yù)期它會按照設(shè)計規(guī)格發(fā)揮功能:能夠支撐這么多的重量,能夠承受一定強(qiáng)度的地震。

但是,面對當(dāng)今世界最重要的技術(shù)之一時,我們基本上是在盲目行事:嘗試不同的設(shè)計,修補(bǔ)不同的初始設(shè)定,但是,直到我們開始試運(yùn)行時,我們并不知道它能做什么,也不知道它會在哪失敗。

這一技術(shù)就是神經(jīng)網(wǎng)絡(luò),其支撐了當(dāng)前最先進(jìn)的人工智能系統(tǒng),并且開始逐漸進(jìn)入社會生活的核心:通過社交網(wǎng)絡(luò)信息決定我們從世界中了解什么,幫助醫(yī)生診斷病癥,甚至可以影響法官決定罪犯是否需要在獄中服刑。

然而,“對于神經(jīng)網(wǎng)絡(luò)如何工作?真正的神經(jīng)網(wǎng)絡(luò)理論是什么?我們幾乎一無所知?!滨U里斯·哈寧(Boris Hanin)說道。他是德克薩斯A & M大學(xué)的數(shù)學(xué)家,也是臉書人工智能實(shí)驗室的訪問科學(xué)家,研究神經(jīng)網(wǎng)絡(luò)。

他把這種情形比作另一項革命性技術(shù)(蒸汽機(jī))的發(fā)展。起初,蒸汽機(jī)只是用于抽水。后來,蒸汽機(jī)可以驅(qū)動火車,這相當(dāng)于復(fù)雜神經(jīng)網(wǎng)絡(luò)所達(dá)到的水平。后來科學(xué)家和數(shù)學(xué)家發(fā)展了熱力學(xué)理論,使得他們可以理解任何發(fā)動機(jī)的內(nèi)部原理。最終,這些知識幫助我們登上月球。

“首先,你擁有偉大的工程設(shè)計,你擁有一些偉大的火車,然后你需要一些理論基礎(chǔ),你才能進(jìn)入火箭飛船?!惫幷f。

在龐大的神經(jīng)網(wǎng)絡(luò)研究群體中,有一小群具有數(shù)學(xué)思維的研究者,他們在嘗試構(gòu)建神經(jīng)網(wǎng)絡(luò)的理論。這樣的理論能夠解釋神經(jīng)網(wǎng)絡(luò)如何工作,確保按照規(guī)定方式建造的神經(jīng)網(wǎng)絡(luò)完成指定任務(wù)。

這項工作尚處極早階段,但是,2018年,研究者發(fā)表若干文章,詳細(xì)闡述神經(jīng)網(wǎng)絡(luò)的形態(tài)和功能之間的關(guān)系。研究表明:在驗證神經(jīng)網(wǎng)絡(luò)能夠駕駛汽車之前,你先得證明神經(jīng)網(wǎng)絡(luò)能夠做乘法。

梅特拉·拉古,谷歌大腦的一員,一直在研究可解釋神經(jīng)網(wǎng)絡(luò)運(yùn)作的原理

模擬大腦的最佳方法

神經(jīng)網(wǎng)絡(luò)的目的是模擬人的大腦,關(guān)于大腦的工作方式之一是:它把較小的抽象合并為更大的抽象。從這個視角來說,思考的復(fù)雜度要用兩點(diǎn)來衡量:一是你可以利用的小型抽象的范圍,二是你能夠把低層抽象合并為高層抽象的次數(shù)。這就像我們學(xué)會區(qū)別狗和鳥。

康奈爾大學(xué)計算機(jī)科學(xué)的博士生、谷歌大腦的成員梅特拉·拉古(Maithra Raghu)說:“對人來說,要學(xué)會如何識別狗,先得學(xué)會識別四只腿,我們希望神經(jīng)網(wǎng)絡(luò)也能做同樣的事?!?/p>

人類大腦的抽象能力是自然獲得的,神經(jīng)網(wǎng)絡(luò)則需要通過工作而獲得。與大腦一樣,神經(jīng)網(wǎng)絡(luò)是由稱為“神經(jīng)元”的基礎(chǔ)組件組成,神經(jīng)元以各種方式互相連接(神經(jīng)網(wǎng)絡(luò)的神經(jīng)元受到大腦神經(jīng)元啟發(fā),但前者并不是直接模仿后者)。每個神經(jīng)元可能代表了一個屬性或一組屬性,網(wǎng)絡(luò)用以表征抽象的各個層級。

當(dāng)把這些神經(jīng)元連接到一起的時候,工程師可以有多種選擇。他們必須決定網(wǎng)絡(luò)有多少層次的神經(jīng)元(有多“深”)。比如,考慮神經(jīng)網(wǎng)絡(luò)來識別圖像中的物體,圖像在第一層進(jìn)入系統(tǒng);在下一層,網(wǎng)絡(luò)上有些神經(jīng)元用以識別圖像的邊緣;再下一層,把邊緣合并為線段來識別曲線;再下一層,把曲線合并為形狀和紋理;最后的層處理這些形狀和紋理并得到結(jié)論:它看到了什么?毛茸茸的猛犸獸!

賓州大學(xué)的數(shù)學(xué)家大衛(wèi)·羅爾尼克(David Rolnick)說:“思路就是每一層把前一層的許多方面合并在一起。圓就是把很多地方的曲線合并在一起,曲線就是把很多地方的線段合并在一起?!?/p>

工程師還得決定每一層的“寬度”,即對應(yīng)于網(wǎng)絡(luò)中每一層所考慮的不同特征的數(shù)量。在這個圖像識別的例子中,層級的寬度就是每一層所考慮的線段、曲線或形狀的種類的數(shù)量。

除了網(wǎng)絡(luò)的深度和寬度之外,還需要選擇:在層內(nèi)和層與層之間,如何連接神經(jīng)元;給予每個連接多大的權(quán)重。

所以,如果你心中有具體的任務(wù),你如何知道選擇哪種神經(jīng)網(wǎng)絡(luò)架構(gòu)來實(shí)現(xiàn)它最好呢?對此,有若干寬泛的經(jīng)驗法則:對于圖像相關(guān)的任務(wù)來說,工程師一般使用“卷積”神經(jīng)網(wǎng)絡(luò),重復(fù)使用層與層之間的相同連接架構(gòu)。對于自然語言處理(比如語音識別或語言生成)來說,工程師發(fā)現(xiàn)“循環(huán)”神經(jīng)網(wǎng)絡(luò)功用最佳。在這種網(wǎng)絡(luò)中,神經(jīng)元可以連接到非鄰近層。

然而,除了這些一般的準(zhǔn)則,工程師基本上要依靠實(shí)驗證據(jù):他們運(yùn)行1 000種不同的神經(jīng)網(wǎng)絡(luò),觀察其中哪些能完成任務(wù)。

哈寧說:“這些選擇基本上通過試錯法,這很困難,因為選擇是無限的,而且人們真的不知道什么是最好的?!?/p>

更好的辦法應(yīng)當(dāng)包括:采用更少的試錯,更深入理解神經(jīng)網(wǎng)絡(luò)架構(gòu)能夠帶來什么。最近的一些文章正把整個領(lǐng)域向此方向推進(jìn)。

“此工作嘗試開發(fā)設(shè)計正確網(wǎng)絡(luò)結(jié)構(gòu)的手冊(類似食譜)。如果你知道自己想要從網(wǎng)絡(luò)結(jié)構(gòu)中獲得什么,那么這就是你需要的秘方?!绷_爾尼克說。

大衛(wèi)·羅爾尼克,賓州大學(xué)的數(shù)學(xué)家,證明了更深的網(wǎng)絡(luò)可以比更淺的網(wǎng)絡(luò)使用更少的神經(jīng)元來完成相同的任務(wù)

圈出紅色的羊

最早的一項關(guān)于神經(jīng)網(wǎng)絡(luò)架構(gòu)的理論保證之一來自30年前。1989年,計算機(jī)科學(xué)家證明:如果神經(jīng)網(wǎng)絡(luò)只有一個計算層,且允許此層擁有無限的神經(jīng)元,允許神經(jīng)元之間有無限的連接,那么,這個神經(jīng)網(wǎng)絡(luò)就能完成你所要求的任何任務(wù)。

這是過分籠統(tǒng)的觀點(diǎn),結(jié)果非常直觀卻沒啥用。這好像是說:如果你能識別圖像中無限的線段,你就可以用一層網(wǎng)絡(luò)來區(qū)別所有物體。這可能在原理上是對的,但是,在實(shí)踐中就需要好運(yùn)。

今天的研究者把這種很寬很平的網(wǎng)絡(luò)稱為“表達(dá)性”(expressive)的,是說它們理論上能捕捉在可能輸入(比如圖像)和可能輸出(比如對于圖像的描述)之間的豐富聯(lián)系。然而這種網(wǎng)絡(luò)卻是非常難以訓(xùn)練,幾乎不可能教會它們?nèi)绾握嬲a(chǎn)生相關(guān)輸出,其所需的計算也超過了任何計算機(jī)的能力。

最近,研究者開始嘗試把神經(jīng)網(wǎng)絡(luò)推向另一個方向,把它變得更窄(每層更少的神經(jīng)元)、更深(擁有更多層次)。所以,很可能你只要挑出100條不同的線段,然后用連接把這100條線段變成50條曲線,再合并成10個不同的形狀,這樣,你就獲得了需要的所有基礎(chǔ)組件,可以用來識別大多數(shù)物體。

在2018年完成的一篇文章中,羅爾尼克和麻省理工學(xué)院的邁克斯·泰格馬克(Max Tegmark)證明:通過增加深度、減少寬度,你可以使用很少的神經(jīng)元來完成相同的功能。他們表明,如果你的模型有100個輸入變量,可以用一層2100的神經(jīng)元或兩層210的神經(jīng)元來達(dá)成相同的可靠度。羅爾尼克說:“神經(jīng)網(wǎng)絡(luò)的深度概念和如下的觀念有關(guān),即把復(fù)雜的事情分解為很多簡單事情,就像流水線?!?/p>

羅爾尼克和泰格馬克證明了深度網(wǎng)絡(luò)的效用,即通過要求網(wǎng)絡(luò)執(zhí)行簡單任務(wù):把多項式函數(shù)相乘。他們通過方程式和解的例子來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。然后要求網(wǎng)絡(luò)計算之前從未見過的方程式的解。深的網(wǎng)絡(luò)比淺的網(wǎng)絡(luò)做這件事情用更少的神經(jīng)元。

盡管乘法不是讓世人震驚的任務(wù),羅爾尼克說這篇文章提出了重要觀點(diǎn):“如果淺的網(wǎng)絡(luò)連乘法都不能做,我們不能信任它們可以做別的事?!?/p>

其他研究者一直在探索可用的單層最小寬度。2018年9月底,杰西·約翰遜(Jesse Johnson)證明:在特定的點(diǎn),再深的深度也無法彌補(bǔ)寬度不足。約翰遜是賽諾菲制藥公司的研究人員,以前是俄克拉荷馬州立大學(xué)的數(shù)學(xué)家。

要理解他的研究成果,我們可以想象田里的羊,羊毛染上幾種不同的顏色。你的神經(jīng)網(wǎng)絡(luò)的任務(wù)就是要把所有相同顏色的羊圈在一起。就實(shí)質(zhì)來說,這個任務(wù)和圖像分類相似,網(wǎng)絡(luò)有一組圖像,然后要把相似的圖像分組。

如何設(shè)計一個神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)把輸入(如一幅圖像)通過很多層的數(shù)字神經(jīng)元進(jìn)行傳輸處理,每一層網(wǎng)絡(luò)都揭示關(guān)于該輸入的更多特征。數(shù)學(xué)家正在揭示神經(jīng)網(wǎng)絡(luò)的架構(gòu)(關(guān)于該網(wǎng)絡(luò)有多少節(jié)點(diǎn)和多少層級,節(jié)點(diǎn)和層級間如何連接在一起)如何決定該神經(jīng)網(wǎng)絡(luò)所擅長的任務(wù)。

當(dāng)數(shù)據(jù)被喂入網(wǎng)絡(luò)時,每個響應(yīng)的人工神經(jīng)元(用“1”作為標(biāo)記)把信號傳遞到下一層的特定神經(jīng)元,而下層的神經(jīng)元如果收到多個信號,就更容易響應(yīng)。這個過程揭示了關(guān)于輸入的抽象信息。

淺網(wǎng)絡(luò)只有較少的層次,但是每層擁有很多神經(jīng)元。這些“表達(dá)性”網(wǎng)絡(luò)在計算量上是很繁重的。

深網(wǎng)絡(luò)有很多的層次,每層擁有相對少的神經(jīng)元。它可以用相對較少的神經(jīng)元到達(dá)很高的抽象能力。

鮑里斯·哈寧,德克薩斯A & M大學(xué)數(shù)學(xué)家,研究神經(jīng)網(wǎng)絡(luò)的深度和寬度之間的權(quán)衡關(guān)系

約翰遜證明:如果網(wǎng)絡(luò)的單層寬度少于或等于輸入的數(shù)量,就無法完成這樣的任務(wù)。以羊為例,每只羊可以用兩個輸入x和y坐標(biāo)來確定它在田地的位置。神經(jīng)網(wǎng)絡(luò)把每只羊標(biāo)記一個顏色,然后在具備相同顏色的羊周圍畫邊界。在這種情況下,你需要每層3個或更多神經(jīng)元的網(wǎng)絡(luò)來解決畫界問題。

更具體地說,約翰遜表示:如果網(wǎng)絡(luò)單層寬度與輸入變量數(shù)的比不合適,那么神經(jīng)網(wǎng)絡(luò)就沒法畫封閉的圈(畫圈就表明,把在草場中間的紅色羊聚在一起)。“如果神經(jīng)元的寬度不能超過輸入維度的數(shù)目,那么,無論使用多少層次,有些形狀網(wǎng)絡(luò)就永遠(yuǎn)不能生成?!?約翰遜說。

像約翰遜這樣的文章正在構(gòu)建神經(jīng)網(wǎng)絡(luò)理論的基礎(chǔ)部分。在當(dāng)下,研究者只能對網(wǎng)絡(luò)架構(gòu)和功能之間的關(guān)系得出很基本的推論;比起神經(jīng)網(wǎng)絡(luò)正在執(zhí)行的大量任務(wù)而言,這些推論占很小的比例。

所以,盡管神經(jīng)網(wǎng)絡(luò)的理論不能很快改變?nèi)藗兘ㄔ煜到y(tǒng)的方法;但是,正在繪制關(guān)于計算機(jī)如何學(xué)習(xí)的新理論的藍(lán)圖。這一理論將使人類達(dá)成比登月更偉大的成就。

猜你喜歡
理論
堅持理論創(chuàng)新
神秘的混沌理論
理論創(chuàng)新 引領(lǐng)百年
相關(guān)于撓理論的Baer模
多項式理論在矩陣求逆中的應(yīng)用
基于Popov超穩(wěn)定理論的PMSM轉(zhuǎn)速辨識
十八大以來黨關(guān)于反腐倡廉的理論創(chuàng)新
“3T”理論與“3S”理論的比較研究
理論宣講如何答疑解惑
婦女解放——從理論到實(shí)踐
主站蜘蛛池模板: 99精品在线看| 99re在线免费视频| 国产白浆视频| 日韩在线中文| 色悠久久综合| 中日无码在线观看| 亚洲无限乱码| 伊人天堂网| 国产精品一区二区久久精品无码| 成人午夜视频在线| 久久青草热| 日日拍夜夜操| 精品国产亚洲人成在线| 色网在线视频| 亚洲精品黄| 久久国产精品夜色| 中国国产高清免费AV片| 日韩在线视频网| 久久伊伊香蕉综合精品| 伊人久久大香线蕉影院| 久久综合色视频| 99在线观看国产| 国产伦片中文免费观看| 喷潮白浆直流在线播放| 亚洲第一综合天堂另类专| 久久精品日日躁夜夜躁欧美| 久久久91人妻无码精品蜜桃HD| 三上悠亚精品二区在线观看| 久久黄色一级视频| 在线观看精品国产入口| 香蕉伊思人视频| 国产成人乱无码视频| 国产日韩精品欧美一区灰| 精品国产电影久久九九| 全午夜免费一级毛片| 国产91视频免费观看| 国产综合网站| 波多野结衣二区| 亚洲欧洲日本在线| 久久99国产精品成人欧美| 亚洲视频影院| 伊人色在线视频| 亚洲无码日韩一区| 秋霞一区二区三区| 在线欧美国产| 国产成人91精品| 99九九成人免费视频精品| 亚洲欧美不卡| 91精品日韩人妻无码久久| 亚洲av综合网| 亚洲国产欧美国产综合久久 | 99久久无色码中文字幕| P尤物久久99国产综合精品| 日本人妻丰满熟妇区| 日本一本在线视频| 中文字幕亚洲综久久2021| 无码丝袜人妻| 国内精品手机在线观看视频| 久99久热只有精品国产15| 72种姿势欧美久久久大黄蕉| 日韩精品无码一级毛片免费| 激情综合网址| 麻豆国产原创视频在线播放| www.99在线观看| 亚洲精品午夜无码电影网| 国产成年女人特黄特色毛片免| 久久精品国产91久久综合麻豆自制| 国产激爽大片在线播放| 日韩色图在线观看| 欧美日韩在线成人| 无码一区18禁| 精品天海翼一区二区| 青青青国产免费线在| 国产在线一区二区视频| 99视频在线观看免费| 精品国产美女福到在线不卡f| 天堂在线亚洲| 亚洲高清无码精品| 欧美色图第一页| 精品91自产拍在线| 91色爱欧美精品www| 久热这里只有精品6|