999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

未來觸手可及
——AlphaZero學(xué)棋記

2018-03-01 09:04:09編譯陳軼翔
世界科學(xué) 2018年2期
關(guān)鍵詞:引擎程序深度

編譯 陳軼翔

深度思維,這個曾創(chuàng)建了世界上最強(qiáng)大的人工智能圍棋程序AlphaGo的公司,將注意力轉(zhuǎn)向了國際象棋,并取得了頗為驚人的成果。

想象一下,你告訴一個計算機(jī)系統(tǒng)如何走棋,并告訴它要學(xué)會的下棋規(guī)則。一天之后——是的,僅僅24小時——它的水平已經(jīng)達(dá)到了能夠擊敗世界上當(dāng)下最強(qiáng)大的程序!

深度思維公司與AlphaZero

大約3年前,谷歌旗下的一家專門從事人工智能開發(fā)的公司——深度思維(DeepMind)將注意力轉(zhuǎn)向了圍棋這一歷史悠久的游戲。一直以來,人們都未能成功設(shè)計出世界級的人工智能圍棋程序——甚至認(rèn)為這是未來10年都無法實(shí)現(xiàn)的目標(biāo)。但奇跡終于還是出現(xiàn)了。一場公開的挑戰(zhàn)發(fā)起了——一位傳奇的世界級圍棋選手李世石與谷歌人工智能AlphaGo展開人機(jī)大戰(zhàn)——每個人都認(rèn)為這將是一場有趣的比賽,而且認(rèn)為人類一定會贏。人們甚至覺得問題并不在于AlphaGo程序是贏或輸,而在于其距離“圣杯”(指人工智能戰(zhàn)勝人類)的目標(biāo)又近了多少。結(jié)果是AlphaGo以4∶1取得壓倒性的勝利,這是圍棋世界的一場革命。盡管人們對這一結(jié)果發(fā)表了大量的評論,但最終他們還是接受了現(xiàn)實(shí)——AlphaGo是一臺非常優(yōu)秀的機(jī)器,但也并非不可戰(zhàn)勝。畢竟,它還是輸了一場比賽。

這一傳奇故事并未就此結(jié)束。一年后,一個更新版本的AlphaGo對戰(zhàn)世界圍棋冠軍柯潔——一個年輕的中國人,其在圍棋方面的天賦可比擬馬格努斯·卡爾森(Magnus Carlsen)在國際象棋領(lǐng)域的才能。柯潔在16歲的時候就贏得了世界級圍棋比賽,17歲就成了世界圍棋冠軍。對戰(zhàn)時,柯潔已經(jīng)19歲,能力更強(qiáng)了。這場新的人機(jī)大戰(zhàn)在中國舉行,比賽前甚至連柯潔都知道自己很可能會慘敗,已經(jīng)不再抱任何幻想。他表現(xiàn)得非常出色,但仍然以0∶3的比分輸?shù)袅吮荣悾@足以有力地證明新型人工智能的驚人能力。

人工智能在圍棋界表現(xiàn)如此驚人,使得許多國際象棋選手和權(quán)威人士都很想知道,人工智能在國際象棋比賽中會有怎樣的表現(xiàn)。人們對其獲勝的程度仍有很大疑慮。因為圍棋是一個復(fù)雜而漫長的游戲,棋盤上有縱橫各19條直線構(gòu)成361個交叉點(diǎn),棋子走在交叉點(diǎn)上,雙方交替行棋,落子后不能移動,以圍地多者為勝。預(yù)先計算是徒勞的,而模式識別才是最重要的。國際象棋則迥然不同。象棋中知識和模式識別是非常重要的,而且這種皇室游戲非常講究戰(zhàn)術(shù)——工于心計、精于算計比掌握知識更加重要。

然而,在過去的幾個月里,有一些非常令人吃驚的結(jié)果需要我們了解。深度思維公司對圍棋的興趣并沒有隨著比賽的勝利而結(jié)束。你可能會問,此后還有什么要做的嗎?不滿足于3∶0的比分,要以20∶0取勝?不,當(dāng)然不是。超級圍棋程序已經(jīng)成為一種內(nèi)部的試金石。它的標(biāo)準(zhǔn)是無爭議的,已被量化,如果有人想要測試一個新的自我學(xué)習(xí)的人工智能程序及其性能,可以把它同AlphaGo程序進(jìn)行比較分析。

一個叫做AlphaZero的新型人工智能誕生了。它有幾個截然不同的變化。首先,AlphaGo顯示了成千上萬的專家級游戲案例可供其自我學(xué)習(xí),而AlphaZero卻沒有顯示任何游戲案例——連一個也沒有。它只是學(xué)了規(guī)則,而沒有其他任何信息。結(jié)果卻令人頗為震驚。在短短3天內(nèi),AlphaZero完全自學(xué)的圍棋程序比那個打敗了李世石的程序版本更強(qiáng)大,這是此前的人工智能需要一年的時間才能實(shí)現(xiàn)的。在3周內(nèi),AlphaZero戰(zhàn)勝了之前打敗柯潔的最強(qiáng)大的AlphaGo版本。還值得注意的是,擊敗李世石的程序版本使用了48個高度專業(yè)化的處理器來創(chuàng)建程序,但AlphaZero只使用了4個。

《精通國際象棋和將棋——用一種常規(guī)的強(qiáng)化學(xué)習(xí)算法實(shí)現(xiàn)自主學(xué)習(xí)》

本文認(rèn)為,AlphaZero通過使用其深層神經(jīng)網(wǎng)絡(luò)補(bǔ)償其分析案例較少的問題,從而更有選擇性地專注于最有價值的分析——可以說是一種更接近于人類的思考方式。正如信息論創(chuàng)始人克勞德·香農(nóng)(Claude Elwood Shannon)最初提出的那樣。

AlphaZero學(xué)習(xí)國棋象棋

盡管深度思維公司已經(jīng)展示了圍棋方面接近革命性的突破,實(shí)際上國際象棋20年前已經(jīng)有了突破進(jìn)展。國際象棋已經(jīng)有了人工智能“深藍(lán)”(1997年俄羅斯國際象棋特級大師加里·卡斯帕羅夫與IBM公司研發(fā)的超級計算機(jī)深藍(lán)進(jìn)行了對決,深藍(lán)最終的勝出表明人類最強(qiáng)國際象棋大師已經(jīng)徹底被人工智能所擊敗)。如今,即使是一部高性能的智能手機(jī)也能打敗國際象棋世界冠軍。那么究竟還需要證明什么呢?

值得一提的是,深度思維的創(chuàng)始人丹米斯·哈撒比斯(Demis Hassabis)本人同國際象棋有著深厚的淵源。青少年時代的他就是一個國際象棋神童——當(dāng)時世界上14歲以下的國際象棋選手中,13歲的哈撒比斯,僅次于尤迪特·波爾加(Judit Polgar),位列第二。他最終離開了國際象棋領(lǐng)域去追求其他的夢想,比如他在17歲時創(chuàng)建了自己的個人電腦視頻游戲公司,但他對國際象棋的興趣始終都在。每個人的腦海中仍然有一個亟待解決的問題:如果讓AlphaZero學(xué)習(xí)國際象棋,會有怎樣的表現(xiàn)呢?它也許很智能,但是否會被如今的數(shù)據(jù)處理引擎所打敗呢?或者會有一些特別的事情發(fā)生嗎?

國際象棋特級大師加里·卡斯帕羅夫與深度思維的創(chuàng)始人丹米斯·哈撒比斯在聊天

一個新范式

2017年12月5日,深度思維研究團(tuán)隊在康奈爾大學(xué)的網(wǎng)站上發(fā)表了一篇論文,名為《精通國際象棋和將棋——用一種常規(guī)的強(qiáng)化學(xué)習(xí)算法實(shí)現(xiàn)自主學(xué)習(xí)》,結(jié)果令人相當(dāng)震驚。AlphaZero不僅僅做到了對游戲的掌握,而且在很多方面達(dá)到了新的高度——這被認(rèn)為不可思議的。當(dāng)然,一切還得靠實(shí)際測試來證明,所以在深入討論一些令人頗感興趣的關(guān)鍵性細(xì)節(jié)之前,讓我們先看看AlphaZero的戰(zhàn)績吧!它與最新及最強(qiáng)大版的Stockfish國際象棋引擎進(jìn)行了一場比賽,并以64∶36的驚人比分獲勝,不僅如此,AlphaZero甚至沒有一場負(fù)局(28勝,72平)。

對于《國際象棋數(shù)據(jù)庫》軟件的使用者來說,Stockfish就無須介紹了。但值得注意的是,Stockfish在一臺計算機(jī)上的運(yùn)行速度比AlphaZero快了900倍!實(shí)際上,AlphaZero每秒大約計算8萬個位置,而Stockfish如果運(yùn)行在一臺64線程(可能是32核)的個人電腦上,每秒運(yùn)行7 000萬個位置。為了更好地理解這一差距究竟有多大,可以這樣理解——如果Stockfish另一版本的運(yùn)行速度慢了900倍,就相當(dāng)于減少了大約8步棋。這怎么可能呢?

換句話說,AlphaZero不是用一種混合的強(qiáng)力攻擊方法——當(dāng)今國際象棋引擎的核心,而是以一種截然不同的方法,使用了一種非常有選擇性的搜索,可以模擬人類的思維方式。一個頂尖的選手可以在一致性和深度方面超過一個能力較弱的選手,但即使是頂尖選手,也無法與哪怕是最弱的計算機(jī)程序所做的相提并論。人類完全是通過自己的知識和能力,才能夠過濾掉很多步驟,以使自己能夠達(dá)到某種水平。值得一提的是,盡管加里·卡斯帕羅夫輸給了人工智能“深藍(lán)”,但還完全不清楚的是,在當(dāng)時“深藍(lán)”是否真的比卡斯帕羅夫更強(qiáng)大,盡管其速度已達(dá)到了每秒2億個位置。雖然AlphaZero比Stockfish的運(yùn)行速度慢了900倍,但如果AlphaZero真的能夠利用它的理解能力對此進(jìn)行彌補(bǔ),進(jìn)而超越Stockfish,那么我們將看到一個重大的范式變化。

AlphaZero的思考時間越長,它的表現(xiàn)就越好

以一個相對埃洛等級分值來衡量(相當(dāng)于Stockfish的40毫秒思考時間),該圖顯示了每一個玩家在不同時間上的埃洛等級分值。AlphaZero的蒙特卡洛樹搜索(MCTS)在同樣的思考時間內(nèi)效率比Stockfish都更高,這不禁讓人們開始質(zhì)疑一個原來普遍認(rèn)可的觀念——alpha-beta搜索在這些領(lǐng)域具有內(nèi)在的優(yōu)勢

AlphaZero如何下棋?

由于AlphaZero并沒有從任何國際象棋知識中受益,意味著沒有游戲或開局理論,也意味著它必須自己去發(fā)現(xiàn)開局理論。回想一下,開頭我們就說到這是AlphaZero進(jìn)行了僅僅24小時自主學(xué)習(xí)的結(jié)果。研究團(tuán)隊制作了令人頗感興趣的圖表,展示了AlphaZero自己發(fā)現(xiàn)的開局理論,以及隨著它變得越來越強(qiáng)大而逐漸放棄的那些開局理論。

上述論文的發(fā)表還伴隨著十場比賽的結(jié)束。需要說明的是,這些與一般的引擎游戲是迥然不同的。曾經(jīng)獲得國際象棋世界冠軍的卡爾波夫(Karpov)如果是一個國際象棋引擎,他可能被稱為AlphaZero。有一種毫不留情的“大蟒蛇”位置分析方法,是聞所未聞的。現(xiàn)代的國際象棋引擎專注于活動,因為它們對活動本身并不理解,需要設(shè)有特別的保護(hù)措施,以避免因?qū)κ纸M合攻擊而卡殼——它們往往還沒意識到就發(fā)現(xiàn)自己已經(jīng)走入一個死胡同了。AlphaZero則不存在這樣的問題,而且似乎很擅長對付對方的組合布局。這讓人印象深刻,令人驚訝的是,它還能找到國際象棋引擎似乎無視的戰(zhàn)術(shù)。

展望未來

那么這一切對于國際象棋來說有什么意義呢?這是一個“游戲規(guī)則改變者”——一個經(jīng)常被使用、甚至濫用的術(shù)語,沒有其他的方式來描述它。人工智能“深藍(lán)”是一個突破性的事件,但它的結(jié)果卻是得益于高度專業(yè)化的硬件——目前只在國際象棋方面有所應(yīng)用。例如,如果有人試圖讓它下圍棋,是永遠(yuǎn)不可能的。而AlphaZero這種完全開放式的人工智能則可以從最少的信息量中學(xué)習(xí),并達(dá)到迄今為止最高的水平。這并非一種威脅——在大量的活動中擊敗我們,而是一種希望——分析諸如疾病、饑荒等問題,以期找到真正的解決方案。

猜你喜歡
引擎程序深度
深度理解一元一次方程
試論我國未決羈押程序的立法完善
深度觀察
深度觀察
深度觀察
“程序猿”的生活什么樣
藍(lán)谷: “涉藍(lán)”新引擎
商周刊(2017年22期)2017-11-09 05:08:31
英國與歐盟正式啟動“離婚”程序程序
創(chuàng)衛(wèi)暗訪程序有待改進(jìn)
無形的引擎
河南電力(2015年5期)2015-06-08 06:01:46
主站蜘蛛池模板: 亚洲熟妇AV日韩熟妇在线| 丁香婷婷综合激情| 久久www视频| 99热这里只有免费国产精品| 色九九视频| 黄片一区二区三区| 久久这里只有精品66| 亚洲精品国产成人7777| 欧美精品导航| 2020最新国产精品视频| 97国产在线视频| 尤物国产在线| AV熟女乱| 91精选国产大片| 亚洲成在人线av品善网好看| 国产成人高清亚洲一区久久| 国产无人区一区二区三区| 日韩av电影一区二区三区四区 | 国产高清国内精品福利| 精品国产www| 欧美不卡二区| 国产成人免费手机在线观看视频| 国产精品三级av及在线观看| 国产国模一区二区三区四区| 亚洲第一黄片大全| 狠狠五月天中文字幕| 国产在线欧美| 亚洲伊人电影| 一本色道久久88亚洲综合| 亚洲无码视频喷水| 国产成人综合久久精品尤物| 国产精品青青| 成年网址网站在线观看| 91福利在线看| 国产一区二区三区在线无码| 99热这里只有精品5| 国产日韩欧美在线视频免费观看| 狠狠色狠狠综合久久| 亚洲人成网站色7777| 欧美a级完整在线观看| 国产91精品久久| 99精品一区二区免费视频| 熟妇人妻无乱码中文字幕真矢织江 | 福利视频一区| 日韩A级毛片一区二区三区| AⅤ色综合久久天堂AV色综合| 四虎国产精品永久一区| 中国特黄美女一级视频| 亚洲视频色图| 无码专区在线观看| 麻豆国产在线观看一区二区| 久久99精品久久久久久不卡| 亚洲天堂区| 亚洲精选高清无码| 精品一区二区三区水蜜桃| 91免费在线看| 精品国产免费观看一区| 日韩AV无码免费一二三区| 丁香六月激情综合| 国产黑人在线| 国产chinese男男gay视频网| 精品亚洲国产成人AV| 538精品在线观看| 国产亚洲精品在天天在线麻豆| 伊人大杳蕉中文无码| 亚洲成a人片77777在线播放| 2020亚洲精品无码| 99热这里只有免费国产精品 | 欧美区在线播放| 婷婷午夜天| 伊人AV天堂| 国产精品免费入口视频| 国产农村妇女精品一二区| 国产对白刺激真实精品91| 国产激情影院| 少妇高潮惨叫久久久久久| 无码专区在线观看| WWW丫丫国产成人精品| 亚洲AV无码乱码在线观看裸奔| 成人午夜视频网站| 国产精品欧美日本韩免费一区二区三区不卡 | 免费一级毛片在线观看|