橫掃圍棋棋壇的AlphaGo(阿爾法狗)如今遇到了對手,不過戰勝它的并不是人類,而是它的升級版Alpha?GoZero。據英國《金融時報》19日報道,在高調推出AlphaGo不到兩年后,谷歌旗下位于倫敦的人工智能公司Deep?Mind宣布開發出人工智能技術的又一里程碑。該團隊以一種新的“強化學習”方式創造出AlphaGoZero,并在科學期刊《自然》(Nature)發表了相關細節。
AlphaGoZero僅擁有4個TPU(張量處理單元),無人類經驗。《金融時報》稱,前幾代AlphaGo最初都是通過分析成千上萬場優秀人類玩家間的對決來發現制勝招數。而新開發的Alpha?GoZero則未用到任何人類圍棋數據,開發者僅向其教授了圍棋規則。英國《每日電訊報》稱,在未經過指導的情況下,AlphaGoZero用3天時間自我摸索,通過與自己下棋,從數百萬份棋譜中找出了最佳對弈方法,并在與AlphaGo的對弈中,十分輕松地以100比0取得勝利。在隨后的40天自學時間內,Alpha?GoZero又與自己對弈了2900萬局,學到了人類積累3000多年才得到的下圍棋經驗。
英國圍棋協會主席羅杰稱,Alpha?GoZero的出現不僅體現出其在圍棋方面的成功,還意味著人工智能的發展取得重大飛躍。DeepMind團隊表示,人工智能的最大挑戰就是要研發一種能從零開始、以超人類的水平學習復雜概念的算法。AlphaGoZero之所以如此強大,正是因為它不局限于人類的知識。DeepMind首席執行官哈薩比斯認為,在接下來的十年內,AlphaGo的更新版本很有可能被應用于多個科學領域。▲
(李曉驍)
環球時報2017-10-20