999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺談圍棋人工智能

2017-05-16 19:05:46胡趙宇
中國科技縱橫 2017年7期
關鍵詞:人工智能

胡趙宇

摘 要:去年3月,AlphaGo以4:1的絕對優勢戰勝了世界圍棋冠軍李世石,排名世界第二。去年年底到今年年初,短短一周內,AlphaGo的升級版Master連勝60場,在圍棋界立于不敗之地。本文圍繞圍棋人工智能AlphaGo系統,主要對圍棋人工智能的基本概念、工作原理以及圍棋人工智能發展意義進行了深刻分析。

關鍵詞:AlphaGo;人工智能;圍棋;未來展望

中圖分類號:TP18 文獻標識碼:A 文章編號:1671-2064(2017)07-0193-02

1 圍棋與人工智能

圍棋作為中國傳統四大藝術之一,擁有著幾千年的悠久歷史。圍棋棋盤由19條橫線和19條豎線組成,共有19*19=361個交叉點,圍棋子分為黑白兩種顏色,對弈雙方各執一色,輪流將一枚棋子下在縱橫交叉點上,終局時,棋子圍上交叉點數目最多的一方獲勝。圍棋棋盤上每一個縱橫交叉點都有三種可能性:落黑子、落白子、留空,所以圍棋擁有高達3^361種局面;圍棋的每個回合有250種可能,一盤棋可長達150回合,所以圍棋的計算復雜度為250^150,約為10^170,然而全宇宙可觀測的原子數量只有10^80,這足以體現圍棋博弈的復雜性和多變性。

人工智能(Artificial Intelligence,AI)主要研究人類思維、行動中那些尚未算法化的功能行為,使機器像人的大腦一樣思考、行動。長期以來,圍棋作為一種智力博弈游戲,以其變化莫測的博弈局面,高度體現了人類的智慧,為人工智能研究提供了一個很好的測試平臺,圍棋人工智能也是人工智能領域的一個重要挑戰。

傳統的計算機下棋程序的基本原理,是通過有限步數的搜索樹,即采用數學和邏輯推理方法,把每一種可能的路徑都走一遍,從中選舉出最優路徑,使得棋局勝算最大。這種下棋思路是充分發揮計算機運算速度快、運算量大等優勢的“暴力搜索法”,是人類在對弈規定的時間限制內無法做到的。但是由于圍棋局面數量太大,這樣的運算量對于計算機來講也是相當之大,目前的計算機硬件無法在對弈規定的時間內,使用計算機占絕對優勢的“暴力搜索法”完成圍棋所有局面的擇優,所以這樣的下棋思路不適用于圍棋對弈。

搜索量巨大的問題一直困擾著圍棋人工智能,使其發展停滯不前,直到2006年, 蒙特卡羅樹搜索的應用出現,才使得圍棋人工智能進入了嶄新的階段,現代圍棋人工智能的主要算法是基于蒙特卡洛樹的優化搜索。

2 圍棋人工智能基本原理

目前圍棋人工智能最杰出的代表,是由谷歌旗下人工智能公司DeepMind創造的AlphaGo圍棋人工智能系統。它在與人類頂級圍棋棋手的對弈中充分發揮了其搜索和計算的優勢,幾乎在圍棋界立于不敗之地。

AlphaGo系統的基本原理是將深度強化學習方法與蒙特卡洛樹搜索結合,使用有監督學習策略網絡和價值網絡,極大減少了搜索空間,即在搜索過程中的計算量,提高了對棋局估計的準確度。

2.1 深度強化學習方法

深度學習源于人工神經網絡的研究,人類大量的視覺聽覺信號的感知處理都是下意識的,是基于大腦皮層神經網絡的學習方法,通過模擬大腦皮層推斷分析數據的復雜層狀網絡結構,使用包含復雜結構或由多重非線性變換構成的多個處理層對數據進行高層抽象,其過程類似于人們識別物體標注圖片?,F如今,應用最廣泛的深度學習模型包括:卷積神經網絡、深度置信網絡、堆棧自編碼網絡和遞歸神經網絡等。

強化學習源于動物學習、參數擾動自適應控制等理論,通過模擬生物對環境以試錯的方式進行交互達到對環境的最優適應的方式,通過不斷地反復試驗,將變化無常的動態情況與對應動作相匹配。強化學習系統設置狀態、動作、狀態轉移概率和獎賞四個部分,在當前狀態下根據策略選擇動作,執行該過程并以當前轉移概率轉移到下一狀態,同時接收環境反饋回來的獎賞,最終通過調整策略來最大化累積獎賞。

深度學習具有較強的感知能力,但缺乏一定的決策能力;強化學習具有決策能力,同樣對感知問題無能為力。深度強化學習方法是將具有感知能力的深度學習和具有決策能力的強化學習結合起來,優勢互補,用深度學習進行感知,從環境中獲取目標觀測信息,提供當前環境下的狀態信息;然后用強化學習進行決策,將當前狀態映射到相應動作,基于初期匯報評判動作價值。

深度強化學習為復雜系統的感知決策問題提供了一種全新的解決思路。

2.2 蒙特卡洛樹搜索

蒙特卡洛樹搜索是將蒙特卡洛方法與樹搜索相結合形成的一種搜索方法。所謂蒙特卡洛方法是一種以概率統計理論為指導的強化學習方法,它通常解決某些隨機事件出現的概率問題,或者是某隨機變量的期望值等數字特征問題。通過與環境的交互,從所采集的樣本中學習,獲得關于決策過程的狀態、動作和獎賞的大量數據,最后計算出累積獎賞的平均值。

蒙特卡洛樹搜索算法是一種用于解決完美信息博弈(perfect information games,沒有任何信息被隱藏的游戲)的方法,主要包含選擇(Selection)、擴展(Expansion)、模擬(Simulation)和反向傳播(Backpropagation)四個步驟。

2.3 策略網絡與價值網絡

AlphaGo系統擁有基于蒙特卡洛樹搜索方法的策略網絡(Policy Network)和價值網絡(Value Network)兩個不同的神經網絡大腦,充分借鑒人類棋手的下棋模式,用策略網絡來模擬人類的“棋感”,用價值網絡來模擬人類對棋盤盤面的綜合評估。

AlphaGo系統主要采用有監督學習策略網絡,通過觀察棋盤布局,進行棋路搜索,得到下一步合法落子行動的概率分布,從中找到最優的一步落子位置,做落子選擇。DeepMind團隊使用棋圣堂圍棋服務器上3000萬個專業棋手對弈棋譜的落子數據,來預測棋手的落子情況。期間,系統進行上百萬次的對弈嘗試,進行強化學習,將每一個棋局進行到底,不斷積累“經驗”,學會贏面最大的棋路走法,最終達到頂級圍棋棋手的落子分析能力。而AlphaGo的價值網絡使用百萬次對弈中產生的棋譜,根據最終的勝負結果來進行價值網絡訓練,預測每一次落子選擇后贏棋的可能性,通過整體局面的判斷來幫助策略網絡完成落子選擇。

3 圍棋人工智能意義

經過比賽測試證明,AlphaGo系統的圍棋對弈能力已經達到世界頂級棋手水平。一直以來,圍棋因為復雜的落子選擇和巨大的搜索空間使得圍棋人工智能在人工智能領域成為一個具有代表性的難度挑戰。目前的硬件水平面對如此巨大的搜索空間顯得束手無策,AlphaGo系統基于有監督學習的策略網絡和價值網絡大大減少搜索空間,在訓練中開創性地使用深度強化學習,然后結合蒙特卡洛樹搜索方法,使得系統自學習能力大大提高,并且AlphaGo系統在與人類頂級棋手對弈中取得的連勝卓越成績,為其在人工智能領域奠定了堅實的里程碑地位。

雖然圍棋人工智能取得了如此優秀的成績,但是也僅僅是它在既定規則內的計算處理能力遠遠超過了人類的現有水平,并且還有有待提高和完善的地方。在人類的其他能力中,例如情感、思維、溝通等等領域,目前的人工智能水平是遠遠達不到的。但是隨著科技的進步和人類在人工智能領域的研究深入,人工智能與人類的差距會逐漸減小,像圍棋人機大戰人工智能連勝人類這樣的例子也可能在其他領域發生,這就意味著人工智能的發展前景十分可觀。

4 結語

人類和人工智能共同探索圍棋世界的大幕即將拉開,讓人類棋手結合人工智能,邁進全新人機共同學習交流的領域,進行一次新的圍棋革命,探索圍棋真理更高的境界。

參考文獻

[1]趙冬斌,邵坤,朱圓恒,李棟,陳亞冉,王海濤,劉德榮,周彤,王成紅.深度強化學習綜述:兼論計算機圍棋的發展[J].控制理論與應用,2016,(06):701-717.

[2]陶九陽,吳琳,胡曉峰.AlphaGo技術原理分析及人工智能軍事應用展望[J].指揮與控制學報,2016,(02):114-120.

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
基于人工智能的電力系統自動化控制
人工智能,來了
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
主站蜘蛛池模板: 亚洲第一成年网| 99re在线视频观看| 无码一区二区波多野结衣播放搜索| a级毛片网| 欧美在线视频不卡第一页| 日本在线欧美在线| 欧美啪啪网| 国产一级视频在线观看网站| 91福利片| 亚洲激情区| 国产成年女人特黄特色毛片免| 国产成人综合亚洲欧美在| 国产美女叼嘿视频免费看| 国产精品99久久久| 99精品热视频这里只有精品7| 日韩午夜福利在线观看| 成人一级黄色毛片| 蜜桃臀无码内射一区二区三区| 国产精品免费福利久久播放| 久久一日本道色综合久久| 亚洲天天更新| 波多野结衣一二三| 亚洲va欧美ⅴa国产va影院| 91高清在线视频| 精品国产香蕉伊思人在线| 国产乱人伦AV在线A| 毛片网站在线播放| 99久久免费精品特色大片| 亚洲精品你懂的| 国产91特黄特色A级毛片| 久久伊人操| 国产在线观看人成激情视频| 亚洲AV无码久久天堂| 国产视频自拍一区| 综合亚洲网| 久久综合婷婷| 日韩毛片基地| 国产69囗曝护士吞精在线视频| 欧美三级自拍| 国产一级毛片yw| 亚洲中文字幕手机在线第一页| 日韩一区二区在线电影| 国产在线视频导航| 制服丝袜亚洲| 波多野结衣一二三| 婷婷五月在线视频| 91精品专区国产盗摄| 一级毛片免费播放视频| 日本a级免费| 欧美性久久久久| 亚洲国产av无码综合原创国产| 91九色最新地址| 亚洲首页在线观看| 四虎国产永久在线观看| 原味小视频在线www国产| 亚洲欧美一区二区三区图片| 国产99精品久久| 亚洲欧美日韩中文字幕在线一区| 一级香蕉视频在线观看| 在线免费不卡视频| 国产SUV精品一区二区| 夜夜拍夜夜爽| 欧美成人看片一区二区三区| 亚洲成人黄色在线观看| 国产91透明丝袜美腿在线| 国产欧美日韩精品第二区| 久久情精品国产品免费| 99在线小视频| 中文字幕欧美日韩高清| 午夜激情婷婷| 国产成人高清精品免费| 免费观看成人久久网免费观看| 婷婷综合色| 午夜不卡视频| 亚洲欧洲一区二区三区| 青青热久免费精品视频6| 免费不卡在线观看av| 91av成人日本不卡三区| 欧美一区二区三区不卡免费| 四虎成人精品| 四虎精品黑人视频| 久久中文字幕不卡一二区|