曹坤澤
人工智能,也被稱為機器智能,是指人類制造的能夠展現出一定的智能的機器或系統。近幾年來,隨機計算機技術的發展,人工智能也隨之快速崛起,很多人工智能的產品已經廣泛應用。在國家層面,人工智能相關的政策也陸續出臺。2017 年7 月,《新一代人工智能發展規劃》由國務院頒布,這一規劃明確了我國人工智能的發展方向,是我國的人工智能發展的戰略性規劃。《規劃》提出到2030 年,我國的人工智能理論、技術、市場應用都要達到全球先進水平,并成為全球人工智能的重要中心之一[1]。
我國游戲市場產值越來越大,擁有巨大前景。2019 年,我國游戲用戶超過6 億,游戲市場實際銷售收入2 330.2 億,同比增長8.7%。中國電競市場預計在2020 年超越韓國,成為繼美國之后的第二大電競市場。游戲產業在蓬勃發展的同時也開始引入人工智能技術,以提高游戲的可玩性。本文將對人工智能在游戲領域中的應用進行討論,以期為其未來發展提供借鑒。
1920 年,一位名為巴貝奇的英國科學家研制出全球第一臺“計算機器”,它的出現標志著計算機硬件的開始,如今也被認為是人工智能的前身。電子計算機的發展和應用,讓人工智能的實現成為了現實。人工智能可以對人類行為進行模仿學習,并且隨著人們對人工智能的探索越來越深以及計算機的計算能力越來越強大,人工智能也變得更“智能”。人工智能的發展經歷了十分漫長的歷史。17世紀,萊布尼茨和巴斯卡首次有了關于人工智能的想法,他們是最早有智能機器想法的人。
游戲人工智能是人工智能技術在游戲領域發展的產物,一直是其發展的前沿,被認為是人工智能界的“果蠅”[2]。《德軍總部3D》(Wolfenstein 3D)早在1992 年就發布了,其游戲中的士兵也有一個基本的人工智能形式。這種智能主要借助有限狀態機(Finite State Machine,FSM)算法實現。設計者首先創建一個機器人可能經歷的所有事件(狀態)的列表,然后,分配機器人對每種情況的具體響應。但有限狀態機算法并不適用于所有游戲。例如,在策略游戲中使用有限狀態機的話,系統將以同樣的方式做出響應,那玩家將會很快學會相關的戰勝計算機的策略。因而會產生重復的游戲體驗,降低了玩家的游戲體驗。因此,必須加入一定的隨機性,即讓人工智能學會思考,在不同情況下作出合理的決策,例如可以采用蒙特卡洛樹搜索(Monte Carlo Search Tree,MCST)算法。
借助人工智能,可以增加電子游戲中的玩家挑戰,構建不同智能等級的模擬敵人/玩家,從而增加游戲的樂趣。目前,利用計算機圖形技術已經可以模擬真實的世界,VR 技術已經可以為玩家帶來沉浸式的體驗。
由美國IBM 公司生產的“深藍”是一臺可以進行象棋博弈的電腦。“深藍”擁有32 個微型處理器。近1 個世紀的200 多萬棋局被輸入這一臺計算機,使其具有強大的國際象棋能力。“深藍”的計算模式采用的是并行計算,用于棋局對弈的程序是由C語言寫成,其所運行的操作系統為AIX 系統。1996年的“深藍”版本僅為每秒1 億步棋,而到了1997年其運算速度約為1997 年的2 倍。在1997 年6 月發布的世界超級電腦排名中,深藍位于第259 位,其每秒的運算能力可達113.8 億。在當時一名頂尖棋手只可對隨后策略估算10 步的情況下,“深藍”就已可達12 步棋之多。
深藍所運用的算法模式是α-β 剪枝,該算法是由約翰·麥卡錫提出。這位算法的研究者也是當時著名人工智能研究者、圖靈獎獲得者。他在1950年就開始研究如何將計算機使用在棋類領域中,并由此提出了α-β 剪枝算法。該算法的主要核心思想是通過利用已經搜索過的狀態對搜索空間進行剪枝,并以此對搜索的精準度和速率進行進一步提高。算法主要分為以下幾個步驟,首先是對雙方的博弈過程進行模仿,在對弈過程中,通過對進行中的棋局進行打分并向上遞送分數。隨后在自己已有的分數基礎上搜索其他走法,實現最大化提高我方所得分數,并以此為依據走下面的步數。
阿爾法圍棋是由谷歌團隊所研發的一個人工智能機器人[3],是至今為止第一個擊敗圍棋世界冠軍的人工智能機器。“深度學習”是其運用的主要核心技術。所謂的“深度學習”是由大量人工神經網絡構成。該算法對人類大腦中的生物神經系統進行了深度模擬,通過一系列的關聯將諸多組織相互銜接,從而構成類神經網絡形式的處理模式,可對面臨的問題進行準確快速處理。阿爾法圍棋的處理模式則是由兩種模式組合而成,一種是“落子選擇器”,它的作用是對當前棋局情況作出評估,從而尋找到最合適的下一步。另一種模式則為“棋局評估器”,它是通過棋子已經定位的情況下,對雙方的贏率進行預測。在訓練中需要不停的反復,并在此過程中對參數進行調節,從而使得下一次的結果更好。
在2016 年度,阿爾法與李世石進行了一場圍棋比賽,李世石是一名圍棋職業九段棋手,并獲得了世界冠軍。最后這場比賽阿爾法以4 比1 的總比分獲勝;在2017 年度,阿爾法在中國烏鎮圍棋峰會上,它與柯潔進行了圍棋對戰,柯潔當時是排名世界第一的圍棋冠軍,最終阿爾法仍然以3 比0 的總比分獲勝。阿爾法如今已被圍棋界公認其能力超過人類頂尖水平。同年10 月,谷歌研發了新一代的阿爾法圍棋人工智能機器人,并取名為AlphaGo Zero。新一代的AlphaGo Zero 與AlphaGo 不同,AlphaGoZero 不再僅僅依賴于人類棋譜,它具備了更為強大的學習模式,這種新型的學習模式就是自我博弈。僅通過三天的訓練,AlphaGoZero 就打敗了舊版本AlphaGo。
MOBA(Multiplayer Online Battle Arena)中文譯為多人在線戰術競技游戲,如《英雄聯盟》《王者榮耀》等。相比棋類游戲,MOBA 更加復雜。在這類游戲中,人工智能的應用也十分普遍[4]。例如,當玩家掛機(由于網絡等原因退出游戲)后,游戲會彈出窗口:隊友退出游戲,是否需要他跟隨你。可選擇“基地掛機”和“跟隨我”。如果選擇了“基地掛機”,那么掛機玩家將會什么都不做,停留在基地。而“跟隨我”選項就運用到了人工智能,電腦會鎖定選了此選項的玩家,與他一起行動,并且掛機的玩家會對此玩家攻擊的對象進行攻擊。在《王者榮耀》中的“AI 托管”即是此類應用。“AI 托管”所用的人工智能比“跟隨我”所用的人工智能更加強大。“AI 托管”的操作十分強大,技能釋放的精準度比玩家更高。
除了掛機時人工智能會起到作用,人工智能還在游戲中有另一種存在形式。在新手剛剛接觸游戲時,由于技術不強,為了不讓新手與老玩家匹配到,游戲公司會向低端水平對局中釋放“機器人”。新手在剛接觸游戲后的幾次對局中,基本都是跟“機器人”進行的對局。當新手變強后,便不會再匹配到“機器人”了。
《英雄聯盟》《守望先鋒》都運用了人工智能。游戲中“機器人”的出現最初是為了解決游戲低水平玩家不至于因人數過少而導致無法匹配的問題。部分游戲公司開發了人對戰人工智能的關卡。幫助玩家進行訓練。游戲公司運用人工智能除了可以幫助玩家進行訓練以外,還可以用人工智能與玩家進行的對戰數據進行檢測,有助于游戲開發方對玩家的操作進行研究,并且利于游戲公司在后臺對游戲進行的優化。
人工智能的運用對于游戲開發方來說有許多益處。對人工智能在游戲中的應用研究可以增加開發方對于游戲的理解。這使得開發方開發游戲的不同玩法,有助于游戲和人工智能的共同發展[5]。在電子游戲中,如何更好的使用人工智能技術,這密切關系到游戲的可玩性。在游戲中在合適的領域加入更好的人工智能技術是設計游戲的主要難點之一,想要設計出優秀的智能游戲,是需要建立在能夠充分理解玩家與人工智能的共通點的基礎上,只有這樣才可以周全考慮到玩家的需求。