王 庚 張學軍 周 宓
(河南科技大學經濟學院,河南 洛陽 471000)
用經濟博弈論分析電腦游戲
王庚張學軍周宓
(河南科技大學經濟學院,河南洛陽471000)
摘要:近幾十年來博弈論赤手可熱,經濟學家通過研究博弈論解決了很多經濟學難題。現在他們同時研究博弈論與經濟學行為是個看似令人費解的現象,而我們卻把注意力全然放在創造力所賦予的博弈活動上,經濟學家的這種堅持,為我們研究電腦游戲和游戲參與者行為提供了謹慎和完善的理論框架。本文總體闡述了將有價值的理論觀點和經濟學博弈論用于指導和鞏固電腦游戲的策略,并且給出了非技術性的介紹,簡要說明了博弈論的一些觀點并對未來電腦游戲可能進行的研究與發展進行了探討。
關鍵詞:經濟博弈論;策略;參與者;電腦游戲
一、博弈論的由來與含義
博弈論,又譯作對策論、游戲論。它是一門研究相互影響著的局中人進行策略選擇時的行為規律的科學。現代博弈論的產生通常認為是由約翰·馮·諾曼于和奧斯卡·摩根斯特恩 1944年出版的《博弈論與經濟行為》最先提出的,這本書中運用了復雜的數學理論富有野心地為經濟學原理建立起了堅實的科學基礎,標志著現代系統博弈理論的初步形成。在之后的幾十年中這一理論得到了充足的發展延伸,20世紀60年代中被運用與政治學,70年代發展與生物學等等。研究闡述了博弈論,正如Jesper Juul(2001)所認為的,它是一項“重復性損失的藝術”。然而在過去幾十年仍有許多人將畢生精力用于博弈論在某方面的研究上,這些人被統稱為運籌學家,可以說他們為電腦游戲中的博弈做出了很大貢獻。
二、國外研究博弈論與“游戲”關系
從國外學者們的觀點來看,博弈論已成為博大精深的體系,廣泛應用于經濟學、政治學、軍事決策、計算機科學、生物演化等研究。它與各學科之間相互影響、相互促進,一方面借鑒其它學科的思想成果,另一方面也促進了其它學科的發展。國外學者們從不同角度闡明和豐富了博弈論的內容,強調指出:博弈論既是研究國際沖突的策略理論,又是處理國際關系的實際手段,其目的是為行為者在面臨沖突和危機時設計各種合理選擇和理性行為;博弈論的要素有弈者、弈步、利益、信息、規則、環境和策路等,而策略選擇正是其游戲的中心環節,策略的準確運用能使自身把握住博弈的主動權,幫助自己贏得“游戲”的勝利。有這樣的一種說法很容易讓人產生不解,為什么說研究博弈論的人會為被戲稱為一項游戲娛樂做出了貢獻。如果兩個孩子分享一塊蛋糕,規則是不切蛋糕的人可以先選蛋糕。現在假設切蛋糕的人想要讓自己得到的那一塊蛋糕最大化,那么他會希望先選蛋糕的那個孩子能夠分享他的優先權,所以他會盡可能的將蛋糕切成兩塊一樣大小的。在這個盡管非常簡單的分析中,暗含了一個博弈論的觀點。我們假設進行游戲的人期待得到最好的個人結果,并且了解其他參與者的意愿,而對于一些非數學專業和經濟學專業的人們來說,博弈論可能是一個極為陌生的概念。在國外,博弈論已成為占據主流的分析工具,真正懂得經濟學的專家學者一定精曉博弈論。博弈論的提法可能太過于學術化,容易讓人們退避三舍。其實它有一個非常通俗的名字———游戲理論。博弈論在我國還有一個名字,叫對策論。博弈字面意思就是賭博、下棋,賭博和下棋的時候常常要千方百計地應付對手,當然必須要講究對策。如果我們要進行一場游戲,首先肯定要有參加游戲的人,否則游戲就無法進行下去,游戲活動的參與人有一個學術名稱叫“局中人”。其次,每一個“局中人”都有自己的“行動”,或者叫做“策略”、“對策”,如果行動不是單一的,那么這個局中人所有的行動構成一個集合,稱行動組合或策略組合;另外,還應該約定輸家要付出什么代價,贏家可獲得什么利益,這在術語上叫做“支付”(或“報酬”)。當然,一場游戲肯定結果不是唯一的,各個參與人分散決策采取不同的行動,會造成不同的結果。約翰·納什證明出,在有限個局中人參加的有限行為對策中,至少存在一個所有參與人的最優戰略的組合,這叫做“納什均衡”。處于納什均衡狀態下,每個人都不能通過改變策略來得到更大的收益,因為其他參與者會阻礙其改變策略的實施,所以任何參與者也不存在改變現狀的動力。
三、國內研究博弈論與“游戲”的關系
我國的博弈論分析運用在春秋戰國時期就被廣泛運用于戰爭,戰國時期思想家孫臏在一次與齊威王賽馬時,孫臏向田忌提出了以下馬對上馬,以上馬對中馬,以中馬對下馬的田忌賽馬法,這也是我國早期的完全信息博弈論運用于游戲中的事例。多數國內學者認為通過分析游戲內容,進行合理的策略調整,達到獲得游戲勝利的目的。博弈論中分析試圖對利益對立的情況,提供一個準確的描述來尋找理性的結果。假設博弈的各方在建立他們的策略時會綜合考慮他們自己所處的位置和對方的認知,或者假設他們在采取策略時并不總是很有遠見的,后者通常用于非人為因素中(比如算法,先后順序等等)。博弈論通常運用于博弈雙方不能達成和解的情況中。這一分支被稱為不合作博弈論,是最為常見的情況,這種情況在電腦游戲中經常出現,玩家為了使自身利益最大化,甚至與不同玩家產生對立,面對同樣的游戲設定環境與其他參與者進行策略博弈,從而壓制其他參與者使的自身利益最大化。從技術層面來講,這里的策略是應對所有對手的一個計劃。回到策略怎樣運用于電腦游戲來看,人類行為被認為是非經驗的,與此不同的是,博弈論是社會決定的,它在人類之間的沖突中很少能得到不顧前因后果完全獨立的最佳策略。由于這些行為是根據認知所產生的,所以在博弈論中人為各方都會受到對方有某種利益驅使,并且會努力得到這種利益。為了不使問題變得復雜,我們需要先分清在電腦游戲博弈中的付出(以金錢、點卡等形式)和收獲。在只考慮在一場博弈內的付出和收獲中,如果將付出的概念擴展到更大的范圍,問題就會復雜許多。例如,人們會認為如果只輸給一個國際象棋大師30步,那將是極大的勝利;或者試想跟一個小孩子玩游戲,這時人們一般會想在第一局輸給小孩來激發鼓勵他對游戲的興趣;再比如在神廟逃亡者的這款游戲中,人們總是會努力的想怎樣取得高分,并選擇自身認為分數高的路線移動,并避免自己不能被身后的怪獸吃掉,盡管這游戲是不可能贏的。
因此,我們研究當試圖解釋和預測一個真實的“游戲者”的行為時,首先需要觀察他的動機和目的是怎樣的,一個相對簡單的方法是看電腦游戲給玩家設置了怎樣的目標,非常重要的一點是要始終意識到玩家會理性的參與游戲并且扮演一個不平凡的角色。
四、用博弈論的策略分析電腦游戲
策略的設計方案是指討論博弈論框架是怎樣應用于博弈的,在討論游戲的可行性設計方案(我們俗稱建立模型)之前,我們要先看一下博弈論的主要概念是怎樣描述電腦游戲的。首先,策略的概念是很吸引人的,但在電腦游戲設定中它似乎并不能立刻被參與者找到,要考慮到不同種類游戲所對應的情況。在囚徒困境中很清楚的定義了可能性空間:每個參與者可從兩種備選策略中選擇一種。但考慮到像Counter-Strike (2000)這樣的游戲中我們看到一個玩家可以將一種策略實施在不同的層面上,參與者也許可以合作,以使自己的行為滿足團隊利益,然后突然變的攻擊性很強,而非以防御為主,最后選擇以攻擊和撤防結合的策略快速地將戰斗升級。這些討論我們統稱成為“策略”,但也只是在個人這一最小單元層面上的討論,這是與博弈論緊密相對應的。而事實上,在博弈中我們不知道最小單元是什么,但幸運的是我們可以將低層次的策略選擇綜合起來作為高層次的策略,這也是游戲設計者在討論主要策略時經常采取的方式。在傳統形式上,博弈論就是指的博弈策略。在另一些情況中,一個人的決定本身就是一種挑戰時,例如大多數的角色扮演型游戲,主導策略就相對而言不是最該考慮的問題。事實上,在許多非決策類游戲中想出一個“最佳策略”是非常有趣的一件事。
有關電腦游戲的另一方面,Jonas Heide Smith認為在使用博弈論概念之前應當說清楚的是,單人游戲和多人游戲的差別。單人游戲通常分為兩類:首先,環境不隨玩家的操作而變化,而是玩家在探索其中的自然環境,在早先的場景游戲中例如Moon Patrol (1982),外星敵人是被程序設定進行進入和開火的,環境不會隨玩家的操作而改變。這種情況與Pac-Man (1980)中相比不同。敵方的運動軌跡(或通常成為“個性化”)對于每一個鬼來說都不同(Mateas,2003)。但它們依然會對玩家角色造成影響,當離的太近時會被追捕到導致游戲失敗。所以,一個成功的玩家必須預測鬼會怎樣運動以采取對應的措施。后一種情況就被稱為策略,然而還是與對真人對手的策略不同,因為Pac-Man的策略無形中減少了控制環境的算法,更加現代的單機游戲中,出現了更復雜的敵人,他們的行為伴隨更復雜的人工智能并且在反復試驗的過程中智能化會提升。至于是否把這樣的單機游戲與多參與者的游戲放在一起討論,要取決于分析的目的和重心,例如“RIOT”公司推出的現如今風靡全球的這款League of Legends(2009)游戲,在人機模式中,電腦人物的難度伴隨著玩家不同手法和策略的擊殺,頻繁做出更加智能化的調整,使其越來越能讀懂玩家的策略,從而用來與對抗玩家。顯然在于高程度的人工智能對抗和與真人對抗之間還存在很多的差別,但在很大程度上玩家的策略是可以相提并論的。當知道了一些博弈論概念對電腦游戲策略的解釋時,我們相信既然博弈論能對策略提供系統的分析,她也能為許多游戲的設計提供參考。另外,對分析家和評論家來或者是游戲的開發設計公司(例如RIOT)來說,能有一些專業術語來討論平衡方案也是極好的。這里將要采用的不是對付出的數學精密分析,因為即使是游戲中小的復雜性也會激發真人玩家多種多樣的應對策略,所以這里更傾向于研究策略是怎樣相互影響推動平衡局面的。最后考慮游戲策略,根據Sid Meier觀點來講,對好游戲的簡要定義,這種情況與“利益選擇”相反。如果在一個策略游戲中,一個玩家能做到的最好策略是“達到三級技術層面然后讓所有隊友針對敵方”,如果不考慮其他玩家的行動的話,游戲就會失去它的策略性要素從而成了一個手眼協調性的考察。為了解釋博弈論怎樣啟發整個游戲設計,這里以游戲《魔獸世界》里的奧克蘭特山脈戰場為例,策略上的無能為力也許可以提供游戲策略和行動上的更多可能性。在戰場中聯盟與部落分化為兩股陣營,相互攻擊直到對方基地里面的守城將軍陣亡,分出勝敗。在通常情形下,聯盟會根據部落之前在游戲中的表現和其他線索來考慮部落部隊的分配實力。還會考慮部落陣營里的40名玩家對攻擊聯盟的執行力,他是否只是想通過戰場來使自己獲得擊殺榮譽,其本身并不想真正的參與廝殺戰場,對本場對戰的輸贏并不在意。然而,考慮對方的情況,如果部落出動全力去進行攻擊很可能引發不可控制的殘暴局面。在聯盟知道自己面對的是什么并且無論如何部落都不會后退了的情況下,聯盟會權衡自己的實力和與對手進行一次小規模的戰斗,和如果失敗后將失去的資源,這時策略上的無能為力將導致結果的大轉變。并且攻擊承諾并不需要是技術上的,也可以僅僅是社會行為上的。例如,聯盟可以聲稱對任何來攻擊的力量都會付出全力進行反擊,而面臨部落入侵的被動局面,可以更換策略利用游戲設計者的戰場任務,召喚NPC精英騎兵或者是終極守衛者來進行反攻,從而取得戰場的勝利。
近些年,通過電腦游戲的普及化提高,世界電競體育行業也被其帶動,世界各地各大游戲產生舉辦的游戲競技比賽也如雨后春筍。參加游戲比賽的參與者,都是世界范圍內同款游戲中博弈的佼佼者。高手之間的博弈對戰以比賽的形式展現,能讓觀眾們更好的領會博弈之間的樂趣。從某程度上來說,電競行業里的“博弈對戰”已經遠遠超越了傳統體育(競速、體力類)的比賽看點,舉個列子說奧運會100M冠軍博爾特可以蟬聯幾年的世界冠軍,而電競中單類游戲個人或者戰隊的冠軍蟬聯要比博爾特困難的多,他們需要戰勝不僅僅是現實的難度與速度,更關鍵的是要對戰已經知道自己常用策略的游戲高手,只有在每次選擇中把握住對自己最有優勢的策略進行游戲博弈,才有可能取得最終的游戲勝利。
通過博弈論對未來的電腦游戲理論研究奠定基礎,將來可以采取經驗分析的方式進行繼續研究,通過行為實驗來鞏固理論。更具體的來說,如果游戲希望讓使玩家感到沮喪和泄氣,事實上很簡單,只需要去研究玩家沮喪的理由。大量的方法論可以提供有用數據來展現沮喪的玩家的表現,這可以幫助游戲設計者了解怎樣影響玩家行為,從而調整自身的設計思路與設計方法,使其制作出來的產品更加貼近市場所需,通過與玩家的多種博弈,不斷完善游戲內容,贏得玩家的口碑與偏愛,提高這款游戲產品的經濟效益。
五、總結
總的來說,經濟學博弈論無論是在游戲的再創作還是只是作為游戲的娛樂方面都可以提供一個良好的工具。在描述了博弈論概念之后增加了游戲概念的系統詞匯,這對于設計新游戲特很有好處。通過一個實時策略游戲的討論,闡述了博弈論觀點對游戲動態性的理解。博弈論作為一種有力的分析手段,在電腦游戲中業有著廣泛的應用前景使得博弈策略、合作與游戲環節緊密相聯。
近年來電腦游戲的一系列突出成就和最新進展,越來越集中地表現出人們對電腦游戲行為主體的認識與深化,電腦游戲越來越受到廣大人們的青睞。作為策略主體行為規律和分析游戲環境現象背后機制所形成的認識工具,博弈論在研究電腦游戲的策略進行與游戲內容創新方面應用潛力巨大。我國大多數學者和大型游戲公司若能消化吸收這方面的理論成果,使之成為我們廣泛研究具體游戲策略問題的一種得心應手的方法,則必將對我國新生的電腦游戲產業有更深刻的把握,并會帶來巨大的經濟利益和市場影響力。