梅險+侯利元+謝文+高旭+孫偉+李冬平
摘要:隨著Alphago在圍棋上戰勝人類,計算機博弈再次引起業內的廣泛關注。人工智能有望成為互聯網經濟的下一個經濟支撐點。高等學校在開展相關創新教育時普遍面臨門檻高、項目偏、交流少的困難。本文以計算機博弈創新教育的平臺建設為主線,分析了影響計算機博弈創新教育的主要問題和產生原因,闡述了改革和推廣計算機博弈教學的研究和實踐過程。
關鍵詞:人工智能;計算機博弈;創新教育
一、高等學校開展計算機博弈創新教育的意義和現狀
(一)高等學校開展計算機博弈創新教育的意義
1997年IBM計算機DeepBlue戰勝等級分排名世界第一的國際象棋世界冠軍加里·卡斯帕羅夫。這標志著計算機下棋成為衡量計算機人工智能水平的重要參考。2016年Google計算機AlphaGo戰勝韓國圍棋冠軍李世石。隨著信息領域的企業巨頭和著名研究機構在計算機棋牌方面的研究和展示,計算機博弈的研究意義和應用價值得到學術界和產業界的重視和關注。
計算機下棋是人工智能在博弈論領域的應用。通過研究計算機博弈可以揭示博弈論的本質,預示人工智能的發展前景。經歷了十幾年的發展,互聯網的經濟紅利已經所剩不多,下一個經濟增長點很可能是人工智能相關產業。高等教育擔負著培養高素質從業人員的重任。在眾多人工智能研究領域中,計算機博弈是最符合中國國情、最適合鋪開推廣的研究方向。因為它需要的硬件條件不高,各大高校現有的計算機設備基本都能滿足開展研究的需求。學生通過對計算機博弈的學習和研究,可以提高計算機程序設計能力、動手實踐能力和科研創新能力,同時可以提高對團隊協作和質量檢測的理解和重視。如何通過多種教學形式對大學生開展計算機博弈知識普及,提高大學生研究能力和創新意識是當前高校創新教育面臨的機遇和問題。
(二)高等學校開展計算機博弈創新教育的現狀
目前國內本科生階段開展計算機教學和研究的高等院校數量還不多。數據顯示北京、遼寧、黑龍江、重慶等地高校計算機博弈研究起步相對較早,區域內院校對人工智能和計算機博弈的教學和研究支持力度較高。以黑龍江為例,每2.72萬本科在校學生有1支隊伍參賽,其參與程度約是山西地區的14倍。數據也反映出國內高校計算機博弈研究分布還不是很均衡。很多省份還處于空白狀態或剛剛起步。普及推廣計算機博弈的目標任重道遠。
二、開展計算機博弈創新教育的常見問題和產生原因
(一)起步階段博弈項目規則不熟,造成學生參與數量不多,積極性也不高
本科學生在校期間,除了要完成大約40門課程的學習任務之外,還面臨社會實踐、就業壓力和升學壓力。前幾年計算機博弈沒有得到社會的普遍認可和重視,對口的就業機會不多,造成學生參與計算機博弈研究單純是出于對棋牌游戲的興趣。而早期的計算機博弈項目多以國外的棋種為主,比如點格棋、亞馬遜等,很多內地學生連名字都沒聽說過,更不要說了解博弈規則和掌握對局技巧,即使根據規則文本編寫程序實現對局,離智能的目標也相差甚遠。因此,項目本地化程度是影響計算機博弈普及推廣的主要原因。
(二)計算機博弈早期入門技術門檻普遍偏高
內地非計算機專業的理工科學生課程通常只包括約70學時的程序設計課程。這些課時對于無基礎的學生只夠掌握常規語法和簡單算法。而幾乎所有計算機博弈項目都是在平面棋盤上描述棋子在不同時刻的狀態和價值。僅僅描述棋盤靜止狀態就需要對二維數組和相關的編碼計算有比較深刻的理解。要讓棋子按照規則合法地運動起來,還須要根據規則描述行棋招法的數據結構描述。比如中國象棋項目,雖然內地群眾基礎較好,大約1/10的學生日常有用中國象棋娛樂消遣的習慣。但是把象棋的最簡單行棋規則“馬走日、象走田”用程序描述出來需要相當復雜的邏輯結構。這個入門程序的復雜度讓有興趣參與計算機博弈學習和研究的學生也容易產生畏懼心理。或者由于較長時間無法提高水平突破瓶頸,造成原有參與學生的大量流失。
(三)計算機博弈交流學習的環境還不完善
現有的內地高等院校的計算機博弈研究和學習交流主要是通過全國大學生計算機博弈大賽和相關的國際國內學術會議。交流時間不充分使得探討很難深入。異地參與比賽或會議的差旅費用對于學生來說壓力也不小。
三、促進計算機博弈創新教育普及和提高的探索和實踐
(一)增設內地學生喜聞樂見的博弈項目
在內地開展計算機博弈競賽的早期階段,多數項目都是來自國外的博弈游戲項目。雖然研究價值比較明確、研究基礎理論比較充實,但是學生缺乏對項目的日常應用理解,因此參與興趣普遍不高。在研究中,團隊成員分析發現傳統二人軍棋暗棋群眾基礎較好,具有不完全信息博弈的特點,造成防守策略一方有較大優勢。因此多數成熟的玩家會考慮優先防守,從而造成無人主動進攻的僵局。因此,研究組對傳統的二人軍棋暗棋規則作了必要的調整。使二人軍棋暗棋游戲重新進入高校學生的視野,并得到高度認可。
隨后,研究組對國內群眾基礎更好、玩家規模更大的斗地主游戲規則進行了分析和研究。研究組設計了斗地主的編碼規則和計算機通信協議指令,使每個參與博弈對局的程序之間有統一和公平的信息交互。
自從開發和設計了軍棋和斗地主博弈的規則和協議,這兩個項目隨之成為全國大學生計算機博弈大賽的正式項目,很多學生都積極參與到這兩個項目的計算機博弈技巧的研究中。
(二)建立便捷的對局平臺并發布易學的示例代碼
傳統計算機博弈多為兩人完全信息博弈,雙方需要在計算機上顯示相應的棋盤圖像。在本科計算機教學中普遍注重對語法的教學和對基礎算法的教學。對鼠標和圖形界面等基本不涉及或僅僅一帶而過。因此對于沒有統一圖形平臺界面的博弈項目,參與者須要投入相當的精力學習相關知識,而這部分精力的投入與博弈研究的本質關系并不大。研究組為新增的項目軍棋和斗地主項目分別開發了圖形化對戰平臺,使掌握基本控制臺編程技能的學生即可參與博弈研究,并集中精力到博弈算法方面。endprint
對戰平臺通過統一的交互協議實現快速通訊,避免了人工操縱可能出現的誤操作,提高訓練和對局的效率。統一的對戰平臺還是非完全信息博弈項目的,可以免于依賴人工裁判的重要技術方向。
要加快新建博弈項目的普及,還須要設計簡單易懂的入門示例代碼。以便各個新參與的學校可以快速嘗試開展深入研究,避免因對通信協議理解偏差造成的時間和精力的浪費。為此,研究組開發了簡練的軍棋示例代碼。它可以實現最簡單的行棋規則,又給各學校提升代碼效果質量預留了充分的空間。研究組也開發了斗地主示例程序。由于斗地主牌型規則特別復雜,研究組將各種牌型的基本輔助判斷以庫函數的形式寫入頭文件,節省了初學者對復雜牌型進行基本判斷的開發精力和時間。示例程序還提供了輔助提示函數,對當前桌面的出牌牌型進行提示,把所有可出的合法牌型列舉出來,供學生智能引擎選擇,使研究者更集中精力在博弈算法研究上。
(三)建立具有遠程參與功能的網絡交流平臺
為了加強各校之間的計算機博弈研究深入交流,研究組還開發了核心算法模塊評估網絡博弈平臺。選手只須要編寫并提交一個函數程序即可實現對五子棋博弈項目的對局,函數的接口參數為二維數組,表示決策時棋盤上雙方的棋子分布。函數的返回值是有落子位置行列坐標描述的棋盤位置編碼。通過網絡交流平臺,使異地的兩個學校可以在不承擔差旅費用開銷壓力的情況下實現定期的交流。
四、結語
經過對計算機博弈創新教育的分析和探索,研究組發現以博弈平臺結合多種教學模式從理論到實踐極大地提升了學生的動手能力和創新能力。軍棋平臺和斗地主平臺在訓練和比賽中運行穩定,判定準確,被指定為全國大學生計算機博弈大賽官方唯一指定平臺。參與研究開發平臺和示例程序的學員在畢業時普遍被重點高等學校錄取為研究生或被著名IT企業高薪聘用。
參考文獻:
[1]徐心和,鄧志立,王驕,徐長明,劉紀紅,馬宗民.機器博弈研究面臨的各種挑戰[J].智能系統學報,2008(8):288-293.
[2]陳卓.“人機大戰”到底應該關注什么?[J].軟件和集成電路,2016(4):52-53.
[3]王亞杰,邱虹坤,吳燕燕,李飛楊,周鳳.計算機博弈的研究與發展[J].智能系統學報,2016(12):788-798.
編輯/呂秀妍endprint