999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據庫自學習的中國象棋研究

2015-05-30 14:38:41劉霞張建剛邢勝
科技創新與應用 2015年32期
關鍵詞:數據庫

劉霞 張建剛 邢勝

摘 要:象棋軟件一般可以通過很多方法提高棋力,但最好的方法是優化數據結構、改進搜索方式,這兩種方法都有很高的博弈水平,但機器學習能力都較差。以前應用數據庫自學習的方法都存在很大的缺陷。文章通過將判斷失誤的關鍵著法和局面值存儲到數據庫中,從而使后面的象棋步驟當中相同局面時轉變策略,避免相同的失誤步驟,從而實現自學習能力。

關鍵詞:數據庫;博弈樹搜索;關鍵著法

引言

目前,象棋軟件大多數存在的問題是不具有自學習能力,以前主要應用提高數據結構和計算機運行速度的方式來改進象棋軟件的水平,而很少應用通過數據庫記錄計算機下棋過程中好的著法和局面值的方法,這種方法可以使計算機在以后相同局面時,轉變象棋軟件策略,不重復失敗的老路,實現自學習能力。

1 棋類游戲典型的自學習方法

目前,自學習能力的實現方法有很多種,最主要有兩種:一是應用加強的學習方法(包括三個方面:加強學習與神經網絡相結合、同數據庫結合以及瞬時差分TD算法);二是自適應遺傳算法,其中重點是加強學習的TD方法。

1.1 加強學習同神經網絡結合(RBP)

在計算機棋類軟件的發展過程中,機器自學習能力的發展有著成功的應用,比如Gerald Tesauro在1995年推出的西洋雙陸棋TD-Gammon。通過150萬盤比賽,最后取得世界冠軍的水平。國內也有這方面的相關研究,王一非,哈爾濱工程大學碩士,2007年在其畢業論文中詳細的說明并提出了應用RBP的缺點:神經網絡運算量太大,自學習過程時間長,收斂時間過慢。

1.2 加強學習同數據庫結合

長沙理工大學碩士付強2006年在其論文《基于激勵學習的中國象棋研究》中已經提出了將象棋軟件和數據庫結合的方法,記錄最好著法值,來提高自學習能力。經過1萬多盤比賽結果,已經下敗了傳統軟件。

1.3 瞬時差分TD 算法

早在1999年,ChrisSzeto就提出瞬時差分TD算法來優化棋類軟件。經過多次游戲實驗,將修正后的棋子子力值保存到數據庫中,比之前通過經驗與試算估計的方法更容易取得比賽的勝利,說明起到了優化作用。

2 基于數據庫自學習的原理及實現

我們對過去的方法進行改進。通過博弈樹搜索,利用數據庫記錄計算機不同的對手著法,只記錄計算機輸棋的情況,將搜索值賦給計算機存儲。當計算機在以后的比賽中遇到此局面時,做出戰略調整。從而實現象棋軟件的自學習功能。這種方法尤其在計算機輸棋時,就要向下多搜兩層,所以值會更精確,值會更小,因為博弈樹是最大最小搜索,具體解決方案如圖1所示。

對比原方法:此方案中三角代表原來的方法,整個圖代表應用數據庫后由原來第五層值變成了現在的第七層值,如此以來就多搜了兩層,所得值更小,更精確。

通過博弈樹的最大最小值搜索,所以當深色方框的值更小時,它必被上層取最小值的圓所選中,而又因為它的值小,在更上層取最大值時會被舍去,所以不會運行最左邊的方案,從而轉變策略,實現了象棋軟件的自學習能力。實驗中整盤棋會有很多種局面,如果按圖1方案,一開始就需要轉變策略,但實際上不必開局轉變。所以就需要判斷哪些是失敗的關鍵著法,需要對記錄著法分析局面值,有所選擇,將影響大的值保留下來,其他影響小的不做記錄,這樣不僅縮小了數據庫,而且讓策略的轉變發生在最合適時。通過實驗得出,分別對正值,負值,最接近0的值進行了實驗,正值是代表勝利,負值代表輸棋,0值基本代表平局。通過實驗分析,最后選取的關鍵著法值即為第一次出現劣勢且之后的棋無可挽回的下到輸的著法。

3 實驗結果及分析

黑‘×表示每一局面值,藍‘○表示不同著法的局面值

此方法證實了它的自學習能力,采用王小春的象棋軟件和應用數據庫象棋軟件對弈。數據庫象棋軟件又分為存儲全部不同著法和存儲關鍵著法。圖2所示的是數據庫軟件先行,同王小春的象棋軟件對弈輸棋的存儲值,黑點表示對弈31盤的評估值,藍圈表示存儲全部不同著法中16個不同值。存儲關鍵著法中存儲的是第四個籃圈值即第一次下降且以后沒有更高值的點。

第一局對弈,先行的數據庫象棋軟件輸給了王曉春的象棋軟件。數據庫象棋軟件將遇到的局面值存儲到數據庫中;第二局對弈,存儲關鍵著法通過記錄的關鍵著法獲勝,圖3線上的點顯示的是對弈贏棋的局面值;存儲全部不同著法一開始就改變策略,實施的著法是上一盤的對稱著法,所以又下輸了。第三局對弈,存儲全部不同著法也贏了王曉春的象棋軟件。經上述實驗表明在計算機輸棋局面下,通過數據庫搜索博弈樹,將值賦給此著法。同時只記錄關鍵著法,以減小數據庫規模,具有更好的自學習能力。

參考文獻

[1]Shi-Jim Yen, Jr-Chang Chen, Tai-Ning Yang, Shun-Chin Hsu, Computer Chinese Chess, ICGA Journal, March 2004.

[2]徐心和,王驕.中國象棋計算機博弈關鍵技術分析[J].小型微型計算機系統,2006,27(6):961-965.

[3]許舜欽.電腦西洋棋和電腦象棋的回顧與前瞻[J].電腦學刊,1990,2(2).

[4]付強,陳煥文.中國象棋人機對弈的自學習方法研究[J].計算機技術與發展,2007,17(12).

[5]付強,陳煥文.基于RL算法的自學習博弈程序設計及實現[J].長沙理工大學學報,2007.12(4):73-78.

猜你喜歡
數據庫
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
兩種新的非確定數據庫上的Top-K查詢
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
數據庫
財經(2015年3期)2015-06-09 17:41:31
數據庫
財經(2014年21期)2014-08-18 01:50:18
數據庫
財經(2014年6期)2014-03-12 08:28:19
數據庫
財經(2013年6期)2013-04-29 17:59:30
主站蜘蛛池模板: 亚洲欧美另类专区| 青草视频免费在线观看| 玩两个丰满老熟女久久网| 97人妻精品专区久久久久| 国产伦精品一区二区三区视频优播 | 无码精品福利一区二区三区| 成人中文在线| 国产欧美精品一区aⅴ影院| 欧美成人午夜视频免看| 91无码人妻精品一区二区蜜桃| 激情无码字幕综合| 亚洲国产成人在线| 亚洲精品福利视频| 日本不卡在线| 国产幂在线无码精品| 亚洲中文无码h在线观看 | 国产在线日本| 免费国产小视频在线观看| 日韩精品成人网页视频在线| 国产1区2区在线观看| 高清不卡毛片| 亚洲国产精品一区二区第一页免 | 国产日本欧美在线观看| 久久精品人人做人人爽| 欧洲极品无码一区二区三区| 国产99视频精品免费观看9e| 国产精品视频猛进猛出| 精品伊人久久久久7777人| 日韩精品毛片人妻AV不卡| 成人精品亚洲| 一本久道久综合久久鬼色| 中文字幕1区2区| 中国一级毛片免费观看| 国产成人成人一区二区| 内射人妻无套中出无码| 欧美日韩国产高清一区二区三区| 中文字幕亚洲专区第19页| 国产一级在线播放| 无码人妻热线精品视频| 久久国产亚洲欧美日韩精品| 国产精品播放| 在线观看国产精美视频| 国产96在线 | 国外欧美一区另类中文字幕| 国产一区二区色淫影院| 欧美精品1区2区| 精品1区2区3区| 国产乱子伦视频在线播放 | 久久久精品国产SM调教网站| 2020最新国产精品视频| 久久国产黑丝袜视频| 特级aaaaaaaaa毛片免费视频| 久久国产精品影院| 日韩毛片免费| 亚洲美女高潮久久久久久久| 九九免费观看全部免费视频| 在线观看国产精品第一区免费| 一级毛片高清| 中国精品久久| 国产视频欧美| 久青草网站| 久久国产热| 国产在线精彩视频二区| 麻豆精选在线| 中文成人无码国产亚洲| 亚洲中文在线视频| a毛片在线| 久久精品国产精品青草app| 91成人精品视频| 一本色道久久88亚洲综合| 黄色在线网| 免费一级无码在线网站| 日韩AV无码免费一二三区| 视频一本大道香蕉久在线播放| 亚洲天堂网在线播放| 久草性视频| 国产在线观看91精品亚瑟| 欧美精品一区二区三区中文字幕| 2021国产精品自拍| 久久一日本道色综合久久| 一本久道热中字伊人| 99久久精品国产自免费|