JAIST Repository >
b. 情報科学研究科・情報科学系 >
b11. 会議発表論文・発表資料等 >
b11-1. 会議発表論文・発表資料 >

このアイテムの引用には次の識別子を使用してください: http://hdl.handle.net/10119/16089

タイトル: 花札のこいこいにおける方策勾配法とNeural Fitted Q Iteration の適用
著者: 佐藤, 直之
池田, 心
キーワード: 花札
こいこい
方策勾配法
Q学習
深層学習
発行日: 2017-11-03
出版者: 情報処理学会
誌名: ゲームプログラミングワークショップ2017論文集
巻: 2017
開始ページ: 64
終了ページ: 71
抄録: 花札の「こいこい」ゲームは交互2人零和不完全情報ゲームの一種で,様々な媒体で多くの人に遊ばれているが研究例が少なく,人間の上級者に匹敵する人工プレイヤが開発されたという話も聞かない.そのため我々は強化学習の方策勾配法とNeural Fitted Q Iterationを用いて強い「こいこい」プレイヤの実装を試みた.それぞれ盤面の低級な特徴量268個を入力に用いた人工ニューラルネットワークを状態行動価値の推定に用い,簡単なルールベース人工プレイヤとの反復対戦を通じて適切なパラメータの学習を行った.その結果それぞれ対戦相手から搾取した平均スコアは-0.3点と0.5点となった. :Koi-koi game, which is played using Hanafuda playing cards, is a Japanese traditional card game classi?ed as two players turn based imperfect information zero sum game. There are few research article focusing on this game even though this game is popular in Japan. Therefore, we tried to make strong Koi-koi game player by applying two types of reinforcement learning methods. We applied policy gradient method and neural ?tted Q iteration. Each player played games against an arti?cial player which we constructed making its decision in a simple rule based manner. Over 1,000 times game, policy gradient player gained -0.3 score per game and neural ?tted Q iteration player gained 0.5 scores in average.
Rights: 社団法人 情報処理学会, 佐藤直之,池田心, ゲームプログラミングワークショップ2017論文集, 2017, pp.64-71. ここに掲載した著作物の利用に関する注意: 本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 Notice for the use of this material: The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
URI: http://hdl.handle.net/10119/16089
資料タイプ: publisher
出現コレクション:b11-1. 会議発表論文・発表資料 (Conference Papers)

このアイテムのファイル:

ファイル 記述 サイズ形式
23758.pdf4634KbAdobe PDF見る/開く

当システムに保管されているアイテムはすべて著作権により保護されています。

 


お問い合わせ先 : 北陸先端科学技術大学院大学 研究推進課図書館情報係