JAIST Repository >
b. 情報科学研究科・情報科学系 >
b10. 学術雑誌論文等 >
b10-1. 雑誌掲載論文 >
このアイテムの引用には次の識別子を使用してください:
http://hdl.handle.net/10119/15102
|
タイトル: | 花札の「こいこい」ゲームの強化学習によるコンピュータプレイヤ |
著者: | 佐藤, 直之 上原, 隆平 池田, 心 |
キーワード: | 花札 こいこい 強化学習 方策勾配法 特徴量 |
発行日: | 2017-07-08 |
出版者: | 情報処理学会 |
誌名: | 情報処理学会研究報告. GI, 研究報告ゲーム情報学 |
巻: | 2017-GI-38 |
号: | 6 |
開始ページ: | 1 |
終了ページ: | 7 |
抄録: | 花札の 「こいこい」 ゲームは交互 2 人零和不完全情報ゲームの一種で,様々な媒体で多くの人に遊ばれているが研究例が少なく,人間の上級者に匹敵する人工プレイヤが開発されたという話も聞かない.そのため我々は強化学習の方策勾配法を用いて強い 「こいこい」 プレイヤの実装を試みた.まずはゲーム知識に基づいた高級な特徴量を人間が設計し,その重み付き線形和モデルで状態行動の価値を推測して学習を行った.その結果,ランダム行動プレイヤとルールベースプレイヤを上回る強さを獲得した.さらに我々は,状態行動の価値により複雑なモデルを適用すれば更に高い性能が引き出せると考えて,その準備のための実験のみを本稿で行った.ゲームに関する低級な特徴量を設計して,それが ANN の学習を通じて適切にゲームの最終スコア予測のために利用できそうな事を確かめた. |
Rights: | 社団法人 情報処理学会, 佐藤 直之, 上原 隆平, 池田 心, 情報処理学会研究報告. GI, 研究報告ゲーム情報学, 2017-GI-38(6), 2017, 1-7. ここに掲載した著作物の利用に関する注意: 本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 Notice for the use of this material: The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan. |
URI: | http://hdl.handle.net/10119/15102 |
資料タイプ: | publisher |
出現コレクション: | b10-1. 雑誌掲載論文 (Journal Articles)
|
このアイテムのファイル:
ファイル |
記述 |
サイズ | 形式 |
23523.pdf | | 2279Kb | Adobe PDF | 見る/開く |
|
当システムに保管されているアイテムはすべて著作権により保護されています。
|