本稿では,RoboCup サッカーシミュレーション 2D を題材として,ゲーム AI における局面評価の表現法と学習法を概
説する.一般的に,サッカーゲームは動的環境下におけるマルチエージェントシステムの代表的な例として知られている.
そこでまず,RoboCup サッカーシミュレーションをゲーム AI 研究における他のベンチマークテストと比較し,類似点や
相違点について議論する.次に,サッカープレイヤが行動選択をするメカニズムとして行動連鎖の考えに基づいた探索法
を示す.それは,チェスや将棋プログラムと同じように探索木と局面評価による状況の「読み」に基づいており,チーム
メイトとの協調行動を計画し,選択することが可能である.そして,行動連鎖生成で用いる局面評価モデルを機械学習の
枠組みにより構築する方法を様々な事例をあげながら概観する.