講演情報
[1Yin-B-11]スマートフォンを用いた分散計算による将棋AIの開発
〇日高 雅俊1、太田 一毅1、橋本 智洋1、原田 達也1,2 (1. 東京大学、2. 理化学研究所)
キーワード:
強化学習、分散計算、ゲーム
高性能な将棋AIは通常、高価なGPUクラスタに依存している。本論文では、こうしたAIの実現を容易にするため、スマートフォンを利用した分散計算システムを提案する。本論文では、30台のiPhoneを用いて将棋AIの強化学習と対局の両方を行うシステムを構築した。学習においては、モデルフリー手法であるKLENTを適用し、中央サーバでパラメータを更新しながら、自己対局シミュレーションを各デバイスに分散させた。対局においては、独立したモンテカルロ木探索エージェントが指し手を投票する合議方式を実装した。異なるファインチューニングを施したモデルの割り当てや、評価関数へのノイズ注入を行うことで、多様性を確保した。実験により、この多数決戦略は、単一の最良モデルよりも高い指し手予測精度を達成することが確認された。本システムはネットワークの不安定さに対する堅牢性を示し、第35回世界コンピュータ将棋選手権において実際に運用され、ゲームAIにおけるスマートフォンベースのボランティアコンピューティングの有効性が実証された。
