講演情報

[4Yin-B-33]Webブラウザを用いたクロスプラットフォームな分散強化学習基盤

〇橋本 智洋1、西澤 優人1、日高 雅俊1、長 隆之2、原田 達也1,2 (1. 東京大学、2. 理化学研究所)

キーワード:

機械学習、強化学習、エッジデバイス

強化学習には膨大な計算リソースが必要であり、近年の傾向として、環境との相互作用を加速させるためにマルチCPUやGPU構成の活用へと移行している。PCやスマートフォンといったエッジデバイスは、クラスタとして多数が集まれば潜在的に膨大な処理能力を有しているにもかかわらず、そのリソースの大部分が未活用のままである。本論文では、ウェブブラウザを利用した、クロスプラットフォーム対応の分散型強化学習フレームワークを提案する。Ape-Xアーキテクチャに基づいて設計されたこのシステムは、ブラウザベースの実装によってUnityやMuJoCoの環境を利用したデータ生成を行う。実験の結果、複数のエッジデバイスを並列実行することで強化学習に成功したことが示され、この分野におけるコンシューマー向けハードウェアのスケーラブルな活用事例を提示している。