Presentation Information
[2Yin-A-08]Multi-Channel Communication Algorithm for Multi-Player Multi-Armed Bandits without Collision Sensing
〇Tomonari Izumi1, Atsuyoshi Nakamura1 (1. Graduate School of Information Science and Technology, Hokkaido University)
Keywords:
Multi-player Multi-Armed Bandits,Distributed Bandits
衝突検知情報なしマルチプレイヤー多腕バンディットは,プレイヤーが衝突発生を検知できない最も困難な分散学習設定である.Huang ら (2022) は同問題に対し,単一アームを介した通信手法を提案した.この手法は事前情報を必要としない利点を持つが,単一通信路に起因する大規模環境での非効率性が課題であった.本研究では,通信用アームを 2 本以上に拡張し,通信の非効率性を解消することを目的とする.我々の提案手法は,初期探索のステップ数が増加するものの,その後の通信フェーズでの並列実行による高速化を可能にする.本稿では,先行研究と比較した場合,大規模システムにおける有効性を示すことを目指す.
