[5M1-GS-2b] Machine learning | The 40th Annual Conference of the Japanese Society for Artificial Intelligence, 2026

Advanced Search

Session Details

General SessionGeneral session : GS-2 Machine learning

[5M1-GS-2b]Machine learning

Fri. Jun 12, 2026 9:00 AM - 10:30 AM JST
Fri. Jun 12, 2026 12:00 AM - 1:30 AM UTC

Room M(Middle room 302A)

座長：森隼基（NEC）

9:00 AM - 9:15 AM JST(12:00 AM - 12:15 AM UTC)

[5M1-GS-2b-01]AlphaZeRS: Efficient Decision-Making with Limited Computational Resources

Takumi Watanabe¹, 〇Suguru Takauchi¹, Yu Kamata², Ryoji Sakuraoka², Yu Kohno¹, Tatsuji Takahashi¹ (1. School of Science and Engineering, Tokyo Denki University, 2. Graduate School of Tokyo Denki University)

9:15 AM - 9:30 AM JST(12:15 AM - 12:30 AM UTC)

[5M1-GS-2b-02]Sample-Efficient Reinforcement Learning through Cross Bisimulation-Based Implicit Imitation Learning

〇Takahisa Imagawa¹, Shuichi Enokida¹ (1. Kyushu Institute of Technology)

9:30 AM - 9:45 AM JST(12:30 AM - 12:45 AM UTC)

[5M1-GS-2b-03]Reinforcement Learning Model for Cash-in-Transit Rebalancing Problem Considering Reuse of Collected Cash

〇Ryoga Miyajima¹, Ai Kondoh¹, Hideaki Tamai¹ (1. Oki Electric Industry Co., Ltd.)

9:45 AM - 10:00 AM JST(12:45 AM - 1:00 AM UTC)

[5M1-GS-2b-04]Model-Based Reinforcement Learning for HVAC Control via a GNN-Based Latent Space

〇Teruaki Hasegawa¹, Ziwei XU¹, Ryutaro Ichise¹ (1. Institute of Science Tokyo)

10:00 AM - 10:15 AM JST(1:00 AM - 1:15 AM UTC)

[5M1-GS-2b-05]Exhaustive Enumeration of Policies in Markov Decision Processes Using SeqBDDs

〇Kotaro Ishihara¹, Kazuma Fuchimoto², Maomi Ueno¹ (1. The University of Electro-Communications, 2. The National Center for University Entrance Examinations)

10:15 AM - 10:30 AM JST(1:15 AM - 1:30 AM UTC)

[5M1-GS-2b-06]Evaluating SFT-free RL Post-training with GRPO for Japanese Large Language Models日本語LLMに対するR1-Zero likeな事後学習手法の多目的評価

〇Naoya Tsuji¹ (1. KADOKAWA DWANGO Educational Institute S High school)

Back to Category List