2026年度人工知能学会全国大会（第40回）

2026年度人工知能学会全国大会（第40回）

セッション詳細

一般セッション一般セッション：GS-2 機械学習

[5M1-GS-2b]機械学習：強化学習と模倣学習

2026年6月12日(金) 9:00 〜 10:30

M会場(中会議室302A)

座長：森隼基（NEC）

9:00 〜 9:15

[5M1-GS-2b-01]限られた計算資源で効率的な意思決定が可能な AlphaZeRS

渡邉拓巳¹、〇高内優¹、鎌田佑²、櫻岡良樹²、甲野佑¹、高橋達二¹ (1. 東京電機大学、2. 東京電機大学大学院)

9:15 〜 9:30

[5M1-GS-2b-02]Cross Bisimulationに基づく暗黙的模倣学習によるサンプル効率的な強化学習

〇今川孝久¹、榎田修一¹ (1. 九州工業大学)

9:30 〜 9:45

[5M1-GS-2b-03]回収現金の再利用を可能とするバランス警送問題のための強化学習モデル

〇宮島龍冴¹、近藤愛¹、玉井秀明¹ (1. 沖電気工業株式会社)

9:45 〜 10:00

[5M1-GS-2b-04]GNNによる潜在空間を利用した空調制御のためのモデルベース強化学習

〇長谷川輝彰¹、許子微¹、市瀬龍太郎¹ (1. 東京科学大学)

10:00 〜 10:15

[5M1-GS-2b-05]マルコフ決定過程におけるSeqBDDを用いた全列挙方策

〇石原皐太郎¹、渕本壱真²、植野真臣¹ (1. 電気通信大学、2. 大学入試センター)

10:15 〜 10:30

[5M1-GS-2b-06]日本語大規模言語モデルに対するGRPOのみを用いたSFT非依存RL事後学習の評価日本語LLMに対するR1-Zero likeな事後学習手法の多目的評価

〇辻直矢¹ (1. 角川ドワンゴ学園S高等学校)

カテゴリ一覧へ戻る