講演情報

[1Yin-B-03]DAGRI Subtask 2: 営農シミュレーションのためのタスク設定とベースラインシステムの構築

〇中嶋 楓花1、板倉 亮真1、坂地 泰紀1、小林 暁雄2、馬場 研太2、大友 将宏2、石原 潤一2、桂樹 哲雄2、髙柳 剛弘3、木村 泰知4、野田 五十樹1 (1. 北海道大学、2. 農研機構 農業研究センター、3. 株式会社 Simulacra、4. 小樽商科大学)

キーワード:

農業、大規模言語モデル

わが国では,次世代の農業従事者の育成と農業技術の継承のため,営農指導を担う農業普及指導員の重要性が一層高まっている.この課題に対し,本研究では実営農の意思決定過程をより忠実に反映した質問応答を実現するため,Dagri subtask2の実施に向けてタスク設定と評価方法を体系化し,それらを具体的なシステム仕様として整理した.タスクでは,複数の表データ参照に加え,現場で生じる条件変更や制約を含む問いを拡充し,実務に近い判断を要する状況を扱う.我々は,定義した評価枠組みに基づき,QA形式で回答を生成するベースラインシステムを構築した.このベースラインは,参照表の抽出・統合と推論過程を通じて回答を導出し,タスクの成立性と評価の再現性を検証可能とする.本稿では,タスク実施に向けた実営農に近しい質問回答群の構築状況と評価設計,および,ベースラインシステムの評価結果について報告する.