講演情報

[1Yin-A-20]NLData2Opt: 自然言語とデータに基づく数理最適化問題定式化のためのパラメータ導出・予測ベンチマーク

〇劉 力加1、新 恭兵1、李 吉屹2、竹内 孝1、梅谷 俊治3、鹿島 久嗣1 (1. 京都大学、2. 北海道大学、3. 株式会社リクルート)

キーワード:

大規模言語モデル、最適化モデリング

現実世界の問題を数理最適化問題へ定式化するには高度な専門知識を要し,人的・時間的コストが高く,汎用化が困難である. 近年、大規模言語モデル(LLM)を用い,自然言語記述から数理最適化モデルを自動定式化する研究が進められている. しかし,既存のベンチマークは入力が明確に整理され,問題記述とデータが完全に整備されていることを前提としている. 実運用の現場で、問題記述やデータの不完全性を補完する処理が求められる. 本研究では,LLMに対して多段階の推論を要求するベンチマークNLData2Optを提案する. NLData2Optでは,(1)問題記述から独立したデータからパラメータを抽出すること,(2)データ属性の変換により欠損パラメータを導出すること,(3)過去の観測データに基づいて将来の未知値を予測することの3段階の推論を必要とする. 複数の最先端ベースライン手法および8種類のLLMを用いて評価を行ったところ,既存のベンチマークと比較して定式化精度が大幅に低下することが示された. このことは,従来のベンチマークにおける性能向上が,現実的なデータ条件下での定式化精度の向上に必ずしも反映されないを示している.