2020年度 人工知能学会全国大会(第34回)

2020年度 人工知能学会全国大会(第34回)

2020年6月9日〜6月12日オンライン開催
人工知能学会
2020年度 人工知能学会全国大会(第34回)

2020年度 人工知能学会全国大会(第34回)

2020年6月9日〜6月12日オンライン開催

[1D5-GS-9-05]Data-to-Textモデルにおけるトピック系列を用いた一貫性の制御

〇村上 聡一朗1,2,3、田中 天1,4、萩行 正嗣5、上垣外 英剛1、高村 大也1,3、奥村 学1(1. 東京工業大学、2. 株式会社NTTドコモ、3. 産業技術総合研究所、4. 株式会社ぐるなび、5. 株式会社ウェザーニューズ)

キーワード:

天気予報コメント、自然言語生成、一貫性、Data-to-Text

Data-to-Textタスクは, 気象予報マップや時系列株価データといった様々な形式のデータからその内容を説明するテキストを生成する研究課題である. ニューラルネットワーク技術の進歩により, 複雑なデータの特徴を捉え, その内容を正確に記述する文章の生成が可能となってきた. しかし, 複数文からなる文書の生成においては, 内容誤りは少ないものの, 同じ話題が複数文に渡って繰り返し言及されていたり, 各文章の話題の一貫性が欠けている文書が生成されてしまう問題があることが知られている. 本研究は, Data-to-Textタスクにおいて, 記述する内容の正確性に加え, 言及する話題に重複が無く, 一貫性のある文書を生成することを目標とする. 本論文では, 言及する話題とその順番を表すトピック系列を予測・付与し, これらの情報に基づくことで生成テキストの一貫性を制御する手法を提案する. 評価実験では, トピック系列を事前にモデルへ与えることで, 話題に重複がなく, 一貫性のあるテキストが生成できるようになることを示す.