2020年度 人工知能学会全国大会(第34回)

2020年度 人工知能学会全国大会(第34回)

2020年6月9日〜6月12日オンライン開催
人工知能学会
2020年度 人工知能学会全国大会(第34回)

2020年度 人工知能学会全国大会(第34回)

2020年6月9日〜6月12日オンライン開催

[1D3-GS-13-05]SDGs日本語データセット及び分類タスクベースラインの作成

〇張 鑫1、本木 悠介2、曽根岡 侑也1、岩澤 有祐1、松尾 豊1(1. 東京大学大学院、2. 慶應大学大学院)

キーワード:

持続可能な開発目標、自然言語処理、深層学習、人工知能、クラス分類

SDGs(持続可能な開発目標)は社会システムや産業構造を変えている現在、アカデミーによる取組が求められるようになってきた。しかし、日本語リソースが少ないため日本での取組が困難であった。本研究では、日本語のSDGs関連データを大学が公表している資料から集め、データセットを作成した。そして、SDGs分類モデルを構築した。オーギュメンテーション手法として、1. BERT MASKモデルを用いて品詞置き換え 2. Google transferを用いて英訳したものを再度日本語訳した逆翻訳手法 を用いた。古典機械学習手法であるトピックモデル(LDA等)及び深層学習モデルであるBERT等を用いて分類を行った。結果は少数データタスクにおいてオーグメンテーションの成果を示す。また、データ数が少ない中で比較的に高い精度を出すことを目指す。