[1A4-GS-2-05]音声データを用いたニューラルネットワークによる感情分類の検討
〇髙久 雅史1、浦野 晶一1(1. 明治大学)
キーワード:
音声認識、ニューラルネットワーク、機械学習、感情分類、ケプストラム分析
近年、音声認識技術は音声翻訳やコールセンターなど、生活の様々な場面で用いられており、その中でも、人とコミュニケーションが取れる「Pepper」などのロボットでは、話者の感情を分析して行動の支援を行うための人工知能が搭載されている。しかし、正確に話者の発言や感情を読み取ることが出来ず誤認識が発生するなどの課題もある。本研究では、音声波形全体を分析して感情ごとの音声データの特徴を抽出し、高精度な音声の感情分類モデルを作成することを目的とする。筆者らは、これまでに音声認識研究の課題である使用するデータの量や活用方法に注目したうえで、音声データからケプストラム分析によって得た特徴量であるフォルマントを高次まで用いて、決定木による感情分類モデルの作成と評価を行ってきた。本稿では、分類手法として機械学習的手法であるニューラルネットワークを適用した感情分類モデルの作成と評価をし、感情分類の精度向上を目指す。また、分類手法として決定木を適用して作成した分類モデルとの比較検証を行う。
