講演情報
[16a-K204-3]深層学習に基づく音声処理
〇伊藤 彰則1 (1.東北大工)
キーワード:
音声処理、深層学習、End-to-end モデル
深層学習の導入により、音声認識、合成など、音声処理分野は劇的に変化した。従来の手法に比べ、音声波形を直接処理するend-to-endモデルが主流となり、高精度な音声認識や自然な音声合成が可能になった。しかし、多様な環境や話者への対応、フェイク音声の検出など、解決すべき課題も残る。今後は、データの多様性や倫理的な側面にも配慮しながら、更なる発展が期待される。