第25回画像センシングシンポジウム

第25回画像センシングシンポジウム

2019年6月12日〜6月14日パシフィコ横浜 アネックスホール
画像センシング技術研究会
第25回画像センシングシンポジウム

第25回画像センシングシンポジウム

2019年6月12日〜6月14日パシフィコ横浜 アネックスホール

[OS2-02]3次元・マルチモーダル音環境認識

*坂東 宜昭1(1. 産業技術総合研究所)
近年の深層学習の発展とともに、音声認識をはじめとした音イベントの認識は圧倒的な性能を達成しつつある。また、遮蔽物を迂回し伝搬する特性を活用した環境認識・計測のため、音源位置(方向)の定位などが広く研究されている。このような認識と定位の結果を SLAM 技術と統合し空間的な音源地図推定を行ったり、音響情報と視覚情報と統合して教師なしで認識や分離を学習したりする研究が盛んである。さらに、これらの一部はオープンソース・ソフトウェアとして公開もされており、手軽に利用できつつある。本講演では、音環境の認識や3Dセンシングといった音響信号処理技術について、分類と位置づけを行いながら解説する。