講演情報

[4Yin-A-51]深層学習とスパース等価音源法に基づく空間情報を考慮した直接音・残響音分離

〇岩松 芽花1、鬼澤 諒介1、内田 彩芽1、津國 和泉1、池田 雄介1 (1. 東京電機大学)

キーワード:

Primary-Ambient Extraction、音源分離

近年、立体音響の流行により、空間的な音場演出手法が必要となっている。特に、直接音と残響音の大きさや周波数特性の制御は、コンテンツの印象を左右する重要な手法である。しかし、実環境で録音された信号には両成分が重畳しており、それらを分離して制御することは容易ではない。また、立体音響に応用する場合、音の到来方向などの空間情報を保持したまま分離することが求められる。近年、両成分を分離するPrimary-Ambient Extractionが研究されているが、分離性能にはさらなる改善が求められる。一方、分離には音場のモデル化が有効な手段であり、代表的なモデル化手法である等価音源法は空間情報を表現可能な手法として知られている。 そこで、本研究では、スパース等価音源法と深層学習を用いて、直接音と残響音を空間情報を保持したまま分離する手法を提案する。深層学習を用いて、録音信号から直接音を表現する等価音源の位置およびその重みをスパース性を仮定して推定する。2つの球形マイクロホンアレイを用いたシミュレーション実験によって、直接音と残響音の分離精度を評価した結果、提案手法には一定の有効性が確認された。