講演情報
[4Yin-A-60]リアルタイムに相槌の対応ができる対話システムの構築
〇香月 祥1、狩野 芳伸1 (1. 静岡大学)
キーワード:
対話システム
大規模言語モデル(LLM)の急速な進歩に伴い、日常的な話し相手となる音声対話システムの需要が高まっている。しかし、従来の音声区間検出(VAD)は、ユーザーのフィラー(「えーっと……」など)や相槌を発話の終了と誤認しやすく、システムによる不自然な割り込みを引き起こすという課題があった。本研究では、OpenAIのChatGPT Realtime APIを採用したうえで、独自の並列アーキテクチャを提案し、応答すべきか待機すべきかをリアルタイムに判定する「Judgeモデル」を組み込んだ。さらに、積極的に自己開示を行う「明るい友人」を模倣するため、「3段階応答(リアクション+自己開示+結び)」という対話戦略を導入した。評価実験の結果、提案手法はフィラーが含まれるシナリオにおいて不自然な割り込みを効果的に排除し、割り込み率を8.7%まで抑制した。応答遅延は2.6秒に増加したが、システムの「思慮深い間(Thoughtful Pause)」と共感的な自己開示戦略を組み合わせることで、ユーザー満足度は大幅に向上した。本アプローチにより、人間とAIのインタラクションにおいて、活気ある自然なリズムを構築することに成功した。
