雑音環境下のための音声案内システム:
ユーザーによる再度発話とセミブラインド音源分離の導入


日本大学大学院 総合基礎科学研究科 地球情報数理科学先行 北原研究室所属

小暮 計貴

研究概要

近年, 音声認識の技術が普及し, カーナビゲーションやインターネットでの情報検索など, 多くの場面で音声対話が活用されるようになっている.音声対話を円滑に行う為には, 雑音環境下で音声認識を正確に行い, ユーザーに正確に伝える必要がある.今まで, 雑音に頑健な音声認識を行う為の研究は数多くなされてきたが,システムの音声を聞こえさせる為の研究はあまり行われていない.
我々は, このような背景の元, 雑音環境下において, 音声合成の聞き取りやすさを向上する為に, 周囲の雑音による音量調節と発話延期機能を構築した.このシステムによって, 聞き取りやすさが向上する結果を得る事ができ, 音声対話システムにおいても, 有効である事が分かった. しかし, 音声対話システムに導入する事に当たって, 2 点の問題点が見つかった. 1 点目の問題は音量調節と発話延期機能を導入したとしても, 音声合成が聞き取れない可能性がある事である. 2 点目の問題はユーザーの発話やシステムの発話を雑音として, 収集してしまう事である.
本稿では, 以上の問題を解決する為に, 1 点目の問題をユーザーの聞き返しに基づく再度発話, 2 点目の問題をセミブラインド音源分離を導入する事で 2 つの問題を解決する事を検討し, 導入を行った. 我々は, 提案手法の有効性を確かめる為, それぞれ音声対話システムに導入し, 被験者実験を行った.1 つ目の提案手法, ユーザーの聞き返しに基づく再度発話に関しては, 3 人の被験者共, ベースラインシステムに比べ, 聞き取りやすさが向上する結果を得られた.また, 2 つ目の提案手法, セミブラインド音源分離を導入した音声対話システムを構築し, 10 人の被験者により, 被験者実験を行った所, ベースラインシステムに比べ, ユーザーの発話によって発話延期される回数が減少する結果を得られた.

音量調節と発話延期機能をの概要を以下に記述する.

提案手法によって問題を解決できたのかを確認するため,本研究では被験者実験を実施し,以下の結果を得た.

参考資料