2体のエージェントを用いた音によるコミュニケーションの研究

日本大学大学院総合基礎科学研究科地球情報数理科学専攻北原研究室所属

研究概要

近年, 特定のタスク達成を目的としたタスク指向型コミュニケーションシステムだけではなく, コミュニケーション自体を目的とした非タスク指向型コミュニケーションシステムの開発が盛んに行われている. 非タスク指向型コミュニケーションシステムは言語情報を用いたコミュニケーションと非言語情報（身振り手振り, 音など）を用いたコミュニケーションに分けることができる. 言語情報を用いたコミュニケーションシステムとして代表的なのは雑談システムである. 雑談システムの問題点として, 音声認識や言語理解に誤りがある場合, 会話が成り立たなくなるという点が挙げられる. 一方, 非言語情報を用いたコミュニケーションシステムでは, 言語情報を用いた際に生じる問題が回避できる利点がある. 多くの研究では人間1人に対してシステム内の対話相手（エージェントと呼ぶ）が1体の1対1コミュニケーションを想定しており, コミュニケーションを維持するために人間もエージェントも（音を用いる場合）話し続けないとコミュニケーションを維持できない. このことから, 人間側の心理的負担が大きいことが予想される.

本研究では, 2体のエージェントと人間が音の韻律的特徴のみを用いてコミュニケーションを行うシステムを提案する. 本システムでは, 2体のエージェントが人間とコミュニケーションを取りつつ, 人間からの反応がない場合にはエージェント同士でコミュニケーションを継続する. これにより前述の問題を解決する. エージェントと円滑にコミュニケーションを行うためには, 時間的随伴性（行動を行った人に対して反応をすること）, エージェンシ（人間がコミュニケーションを取るべき適切な対象として捉えることができる特徴を持つこと）, 人間に学習・適応する能力（人間の行動に無関係にシステムの挙動を決めるのではなく, 人間の行動に影響を受けて行動すること）が必要だと言われている. 「時間的随伴性」については, 各エージェントは, 人間または他のエージェントが発話を終えると, 正規分布に従う乱数により決められた時間待った後に発話を始めるものとする. 「エージェンシ」については, お化け型の外見が発話時に光ることで対話相手らしさを演出する. 「人間への学習・適応」は, エージェントが発する音を決める内部パラメータを対話相手（人間または他のエージェント）に合わせて変化させる（これを同調と呼ぶ）ことで実現する. また, 人間が発話を数秒間行わないとエージェント同士がコミュニケーションを始めるので, その様子を見ることでコミュニケーションはより円滑化されると期待される.

本システムの有効性を確認するために, 2種類の評価実験を行った. 実験1ではエージェントが2体いることの有用性を検証するため, エージェントが1体のみのシステムとの比較を行った. 実験の結果，エージェントが1体のシステムが良いと答えた被験者と, エージェントが2体のシステムが良いと答えた被験者に分かれた. この評価の差は, どちらのシステムを先に使ったのかに依存するため, 今後, 両システムを長期的に試行し検証していく必要がある.

また, 実験2は同調制御の効果を検証するため同調制御をしないシステムとの比較を行った. その結果, 6人中5人は同調制御を行うエージェントの方が, 同調を行わないエージェントに比べて, 協調的だった, 会話を行うことができた, と回答した. このことから, 同調制御を行うことで, 協調的な会話を行うことができる可能性が示唆された.

本研究では, 2体のエージェントと人間が音の韻律的特徴のみを用いてコミュニケーションを行うシステムを提案した. 実験の結果, 韻律的特徴を同調することにより, 協調的な会話を行うことができる可能性が示唆された. しかし, 2体にすることによってコミュニケーションの維持ができるかについては, 検証が必要な結果となった. 加えて, 非言語コミュニケーションにおいても発話を行うタイミングや頻度も考慮に入れるべきということがわかった. 今後は被験者数を増やし, 長期的な検証や本システムの有効性を確かめるとともに, 発話頻度やタイミングも考慮に入れた持続的な非言語コミュニケーションの実現を目指したい.

システム使用例

研究資料

ReadMe

修士論文

pythonプログラム

Arduinoプログラム

修士論文審査会発表スライド