2016年4月1日

本研究成果のポイント

・人とロボットとのコミュニケーション研究に基づいた三つの対話システムを開発
・大阪大学石黒研究室で進めてきた研究をベースに、新たにNTTと共同研究することで実現
・人間同士のコミュニケーションにも利用可能であり、医療現場や接客場面での利用や、通常の対話とは違った新たなコミュニケーション手段として一般に普及することに期待

概要

大阪大学大学院基礎工学研究科の石黒浩教授、吉川雄一郎准教授、小川浩平助教らの研究グループは、NTTと協働して、人とロボットとのコミュニケーション研究に基づいた三つの対話システム、「自律対話アンドロイドシステム」、「賛否感応型社会的対話システム」、「タッチパネル対話システム」を開発しました。

一般的な生活環境でも人と自律的に対話ができるロボットの開発は大きく注目されています。今回開発された対話システムはどれも、人とロボットとのコミュニケーションのあり方を異なる側面から研究することによって生み出されたものであり、今後は様々な状況での実証実験や対話コンテンツの開発を行うことで、社会への普及を進めていく予定です。特に、タッチパネル対話システムは、人とロボットとのコミュニケーションだけでなく、人間同士のコミュニケーションにおいても活用できるものであり、音声でのコミュニケーションが困難な医療現場や接客場面での利用、さらには、通常の対話とは違った新たなコミュニケーション手段として一般に普及させていくことが予定されています。

本研究成果は、2016年3月14日(現地時間)にアメリカ・テキサス州で開催された世界最大規模の展示会「South by Southwest(サウス・バイ・サウスウェスト)」で公開し、USA TODAYの一面に記事が掲載されるなど、注目を集めました。

今回発表した三つの対話システム:
(左)自律対話アンドロイドシステム、(中央)賛否感応型社会的対話システム、(右)タッチパネル対話システム

研究の背景

ロボット開発の広がりとともに、ロボット研究は人と関わるロボットの研究に焦点を移しつつあります。中でも特に、一般的な生活環境でも人と自律的に対話ができるロボットの開発は大きく注目されています。このような背景のもと、石黒教授、吉川准教授、小川助教らの研究グループは、ERATO石黒共生ヒューマンロボットインタラクションプロジェクト(以下、ERATO石黒プロジェクト)において、人とロボットとのコミュニケーションの研究を進めるとともに、人と自律的に対話するロボットの研究開発を行ってきました。今回開発された対話システムは、ERATO石黒プロジェクトにおいて進められてきた研究をベースに、新たにNTTと共同研究することで実現しました。

研究の内容

今回開発したのは以下の三つの対話システムです。

(1)自律対話アンドロイドシステム:
人間酷似型ロボット(アンドロイド)用の自律対話システム。これまで大阪大学石黒研究室が開発してきたアンドロイドは遠隔操作型であり、人間との対話では操作者が必要でしたが、NTTの音声対話技術 を利用することで、操作者なしで自律的に対話する機能を実現しました。今回は石黒研究室で開発されたアンドロイド「Geminoid HI-4」に実装しました。

アンドロイド「Geminoid HI-4」

(2)賛否感応型社会的対話システム:
ERATO石黒プロジェクトは、複数のロボットによるロボット同士の対話に人間を巻き込むことで、人間同士の対話で得られるような「対話感」(対話に参加しているという感覚)を対話者に与える社会的対話ロボット「CommU」を開発していますが、これまでは音声認識を利用しておらず、会話内容に制限がありました。今回新たにNTTの音声対話技術と組み合わせることにより、人間側の意見の賛否に応じたより高度な対話が可能になりました。

社会的対話ロボット「CommU」

(3)タッチパネル対話システム:
タッチパネルを使った対話システム。発言の選択肢をタッチパネルに表示されるものに限定することにより、音声認識が難しい状況での対話を実現しました。加えて、選択された発言は読み上げられるため、対話が実際に音声として交わされることになり、自然な対話が可能となります。ロボットと人との対話だけでなく、実際に言葉を交わしての対話が困難な状況での人間同士の会話にも利用できます。

タッチパネル対話システム

また、これらの対話システムを公開したサウス・バイ・サウスウェストでは、石黒教授、吉川准教授、小川助教に加え、今回使用された音声対話技術の開発に携わったNTTの東中竜一郎主任研究員も登壇し、これらの対話システムを含むERATO石黒プロジェクトで開発した最新のロボット技術、およびNTTの音声対話技術について解説しました。

技術解説をする石黒教授、吉川准教授、小川助教、東中主任研究員(左から)

本研究成果が社会に与える影響(本研究成果の意義)

今回開発された対話システムはどれも、人とロボットとのコミュニケーションのあり方を異なる側面から研究することによって生み出されたものであり、今後は様々な状況での実証実験や対話コンテンツの開発を行うことで、社会への普及を進めていく予定です。特に、タッチパネル対話システムは、人とロボットとのコミュニケーションだけでなく、人間同士のコミュニケーションにおいても活用できるものであり、音声でのコミュニケーションが困難な医療現場や接客場面での利用、さらには、通常の対話とは違った新たなコミュニケーション手段として一般に普及させていくことが予定されています。

特記事項

今回開発された対話システムは、これまで本研究グループが科学技術振興機構(JST)戦略的創造研究事業 総括実施型研究(ERATO)石黒共生ヒューマンロボットインタラクションプロジェクト(http://www.jst.go.jp/erato/ishiguro/)において進めてきた研究に基づいており、新たにNTTと共同研究することで開発されたものです。

また、今回開発された対話システムが公開されたサウス・バイ・サウスウェストは世界最大規模の展示会であるだけでなく、投資家や企業経営者、米国政府関係者なども多数来場する著名な総合展示会としても知られています。特に今年は、バラク・オバマ米国大統領が基調講演を行ったことで注目を集めており、今回開発された対話システムを使用した石黒教授の講演は、アメリカの全国紙「USA TODAY」の3月15日付け紙面の一面に記事が掲載されるなど、オバマ大統領の講演と並ぶ今年のサウス・バイ・サウスウェストの目玉だとして、評判になりました。こうしたことから、今回の対話システムの公開は、大阪大学のロボット技術の国際的な社会普及につながることが期待されます。

用語解説

※ NTTの音声対話技術
今回公開された対話システムでは、NTTが開発した以下の音声対話技術が使用されています。

1.耐騒音集音技術
複数の汎用小型インテリジェントマイクと音響信号処理技術の組み合わせで実現されている、騒音環境下でも高精度の音声認識を可能としたインテリジェントマイク技術*。音の到来方向、周波数特性、時間的な変動特性を利用することで、目的音の劣化を抑えつつ、周囲雑音のパワーを低減させることで、目的音のクリアな集音が可能。
*(参考)http://www.ntt.co.jp/news2014/1409/140924a.html

2.音声認識技術
Deep Learning(深層学習)を活用した音響モデリングによる高い認識性とWFST(重み付き有限状態トランスデューサ)と呼ばれる状態遷移モデルによる最適な探索ネットワークにより大語彙でも高速・高精度を実現した音声認識技術。

3.雑談対話技術
大規模なテキストデータを言語処理により構造化し、対話知識とすることで、幅広い話題に対応する雑談対話技術と文脈上不適切な発言を高精度に抑制する破綻検出技術。

4.機械翻訳技術
大規模なテキストデータから高精度かつコンパクトなモデルを学習する言語解析技術と、異なる言語間の語順の違いを解消する事前並べ替え技術、大量の対訳データから自動的に翻訳の知識を学習する統計的機械翻訳技術により、高精度な機械翻訳を可能にしました。

参考URL

大阪大学大学院基礎工学研究科 システム創成専攻システム科学領域 石黒研究室HP
http://www.irl.sys.es.osaka-u.ac.jp/

この組織の他の研究を見る

Tag Cloud

back to top