夢ナビ

未来の音声対話システムは、どう進化するのだろう?

講義No.10723

案内ロボットはどう声を聞き分ける?

 ショッピングモールなどの施設に、音声案内システムが置かれるようになってきました。話しかけると目的の場所などを音声で案内してくれます。これはどうやって質問の声と、関係のない声とを聞き分けるのでしょうか。普通には声の大きさで判断しますが、よりよい1つの方法は、声がどの距離から届いているかを推定することです。遠くからの声は室内の反響があり、音声が不明瞭になるので、関係のない声だと判断できます。また、顔がカメラに向いていたら質問者、横や後ろを向いていたら関係のない人だと、画像認識で判別する方法もあります。

音声の特徴を見つけて学習する音声認識のスゴ技

 スマホなどにも利用されている音声認識には、3つの技術が活用されています。1つは話者の音声を「あ」「い」のように短く切って周波数を分析し、それが50音のどれに近いかを識別する「音声モデル」。2つ目は単語の並びのパターンから、次にどの単語がくるかを予測する「言語モデル」。3つ目は、適切な単語列(=文)を効率的に見つける「探索」です。
 これらを用いた音声認識の精度を上げるために、コンピュータが、多人数かつ大量の音声データを基に音声の特徴を見つけ、的確に識別できるよう、自動で学習し、認識する仕組み、深層学習と呼ばれる「ディープニューラルネットワーク」技術が役立っています。

会話のようで、会話じゃない?

 現在の音声対話システムは、持っている情報を返すだけで、まだ「会話」になっていません。なんの話をしているかを理解して自分から話題をふったり、周囲の状況を考慮してどの質問に返答するかを判断したりすることはできないのです。そこで有益な会話をするために、環境音、例えば足音や何か物が動くときの音、笑い声なども的確に認識し、会話に役立てることに着目する研究が始まろうとしています。返答に笑いがおこったら「変なことを言ったかな」と反省する音声対話システムも、やがて登場するでしょう。

この学問がむいているかも情報処理学、人工知能学、音声情報処理学

愛知工科大学
工学部 情報メディア学科 教授
實廣 貴敏 先生

先生がめざすSDGs
メッセージ

 受験勉強もあって大変ですが、高校時代にしかできないこともたくさんあるので、趣味についても取り組むといいと思います。
 それがプログラミングなら、今はインターネットで欲しい情報がいくらでも得られますし、開発ができる環境も無料であるので、アプリ開発などをしてみましょう。ソフトウェアの勉強にもなりますし、ひょっとしたら売れるかもしれません。今は関係ないと思っても、将来の役に立つかもしれません。社会人になると自由な時間がなくなるので、学生のうちにやりたいことをいろいろやっておきましょう。

メッセージ

 高校時代は物理部に所属し、パソコンでゲームを作っていました。当時はパソコンが出はじめた頃で、自分でプログラミングしてつくるしかなかったのです。その後、大学の研究室見学の時に、「前」「右」などの音声コマンドで画面が変わり、迷路を解いていくデモンストレーションを見ました。「そんなことができるのか!」と感動したのが、音声の研究に関わる出発点です。卒業後は恩師の力添えもあって、NTTの研究所へ入所し、音声認識の研究の道に進みました。現在に至るのは恩師のおかげだととても感謝しています。

メッセージ

ソフトウェア開発会社プログラマー/ソフトウェア開発会社システムエンジニア/ゲームソフト開発会社ゲームプログラマー

大学アイコン
實廣 貴敏 先生がいらっしゃる
愛知工科大学に関心を持ったら

 愛知工科大学は、工学部:機械システム工学科、電子ロボット工学科、情報メディア学科の3学科を設置しています。モノづくりの盛んな地の利を生かし、1年次から始まるインターンシップや企業・自治体等と取り組むプロジェクト型授業、実験・実習を多く取り入れたカリキュラム編成など、モノづくりを体感しながら学ぶ実践的技術者教育を展開しています。また、所属学科の科目とは別にIoT技術(デジタル化技術、ネットワーク化技術、データ活用技術)を学べる学科横断型特別選抜教育となる「IoTモノづくりコース」を設置しています。

TOPへもどる