夢ナビWebセレクション

岡山大学 工学部の教員によるミニ講義

関心ワード
  • 合成、
  • アニメ(アニメーション)、
  • 人間(人・ヒト・人類)、
  • 言葉、
  • 音声、
  • 感情、
  • イメージ、
  • コンピュータ、
  • データ、
  • 電話、

人間の声に近づいている、音声合成処理技術

音声データを組み合わせる

 音声合成処理は進歩し、コンピュータがしゃべることは珍しくなくなりました。パソコンに打ち込んだテキストを音声で聞くことができます。この技術は「あ」や「い」などの音素を認定して音声を組み合わせているものです。これは声優などの声を20時間ぐらい録音して、その声を分割して組み合わせています。声のどこからどこまでが「あ」なのか、「い」なのかをデータにして再生しています。例えば「わかやま」を再生する時は、「おかやま」の文字列の中の「かやま」はそのまま利用して、冒頭に「わ」を持ってきて組み合わせています。このようにして、大量の音声データから音素を探し出して再生が行われています。

感情を表現する方法とは

 しかし現在の合成音声はロボット的な言葉で、感情がありません。もっと人間の声に近づけるために、感情を表現する研究が進められています。感情のこもった声を録音すればいいと言う人もいますが、喜怒哀楽など人間の感情はバリエーションが豊富で、すべての感情がこもった声を用意することはとても不可能です。そこで、普通にしゃべった言葉を加工して感情のこもった表現にします。コンピュータで処理して、声の大きさや高低を変えるのです。さらにもっと加工すると、全く別人の声に変えてしまうことも可能です。

イメージに合った声を作る

 会社などが電話で自動応答する場合、合成音声を使うケースが増えつつあります。しかし会社のイメージと合わない声では、電話をかけてきた人に悪い印象を与えてしまいます。電話の声も会社を代表しているので会社のイメージを大切にするのは当然です。そこでイメージに合った声に加工することが求められます。またアニメなどでは、登場人物のイメージの声に近づけるために声を変えることが必要です。
 元がいくら人間の声でも、加工して変換するとどうしても機械的な「音」になってしまいます。今後はもっと人間らしい「声」に近づける音声処理の研究が待たれています。

1.0倍速 1.4倍速

コンピュータがしゃべる。どうやって?

夢ナビライブ2014 東京会場

アイコン

滑らかな音をつくるには・・・

アイコン

講義を視聴する(1分 その2)

アイコン

講義を視聴する(1分 その3)

アイコン

講義を視聴する(30分)

この学問が向いているかも 情報工学


工学部 情報系学科 教授
阿部 匡伸

先生の他の講義を見る
メッセージ

 大学では、高校の延長で座学もありますが、なんといっても面白いのは4年生になってからの卒業研究と大学院に行ってからの研究でしょう。非常に楽しいと思います。3年生までの勉強はその準備期間です。自分の好きなことを見つけて、学び考えながら新しいことを創造していきます。工学部は自分の考えた新しいことを作っていけるのが非常に魅力的です。偏差値だけを気にするのではなく、「どの大学にどんな研究があるのか」「どのような先生がいるのか」を調べて、進学する大学を決めるのがよいでしょう。

先生の学問へのきっかけ

 私が大学生だった頃のコンピュータは、やらせたいことをプログラムし、計算結果を数字で表示させるだけの「無味乾燥なもの」でした。そんなと き、人間が音声でコンピュータに命令したり、コンピュータが人間に音声で答えてくれるという研究に出合ったのです。「音声対話は人間にしかできない知的な活動のはずなのに、一体どうなっているんだろう?」と思ったのがこの分野に入ったキッカケです。そして、人間とコンピュータが音声でコミュニケーションできれば、夢のような世界が開けるのではないかと期待したのです。

先輩たちはどんな仕事に携わっているの?

システム開発会社ソフト設計、システム開発会社ソフト開発、メーカー研究員、メーカー開発業務、メーカー営業

TOPへもどる

夢ナビロゴ

夢ナビ編集部copyright(c) 2008- Frompage Co.,Ltd. All Rights Reserved.