夢ナビWebセレクション

山形大学の教員によるミニ講義

関心ワード
  • スマートフォン、
  • コンピュータ、
  • 音声、
  • 声、
  • ニューラルネットワーク、
  • グラフィックス プロセッシング ユニット(GPU)、
  • 音声認識

コンピュータで自由自在に人の声を聞いたり作り出せたら……

スマホやパソコンで音声検索をする技術

 コンピュータを使って音声の処理をする技術を、「音声情報処理技術」と言います。例えば、スマートフォンに向かって「今日の天気は?」と話しかけると、コンピュータが検索をするなどして、正しい情報を人の声で答えてくれる音声検索機能は、かなり一般的になってきました。
 ただ、長い文章や話し言葉をコンピュータが正しくとらえるのは、まだ難しい段階です。なぜなら、話す人になまりがあったり、文法的に違っていたり、滑舌が悪かったりするからです。そこで、その精度をさらに上げていくことが求められています。

より精度の高い認識を実現するためには?

 コンピュータは、聞こえてきた人の声をテキストに置き換えることができますが、そのためには膨大な量の人の声のデータが必要となります。そこで活躍するのが、「ニューラルネットワーク」です。これは、脳内でさまざまな情報処理を行う神経細胞の仕組みをシミュレーションし、まねたもので、音声や画像の分野で大きな力を発揮しています。
 このニューラルネットワークにデータ処理を行うGPU(グラフィックス プロセッシング ユニット)という高性能な演算装置を使って、1000人以上の膨大な人の声のデータを読み込ませます。これによりネットワークの学習ができ、音声認識の精度を上げられるのです。

音声情報処理技術が秘めた可能性

 音声情報処理技術が高度になり、さまざまな声を自由に出せるようになると、どんなことが可能になるのでしょうか?例えば、病気や事故で声をなくした人でも、過去に録音した元の声のデータがあれば、元と同じ声を作り出すことができるかもしれません。また、人気アニメの主役の声を、永遠に変えないということも可能になるでしょう。このように音声情報処理技術が進歩すると、さまざまな可能性が広がっているのです。

1.0倍速 1.4倍速

アイコン

講義を視聴する(1分)

アイコン

講義を視聴する(1分 その2)

アイコン

講義を視聴する(1分 その3)

アイコン

講義を視聴する(30分)

この学問が向いているかも 情報エレクトロニクス学


工学部 情報・エレクトロニクス学科 教授
小坂 哲夫

メッセージ

 工学部では、人の生活にダイレクトにつながる「ものづくり」ができます。自分の作ったものが、人の役に立ったり、楽しませたりできるので、とてもやりがいがあります。
 私の研究室では、「音声とコンピュータ」について研究しています。人間の声とコンピュータでいろいろな処理をして、新しい技術を開発します。例えば、コンピュータにしゃべらせたり、コンピュータが聞いたり、人間の声を違う声に変えたりという研究をする分野です。声や音に興味がある人は、ぜひ一緒に研究しましょう。

先生の学問へのきっかけ

 子どもの頃にコンピュータの存在を知りましたが、私にとっては「名前は知っているけど、何をするのかよくわからない機械」というイメージでした。
 しかし、高校生の頃「マイクロコンピュータ」が発売され、父が「これからはコンピュータの時代だ」と言って買ってくれたのです。ただし、今のコンピュータとは異なり、テンキーと簡単な表示装置がついているだけで、使える範囲も限られていました。その後、大学の研究室を見学した際、コンピュータを使って音声を認識するというシーンを見て衝撃を受け、この分野に関わるようになりました。

先輩たちはどんな仕事に携わっているの?

情報サービス業システム・エンジニア/情報通信機器メーカー研究・開発職

TOPへもどる

夢ナビロゴ

夢ナビ編集部copyright(c) 2008- Frompage Co.,Ltd. All Rights Reserved.