夢ナビ夢ナビは、さまざまな言葉をデータベースから検索・閲覧し、将来の進路を決める“きっかけ”を提供します。

講義No.08570

コンピュータは自ら学習する時代! でも苦手分野もある!

AI開発にも関連する自然言語処理とは?

 人間の言葉をコンピュータに理解させたり、処理させたりする技術を「自然言語処理」と言います。言語学的側面を強調して「計算言語学」と呼ばれることもあります。自然言語処理は、データの入出力にテキスト(文字データ)が関係する、あらゆる領域で使用される技術であり、身近な例で言えば、機械翻訳や日本語入力、検索エンジンなどに応用されています。

コンピュータが自分で学習する?

 1980年代くらいまでは、コンピュータに人間の言葉を学習させるには、まず人間が、どの単語が主語になり、どの単語が述語になるかなどのルールを手作業で記述し、基礎となる知識をコンピュータに与える必要がありました。しかし、90年代以降はコンピュータが人間の作ったテキストから自動的にルールを抽出することができるようになりました。これを機械学習「マシンラーニング」と言います。
 インターネットの普及により、ウェブ上に大量のテキストが公開されるようになってからは、それらの膨大なデータを使ってより効率的な機械学習が可能になりました。また、深層学習「ディープラーニング」と呼ばれる大規模かつ高精度な学習も可能になり、注目を集めています。Googleの開発したAlphaGoと呼ばれるコンピュータ囲碁は2016年に世界チャンピオンを破りましたが、深層学習の上にコンピュータ同士を対局させる強化学習と呼ばれる手法を用いています。

コンピュータの意外な苦手分野とは?

 コンピュータの言語処理能力は機械学習により飛躍的に向上しました。しかし、いまだに不得意な分野もあります。それは、文章の前後の関係性や、単語の背景知識などの「文脈を理解すること」です。
 例えば、日本語の日常会話では、主語が省略されることがよくあります。人間なら文脈から主語が誰か、あるいは何かを判断することができますが、コンピュータにはその判断が難しいのです。コンピュータに文脈を理解させることは、自然言語処理の分野におけるこれからの重要な課題と言えます。

計算言語学への招待 ~コトバを科学する~

夢ナビライブ2017 東京会場

アイコン

単語の類似度をベクトルで計る!?

アイコン

深層学習で言葉を分析するとは?

アイコン

統計的機械翻訳発展の経緯

アイコン

講義を視聴する(30分)

この学問が向いているかも 自然言語処理学

首都大学東京
システムデザイン学部 情報科学科 准教授
小町 守 先生

先生の他の講義を見る 先生の著書
メッセージ

 私は文系の学部から理系の大学院に進学し、両方の分野を経験しました。その上で必要な知識を振り返ると、必須スキルは「読み、書き、そろばん」ではなく「英語、数学、プログラミング」です。理系分野は文系以上に英語が国際語で、実際に仕事で英語をバリバリ使うのは文系ではなく理系です。文系分野は数学の知識の有無で統計的な嘘にだまされるかに決定的な差がつきます。どちらの分野でも、繰り返し作業をしたり漏れなく処理したりするにはプログラミングが必須です。これらのスキルを身につけて、大きく活躍してください。

先生の学問へのきっかけ

 中学生の時から語学に興味があり、ラジオでいろいろな語学番組を聞くのが好きで、将来は言葉に関する勉強がしたいと思い、大学では哲学や言語学を学びました。在学中に「国立国語研究所」でアルバイトをしたことがきっかけで、人間の言葉をコンピュータに理解させたり、処理させたりする技術「自然言語処理」と出会いました。
 その後、大学院で本格的に自然言語処理を研究するようになるのですが、それまで人文系の学問として言語学を学んでいたこともあり、コンピュータ・サイエンスの基礎となる数学の勉強ではとても苦労しました。

先輩たちはどんな仕事に携わっているの?

ウェブ開発企業ソフトウェアエンジニア/AI開発企業ソフトウェアエンジニア

大学アイコン
小町 守 先生がいらっしゃる
首都大学東京に関心を持ったら

 東京都立大学(現首都大学東京)は「大都市における人間社会の理想像の追求」を使命とし、東京都が設置している公立の総合大学です。人文社会学部、法学部、経済経営学部、理学部、都市環境学部、システムデザイン学部、健康福祉学部の7学部23学科で広範な学問領域を網羅。学部、領域を越え自由に学ぶカリキュラムやインターンシップなどの特色あるプログラムや、各分野の高度な専門教育が、充実した環境の中で受けられます。

TOPへもどる