夢ナビ夢ナビは、さまざまな言葉をデータベースから検索・閲覧し、将来の進路を決める“きっかけ”を提供します。

講義No.08351

言語のデータベース「コーパス」で明らかにする、日本語の使われ方

「えっと」「まぁ」「うーん」……

 私たちは普段、何気なく「えっと」や「まぁ」、「うーん」などの言葉を挟みながら話をしています。「フィラー」と呼ばれるこれらの言葉は、会話をなめらかにしたり、次に言うことが出てこないときに時間稼ぎをしたりする働きを持っています。それでは、日本語の中で一番多く使われるフィラーは、どの形でしょうか? この問いに正確に答えることは、母語話者であっても難しいでしょう。そこで力を発揮するのが、大量の言葉を記録してコンピュータで検索できるようにしたデータベース「コーパス」です。

日本語の使われ方を明らかにする

 コーパスを検索することにより、日本語がどのように使われているのか、その実態を明らかにすることができます。例えば、約651時間、752万語の講演音声を収録した「日本語話し言葉コーパス」を検索すると、日本語の講演の中で最も多く使われるフィラーは「えー」であることがわかります(122,651回、フィラー全体の25.2%)。
 では、書き言葉の中で、「たまご」「タマゴ」「玉子」「卵」のうち、最も多く使われるのはどの表記でしょうか? 「見られる」と「見れる」、「考えられる」と「考えれる」は、それぞれどれくらいの比率で使われているでしょうか? このような、母語話者が頭で考えてもわからない「日本語の使われ方」に関する問題を解くために、コーパスが必要になるわけです。

最先端の日本語研究

 日本語コーパスの開発は2000年代から本格的に始まりました。現代では、いろいろなタイプの書き言葉を収録した「書き言葉コーパス」、外国人(非母語話者)が日本語を話したり書いたりした結果を収録した「学習者コーパス」、普段の日常会話を映像つきで収録した「日常会話コーパス」など、さまざまなコーパスの開発が盛んに進められています。コーパスに基づく日本語研究は、言語学と情報科学が融合した、最先端の日本語研究と言えます。

夢ナビライブ2019 東京会場

アイコン

日本語にはさまざまな側面がある

アイコン

「コーパス」とは何か?

アイコン

「コーパス日本語学」の展開可能性

アイコン

講義を視聴する(30分)

この学問が向いているかも 日本語学

専修大学
国際コミュニケーション学部 日本語学科(2020年4月設置) 教授
丸山 岳彦 先生

メッセージ

 「考える」ということを大事にしてほしいと思います。当たり前のことを当たり前と思わず、日常の中から疑問を見つけ出して主体的に考える姿勢や、現状を客観的に把握して課題を解決する方法を考える力は、あなたが社会に出てから必ず役立ちます。
 「日本語学」は、そのような「考える」力のトレーニングには非常によい研究分野だと思います。私たちが普段「当たり前」のように使っている日本語を改めて見つめ直し、課題を見つけて解決に導く、その視力・基礎体力を養ってほしいと思います。

先生の学問へのきっかけ

 「山に登る」と「山を登る」、この意味の違いがわかりますか。私は大学で最初に受けた授業の先生から同じ質問をされました。何かが違うのはわかるけど、どう説明してよいかわからない。その時に自分が知らない日本語の世界があることに気づき、視界がぱっと開けた気がしたのです。これが研究の原点です。
 その後、話し言葉を録音して大規模なデータベースにした「コーパス」と出会い、自分の知らない日本語の姿を客観的にとらえることができると気づき、大きな衝撃を受けました。以来、コーパスを使った日本語の研究に没頭してきました。

先輩たちはどんな仕事に携わっているの?

IT企業システムエンジニアなど

大学アイコン
丸山 岳彦 先生がいらっしゃる
専修大学に関心を持ったら

 専修大学は、1880年(明治13年)に経済科と法律科からなる専修学校として創立されました。「経済科」は日本初の、また「法律科」は私学で初の高等教育機関でした。2019年に創立140年を迎える、日本でも屈指の伝統を持つ大学です。社会科学、人文科学、総合科学、の3系統、8学部20学科からなる社会人文系総合大学として、「自ら問題を見つけ主体的に解決する知力」と「人間力」、「倫理観」を持った人材を育成しています。まずはオープンキャンパスの大学紹介や模擬授業に参加して、大学の雰囲気を体感してみてください。

TOPへもどる