01
23 2023

「曖昧さ」が苦手な コンピュータの手助けを。

工学部電子情報工学科 内田 ゆず 教授

「ごろごろ」というオノマトペ(擬音語・擬態語)には、①雷が鳴る音②大きくて重たいものが転がる音③何もせずに無駄に過ごしている様子④猫がのどを鳴らす音⑤異物があって違和感がある様子、など多くの意味があります。こうした意味の曖昧さは、コンピュータにとっては扱いにくいものです。オノマトペの意味を適切に処理できるように、内田先生は研究を進めています。

オノマトペのデータベース構築へ。

–自然言語処理の技術を、私たちは日常的に使っているのですね。

そうです。「自然言語」は人間が普通に使っている言葉のこと。「自然言語処理」とは、人間の言葉をコンピュータで処理するための技術です。現在の人工知能を支える技術でもあり、幅広い応用分野があります。日常生活にたくさん取り入れられていて、例えばパソコンで文章を書く時に日本語で入力できるのも自然言語処理の技術のおかげです。ほかに高校生の皆さんにも身近な例としては、Web検索エンジン、機械翻訳、迷惑メールフィルター、SiriやAlexaなどの音声アシスタントといったものがあります。

–中でも先生が研究に力を入れているのが日本語「オノマトペ」。

ええ。コンピュータは1か0かという世界なので、言葉が持っている曖昧さみたいなものは大変苦手です。特にオノマトペには、意味を明確に定義できない、複数の意味を持つ、意味が変化しやすいという特徴があり、意味の曖昧さがコンピュータでオノマトペを処理する際の障壁になっています。この問題を解決するための研究として取り組んでいるのが、オノマトペデータベースの構築です。人間はオノマトペの周りにある単語から、オノマトペの意味を理解します。そこで、オノマトペ周辺の単語とオノマトペをペアにして意味と結びつけたデータベースを構築し、コンピュータがオノマトペの意味を理解する手助けをしようとしています。

–研究はどのように行っていくのですか?

オノマトペの用例を大量に収集・分析しています。最近は漫画も扱っていますが、文章中に出てくるオノマトペとは種類も使われ方も違うことがわかって、面白さを感じています。例えばドアが閉まった状態の絵だけが描かれていると、ずっと閉まっていることになると思いますが、そこに「バタン」とか「ガタン」と書いてあると、今閉まったんだなと分かる。静止画の漫画にオノマトペを加えることで、動きを伝えることができるようになるわけです。ちなみに漫画は世界中でブームになっていますが、日本語のオノマトペは種類が豊富で使われ方も独特なので、ほかの言語では対応する言葉がなく、翻訳できずに困るとか。私たちはオノマトペの意味を直感的に理解して使い分けていますが、日本語を母語としない人たちやコンピュータには難しいものなのです。こうした私の研究は、言語学や認知科学などの分野の知識も必要です。”文系”の先生たちと一緒に研究することも多いのですが、”理系”的なアプローチで研究をしている先生もいっぱいいます。学生はよく理系・文系と分けて考えますが、そういった枠組みにとらわれないでほしいですね。学問はそんなに簡単に分割できるものではありませんから。

失敗も研究成果に。

–卒業研究では、学生はどんなことに取り組むのでしょう?

学生自身が興味を持っていることと、自然言語処理の技術を組み合わせることが多いです。本人に興味のあることの方が頑張れるかなと思いますし、自然言語処理の場合は、言語のデータさえあれば分野を問わず研究テーマにできます。これまでには例えば、日本史に興味のある学生が受験対策用の日本史一問一答問題を自動生成するシステムを作ったり、サッカーが好きな学生がwebサイトにあるサッカーの試合のテキスト速報から実況コメントを生成するシステムを作ったりしました。一人ずつテーマを決めて、自分で何かを考えて作ったという経験を持って卒業してほしいと思っています。

–研究活動にはどんなステップがあるのですか?

まず自分で課題を設定し、解決する方法を考えます。それをプログラムに落とし込んでシステムを構築し、評価・考察します。工学は人の役に立たなければならない学問なので、作って終わりではなく、役に立つかどうかを証明しなければなりません。たとえ失敗しても、評価はする。なぜ失敗したかを論文に書ければ、それでいいんです。学生は完璧なものを作らなければという気持ちが強いようですが、授業と違って研究は簡単には解けないことをやっているわけですから、失敗した原因が分かればそれも一つの研究成果。こうやったら失敗するということが分かれば、ほかの人は失敗しなくて済むからいいんだということを、最初に繰り返し伝えます。できそうなことしかやらないのではなく、面白そうと思えるテーマに挑戦してもらいたいですね。

–最終的には論文のほかに、研究成果をプレゼンテーションするのですね。

2月に学科として卒業研究発表会を行うので、そこで各自がプレゼンをします。プレゼンが苦手な学生も多いので、私の研究室では毎月1回進捗報告会みたいな形で発表し、練習の場にもしています。毎回資料を作るので、最終的な発表の時にそれを流用できるという利点もあります。研究の各ステップを経験することで、問題を発見・解決する能力、計画・管理能力、プログラミング能力、プレゼンテーション能力など幅広いスキルが身につき、社会に出て試行錯誤していく時にも役立ってくれるのではないかと考えています。

–内田研究室で大切にしていることは?

自分の研究テーマはもちろん、ほかのメンバーの研究にも興味を持ってほしい。メンバーの前でプレゼンを行うのも、それが目的の一つです。テーマは違っても、基礎の部分は一緒だったり、共有できる部分が多いんです。勉強したことが、お互いの役に立てばいいですよね。そうやって学生同士がコミュニケーションを図りながら研究に取り組めるのが、研究室の意味かなと思っています。

工学部電子情報工学科 内田 ゆず 教授
[専門分野]自然言語処理  [主な担当科目]基礎演習、プログラミング序論Ⅰ・Ⅱ、計算機実習Ⅱ、自然言語処理

関連記事

NEW

新着記事

カテゴリ