機械翻訳の研究を通して ディープラーニングの 限界突破に挑む。
越前谷先生の専門はディープラーニングの技術を使った機械翻訳の研究です。アイヌ語のように、今では話せる人が少なく、データ量が限られた言語であっても、高い精度で翻訳できる機械翻訳の技術を研究しています。授業では、ビッグデータを解析して有益な情報を取り出すテキストマイニングを実践。話題の生成AIをはじめとした人工知能について、歴史から仕組みまで幅広く扱う講義も担当しています。
解析技術の基礎、テキストマイニングを実践。
——生命工学科ではバイオだけではなく、情報についても学びますが、それはなぜですか?
現在はどの分野においても、膨大なデータを扱うことが求められています。例えばDNA配列やタンパク質の構造などのデータがオープンソースとしてインターネット上にどんどん集積されていますが、そのビッグデータを解析し、内在する知識をいかに引っ張り出せるかが重要になってきています。
データマイニングという言葉があります。マイニングは採掘と訳されますが、膨大なデータから「知識」という宝物をマイニング(採掘)するにはコンピュータの力が不可欠。情報を学ぶことは、皆さんが将来を切り開くにあたって大きな強みになるはずです。ですから、生命工学科ではバイオだけでなく、プログラミングの知識もきちんと身につけられるようカリキュラムを構成しています。
——先生が担当されている情報系の科目には、どのような授業がありますか?
2年次に開講する「テキストマイニング」では、大量の文章データから言語処理技術を活用して有益な情報を取り出すテキストマイニングを実際に体験します。学生一人ひとりがコンピューターに向かい、私の用意するシステムを使ってデータの分析を行います。例えば、ある観光地に関してSNSのポストを収集し、ビッグデータから重要語を抽出。その観光地について、多くの人がどういった場所や食べ物に注目しているのかを分析します。あるいは、膨大なテキストが何に関する情報なのかをAIの技術を活用して自動的に分類します。私が提供するプログラムを使って、たくさんの文章の中から食べ物に関する単語を集めて分類し、単語間の関係性を図にして表すといったようなことを行います。
——すごい! 実際の投稿から観光地の分析ができてしまうんですね。
情報技術と聞いても範囲が広すぎて、一体何ができるのかをイメージすることは簡単ではありません。この科目ではテキストマイニングの体験を通して、情報技術の可能性や面白さを感じてもらえたらと思います。また、3年次の「人工知能概論」では、ディープラーニングをはじめとしたAIの分野について、その歴史から仕組みまでを幅広く学びます。日進月歩のAI技術ですが、まだまだ万能ではありません。AIが得意なこと、苦手なことを知る中で、どう使えるのかというところまで理解を深めます。
ディープラーニングの弱点を克服したい。
——越前谷先生はどんな研究をしていますか?
自然言語処理分野の一つである機械翻訳の研究を行っています。自然言語とは、人間が実際にコミュニケーションを図るための言語です。日本語や英語がこれに当たります。ChatGPTを使ったことのある方もいると思いますが、今日ではディープラーニング技術の活用により、あたかもコンピュータが言葉の意味を理解しているかのような高度かつ汎用的な受け答えが可能になっています。私自身は、ディープラーニング技術を用いて機械翻訳や翻訳のための自動評価の研究に取り組んでいます。
主な研究テーマの一つが、低資源言語と呼ばれる資源の乏しい言語の機械翻訳です。アイヌ語は現在、言語データが十分にあるとはいえません。そのためディープラーニングを活用してアイヌ語を日本語に、あるいは日本語をアイヌ語に機械翻訳しようとしても、ディープラーニングは基本的に大量のデータがないと学習をしてくれないので、なかなか翻訳の精度が上がりません。AIといえどもデータの乏しい対象には弱いのです。
こうしたデータの少ない言語を対象としながら、技術的にデータを無理やり増やすのではなく、ディープラーニングの内部構造を高度にすることで翻訳の精度を上げる研究に取り組んでいます。このような技術が発展すれば、例えばデータが少なくても生成AIが対応できるようになり、不得意な分野がなくなっていくので、AIはさらに人間に近づくことになるでしょう。
——AIの弱点を克服するということですね。先生は、この分野のどんなところに惹かれるのでしょうか?
そうですね。コンピュータが言葉の意味を理解する。それを研究することは、そもそも「言葉の意味とは何か?」を突き詰めることなんです。そしてそれは結局、「人間とは何か?」を考えるところに行き着きます。赤ちゃんは成長する過程で言語能力を獲得していきますが、それは生得的に備わっている能力だという研究者もいれば、環境によって身につくものだと主張する研究者もいて、それを巡る論争は今もなお繰り返されています。私の場合はコンピュータに自然言語を処理させることで「言語能力の獲得」を再現しようとしていますが、コンピュータでそれをやるには、何が足りず、何ができれば人間と同じように言語処理ができるのか、探し続けているわけなんです。そういう意味では、自然言語処理分野はエンジニアリングなんですけれども、サイエンスの部分を多分に含んだ分野であって、それを探究する楽しさがやっぱり私の根底にあるのだと思います。
——研究の対象はコンピュータですが、その先には人間探究という大きなテーマがあるんですね。最後に、これから大学生になる皆さんへのメッセージをお願いします。
はい。大学はさまざまな人と出会える場です。自分とは異なる価値観の人たちと接する機会を持つことは、自分自身の成長の糧になります。学生同士の出会いはもちろん、教員との出会いもあります。私は北海学園大学を卒業していますが、卒業研究で恩師と出会わなければ研究の道に入ることもなかったでしょう。大学は、自分に何が向いているのか、自分は何をしたいのかを探る場でもあります。夢中になれる何かを見つけるために、受け身ではなく、チャレンジ精神を持って何事にも積極的に取り組んでほしいと思います。
関連記事
新着記事
-
ディスプレイに欠かせない 液晶分子が織りなす 秩序構造に魅せられて。
工学部 電子情報工学科電子情報工学科 -
現役経営者に学ぶ 生きた経営学が 面白い。
経営学部2部 経営学科2年2部(夜間部) 経営学科 -
座学の知識が 実習で合致する。 その達成感が喜び。
工学部 電子情報工学科4年電子情報工学科 -
安全・快適性と意匠性。 無謀な取り組みを解決する それが建築の仕事
工学部 建築学科建築学科 -
ニュースや企業の 裏側が見えてくる。 それが学びの面白さ。
経済学部2部 地域経済学科2年2部(夜間部) 地域経済学科 -
「プロ野球が大好き!」 趣味が学びに繫がった 意外な分野との出合い。
経営学部1部 経営情報学科2年経営情報学科