生成AIで何が変わり、何が変わっていく？――自然言語処理研究者×グロービスAI経営教育研究所が語る2023年と2024年後編

生成AIで何が変わり、何が変わっていく？――自然言語処理研究者×グロービスAI経営教育研究所が語る2023年と2024年後編

テクノベート

投稿日：2024/01/02更新日：2024/01/05

昨年2023年を象徴するトピックである、生成AI／ChatGPT型AIシステム及びそれが活用する大規模言語モデル（LLM：Large Language Model）の進化。今回は、海外の研究機関でLLMを含む自然言語処理（NLP：Natural Language Processing）を専門として研究に取り組む栗林樹生氏をゲストに招き、グロービスAI経営教育研究所（GAiMERi）のメンバーとで行った鼎談の模様をお伝えする。

前編では栗林氏のご専門からNLPの研究により明らかになること、そしてアカデミアとビジネスそれぞれの観点で2023年に起きた変化を振り返った。後編となる今回は、2024年に期待される変化、その中でビジネスパーソンがサバイブする方法について考える。

2024年に期待される「オープンソースLLM」と「マルチモーダル」による進化

――ここまで、NLPやAIなどの領域の中で起きた2023年の変化などについてお話ししてきました。これを踏まえて、2024年にはどういったことが起きそうか。また、そのために企業や個人はどうすべきなのか、考えてみたいと思います。

栗林樹生（MBZUAI研究員）：いまのアカデミアにおけるトピックのひとつには、ニューラルネットワークや深層学習によるアウトプットがなぜ「うまい」出力をするのか、経験的に観察できるだけで真に理解は出来ていないということがあります。特に、ほとんどのモデルやデータがクローズドで、ブラックボックスのようなところにAPIを叩くしかないという状況が足枷になっていました。
モデル作成の観点では、例えば、ChatGPTは「なぜか」日本語を喋れるのですが、あのアウトプットをするにはどれくらい日本語のデータが学習ベースに混じっていればいいのか、外からはわかりません。モデル出力の観点では、なぜその答えを出したのか、人間が納得できる説明を示せることも社会実装の観点で重要ですが、これも仕組みの理解までたどると、やはりモデルの内部を見ざるを得ません。

幸いにも2023年を通し、中で起きている処理にアクセス出来るなどのオープンかつ強力な言語モデルが徐々に公開されてきています。それらを分解して、現象の理解に努めていくことが、アカデミアではこれから間違いなく大事になるだろうと考えています。

なぜその答えを出したのか、人間が納得できる説明を示せることは社会実装においても重要です。そういった観点でも、先ほどお話しした私の研究テーマである「人間の言語の理解に迫る」というのも、こうした認知的な妥当性という観点からの言語モデルの理解に通じると期待しています。

また2024年以降、画像や音声、動画などのマルチモーダルな要素と言語との結びつきは一層強まっていくと思います。
例えば人間がイヌという単語を学ぶとき、実際にイヌの実体に紐づけて理解が進むはずです。しかし通常の言語モデルというのは、この世界の実体についてある種、何も知らずに、ただひたすら単語の列だけから何かを学ぼうとしているわけですよね。このような「実体に紐づいていない」という批判は長年自然言語処理に対して向けられてきたわけですが、マルチモーダルなモデルによって「どううまく紐付けるか」というより実践的な解決に向かっていくのだと思います。

梶井麻未（GAiMERi主席研究員）：OpenAI社が提供するサービス「DALL・E」のように自然言語のプロンプトからさまざまな画像を生成できるAIは、自然言語と画像が結びついているわけですね。

栗林：画像の次は動画、そして更に今度は仮想空間上、もっと行けばロボティクスなどとの融合にも及んでいくでしょう。いまのChatGPTは物を取ってくれたり皿を洗ってくれたりはしないわけですが、ロボティクスと融合すれば、いよいよ人間の労働力の代替などの話題が出てくるのかもしれません。

鈴木健一（GAiMERi所長）：例えばGAiMERiが開発に取り組む自然言語テキスト解析エンジン「GAiDES」を搭載したレポート採点システム^※1も、いまはグラフなど画像の採点には導入できていません。ですがこれは、ある程度近いうちに乗り越えられるかもしれません。あるいは、先ほどお話ししたチャットボットも、テキストベースに限る必要は全くなく、アバターとの音声会話形式で疑問を解消できるなどもいいかもしれない。マルチモーダルな生成AI活用が発展すると、相当いろんな可能性が広がるのではないでしょうか。

思考力は「人の思考力×AIの思考力＋ベースとしての体系的知識」に

――そうした流れがある一方で、ビジネス現場において個人や企業はどんなことに取り組んでいくべきなのでしょうか。

鈴木：先ほど話題になったハルシネーションを含め、いまは改めて使う側の思考力がかなり求められていると思っています。社会全体としての思考力が「人の思考力×AIの思考力（言語モデルの力）＋ベースとしての体系的知識」となっていくからです。AIを使うことで、単独では思考力に自信がなかった人が力を発揮していく可能性もなきにしもあらずなんですよね。

同時に、AIを使う人と使わない人との差は広がるでしょう。少し触ってみたけど、ハルシネーションに「噓じゃん」と感じて使わなくなってしまっているとしたら本当に残念です。掛け合わせの能力としてぜひそれぞれを伸ばすことを意識していって頂きたいですね。

佐々木健太（GAiMERi主任研究員）：「使ってみる」に大事なのは知的好奇心かなと思います。新しいものができたとき、知的好奇心を持っていれば、例えハルシネーションに遭ったとしても、じゃあ正しい答えを得るにはどうすればいいか？そもそも仕組みはどうなっているんだ？など、どんどん調べていくと思うんです。

更に一歩引いて考えてみると、知的好奇心の必要性は生成AIに限った話ではありません。例えばプログラミングという仕事であれば、優秀なプログラマーは知的好奇心が旺盛で、コンピュータはなぜ動くのか？プログラムはなぜ動くのか？をどんどん深掘りして知識を増やしていく。そういった面では、ビジネスパーソンとして求められるスキルや能力はどの領域でも引き続き変わらないということかもしれません。

鈴木：現状の言語モデルだけだとまだまだできないこと、欠点もたくさんありますが、システム開発の工夫など工学的なソリューションと掛け合わせることなどによって、これからどんどん解決していくのだと思います。例えば、指示自体もプロンプトで目的を与えれば、ある程度その目的の達成方法を自律的に考え、必要な情報をネットで検索したり、データベースから持ってきたりすることもできるAIエージェントのような存在もでてきています。すると、一般のビジネスパーソンもAIを用いてよりたくさんのことができる世界が目の前に広がっていくでしょう。このあたりは非常に注目していますし、楽しみにしてるところではありますね。

「掛け合わせ」によって新しい扉が開かれる

佐々木：産業界を見ていて思うのは、確かにみんなChatGPTの登場で衝撃を受けていますが、英会話など限られたものを除くと「ChatGPTの影響で事業の構造やお金の動きが大きく変わった」というような破壊的なアプリやサービスは出ていないと思っています。2024年はこれをどこがどう作ってくるのか、というところは注目したいですね。

栗林：同感です。日本でも、産業界から同規模の言語モデルが複数作られてきていますよね。それ自体は重要なことだと思いつつ、各々が各々のモデルを作ってもエコでないですし、必ずしも大きなモデルを作ることだけが目的・差別化点ではないはずです。
作った先でどう活かすか、どうモデルを制御するか、ユニークな性質を持ったモデルの公開など、多様な目的感で取り組んでみることも大切なのではないでしょうか。

梶井：人間の思考力とAIの思考力の掛け合わせ、そしてAIと工学ソリューションの掛け合わせなどが大切になるということは、新しいものをつくるときには、改めてアカデミアの皆さんと企業などビジネス界が連携し「掛け合わせ」で模索していくことも大切なのだろうと思います。

鈴木：単独では解決できないからこそ、掛け算が大切です。そういった意味では、僕らの持っているものと栗林さんたちが持っているものを掛け算することで、いままでも色々な新しいものを作ってこれましたし、これからも作れるんじゃないか、と思っています。

栗林：新しいものとは基本的に、何かと何かの新しい組み合わせであることが多い。例えばコンピュータが世に普及した頃、「計算〇〇学：コンピュテーショナル〇〇〇」という分野がいくつも生まれました。いまは恐らく「LLM〇〇〇」という分野・産業がいくつも生まれようとしているでしょう。何にでも掛け合わせて考えてみることはできる。特に言語は人間の活動から切っても切り離せないからこそ、誰も人ごとにはできないはずです。

AIが普及してきたことにより、アウトプットの差別化の難しさやそこからの競争の激しさというのはまさに研究者としても感じているところですし、GAiMERiの皆さんも感じておられると思います。特に世界では、研究の速度はこれまで以上に上がっていますし、企業の所属を含め、周辺分野の研究者がどんどん参入してきています。GPU^※2をはじめとする計算リソースの争奪戦などは輸出規制などの政治も絡みつつ話題になっており、どうやって持続可能な研究をしていくかなども含め、課題はたくさんあります。

ですが客観的に見て、生成AIの台頭により、「これをどう使い倒そう・どう立ち向かおう」という前向きな思考・妄想・活力が掻き立てられているのではないかと感じています。個人としても、分野の激動の中で積極的に外に出ながら、より研究を深め、広げていければと思います。

梶井：2023年はこれだけ汎用性の高い、基盤となる技術やサービスが出てきました。2024年はビジネスや社会に直結するユースケースがどんどん出てくるのではないかと思います。
我々も教育サービスへの実装を軸に、新しいことにチャレンジし続けたいと思います。

――本日は貴重なお話をありがとうございました。

＜参考＞

※1 グロービス、AIによる自然言語テキスト解析エンジン「GAiDES」を開発〜レポートやエッセイ評価の支援ツールとして活用へ～｜グロービス

※2 GPU：Graphics Processing Unitの略。小型で特殊なコアを多数搭載した演算装置、プロセッサー