2023.04.13 2024.12.17

ChatGPTのような大規模言語モデルで知っておくべき8つのこと

松原太一

毎日話題が尽きない、対話型AIのChatGPTは大人気ですよね。先日、開発元であるOpenAI社のサム・アルトマンCEOが来日し、岸田首相と面会して、日本にも拠点を置くと明言したニュースも話題になりました。

ChatGPTに関する4月2日に公開された最新の論文のプレプリントで面白いものがあったので、紹介したいと思います。論文タイトルは、”Eight Things to Know about Large Language Models”（大規模言語モデルについて知っておくべき8つのこと）です。

大規模言語モデルとは

この論文ではその名の通り、大規模言語モデルに関して考慮すべき、8つの重要なポイントが解説されています。大規模言語モデル（LLM）というのは、深層学習アルゴリズムを用いて人間の言語を分析・生成する、コンピュータープログラムのことです。書籍や論文、Webサイトなどの膨大なテキストデータを用いて学習されます。

ChatGPTはその最たる例で、2022年11月にOpenAIがリリースし、瞬く間に話題となったチャットモデルです。論文を解説したり、コードを生成してくれるので、研究効率と仕事効率がものすごく上がります。

この論文の意義

この論文の意義は、ユーザーや研究者、政策立案者、そして専門家たちがより適切な判断を下すための、知識を提供することです。大規模言語モデル（LLM）に関する議論や評価において、重要かつ驚くべき点が整理されています。

この論文における著者の主張は、以下の8つです。それぞれの主張はすべて、科学的なファクト（事実）に基づいています。

LLMは、技術的革新がなくても、投資を増やすだけで性能が向上する
多くの重要なLLMの振る舞いは、投資が増えることで予測できない形で生じる
LLMは、外部世界の表現を学習しているようだ
LLMの振る舞いをコントロールする信頼できる技術は存在しない
現在の専門家は、LLMの内部構造を解釈することができない
LLMの性能は人間を超える
LLMの抱く価値観はコントロール可能（LLMは、制作者の価値観や、Webテキストに符号化された価値観を表現する必要はない）
LLMとの少しばかりの交流ではLLMを理解することはできない

今後ますます、新しいAI技術が登場してくるでしょう。ChatGPTのようなLLMを使ったことがない人も、すでに知っていてバリバリ使っている人も、どちらの人にとっても有益な情報として、上記8つの主張について順番に紹介します。

1. LLMは、技術的革新がなくても、投資を増やすだけで性能が向上する

どういうことかというと、お金をめっちゃ投資して、データ量やモデルパラメータやGPU数などを増やせば増やすほど、より性能の高いAIが作れることが保証されていることです。

背後にはスケーリング則という、OpenAIが2020年に発表した大規模言語モデルの性能に関する経験則で、「モデルを大きくすればするほどモデルの性能は高くなる」 という法則の存在があります。スケーリング法則により、データやサイズ（パラメータ）、トレーニングに使用する計算の観点からモデルをスケールアップすることで、将来のモデルの性能を予測することができるのです。

例として、OpenAIはこれまでに4世代（GPT、GPT-2、GPT-3、GPT-4（モデル詳細は未公開））にわたって言語モデルをリリースしていますが、モデルのアーキテクチャ設計はほとんど変更していません。主な違いは、より多くの計算、データ、およびトレーニングに使用するパラメータなど、スケールが大幅に増加したことです。

2. 多くの重要なLLMの振る舞いは、投資の増加に伴い予測不可能に出現する傾向がある

これは、スケール則に従ってモデルを大幅に拡大することで、突然新しいタスクやスキルが実現されることがありますが、どのような能力が得られるかについては予測不可能ということです。

背後には創発現象（Emergent Abilities）という2022年に発見された現象があります。モデルのパラメータ数を大きくしていくと、あるところで突然予想外の能力（例えば「順序だてて考えよう」と宣言することで、回答の質が一気に上がる能力）を開花させるというものです。

『モデルを巨大にすると性能が上がること自体は確実だけど、どんな機能を獲得するかは予測不能で、実際にやってからのお楽しみ』状態ということです。

3. どうやらLLMは、外部世界の表現を学習しているみたいだ

LLMは大規模言語モデルというくらいですから、テキスト情報のみを学習しています。直観的にはテキストしか与えられずに育った知能は、色彩や物体の構造について知らないはずです。

ですが、例えば、GPTモデルはユニコーンの絵を書くことができます。以下の図が論文中で挙げられています。

この図は、視覚情報に一切アクセスできない状態で訓練された言語モデルGPT-4のプライベートバージョンに、グラフィックプログラミング言語でユニコーンを描く命令を書かせる様子を示しています。描かれた絵は、モデルの訓練が進むにつれてより有能なものになり、ユニコーンっぽくなっています。言語モデル（LLM）はテキスト情報しか学習していないはずなのに、視覚表現を操作する能力を持っているのです！！

4. LLMの振る舞いをコントロールする信頼できる技術は存在しない

LLMの振る舞いを完全に制御することが困難、つまりリスクを孕んでいることを主張しています。LLMをコントロールするための技術例として、強化学習やファインチューニングが挙げられていますが、これらの方法は完璧ではないことが述べられています。モデルは、曖昧なプロンプトやインセンティブを不合理に解釈し、人間には曖昧でないように見える状況でも、予想外の行動を取ることがあります。

その実例として、マイクロソフトのBing Chatの初期バージョンが、ローンチ前に広範囲にテストされていたにもかかわらず、奇妙で操作的な振る舞いを示したことが、挙げられています。

5. 現在の専門家は、LLMの内部構造を解釈することができない

LLMは、アーキテクチャが先行的に開発され、大規模化されて性能がどんどん上がってきました。しかし実は、研究者たちは、開発したLLMについてすべてを把握しているわけではなく、なぜLLMが上手くいくのかよく分かっていないのです。

LLMの内部構造である、ニューラルネットワークを理解するための効果的なツールは、まだありません。現在もそのようなツールの開発が進められていますが、システムが複雑であるため、モデルがどのような知識や推論、目標を持って出力しているかを判断することは困難です。

6. LLMの性能は人間を超える（あるタスクにおける人間のパフォーマンスは、LLMのパフォーマンスの上限値にはならない）

LLMは、人間が見るよりもはるかに多くのデータで訓練され、記憶し合成するための多くの情報を与えられています。そのため、多くのタスクで人間を凌駕できる可能性があることを主張しています。すでに囲碁のようなゲームでは、超人的な囲碁AIが人間を破っている例が挙げられています。

7. LLMの抱く価値観はコントロール可能（LLMは、制作者の価値観や、Webテキストに符号化された価値観を表現する必要はない）

大規模言語モデルの学習時には、大量のテキストデータから学習するため、そのデータに反映された値やバイアスが含まれることがあります。しかし、製品として展開する際には、強化学習などを用いて、モデルの開発者がこれらの値を制御・修正することができます。

8. LLMとの少しばかりの交流ではLLMを理解することはできない

LLMモデルは我々が要求したタスクを、実行できないこともあります。しかし、要求が少し言い換えられたり、再フレーミングされたりすると、タスクを正しく実行するようになります。

これはプロンプトエンジニアリングの技術と呼ばれ、急速に発展しています。「呪文」とも呼ばれるこの技術では、要求がわずかに言い換えられたり、再構成されたりすることで、モデルがタスクを正しく実行できるようになります。

LLMについての論文を深掘りするのは面白い

論文の中では、8つの主張以外にも追加で言及していますが、長くなるので今回は割愛します。本文もそこまで長くないので、興味があったら読んでみてください。

最近、AIの技術進化が速すぎて、気を抜いているとあっという間に取り残されてしまいます。ChatGPTの大元になっているGPTモデルについては、論文も出ているので、自分の理解のためにも今度はそちらも読んで解説したいと思います。

参考文献

Bowman, Samuel R. “Eight Things to Know about Large Language Models.” arXiv preprint arXiv:2304.00612 (2023)
https://arxiv.org/abs/2304.00612

Kaplan, Jared, et al. “Scaling laws for neural language models.” arXiv preprint arXiv:2001.08361 (2020)
https://arxiv.org/abs/2206.07682

Wei, Jason, et al. “Emergent abilities of large language models.” arXiv preprint arXiv:2206.07682 (2022)
https://arxiv.org/abs/2206.07682

AI（LLM）についてまだみんなが知らない8つの事実（論文：Eight Things to Know about Large Language Modelsについて）
https://soysoftware.sakura.ne.jp/archives/3715

#AI #arXiv #ChatGPT #GPT #LLM #OpenAI #バイオインフォマティクス #大規模言語モデル #論文

ChatGPTのような大規模言語モデルで知っておくべき8つのこと

大規模言語モデルとは

この論文の意義

1. LLMは、技術的革新がなくても、投資を増やすだけで性能が向上する

2. 多くの重要なLLMの振る舞いは、投資の増加に伴い予測不可能に出現する傾向がある

3. どうやらLLMは、外部世界の表現を学習しているみたいだ

4. LLMの振る舞いをコントロールする信頼できる技術は存在しない

5. 現在の専門家は、LLMの内部構造を解釈することができない

6. LLMの性能は人間を超える（あるタスクにおける人間のパフォーマンスは、LLMのパフォーマンスの上限値にはならない）

7. LLMの抱く価値観はコントロール可能（LLMは、制作者の価値観や、Webテキストに符号化された価値観を表現する必要はない）

8. LLMとの少しばかりの交流ではLLMを理解することはできない

LLMについての論文を深掘りするのは面白い

参考文献

コメントをキャンセル

難解な論文だってラクに読める！ChatGPTで「3分論文リーディング」

GPT-4.5登場！人に寄り添った感情的な会話を研究者が試してみた

複数のAIを接続するMCPとは？AI時代のUSB-Cとして注目される理由

AIにその手があったか！DeepSeekの革新性を研究者が論文解説する

AIにとっての「言葉」である自然言語処理の発展の歴史を振り返ろう

トークン拡大と価格暴落！2024年のAIとLLMの発展を振り返る