AI

GPT-4.5登場!人に寄り添った感情的な会話を研究者が試してみた

盛 堃

2025年2月末、OpenAIからGPT-4.5がリリースされました。読者の中には、もう使っている方も多いかもしれません。

GPT-4.5は、同社がこれまで出した最大のLLM(大規模言語モデル)です。GPT-4oやDeepSeekなどのLLMと比較して、そのポジショニングは明確です。より大規模なモデル、より多くのデータを用いて、教師なし学習の可能性を極限まで追求しています。

今回の記事では、GPT-4.5の概要や特徴について、研究者の視点で解説します。

より大きなモデルで、より自然な会話を実現

OpenAIのCEOであるSam Altman氏は、2月28日に「GPT-4.5の準備が整いました!」と発表しました。

和訳すると以下のとおりです。

良いニュース:思慮深い人間と話しているように感じられる、初めてのモデルです。椅子に座り直して、AIから実際にいいアドバイスをもらって驚いた瞬間が何度かありました。

悪いニュース:これは巨大で高価なモデルです。本当はPlusとProに同時に発売したかったのですが、私たちは大きく成長していて、GPUが不足しています(来週には数万GPUを追加し、その時にPlus層にも展開する予定です)。

また、彼はこうも説明しています。

すぐに数十万個を追加する予定ですが、皆さんが私たちの構築できるすべてのGPUを使い切ることは確実です。これは私たちが望む運営方法ではありませんが、GPU不足を引き起こす成長のピークを完璧に予測するのは本当に難しいのです。

GPT-4.5は有料ユーザー向けに公開され、GPT Proユーザーは月額200ドル、Plusユーザーは月額20ドルで利用可能です。Proユーザーは1週間早く体験できるという特典もあります。

▼GPT-4.5 が登場 | OpenAI
https://openai.com/ja-JP/index/introducing-gpt-4-5

GPT-4.5の会話が自然な理由は、より深い知識と優れた文脈理解能力を持っているからです。小さなモデルを使って高品質な対話サンプル(心理カウンセリングや創造的なコラボレーションなど)を生成し、GPT-4.5に人間らしい感情表現パターンを学習させた結果です。OpenAIは、このアプローチを通じて、AIに人間のニーズと意図をより深く理解することを教えています。その結果、GPT-4.5のコントロール性、ニュアンスを理解する能力、自然な会話でのパフォーマンスが飛躍的に向上しました。

実際に対話してみた!人の感情に寄り添うGPT-4.5

以下の実例で、GPT-4oとGPT-4.5の違いを説明します。

ユーザー:最近試験に合格できなくて、今とても気分が悪いんです…

GPT-4o:(比較的機械的な回答)

こんにちは。試験に合格できなかったことで気分が落ち込んでいるのですね。それは本当につらい経験ですね。

試験の不合格について

試験に合格できないというのは、とても落ち込む経験です。特に努力してきたのであれば、なおさらでしょう。あなたの気持ちは十分に理解できます。

前向きに考えるためのヒント

  1. 振り返りの時間を持つ:何がうまくいかなかったのか、次回に向けて何を改善できるか考えてみましょう
  2. 小さな目標を設定する:一度に大きな目標を達成しようとせず、小さなステップに分けてみましょう
  3. 休息を取る:心身ともに疲れているかもしれません。適切な休息を取ることも大切です
  4. サポートを求める:友人、家族、先生など、周りの人に相談してみましょう

もし良ければ、どのような試験だったのか、また次回に向けてどのような準備をしているのかなど、もう少し詳しく教えていただけますか?より具体的なアドバイスができるかもしれません。

GPT-4.5:(感情的な対話)

ああ、それは本当に残念ですね。試験に合格できないのは確かにショックで、落ち込むものですよね。でも覚えておいてください、これはただの一つの試験に過ぎず、あなた自身を表すものでも、あなたの能力を示すものでもありません。具体的な状況について話してみませんか?または気分転換に別の話題でもいいですよ?どうしたいか、あなた次第です。私はここであなたに寄り添います。

GPT-4.5のような感情的な会話は、ToC(to Customer:消費者向け)製品の核心的な売りです。GPT-4.5の「心の友」としての設定は、心理カウンセリングやインテリジェントなカスタマーサービスなどの市場に応用できます。

GPT-4.5でハルシネーション(誤情報)が減少

GPT-4.5は世の中の知識を備えています。質問応答のベンチマークでは、Grok 3、GPT-4o、o3-miniを明らかに上回る精度を示しています。

GPT-4.5の正確率
GPT-4.5の正確率
出典:GPT-4.5 が登場 | OpenAI

また、生成AIでの課題はハルシネーション(幻想)と呼ばれる誤情報です。GPT-4.5のハルシネーション率は、GPT-4oの61.8%から37.1%に低下しました。

GPT-4oのハルシネーション率
GPT-4oのハルシネーション率
出典:GPT-4.5 が登場 | OpenAI

ハルシネーション率が下がれば、医療や法律などの高い知識障壁がある分野にも応用できます。GPT-4.5は信頼性が向上したことで、AIは単なる娯楽だという偏見を打破しようとしています。

まだまだ残る、GPT-4.5が抱える課題

GPT-4.5への期待もある一方で、さまざまな課題もあります。

計算コストが高い

GPT-4.5のトレーニングには数万台のA100 GPUクラスターが消費され、APIコールのコストがGPT-4の3倍に達しています。Sam Altman氏はXで「GPUの不足が予想より10倍深刻だったため、Pro版ユーザーに限定して提供せざるを得ませんでした」とポストしていました。

対照的に、DeepSeekのR1モデルは1/10の計算予算で同等のパフォーマンスを実現しています。「動的スパーストレーニング」技術を採用することで、業界に別のアプローチを提供しています。

推論能力が弱い

OpenAIが発表したベンチマークテストでは、GPT-4.5の理系学性能は驚異的でした。その一方で、数学的推論では、独自のo3-miniモデルに後れを取っていました。

モデル評価スコア
モデル評価スコア 出典:GPT-4.5 が登場 | OpenAI

GPT-4.5は、段階的な論理的推論ではなく、膨大なデータに依存して答えを記憶する純粋な事前学習済みモデルです。AIの推論能力については、この記事で説明したのでぜひお読みください。

OpenAIの研究者は、「Wikiのようなものですが、問題を解決するための能力が欠けています」と率直に語っています。これに対し、o3-miniは推論最適化モデルとして、思考の連鎖技術を通じて人間の段階的な思考のプロセスをシミュレートできます。

すでにGPT-5が開発中!

OpenAIはGPT-4.5で立ち止まる予定はなく、5月末にGPT-5を発表する計画です。Sam Altman氏によると、GPT-5は「多くの技術を統合したシステム」になり、新しいo3推論モデルも含まれるとのこと。つまり、GPT-5は事前学習と推論能力を組み合わせた、賢くて論理的な存在となります。

GPT-4.5は推論モデルではありませんが、将来の発展のための基盤を築いています。OpenAIの目標は明確です。AIが単に会話するだけでなく、考え、ツールを使用し、さらにはどのモデルがあなたのニーズに最も適しているかを自動的に判断できるようにすることです。引き続き注目していきましょう。


AIを始めとするさまざまな先端テクノロジーについて解説する、BlueMemeの研究職の最新記事は、リープリーパーのソーシャルメディアでもお知らせしています。ぜひ、フォローをお願いします!

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

ABOUT ME
盛 堃
盛 堃
研究員(専門分野:脳グラフネットワーク・深層学習)
2023年株式会社BlueMemeに入社、アプリ開発及びAPI開発プロジェクトに参画、2024年からグラフネットワークについて研究活動を開始する
盛 堃の記事一覧

記事URLをコピーしました