GPT 4.5 ついに登場:本当に Claude 3.7 を上回っているのか?

OpenAIがGPT 4.5を発表しました - 優れた事実精度と多言語対応を持ちながら、数学とコーディングはまだ劣っています。anakin.aiを探求してください。

Anakin AIを無料で利用開始

GPT 4.5 ついに登場:本当に Claude 3.7 を上回っているのか?

Start for free
目次

クラウドがクラウド3.7ソネットを発表してからまだ4日しか経っていません。そして私たちはここにいます、GPT 4.5へようこそ!オープンAIのこれまでで最も大きく、最高のチャットモデルです。
あなたの最も洞察に満ちた仲間のように感じるAIとチャットすることを想像してみてください。賢いアイデアを投げかけるだけでなく、あなたを本当に「理解する」AI。それがオープンAIの最新リリース、GPT‑4.5の約束です。フレッシュな話題として、技術愛好家の間で会話を生み出しているGPT‑4.5は、自然で人間らしい対話の基準をより高く設定しています。

これらの最先端の能力とそれ以上を探求する準備はできていますか?アナキンAIに飛び込んでください。数百のモデルとツールのためのワンストップAIハブです。今すぐサインアップして、サイトを切り替えることなく、創造性を向上させましょう!

GPT‑4.5の大きな特徴は何ですか?

GPT 4.5

GPT‑4.5は、コードネームオリオンにより、オープンAIの最大かつ最も計算リソースを必要とするモデルです。GPT‑4oの成功を基に、教師なし学習を新たな高みへとスケールアップしています。12.8兆のパラメータでトレーニングし、128の動的な専門ネットワークを通じて入力をルーティングすることで、GPT‑4.5はこれまでにないパターン認識や創造的なつながりを描けるように設計されています。初期の評価では、前モデルに比べて幻覚を約25ポイントも削減し、科学的質問の正確性は53.6%から71.4%に向上しています。数学でも、AIME '24のベンチマークでわずか9.3%から36.7%に跳ね上がっています!

しかし、騙されないでください、これは単に数を処理するためのモデルではありません。高度な感情整合層により、GPT‑4.5は会話に合ったトーンに調整できます。あなたが辛い一日の後に慰めの言葉を必要とする場合でも、次のプロジェクトのためのクリエイティブなインスピレーションが欲しい場合でも、GPT‑4.5は温かく、人間のように感じられる応答を提供することを目指しています。

声を持つベンチマーク

いくつかの数字について語りましょう:

  • 科学と事実の正確さ:
    GPT‑4.5はGPQAで71.4%を記録し、GPT‑4oの53.6%から確実に飛躍的な成長を見せています。この進展は、科学や一般的な知識の質問に対して「幻覚」を起こす可能性が非常に低くなることを意味しており、その応答の信頼性を高めています。
  • 数学:
    AIME '24数学テストで、GPT‑4.5は36.7%を獲得し、GPT‑4oの9.3%から大幅に向上しています。しかし、この分野では約87.3%に達するような専門モデルにはまだ及びません。GPT‑4.5が数学で向上している一方で、自然な会話に重点を置いていることは明らかです。
  • 多言語能力:
    MMMLUベンチマークで85.1%を記録し、GPT‑4.5は複数の言語をうまく扱えることを証明しています。これはグローバルな利用に理想的です。
  • コーディングパフォーマンス:
    SWE‑Benchで測定されたコーディング課題では、GPT‑4.5は38.0%を記録し、GPT‑4oの30.7%と比較して改善を示しています。それでも、クラウド3.7ソネットのようなモデルにはまだ遅れをとっています。

これらの統計は、GPT‑4.5が日常の会話タスクや事実の正確さにおいて際立っている一方で、重いコーディングや複雑な数学的推論に関しては優れたモデルではないことを証明しています。人間的なタッチに優れた器用貧乏でありながら、専門的な推論モデルにはやや後れを取っています。

全体として、これらのベンチマークは、GPT‑4.5が事実の正確さと多言語理解に優れたモデルであることを示していますが、その数学やコーディング能力は改善されながらも主要な売りポイントではありません。友好的で人間らしい会話に最適化されており、創造的なタスクや日常の対話にぴったりです。

これらのモデルを含むシームレスな体験を探索するには、アナキンAIをチェックしてください。サイト間での切り替えを気にせず、さまざまなツールにアクセスできるオールインワンプラットフォームです。

卓越性の価格

このすべての頭脳労働は高価であることに注意してください。APIの料金は、入力トークンが100万件あたり75ドル、出力トークンが100万件あたり150ドル、そしてChatGPT Proのサブスクリプションは月200ドルです。GPT‑4.5は、決して安くはありません。しかし、多くのユーザーが言うように、支払った分の価値を得られることがよくあります。創造的な執筆、情緒的なサポート、そしてスムーズで自然なチャット体験のために、追加のコストはそれだけの価値があるかもしれません。

心に響くユースケース

GPT‑4.5は、友好的で思慮深い会話が重要なタスクに最適です:

  • 情緒的サポートとコーチング:賢い友達が話を聞いてくれて、優しいアドバイスをくれるような体験です。
  • 創造的なコラボレーション:次の小説やマーケティングキャンペーンのためにブレインストーミングが必要ですか?GPT‑4.5は鮮やかなアイデアや鋭いアナロジーを提供できます。
  • ドキュメントの統合:さまざまな情報を一つのきれいなレポートにまとめる必要がありますか?このモデルはそれもできます。
  • エージェンティックタスクの自動化:複数ステップのワークフローをコーディネートしたり、データを要約したりすることができます。GPT‑4.5は作業負担を軽減します。

すべてをまとめるプラットフォーム

さて、もしあなたが私と同じように、さまざまなAIモデルをテストするためにウェブサイトを行き来しているなら、小さな秘密を教えます:アナキンAI。このオールインワンAIプラットフォームはゲームチェンジャーです。複数のツールやウェブサイトを持ち運ぶ代わりに、anakin.aiは数百のAIモデルとツールをテキスト、画像、動画、音声として一つのシームレスなインターフェースで手の届くところに提供します。あなたの個人的なAIツールボックスを一つの場所に集めて、ナビゲート、統合、そしてGPT‑4.5のようなモデルを手間なく展開できるのです。試した人たちは、それが本当に時間を節約し、AIツールの混沌とした世界における新鮮な風であると言っています。

GPT‑4.5はClaude 3.7ソネットのような競合相手とどう比較されていますか?

他のAIパワーハウスと比較すると:

  • クラウド3.7ソネット:Claude 3.7は構造的推論とコーディングに優れていますが(SWE‑Benchスコアが高い)、GPT‑4.5は魅力的で感情豊かな会話を創造する点でリードしています。
  • グーグルのジェミニウルトラ2.0:Gemini Ultraは素晴らしいマルチモーダル能力を提供しますが、GPT‑4.5の大規模なスケールは、より広範な知識ベースと自然な会話フローをもたらします。
  • 推論モデル(o1/o3-mini):これらのモデルは、技術的な数学やコーディングタスクにおいて依然としてGPT‑4.5を上回っており、AIの世界においては一律の解決策は存在しないことを示しています。

前進する道

オープンAIは怠けてはいません。両方の世界のベストを融合したハイブリッドモデルの噂もあり、GPT‑4.5の会話の魅力とそのoシリーズの特徴的な推論を取り入れたモデルが期待されています。今のところ、GPT‑4.5はChatGPT Proユーザーおよび特定の企業顧客にリサーチプレビューとして利用可能であり、より広範なアクセスが間もなく提供されます。

最後の考え

GPT‑4.5は、AIが人間の協力者に近づく重要な一歩を示しています。共感的で創造的、瞬時にチャットできる準備が整っています。確かに、コストが高く、重いコーディングや高度な数学には最適ではありませんが、ブレインストーミングや最高のマーケティングコピーの作成を助けてくれる友好的なデジタルパートナーを求めている人には、これが最適なソリューションとなるかもしれません。

そして、さまざまなAIモデルをサイト間でスイッチすることなく探求したい場合は、アナキンAIをチェックしてください。AIの未来がここにあります—すべてのツールを一つの neat パッケージにまとめて、最も重要なことに集中できるようにします:革新と創造です。