コスト効率の高いインテリジェンスの推進

allen-dolph

OpenAI は、知能を可能な限り広く利用できるようにすることに取り組んでいます。本日、最もコスト効率の高い小型モデルである GPT-4o mini を発表します。

チャットボット

アプリの概要

GPT-4o mini は、幅広いアプリケーションをサポートできる高度で低コスト、低レイテンシーのモデルです。これには、複数のモデル呼び出しの連鎖や並列化、大量のコンテキストの管理、顧客とのインタラクションにおけるリアルタイムのテキスト応答の提供を必要とするアプリケーションが含まれます。

主な特徴

価格設定: GPT-3.5 Turboと比較してコストを60%以上削減。

性能: GPT-4o Miniは、多くのベンチマークでGPT-3.5 Turboを上回り、より速い結果とコスト効率の向上を実現。

コンテキストウィンドウ: このモデルは128,000トークンの広範なコンテキストウィンドウを特徴とし、大規模なデータセットの処理能力を向上。

可用性: 開発者は、Assistants API、Chat Completions API、Batch APIなど、様々なendpointを通じてGPT-4o Miniにアクセスでき、技術プロジェクトへの幅広い適用が可能。

機能: 初期段階ではテキストと画像入力をサポートし、今後のアップデートでオーディオとビデオにも対応予定。

マルチモーダル機能とスコア

現在、モデルはテキストとビジョンをサポートしており、将来的にはテキスト、画像、ビデオ、オーディオの入出力に対応する予定です。特筆すべきは、GPT-4o miniが128Kトークンのコンテキストウィンドウを持ち、リクエストごとに最大16Kの出力トークンをサポートし、2023年10月までの知識を持っていることです。このモデルは、特に非英語テキストの処理においてコスト効率を向上させる改良されたトークナイザーを採用しています。

コンパクトモデルにおける優れた能力

GPT-4o miniは、学術的ベンチマークにおいてGPT-3.5 Turboや他の同等モデルを上回り、様々な言語におけるテキスト知能とマルチモーダル推論の両方で優れています。関数呼び出しや長文脈のインタラクションにおいて顕著な能力を示し、開発者が外部システムとやり取りするより動的なアプリケーションを作成することを可能にします。

ベンチマーク評価において、GPT-4o miniは優れた性能を示しました：

推論タスク: MMMLUベンチマークで82.0%を達成し、他の小型モデルを上回ります。
数学とコーディング能力: 数学的推論とコーディング能力を評価するMGSMとHumanEvalベンチマークにおいて、GPT-4o miniは同等モデルよりも高いスコアを記録しています。
マルチモーダル推論: マルチモーダル推論評価において、競合モデルよりも高いスコアを記録し、テキストと視覚的入力の両方を含む複雑な推論タスクを処理する強力な能力を反映しています。

開発過程を通じて、主要な業界パートナーと協力してGPT-4o miniの能力を洗練し、実世界のアプリケーションニーズに効果的に対応できるようにしました。

組み込みの安全対策

モデル開発の当初から、安全性は基本的な要素でした。望ましくないソースからの学習を防ぐために事前訓練で厳格なフィルタリングを採用し、人間のフィードバックによる強化学習（RLHF）などの事後訓練技術を通じてモデルの出力を洗練させています。この綿密なアプローチにより、GPT-4o miniが生成する応答の信頼性と安全性が向上しています。

GPT-4o miniは、GPT-4oと同じ安全プロトコルを組み込んでおり、広範なテストと専門家の評価によって裏付けられています。このモデルは、APIに最新の安全革新である指示階層メソッドを導入しています。この新機能により、モデルの複雑な入力を安全に処理する能力が向上し、多様なアプリケーションにおける潜在的な誤用に対してより強固になりました。

小型言語モデルの価値

小型の大規模言語モデル（LLM）は一般的にパラメータが少ないです。ニューラルネットワークにおいて、パラメータは学習した情報を格納する重要な要素であり、モデルの情報の文脈化能力に直接影響します。通常、パラメータが少ないモデルはよりシンプルなニューラルネットワークを持ち、より多くのパラメータを持つ大型モデルと比較して、複雑な接続や深い洞察を形成する能力が限られています。

しかし、パラメータ数とモデルの能力の関係は線形ではありません。訓練データの品質、モデルアーキテクチャの効率性、訓練プロセスの詳細が全て性能を決定する上で重要な役割を果たします。これは、小型であるにもかかわらず大きな能力を示すMicrosoftのPhi-3のような例で明らかです。

パラメータ数を減らすことは、計算負荷を減らすだけでなく、モデルがより低性能のGPUで動作したり、既存のハードウェアでより少ない計算で動作することを可能にします。この効率性は、エネルギー消費の低減と運用コストの削減につながり、これらのモデルを経済的にも環境的にも好ましいものにしています。

よくある質問

GPT-4o miniとは何ですか？

GPT-4o miniは、OpenAIの新しい、より手頃な価格のAIモデルです。GPT-4oモデルのコンパクトバージョンで、低コストでより高いパフォーマンスを提供するように設計されています。

GPT-4o miniの価格詳細は何ですか？

GPT-4o miniは、入力トークン100万個あたり15セント、出力トークン100万個あたり60セントで、GPT-3.5 Turboより60%以上安価です。

GPT-4o miniは他社のモデルとどのように比較されますか？

具体的な比較はまだ利用できませんが、GPT-4o miniは、AnthropicのClaude 3 Haikuのようなモデルと競合し、開発者に効率的で費用対効果の高いソリューションを提供することを目指しています。

誰がGPT-4o miniにアクセスできますか？

無料および有料のChatGPTユーザー、そしてAssistants API、Chat Completions API、Batch APIを通じて開発者がGPT-4o miniにアクセスできます。