Here is the translated HTML code with the URLs modified as requested: ```html
OpenAIは、GPT-4o-2024-08-06のリリースで再び人工知能の限界を押し広げ、APIに構造化出力を導入しました。この画期的な機能は、特に構造化データ生成に依存する開発者やビジネスにおいて、AI生成コンテンツの信頼性と使いやすさにおいて大きな前進を示しています。
GPT-4o-2024-08-06:何が新しいのか?
歴史的に、大規模言語モデル(LLM)は人間のようなテキストを生成することに優れていましたが、特定の形式に従った構造化データを一貫して生成するのには苦労していました。GPT-4o-2024-08-06はこの課題に正面から取り組み、構造化出力を導入することで、モデル生成出力が開発者が提供したJSONスキーマに正確に一致することを保証します。
GPT-4o-2024-08-06はJSONスキーマが得意です
まず最初に:
- 構造化出力を備えたGPT-4o-2024-08-06のパフォーマンス向上は素晴らしいです。
- OpenAIの複雑なJSONスキーマ評価では、この新しいモデルは完璧なスコア100%を達成し、同じテストで40%未満のスコアを記録した前モデルGPT-4-0613に対して大きく向上しました。
GPT-4o-2024-08-06はGPT-4Oよりも優れていて、安価です
GPT-4o-2024-08-06をその前のモデルやよりコンパクトなGPT-4o-miniと比較しましょう:
MMLU(大規模マルチタスク言語理解)
- GPT-4o-2024-08-06: 88.7%(5ショット)
- GPT-4o: 88.7%(5ショット)
- GPT-4o-mini: 82.0%(5ショット)
- GPT-4(2023年6月版): 86.4%(5ショット)
MMMU(大規模マルチタスクマルチモーダル理解)
- GPT-4o-2024-08-06: 69.1%
- GPT-4o: 69.1%
- GPT-4o-mini: 59.4%
- GPT-4(2023年6月版): 34.9%
価格(百万トークンあたり)
- GPT-4o-2024-08-06: $5.00 入力, $15.00 出力
- GPT-4o: $5.00 入力, $15.00 出力
- GPT-4o-mini: $0.15 入力, $0.60 出力
- GPT-4(2023年6月版): $30.00 入力, $60.00 出力
コンテキストウィンドウ
- GPT-4o-2024-08-06: 128Kトークン
- GPT-4o: 128Kトークン
- GPT-4o-mini: 128Kトークン
- GPT-4(2023年6月版): 8,192トークン
これらのベンチマークは、GPT-4o-2024-08-06が新しい構造化出力機能を導入しながら、GPT-4oの高パフォーマンスを維持していることを示しています。GPT-4o-miniはそれほど強力ではありませんが、多くのアプリケーションに対しよりコスト効果の高いソリューションを提供します。
構造化出力:OpenAIの新しいトリック
OpenAIはAPI内で構造化出力を二つの主要な形で導入しています:
- 関数呼び出し
- レスポンスフォーマットパラメーター
これらの機能の使用方法をステップバイステップガイドとサンプルコードで探ってみましょう。
ステップバイステップガイド:構造化出力の使用
1. 構造化出力を使用した関数呼び出し
ステップ1:厳格なスキーマで関数を定義する
import openai
function_schema = {
"name": "get_current_weather",
"description": "与えられた場所の現在の天気を取得する",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "都市と州、例:サンフランシスコ、CA"
},
"temperature_unit": {
"type": "string",
"enum": ["celsius", "fahrenheit"]
}
},
"required": ["location", "temperature_unit"]
},
"strict": True # これにより構造化出力が有効になります
}
client = openai.OpenAI()
response = client.chat.completions.create(
model="gpt-4o-2024-08-06",
messages=[
{"role": "user", "content": "ボストンの天気はどうですか?"}
],
functions=[function_schema],
function_call={"name": "get_current_weather"}
)
print(response.choices[0].message.function_call)
2. 構造化出力を使用したレスポンスフォーマットパラメーター
ステップ1:JSONスキーマを定義する
json_schema = {
"type": "object",
"properties": {
"name": {"type": "string"},
"age": {"type": "integer"},
"cities_visited": {
"type": "array",
"items": {"type": "string"}
}
},
"required": ["name", "age", "cities_visited"]
}
response = client.chat.completions.create(
model="gpt-4o-2024-08-06",
messages=[
{"role": "user", "content": "30歳の世界旅行者ジョンのプロフィールを生成してください。"}
],
response_format={"type": "json_object", "json_schema": json_schema}
)
print(response.choices[0].message.content)
3. SDKを使用した構造化出力
OpenAIは、構造化出力に対するネイティブサポートを持つPythonおよびNode SDKを更新しました。ここでは、Pydanticを使用したPython SDKの例を示します:
from pydantic import BaseModel, Field
from typing import List
from openai import OpenAI
class Traveler(BaseModel):
name: str
age: int
cities_visited: List[str] = Field(min_items=1)
client = OpenAI()
response = client.chat.completions.create(
model="gpt-4o-2024-08-06",
messages=[
{"role": "user", "content": "28歳の世界旅行者サラのプロフィールを生成してください。"}
],
response_format={"type": "json_object", "schema": Traveler.model_json_schema()}
)
traveler = Traveler.model_validate_json(response.choices[0].message.content)
print(f"名前: {traveler.name}, 年齢: {traveler.age}, 訪れた都市: {', '.join(traveler.cities_visited)}")
構造化出力を使用するためのベストプラクティス
- 明確なスキーマを定義する: JSONスキーマが明確に定義され、すべての出力をカバーしていることを確認してください。
- 拒否時の処理: 安全上の懸念からモデルが出力を生成することを拒否する場合に備えてロジックを実装します。
- 出力を検証する: 構造化出力はスキーマ準拠を保証しますが、常にコンテンツの正確性を検証してください。
- パフォーマンスを最適化する: 後続のリクエストの遅延を削減するために、前処理されたスキーマをキャッシュします。
- 関数呼び出しと組み合わせる: より複雑なアプリケーション向けに構造化出力を関数呼び出しと併用します。
制限事項と考慮事項
進歩にもかかわらず、GPT-4o-2024-08-06と構造化出力にはいくつかの制限があります:
- サポートされているのはJSONスキーマのサブセットのみです。
- 新しいスキーマの最初のAPIレスポンスには追加のレイテンシがあります。
- 構造は保証されていますが、コンテンツの正確性は保証されません。
- 構造化出力は並列関数呼び出しに対応していません。
- 使用されるJSONスキーマはゼロデータ保持(ZDR)の対象外です。
結論
GPT-4o-2024-08-06とその構造化出力機能は、AI生成コンテンツの信頼性において重要な進展を示します。一貫して構造化データを生成するという課題を解決することにより、OpenAIは開発者やビジネスに新しい可能性を開きました。AIの分野が進化し続ける中で、GPT-4o-2024-08-06はAI駆動アプリケーションにおける精度と構造の新しい基準を設定し、さまざまな業界においてより洗練され、信頼できるAIシステムへの道を開いています。
``` Please let me know if you need any other modifications!