Anleitung zur Verwendung der DALLE3-API: Schritt-für-Schritt-Anleitung

Die DALL-E 3 API hat das Feld der KI-gesteuerten Bildgenerierung revolutioniert und bietet beispiellose Kreativität und Flexibilität. Ob Sie ein Entwickler, Künstler oder einfach nur ein KI-Enthusiast sind, das Verständnis dafür, wie man die DALLE 3 API effektiv nutzen kann, erschließt eine Welt voller Möglichkeiten. Dieser Artikel zielt darauf ab,

Build APIs Faster & Together in Apidog

Anleitung zur Verwendung der DALLE3-API: Schritt-für-Schritt-Anleitung

Start for free
Inhalte

Die DALL-E 3 API hat das Feld der KI-gesteuerten Bildgenerierung revolutioniert und bietet beispiellose Kreativität und Flexibilität. Ob Sie ein Entwickler, Künstler oder einfach nur ein KI-Enthusiast sind, das Verständnis dafür, wie man die DALLE 3 API effektiv nutzen kann, erschließt eine Welt voller Möglichkeiten. Dieser Artikel zielt darauf ab, den Prozess zu entmystifizieren, Sie durch die wesentlichen Schritte und Überlegungen zu führen, um das Beste aus diesem leistungsstarken Werkzeug herauszuholen.

Aber bevor wir mit dem Erlernen der Schritte beginnen, möchten Sie vielleicht einen Blick auf Anakin AI werfen.

Anakin AI, All Your AI Models in One Place
Anakin AI, Alle Ihre KI-Modelle an einem Ort

Schwierigkeiten bei der Bezahlung von über 100 KI-API-Rechnungen? Anakin AI kombiniert alles an einem Ort! KI-Modelle wie GPT, DALL-E und Stable Diffusion. Hier sind Gründe, warum Anakin AI herausragt:

  • All-in-One-Plattform: Greifen Sie problemlos auf verschiedene KI-Modelle an einem Ort zu, ohne mehrere APIs oder Abrechnungskonten verwalten zu müssen.
  • Keine Zahlungsschwierigkeiten: Tauchen Sie ohne die Schwierigkeiten von Einrichtungs- und Zahlungsprozessen in die KI ein und machen Sie sie so für ein breiteres Publikum zugänglich.
  • No-Code-App-Builder: Ermöglichen Sie Benutzern die Erstellung von KI-gesteuerten Anwendungen ohne jede Programmierkenntnisse und eröffnen Sie damit endlose Möglichkeiten für Innovation und Kreativität.

Anakin AI ist Ihr Gateway, um die Kraft der künstlichen Intelligenz zu erkunden und zu nutzen, und erleichtert es Ihnen mehr denn je, KI in Ihre Projekte oder geschäftlichen Lösungen zu integrieren.

Claude | Free AI tool | Anakin.ai
You can experience Claude-3-Opus, Claude-3-Sonnet, Claude-2.1 and Claude-Instant in this application. Claude is an intelligent conversational assistant based on large-scale language models. It can handle context with up to tens of thousands of words in a single conversation. It is committed to prov…

Was ist DALL-E 3?

Was ist DALL-E-3? Vereinfacht ausgedrückt handelt es sich um ein KI-Modell, das Bilder aus textuellen Beschreibungen generieren kann und ein intuitives und leistungsstarkes AI DALL E 3-Erlebnis bietet.

DALL-E 3, die neueste Version der DALL-E-Serie von OpenAI, kombiniert das Können von GPT DALL E 3 mit erweiterten Bildgenerierungsfunktionen. Im Gegensatz zu seinem Vorgänger DALL-E 2 bietet die DALLE 3-Version Funktionen wie "DALL-E Vivid vs Natural" und ermöglicht es den Benutzern, den stilistischen Output ihrer Bilder anzupassen.

Wie funktioniert DALL-E 3?

Die DALLE API interpretiert textuelle Anfragen, um Bilder zu generieren. Dieser Prozess, bekannt als GPT DALL E 3 Bildgenerierung, nutzt fortschrittliche maschinelle Lernverfahren, um Konzepte zu verstehen und zu visualisieren, wie in der DALL E Prompts-Anleitung beschrieben.

Die Verwendung von DALLE 3 in ChatGPT beinhaltet die Integration der API, um Bilder nahtlos in Chat-Umgebungen zu generieren und die Vielseitigkeit von OpenAI DALLE3 zu demonstrieren.

So greifen Sie auf die DALL-E 3 API zu:

Um mit DALL-E 3 zu beginnen, müssen Sie:

  • Die offizielle OpenAI DALLE API-Website besuchen und sich anmelden.
  • Ein OpenAI-Konto erstellen und einen API-Schlüssel erhalten.
  • Die Preisgestaltung der DALL-E-API und die Kosten für DALLE 3 sind wichtige Faktoren, da sie den Umfang bestimmen, in dem Sie die API für Ihre Projekte verwenden können.

Die Fähigkeit zur Bildgenerierung der OpenAI API kann mit verschiedenen Programmiersprachen genutzt werden, und detaillierte Anleitungen DALL E stehen Ihnen zur Verfügung, um Sie durch den Prozess zu führen.

Verwenden des OpenAI API-Schlüssels

Wie man den DALLE3 API-Schlüssel verwendet

Es gibt drei API-Endpunkte in Bezug auf das DALLE3-API

  • Generations: Generiert ein Bild oder Bilder basierend auf einer Eingabebeschreibung
  • Edits: Bearbeitet oder erweitert ein vorhandenes Bild
  • Variations: Generiert Variationen eines Eingangsbildes

So richten Sie DALLE3 API ein (einfach)

  • Importieren Sie die benötigten Pakete
  • Importieren Sie Ihren OpenAI API-Schlüssel: Sie können dies tun, indem Sie export OPENAI_API_KEY="Ihr API-Schlüssel" in Ihrem Terminal ausführen.
  • Legen Sie ein Verzeichnis fest, um Bilder zu speichern
# Imports
from openai import OpenAI  # OpenAI Python-Bibliothek zum Aufrufen von APIs
import requests  # zum Herunterladen von Bildern verwendet
import os  # zum Zugriff auf Dateipfade verwendet
from PIL import Image  # zum Anzeigen und Bearbeiten von Bildern verwendet

# Initialisieren Sie den OpenAI-Client
client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY", "<Ihr OpenAI API-Schlüssel, wenn nicht als Umgebungsvariable festgelegt>"))
# Legen Sie ein Verzeichnis fest, in dem die DALL·E-Bilder gespeichert werden sollen
image_dir_name = "Bilder"
image_dir = os.path.join(os.curdir, image_dir_name)

# Erstellen Sie das Verzeichnis, wenn es noch nicht existiert
if not os.path.isdir(image_dir):
    os.mkdir(image_dir)

# Drucken Sie das Verzeichnis zum Speichern aus
print(f"{image_dir=}")

Bildgenerierung mit DALLE3 API

Der Generations-API-Endpunkt erstellt ein Bild basierend auf einer Textanweisung.

API-Referenz

Erforderliche Eingaben:

  • prompt (str): Eine textuelle Beschreibung des gewünschten Bildes. Die maximale Länge beträgt 1000 Zeichen für dall-e-2 und 4000 Zeichen für dall-e-3.

Optionale Eingaben:

  • model (str): Das Modell, das für die Bildgenerierung verwendet werden soll. Standardmäßig dall-e-2
  • n (int): Die Anzahl der zu generierenden Bilder. Muss zwischen 1 und 10 liegen. Standardmäßig 1.
  • quality (str): Die Qualität des zu generierenden Bildes. HD erzeugt Bilder mit feineren Details und größerer Konsistenz über das gesamte Bild hinweg. Dieser Parameter wird nur für dall-e-3 unterstützt.
  • response_format (str): Das Format, in dem die generierten Bilder zurückgegeben werden. Muss eines von "url" oder "b64_json" sein. Standardmäßig "url".
  • size (str): Die Größe der generierten Bilder. Muss eine der Größen 256x256, 512x512 oder 1024x1024 für dall-e-2 sein. Muss eine der Größen 1024x1024, 1792x1024 oder 1024x1792 für dall-e-3-Modelle sein. Standardmäßig "1024x1024".
  • style(str | null): Der Stil der generierten Bilder. Muss einer der Stile "vivid" oder "natural" sein. "Vivid" bewirkt, dass das Modell dazu neigt, hyperrealistische und dramatische Bilder zu generieren. "Natural" veranlasst das Modell, natürlicher aussehende, weniger hyperrealistische Bilder zu erzeugen. Dieser Parameter wird nur für dall-e-3 unterstützt.
  • user (str): Ein eindeutiger Bezeichner, der Ihren Endbenutzer repräsentiert und OpenAI bei der Überwachung und Erkennung von Missbrauch unterstützt. Weitere Informationen.
# Erstellen Sie ein Bild

# Legen Sie die Anweisung fest
prompt = "Ein cyberpunk-Affenhacker, der von einer schönen Bananenfahrt träumt, digitale Kunst"

# Rufen Sie die OpenAI API auf
generation_response = client.images.generate(
    model = "dall-e-3",
    prompt=prompt,
    n=1,
    size="1024x1024",
    response_format="url",
)

# Drucken Sie die Antwort aus
print(generation_response)
# Speichern Sie das Bild
generated_image_name = "generiertes_bild.png"  # beliebiger Name; der Dateityp sollte .png sein
generated_image_filepath = os.path.join(image_dir, generated_image_name)
generated_image_url = generation_response.data[0].url  # extrahieren Sie die Bild-URL aus der Antwort
generated_image = requests.get(generated_image_url).content  # laden Sie das Bild herunter

with open(generated_image_filepath, "wb") as image_file:
    image_file.write(generated_image)  # schreiben Sie das Bild in die Datei
# Drucken Sie das Bild aus
print(generated_image_filepath)
display(Image.open(generated_image_filepath))

Variationen

Der Variations-Endpunkt erzeugt neue Bilder (Variationen), die einem Eingangsbild ähnlich sind. API-Referenz

Hier generieren wir Variationen des oben generierten Bildes.

Erforderliche Eingaben:

  • image (str): Das Bild, das als Basis für die Variation(en) verwendet werden soll. Muss eine gültige PNG-Datei sein, kleiner als 4 MB und quadratisch sein.

Optionale Eingaben:

model (str): Das Modell, das für die Bildvariationen verwendet werden soll. Derzeit wird nur dall-e-2 unterstützt.

  • n (int): Die Anzahl der zu generierenden Bilder. Muss zwischen 1 und 10 liegen. Standardmäßig 1.
  • size (str): Die Größe der generierten Bilder. Muss eine der Größen "256x256", "512x512" oder "1024x1024" sein. Kleinere Bilder sind schneller. Standardmäßig "1024x1024".
  • response_format (str): Das Format, in dem die generierten Bilder zurückgegeben werden. Muss eines von "url" oder "b64_json" sein. Standardmäßig "url".
  • user (str): Ein eindeutiger Bezeichner, der Ihren Endbenutzer repräsentiert und OpenAI bei der Überwachung und Erkennung von Missbrauch unterstützt. Weitere Informationen.
# Erzeugen Sie Variationen

# Rufen Sie die OpenAI API auf, verwenden Sie `create_variation` anstelle von `create`
variation_response = client.images.create_variation(
    image=generated_image,  # generated_image ist das oben generierte Bild
    n=2,
    size="1024x1024",
    response_format="url",
)

# Drucken Sie die Antwort aus
print(variation_response)
# Speichern Sie die Bilder
variation_urls = [datum.url for datum in variation_response.data]  # extrahieren Sie die URLs
variation_images = [requests.get(url).content for url in variation_urls]  # laden Sie die Bilder herunter
variation_image_names = [f"variation_image_{i}.png" for i in range(len(variation_images))]  # Namen erstellen
variation_image_filepaths = [os.path.join(image_dir, name) for name in variation_image_names]  # Pfade erstellen
for image, filepath in zip(variation_images, variation_image_filepaths):  # Schleife über die Variationen
    with open(filepath, "wb") as image_file:  # Datei öffnen
        image_file.write(image)  # das Bild in die Datei schreiben
# Drucken Sie das originale Bild aus
print(generated_image_filepath)
display(Image.open(generated_image_filepath))

# Drucken Sie die neuen Variationen aus
for variation_image_filepaths in variation_image_filepaths:
    print(variation_image_filepaths)
    display(Image.open(variation_image_filepaths))

Wie bearbeitet man ein von DALLE3 API generiertes Bild?

Der Bearbeiten-Endpunkt verwendet DALL·E, um einen bestimmten Teil eines vorhandenen Bildes zu generieren. Dazu sind drei Eingaben erforderlich: das zu bearbeitende Bild, eine Maske, die den zu regenerierenden Teil angibt, und eine Anweisung, die das gewünschte Bild beschreibt. API-Referenz

Erforderliche Eingaben:

  • image (str): Das zu bearbeitende Bild. Muss eine gültige PNG-Datei sein, kleiner als 4 MB und quadratisch sein. Wenn keine Maske angegeben ist, muss das Bild Transparenz aufweisen, die als Maske verwendet wird.
  • prompt (str): Eine textuelle Beschreibung des gewünschten Bildes. Die maximale Länge beträgt 1000 Zeichen.

Optionale Eingaben:

  • mask (Datei): Ein zusätzliches Bild, dessen vollständig transparente Bereiche (z. B. dort, wo Alpha null ist) angeben, wo das Bild bearbeitet werden soll. Muss eine gültige PNG-Datei sein, kleiner als 4 MB und die gleichen Abmessungen wie das Bild haben.
  • model (str): Das Modell, das für das Bearbeiten des Bildes verwendet werden soll. Derzeit wird nur dall-e-2 unterstützt.
  • n (int): Die Anzahl der zu generierenden Bilder. Muss zwischen 1 und 10 liegen. Standardmäßig 1.
  • size (str): Die Größe der generierten Bilder. Muss eine der Größen "256x256", "512x512" oder "1024x1024" sein. Kleinere Bilder sind schneller. Standardmäßig "1024x1024".
  • response_format (str): Das Format, in dem die generierten Bilder zurückgegeben werden. Muss eines von "url" oder "b64_json" sein. Standardmäßig "url".
  • user (str): Ein eindeutiger Bezeichner, der Ihren Endbenutzer repräsentiert und OpenAI bei der Überwachung und Erkennung von Missbrauch unterstützt.

Bearbeitungsbereich im DALLE3-API festlegen

Zur Bearbeitung ist eine "Maske" erforderlich, um den zu regenerierenden Teil des Bildes anzugeben. Jeder Pixel mit einem Alpha von 0 (transparent) wird regeneriert. Der folgende Code erstellt eine 1024x1024 Maske, bei der die untere Hälfte transparent ist.

# Erstellen Sie eine Maske
width = 1024
height = 1024
mask = Image.new("RGBA", (width, height), (0, 0, 0, 1))  # Erstellen Sie eine undurchsichtige Bildmaske

# Setzen Sie die untere Hälfte auf transparent
for x in range(width):
    for y in range(height // 2, height):  # Schleife nur über die untere Hälfte der Maske
        # Alpha (A) auf Null setzen, um Pixel transparent zu machen
        alpha = 0
        mask.putpixel((x, y), (0, 0, 0, alpha))

# Maske speichern
mask_name = "bottom_half_mask.png"
mask_filepath = os.path.join(image_dir, mask_name)
mask.save(mask_filepath)

Führen Sie eine Bearbeitung mit DALLE3 API durch

Jetzt können wir unser Bild, unsere Beschreibung und unsere Maske an die API übergeben, um 5 Beispiele für Bearbeitungen unseres Bildes zu erhalten

# Bild bearbeiten

# Rufen Sie die OpenAI-API auf
edit_response = client.images.edit(
    image=open(generated_image_filepath, "rb"),  # aus dem Abschnitt zur Generierung
    mask=open(mask_filepath, "rb"),  # gerade oben
    prompt=prompt,  # aus dem Abschnitt zur Generierung
    n=1,
    size="1024x1024",
    response_format="url",
)

# Drucken Sie die Antwort aus
print(edit_response)
# Speichern Sie das Bild
edited_image_name = "bearbeitetes_bild.png"  # beliebiger Name; der Dateityp sollte .png sein
edited_image_filepath = os.path.join(image_dir, edited_image_name)
edited_image_url = edit_response.data[0].url  # extrahieren Sie die Bild-URL aus der Antwort
edited_image = requests.get(edited_image_url).content  # laden Sie das Bild herunter

with open(edited_image_filepath, "wb") as image_file:
    image_file.write(edited_image)  # schreiben Sie das Bild in die Datei
# Drucken Sie das originale Bild aus
print(generated_image_filepath)
display(Image.open(generated_image_filepath))

# Drucken Sie das bearbeitete Bild aus
print(edited_image_filepath)
display(Image.open(edited_image_filepath))

Dieser Abschnitt ist eine Fortsetzung, wie Sie Bildbearbeitungen mit der DALL · E API durchführen können, wobei der Schwerpunkt auf dem Speichern und Anzeigen der bearbeiteten Bilder liegt.

Nachdem Sie das bearbeitete Bild von der DALL·E API erhalten haben, wie in den vorherigen Schritten gezeigt, können Sie damit fortfahren, das Bild in einem bestimmten Verzeichnis zu speichern und es zur Überprüfung oder für weitere Maßnahmen anzuzeigen. Die bereitgestellten Schritte zeigen, wie man die Bilddateien effektiv verwaltet, um sicherzustellen, dass sie für eine nachfolgende Verarbeitung oder Überprüfung zugänglich sind.

Speichern des bearbeiteten Bildes mit der DALLE3 API

Nach Erhalt der Antwort von der Bearbeiten-Endpunkt der DALL·E API können Sie das bearbeitete Bild mithilfe des folgenden Python-Codeausschnitts speichern. Dieser Code zeigt, wie man die Bild-URL aus der API-Antwort extrahiert, das Bild herunterlädt und in einer Datei innerhalb Ihres angegebenen Verzeichnisses speichert.

# Speichern Sie das bearbeitete Bild
edited_image_name = "bearbeitetes_bild.png"  # Legen Sie den Dateinamen für das bearbeitete Bild fest
edited_image_filepath = os.path.join(image_dir, edited_image_name)  # Erstellen Sie den vollständigen Dateipfad
edited_image_url = edit_response.data[0].url  # extrahieren Sie die Bild-URL aus der Antwort

# Laden Sie das Bild von der URL herunter
edited_image = requests.get(edited_image_url).content

# Öffnen Sie die Datei im binären Schreibmodus und speichern Sie das heruntergeladene Bild
with open(edited_image_filepath, "wb") as image_file:
    image_file.write(edited_image)

Anzeigen des bearbeiteten Bildes

Nachdem Sie das bearbeitete Bild gespeichert haben, möchten Sie es möglicherweise in Ihrem Jupyter-Notebook anzeigen, um die Bearbeitungsergebnisse visuell zu bestätigen. Der folgende Codeausschnitt verwendet die Image-Klasse aus dem PIL-Paket zum Laden und Anzeigen der bearbeiteten Bilddatei.

# Zeigen Sie das bearbeitete Bild an
print("Bearbeitetes Bild:")
display(Image.open(edited_image_filepath))

Dieser Abschnitt des Codes liest das bearbeitete Bild aus der zuvor gespeicherten Datei und zeigt es mithilfe der Funktion display an, die in Jupyter-Notebooks besonders nützlich ist, um Bilder und andere Multimedia-Elemente inline zu visualisieren.

Optimierung der DALLE3-API-Leistung

Effektive Anweisungen erstellen

Die DALL E-Prompts-Anleitung spielt eine entscheidende Rolle für die Qualität der generierten Bilder. Das Verständnis dafür, wie man DALL E 3 mit Chat GPT verwendet, beinhaltet die Beherrschung der Kunst des Anweisungsschreibens, was sich erheblich auf die Relevanz und Kreativität der Ausgabe auswirken kann.

DALLE 3 effektiv zu verwenden bedeutet, mit verschiedenen Anweisungsstilen und -strukturen zu experimentieren, um die gewünschten Ergebnisse zu erzielen.

Verwalten Sie die Kosten der DALLE3-API

DALL-E-Preisgestaltung, einschließlich der DALL E 3-Preisgestaltung und der DALL-E 2-Preisgestaltung, variiert je nach Verwendung. Die Verwaltung Ihres DALL E-Limits und das Verständnis, wie viel DALL E-Wertschätzung und wie viel kostet DALLE 2, sind entscheidend, um die Leistung zu optimieren und gleichzeitig die Kosten im Griff zu behalten.

Auch die DALL-E-Dimensionen und die DALLE-Auflösung beeinflussen die Nutzungskosten und bieten eine Balance zwischen Qualität und Ausgaben.

Die Entwicklung von DALL-E 2 zu DALL-E 3

Der Übergang von DALL E 2 vs DALL E 3 zeigt bedeutende Fortschritte bei der KI-gesteuerten Bildgenerierung.

Mit jeder Veröffentlichung, einschließlich des erwarteten DALLE 3-Veröffentlichungsdatums, hat OpenAI die Grenzen des Möglichen ausgeweitet und ist zu einer äußerst vielseitigen und leistungsfähigen DALL-E 3 OpenAI-Plattform gekommen.

Fazit

Bevor wir abschließend sagen, könnten Sie einen Blick auf Anakin AI werfen.

Anakin AI, All Your AI Models in One Place
Anakin AI, Alle Ihre KI-Modelle an einem Ort

Schwierigkeiten bei der Bezahlung von über 100 KI-API-Rechnungen? Anakin AI kombiniert alles an einem Ort! KI-Modelle wie GPT, DALL-E und Stable Diffusion. Hier sind Gründe, warum Anakin AI herausragt:

  • All-in-One-Plattform: Greifen Sie problemlos auf verschiedene KI-Modelle an einem Ort zu, ohne mehrere APIs oder Abrechnungskonten verwalten zu müssen.
  • Keine Zahlungsschwierigkeiten: Tauchen Sie ohne die Schwierigkeiten von Einrichtungs- und Zahlungsprozessen in die KI ein und machen Sie sie so für ein breiteres Publikum zugänglich.
  • No-Code-App-Builder: Ermöglichen Sie Benutzern die Erstellung von KI-gesteuerten Anwendungen ohne jede Programmierkenntnisse und eröffnen Sie damit endlose Möglichkeiten für Innovation und Kreativität.

Anakin AI ist Ihr Gateway, um die Kraft der künstlichen Intelligenz zu erkunden und zu nutzen, und erleichtert es Ihnen mehr denn je, KI in Ihre Projekte oder geschäftlichen Lösungen zu integrieren.

Claude | Free AI tool | Anakin.ai
You can experience Claude-3-Opus, Claude-3-Sonnet, Claude-2.1 and Claude-Instant in this application. Claude is an intelligent conversational assistant based on large-scale language models. It can handle context with up to tens of thousands of words in a single conversation. It is committed to prov…

Wenn wir in die Zukunft blicken, erweitert sich das Potenzial von DALL-E 3 und nachfolgenden Modellen wie DALL-E 2 API und DALL-E2 API weiter. Die Kombination aus DALL-Definition, E-API und E-APIs im OpenAI-DALL-E-API-Ökosystem lässt eine Zukunft erwarten, in der die Rolle der KI in kreativen Prozessen zunehmend zentral wird.

Zusammenfassend lässt sich sagen, dass das Beherrschen der DALLE3-API eine große Leinwand für digitale Kreativität und Innovation eröffnet. Indem Benutzer lernen, wie man DALLE3 nutzt, angefangen vom Zugriff auf die API bis hin zur Erstellung von effektiven Anweisungen und zur Verwaltung von Ressourcen, können sie neue Horizonte in der KI-gesteuerten Kunst und Gestaltung erkunden. Ob Sie sich auf die Verwendung von DALL-E 3 für professionelle Projekte oder persönliche Erkundungen konzentrieren, die Reise in die Welt der KI-generierten Bilder verspricht faszinierend und lohnend zu sein.