FLUX, ein bahnbrechendes KI-Bildgenerierungsmodell, gewinnt schnell an Popularität in der digitalen Kunstwelt. Es wird für seine bemerkenswerte Fähigkeit gefeiert, hochwertige Bilder aus einfachen Textaufforderungen zu generieren und ist schnell zu einem bevorzugten Werkzeug für Künstler und Kreative geworden. Eine bemerkenswerte Einschränkung war jedoch die fehlende Unterstützung für negative Aufforderungen – ein Feature, das es den Nutzern ermöglicht, bestimmte Elemente aus ihren generierten Bildern auszuschließen. In diesem Artikel werden wir einen kürzlich erzielten Durchbruch untersuchen, der negative Aufforderungen in FLUX ermöglicht, und eine Schritt-für-Schritt-Anleitung geben, wie man sie effektiv implementiert.
Was sind negative Aufforderungen?
Negative Aufforderungen sind spezifische Anweisungen, die die KI leiten, bestimmte Elemente aus einem Bild auszuschließen. Dieses Feature ist entscheidend für Kreative, die mehr Kontrolle über das Ergebnis möchten, da es ihnen hilft, unerwünschte Details zu vermeiden oder das Endprodukt zu verfeinern. Zunächst unterstützte FLUX keine negativen Aufforderungen oder erlaubte keine Classifier-Free Guidance (CFG) Werte außer 1. Infolgedessen waren die Nutzer in ihrer Fähigkeit, Bilder feinzujustieren, eingeschränkt.
Dynamisches Thresholding: Eine Lösung für negative Aufforderungen in FLUX
Eine von der Nutzer-Community entwickelte Lösung hat es ermöglicht, negative Aufforderungen in FLUX zu verwenden und CFG-Werte anzupassen. Diese Methode, genannt Dynamisches Thresholding, verbessert die Fähigkeiten von FLUX erheblich, indem sie den Nutzern mehr Flexibilität und Kontrolle gibt.
Wie dynmisches Thresholding funktioniert
Dynamisches Thresholding funktioniert, indem latente Werte skaliert und extreme Werte begrenzt werden. Dies verhindert Übersättigung und den Zusammenbruch der Bildqualität bei Verwendung höherer CFG-Werte. Durch die Steuerung dieser latenten Werte wird sichergestellt, dass das Bild ausgewogen und visuell ansprechend bleibt, selbst wenn detailliertere Anweisungen gegeben werden.
Implementierung des dynamischen Thresholdings in FLUX
Um dynamisches Thresholding zu implementieren, müssen die Nutzer die sd-dynamic-thresholding-Erweiterung in ihrer FLUX-Installation installieren. Dies geschieht typischerweise über Schnittstellen wie ComfyUI oder ähnliche Plattformen, die eine nahtlose Integration dieses leistungsstarken Features ermöglichen.
Einrichten von negativen Aufforderungen für FLUX
Was du benötigst:
- FLUX-Modell
- ComfyUI oder eine ähnliche Schnittstelle
- sd-dynamic-thresholding-Erweiterung
Jetzt lass uns an die Arbeit gehen!
- Installiere die sd-dynamic-thresholding-Erweiterung.
- Füge in ComfyUI den DynamicThresholdingFull-Knoten hinzu.
- Verbinde dein FLUX-Modell mit dem Eingang des DynamicThresholdingFull-Knotens.
- Verbinde den Ausgang mit dem Eingang deines KSampler.
So optimierst du die Parameter für dynamisches Thresholding
Im Grunde musst du auf diese Parameter achten:
- CFG-Skala: Typischerweise zwischen 3–7 eingestellt. Höhere Werte erhöhen die Befolgung der Aufforderungen, können jedoch zu Übersättigung führen.
- Interpolieren Phi: Steuert die Bildsättigung. Werte zwischen 0.7–0.9 liefern oft die besten Ergebnisse.
- Nachahmungsskalierung und CFG-Modus: "Halbe Kosinus nach oben" für beide Parameter hat sich als optimal erwiesen.
Während das Erhöhen von CFG die Befolgung der Aufforderungen verbessert, kann es die Generierung verlangsamen. Finde ein Gleichgewicht zwischen CFG und der integrierten Flux Guidance Scale für optimale Ergebnisse.
Hier sind einige weitere Tipps zu CFG-Werten:
- Realistische Bilder: Niedrigere CFG (ca. 2–3) und reduziertes Interpolieren Phi (0.6–0.7).
- Künstlerische Darstellungen: Höhere CFG (4–6) und erhöhtes Interpolieren Phi (0.8–0.9).
- Abstrakte Konzepte: Experimentiere mit extremen CFG-Werten (7+) sei aber auf unvorhersehbare Ergebnisse vorbereitet.
Hier sind einige Beispiel-Einstellungen, die du verwenden kannst:
CFG-Skala: 3
Interpolieren Phi: 0.7
Nachahmungsskalierung: Halbe Kosinus nach oben
CFG-Modus: Halbe Kosinus nach oben
Wie man die besten Aufforderungen für FLUX schreibt
Die meisten negativen Aufforderungen von Stable Diffusion funktionieren in FLUX. Hier ist ein Beispiel:
verschwommen, übersättigte Farben, moderne Gebäude, Menschen, Tiere außer Koi-Fischen, Text, Logos, Wasserzeichen, verzerrte Proportionen, unrealistische Beleuchtung
Es ist immer am besten, negative Aufforderungen basierend auf der Art der Bilder zu erstellen, die du erzeugen möchtest. Für Porträtfotografie:
Positive Aufforderungen: Professionelles Porträt einer mittelalten Frau mit kurzen grauen Haaren, warmem Lächeln und freundlichen Augen. Natürliches Außenlicht, geringe Schärfentiefe, Bokeh-Hintergrund eines Parks. Hochwertiges DSLR-Foto, scharfer Fokus auf das Gesicht.
Negative Aufforderungen: jüngeres Aussehen, lange Haare, Innenraum, grelles Licht, verschwommene Sicht, mehrere Personen, Accessoires, Hüte, Brillen
Hier ist das Testergebnis:
Du kannst es hier bei Anakin AI ausprobieren:
FLUX Realism LoRA Online | Anakin
Erhebe deine KI-generierten Bilder mit unvergleichlichem fotorealismus mithilfe von FLUX Realism LoRA.
app.anakin.ai
Wie man allgemein bessere FLUX-Aufforderungen schreibt
- Übersättigung: Wenn Bilder zu gesättigt erscheinen, reduziere den Wert von Interpolieren Phi.
- Mangelnde Befolgung der Aufforderung: Erhöhe die CFG-Skala schrittweise, berücksichtige dabei jedoch die Auswirkungen auf die Leistung.
- Langsame Generierung: Erwäge, für erste Tests eine niedrigere Auflösung zu verwenden und dann für die endgültigen Ausgaben nach oben zu skalieren.
- Inkonsistente Ergebnisse: Experimentiere mit unterschiedlichen Seed-Werten, um optimale Ausgangspunkte zu finden.
Und du möchtest vielleicht diese Techniken in Betracht ziehen, um die Qualität deiner Bilder zu verbessern:
- LoRA-Integration: Kombiniere dynamisches Thresholding mit LoRA-Modellen für noch präzisere Kontrolle.