Comment écrire des invites négatives dans FLUX

FLUX, un modèle révolutionnaire de génération d'images par IA, gagne rapidement en popularité dans le monde de l'art numérique. Célébré pour sa capacité remarquable à générer des images de haute qualité à partir de simples instructions textuelles, il est rapidement devenu un outil incontournable pour les artistes et les créateurs.

Build APIs Faster & Together in Apidog

Comment écrire des invites négatives dans FLUX

Start for free
Inhalte

FLUX, un modèle révolutionnaire de génération d'images par IA, gagne rapidement en popularité dans le monde de l'art numérique. Célébré pour sa capacité remarquable à générer des images de haute qualité à partir de simples instructions textuelles, il est rapidement devenu un outil incontournable pour les artistes et les créateurs. Cependant, une limitation notable a été son manque de support pour les instructions négatives — une fonctionnalité qui permet aux utilisateurs d'exclure des éléments spécifiques de leurs images générées. Dans cet article, nous explorerons une récente avancée qui permet d'utiliser des instructions négatives dans FLUX et fournirons un guide étape par étape sur la façon de les mettre en œuvre efficacement.

💡
Voulez-vous générer des images réalistes avec FLUX maintenant ?

Essayez-le sur Anakin AI!

Qu'est-ce que les instructions négatives ?

Les instructions négatives sont des directives spécifiques qui guident l'IA pour exclure certains éléments d'une image. Cette fonctionnalité est essentielle pour les créateurs qui souhaitent un meilleur contrôle sur le rendu, les aidant à éviter des détails indésirables ou à affiner le produit final. Au départ, FLUX ne supportait pas les instructions négatives et n'autorisait pas des valeurs de guidance sans classificateur (CFG) autres que 1. En conséquence, les utilisateurs étaient limités dans leur capacité à peaufiner les images.

Seuil dynamique : Une solution pour les instructions négatives dans FLUX

Une solution développée par la communauté des utilisateurs a permis d'utiliser des instructions négatives et d'ajuster les valeurs CFG dans FLUX. Cette méthode, appelée Seuil Dynamique, améliore considérablement les capacités de FLUX en offrant aux utilisateurs plus de flexibilité et de contrôle.

Comment fonctionne le seuil dynamique

Le seuil dynamique fonctionne en redimensionnant les valeurs latentes et en limitant les extrêmes. Cela évite la saturation excessive et l'effondrement de la qualité d'image lors de l'utilisation de valeurs CFG plus élevées. En gérant ces valeurs latentes, il garantit que l'image reste équilibrée et visuellement attrayante, même lorsque des instructions plus détaillées sont fournies.

Mise en œuvre du seuil dynamique dans FLUX

Pour mettre en œuvre le seuil dynamique, les utilisateurs doivent installer l'extension sd-dynamic-thresholding dans leur configuration FLUX. Cela se fait généralement via des interfaces comme ComfyUI ou des plateformes similaires, permettant une intégration fluide de cette fonctionnalité puissante.

Configuration pour les instructions négatives pour FLUX

Ce dont vous avez besoin :

  1. Modèle FLUX
  2. ComfyUI ou une interface similaire
  3. Extension sd-dynamic-thresholding

Travaillons donc là-dessus !

  1. Installez l'extension sd-dynamic-thresholding.
  2. Dans ComfyUI, ajoutez le nœud DynamicThresholdingFull.
  3. Connectez votre modèle FLUX à l'entrée du nœud DynamicThresholdingFull.
  4. Liez la sortie à l'entrée de votre KSampler.

Comment optimiser les paramètres du seuil dynamique

En gros, vous devez vous occuper de ces paramètres :

  • Échelle CFG : Généralement fixée entre 3 et 7. Des valeurs plus élevées augmentent l'adhérence à l'instruction mais peuvent entraîner une saturation excessive.
  • Interpolation Phi : Contrôle la saturation de l'image. Les valeurs entre 0.7 et 0.9 donneront souvent les meilleurs résultats.
  • Échelle Mimic et Mode CFG : « Demie Cosine Up » pour les deux paramètres a montré qu'elle produisait des résultats optimaux.

Bien qu'augmenter le CFG améliore l'adhérence à l'instruction, cela peut ralentir la génération. Trouvez un équilibre entre le CFG et l'échelle de guidance intégrée de Flux pour des résultats optimaux.

Voici quelques conseils supplémentaires concernant les valeurs CFG :

  1. Images réalistes : Valeur CFG plus basse (environ 2 à 3) et réduire l'Interpolation Phi (0.6 à 0.7).
  2. Rendus artistiques : Valeur CFG plus élevée (4 à 6) et augmenter l'Interpolation Phi (0.8 à 0.9).
  3. Concepts abstraits : Expérimentez avec des valeurs CFG extrêmes (7+) mais soyez prêt à des résultats plus imprévisibles.

Voici quelques paramètres d'exemple que vous pouvez utiliser :

Échelle CFG : 3

Interpolation Phi : 0.7

Échelle Mimic : Demie Cosine Up

Mode CFG : Demie Cosine Up

Comment rédiger les meilleures instructions pour FLUX

La plupart des instructions négatives de Stable Diffusion fonctionnent dans FLUX. Voici un exemple :

flou, couleurs surexposées, bâtiments modernes, personnes, animaux autres que les carpes koï, texte, logos, filigranes, proportions déformées, éclairage irréaliste

Il est toujours préférable de créer des instructions négatives en fonction du type d'images que vous souhaitez créer. Pour la photographie de portrait :

Instructions positives : Portrait professionnel d'une femme d'âge moyen avec des cheveux courts gris, un sourire chaleureux et des yeux gentils. Éclairage naturel en extérieur, faible profondeur de champ, arrière-plan bokeh d'un parc. Photo de haute qualité en DSLR, mise au point nette sur le visage.

Instructions négatives : jeune apparence, longs cheveux, cadre intérieur, éclairage dur, mise au point floue, plusieurs personnes, accessoires, chapeaux, lunettes

Voici le résultat du test :

Vous pouvez le tester ici sur Anakin AI :

FLUX Réalisme LoRA en ligne | Anakin

Élevez vos images générées par IA avec un photoréalisme inégalé grâce à FLUX Réalisme LoRA.

app.anakin.ai

Comment rédiger de meilleures instructions FLUX, en général

  1. Saturation excessive : Si les images semblent trop saturées, réduisez la valeur d'Interpolation Phi.
  2. Manque d'adhérence à l'instruction : Augmentez progressivement l'échelle CFG, mais soyez conscient de l'impact sur les performances.
  3. Génération lente : Envisagez d'utiliser une résolution inférieure pour les tests initiaux, puis augmentez-la pour les rendus finaux.
  4. Résultats incohérents : Expérimentez avec différentes valeurs de seed pour trouver des points de départ optimaux.

Et vous pourriez vouloir considérer ces techniques pour améliorer la qualité de vos images :

  • Intégration LoRA : Combinez le seuil dynamique avec des modèles LoRA pour un contrôle encore plus précis.