FLUX、画期的なAI画像生成モデルは、デジタルアートの世界で急速に人気を博しています。シンプルなテキストプロンプトから高品質な画像を生成する卓越した能力で称賛され、アーティストやクリエイターにとって必要不可欠なツールとなっています。しかし、特定の要素を生成された画像から除外することを可能にするネガティブプロンプトのサポートが欠如しているという顕著な制約がありました。この記事では、FLUXにネガティブプロンプトを実装するための最近のブレークスルーを探求し、それを効果的に実装するためのステップバイステップガイドを提供します。


ネガティブプロンプトとは何ですか?
ネガティブプロンプトは、AIに画像から特定の要素を除外するよう指導する具体的な指示です。この機能は、出力に対してより多くの制御を望むクリエイターにとって重要で、不要な詳細を避けたり、最終製品を洗練させたりするのに役立ちます。最初、FLUXはネガティブプロンプトをサポートせず、1以外のClassifier-Free Guidance(CFG)値を許可していませんでした。その結果、ユーザーは画像を微調整する能力が制限されていました。
ダイナミックスラジング:FLUXにおけるネガティブプロンプトの解決策
ユーザーコミュニティによって開発された解決策により、FLUXでネガティブプロンプトとCFG値を調整することが可能になりました。この手法はダイナミックスラジングと呼ばれ、ユーザーにより多くの柔軟性と制御を与えることでFLUXの能力を大幅に向上させます。
ダイナミックスラジングの仕組み
ダイナミックスラジングは、潜在値をスケーリングし、極端な値を制限することによって機能します。これにより、CFG値を高く設定した際に過剰な飽和や画像品質の低下を防ぐことができます。これらの潜在値を管理することで、画像がバランスの取れた視覚的に魅力的なものとなることを保証します。
FLUXでのダイナミックスラジングの実装
ダイナミックスラジングを実装するには、ユーザーはFLUXセットアップにsd-dynamic-thresholding拡張機能をインストールする必要があります。これは通常、ComfyUIや類似のプラットフォームなどのインターフェースを通じて行われ、この強力な機能のシームレスな統合を可能にします。
FLUX用ネガティブプロンプトの設定
必要なもの:
- FLUXモデル
- ComfyUIまたは類似のインターフェース
- sd-dynamic-thresholding拡張機能
さあ、始めましょう!
- sd-dynamic-thresholding拡張機能をインストールします。
- ComfyUIで、DynamicThresholdingFullノードを追加します。
- FLUXモデルをDynamicThresholdingFullノードの入力に接続します。
- 出力をKSamplerの入力にリンクします。
ダイナミックスラジングのパラメータを最適化する方法
基本的に、これらのパラメータに注意する必要があります:
- CFGスケール: 通常3〜7の範囲に設定します。値を高くするほどプロンプトの遵守が向上しますが、過剰な飽和を引き起こす可能性があります。
- 補間Phi: 画像の飽和を制御します。0.7〜0.9の値が最良の結果を得られることが多いです。
- 模倣スケールとCFGモード: 両方のパラメータで「ハーフコサインアップ」が最適な結果をもたらすことが証明されています。
CFGを増やすとプロンプトの遵守が改善されますが、生成速度が遅くなる可能性があります。最適な結果を得るために、CFGと内蔵のFlux Guidance Scaleのバランスを見つけることが重要です。
CFG値についての追加のヒントはこちらです:
- リアルな画像: CFGを低く設定(約2〜3)し、補間Phiを減少(0.6〜0.7)させます。
- アート的レンダリング: CFGを高く設定(4〜6)し、補間Phiを増やします(0.8〜0.9)。
- 抽象的概念: 極端なCFG値(7以上)で実験しますが、より予測不能な結果が得られることに備えてください。
使用可能な設定の例はこちらです:
CFGスケール: 3
補間Phi: 0.7
模倣スケール: ハーフコサインアップ
CFGモード: ハーフコサインアップ
FLUXに最適なプロンプトを書く方法
Stable DiffusionからのほとんどのネガティブプロンプトはFLUXで機能します。以下はその例です:
ぼやけた、過剰に飽和した色、近代的な建物、人々、鯉以外の動物、テキスト、ロゴ、透かし、歪んだ比率、非現実的なライティング
作成したい画像のタイプに基づいてネガティブプロンプトを作成するのが最善です。ポートレート写真の場合:
ポジティブプロンプト: 短い灰色の髪を持つ中年女性のプロフェッショナルポートレート、温かい笑顔、優しい目。自然な屋外ライティング、浅い被写界深度、パークのボケ背景。高品質なDSLR写真、顔にシャープな焦点。
ネガティブプロンプト: 若々しい外見、長い髪、屋内設定、厳しいライティング、ぼやけた焦点、複数の人々、アクセサリー、帽子、眼鏡
こちらがテスト結果です:
こちらでAnakin AIを使ってお試しいただけます:
FLUX Realism LoRA Online | Anakin
FLUX Realism LoRAを使用して、比類のないフォトリアリズムでAI生成画像を向上させましょう。
app.anakin.ai
一般的にFLUXプロンプトをより良く書く方法
- 過剰飽和: 画像が過飽和に見える場合は、補間Phi値を減少させます。
- プロンプト遵守の欠如: CFGスケールを徐々に増やしますが、性能への影響に注意してください。
- 生成の遅延: 初期テストには低解像度を使用し、最終的な出力にはスケールアップを検討してください。
- 不均一な結果: 様々なシード値で実験して最適なスタート地点を見つけます。
画像品質を向上させるためにこれらの技術を考慮することもお勧めです:
- LoRA統合: ダイナミックスラジングとLoRAモデルを組み合わせて、より正確な制御を実現します。
