FLUXは、革新的なAI画像生成モデルであり、デジタルアートの世界で急速に人気を集めています。シンプルなテキストプロンプトから高品質な画像を生成する卓越した能力で称賛されており、アーティストやクリエイターにとってすぐに使えるツールとなっています。しかし、注目すべき制限は、生成された画像から特定の要素を除外することを可能にする「ネガティブプロンプト」のサポートが欠如していることです。本記事では、FLUXでネガティブプロンプトを可能にする最近のブレークスルーを探り、それを効果的に実装する方法についてのステップバイステップガイドを提供します。
ネガティブプロンプトとは何ですか?
ネガティブプロンプトは、AIに画像から特定の要素を除外するよう指示を与える具体的な指示です。この機能は、出力をより制御したいクリエイターにとって重要であり、不要な詳細を避けたり最終的な製品を洗練させたりするのに役立ちます。当初、FLUXはネガティブプロンプトをサポートしておらず、1以外のクラスファイアフリーガイダンス(CFG)値を許可していませんでした。その結果、ユーザーは画像の微調整の能力が制限されていました。
ダイナミックスレッショルディング:FLUXにおけるネガティブプロンプトの解決策
ユーザーコミュニティによって開発された解決策により、FLUXでネガティブプロンプトを使用し、CFG値を調整することが可能になりました。この方法はダイナミックスレッショルディングと呼ばれ、ユーザーにより多くの柔軟性と制御を提供することで、FLUXの機能を大幅に向上させます。
ダイナミックスレッショルディングの仕組み
ダイナミックスレッショルディングは、潜在値のリスケーリングと極端な値のクランプを行います。これにより、高いCFG値を使用する際の画像品質の過剰飽和や崩壊を防ぎます。これらの潜在値を管理することにより、詳細な指示が提供されても画像がバランスが取れて視覚的に魅力的であることを保証します。
FLUXにおけるダイナミックスレッショルディングの実装
ダイナミックスレッショルディングを実装するには、ユーザーはFLUXの設定にsd-dynamic-thresholding拡張をインストールする必要があります。これは通常、ComfyUIなどのインターフェースを介して行われ、この強力な機能のシームレスな統合を可能にします。
FLUX用のネガティブプロンプトの設定
必要なもの:
- FLUXモデル
- ComfyUIまたは同様のインターフェース
- sd-dynamic-thresholding拡張
さあ、作業を始めましょう!
- sd-dynamic-thresholding拡張をインストールします。
- ComfyUIでDynamicThresholdingFullノードを追加します。
- FLUXモデルをDynamicThresholdingFullノードの入力に接続します。
- 出力をKSamplerの入力に接続します。
ダイナミックスレッショルディングパラメータの最適化方法
基本的に、次のパラメータに注意する必要があります:
- CFGスケール: 通常、3〜7の間に設定します。高い値はプロンプトの遵守を高めますが、過剰飽和につながる可能性があります。
- インターポレートファイ: 画像の飽和度を制御します。0.7〜0.9の値が最良の結果をもたらすことが多いです。
- ミミックスケールおよびCFGモード: 両方のパラメータに「ハーフコサインアップ」を設定すると最適な結果が得られます。
CFGを高めることでプロンプトの遵守が向上しますが、生成速度が遅くなることがあります。CFGと組み込みのFlux Guidanc Scaleとのバランスを見つけて最適な結果を得てください。
CFG値についての追加のヒントは以下の通りです:
- リアルな画像: CFGを低め(約2〜3)にし、インターポレートファイを削減(0.6〜0.7)します。
- 芸術的なレンダリング: CFGを高め(4〜6)にし、インターポレートファイを増加(0.8〜0.9)させます。
- 抽象的な概念: 極端なCFG値(7以上)で実験しますが、より予測不可能な結果に備えてください。
以下は、使用できる設定の例です:
CFGスケール: 3
インターポレートファイ: 0.7
ミミックスケール: ハーフコサインアップ
CFGモード: ハーフコサインアップ
FLUXのための最良のプロンプトを書く方法
Stable DiffusionのほとんどのネガティブプロンプトはFLUXで動作します。以下は例です:
ぼやけた、過剰に飽和した色、現代的な建物、人々、コイ以外の動物、テキスト、ロゴ、透かし、歪んだ比率、非現実的な照明
作成したい画像のタイプに基づいてネガティブプロンプトを作成することが最良です。ポートレート写真の場合:
ポジティブプロンプト: 短い灰色の髪、中年の女性のプロフェッショナルポートレート、温かい笑顔、優しい目。自然な屋外の照明、浅い被写界深度、公園のボケた背景。高品質のDSLR写真、顔にシャープな焦点。
ネガティブプロンプト: 若々しい外見、長い髪、屋内の設定、厳しい照明、ぼやけた焦点、複数の人々、アクセサリー、帽子、眼鏡
テスト結果は以下の通りです:
こちらでAnakin AIを使ってテストできます:
FLUXリアリズムLoRAオンライン | Anakin
FLUXリアリズムLoRAを用いて、比類のないフォトリアリズムでAI生成画像を向上させましょう。
app.anakin.ai
一般的にFLUXプロンプトを書く方法
- 過剰飽和: 画像が過剰に飽和している場合は、インターポレートファイの値を減らします。
- プロンプトの遵守不足: CFGスケールを徐々に増加させますが、パフォーマンスへの影響に注意してください。
- 生成の遅延: 初期テストに低解像度を使用し、最終出力のためにスケールアップを検討してください。
- 不一致な結果: 最適なスタートポイントを見つけるために異なるシード値で実験します。
さらに画像品質を向上させるための技術を考慮する価値があります:
- LoRA統合: ダイナミックスレッショルディングとLoRAモデルを組み合わせて、さらに正確な制御を実現します。