FLUX, революционная модель генерации изображений на основе ИИ, быстро набирает популярность в мире цифрового искусства. Прославленная своей выдающейся способностью создавать качественные изображения из простых текстовых подсказок, она быстро стала незаменимым инструментом для художников и создателей. Однако заметным ограничением была её неспособность поддерживать отрицательные подсказки — функцию, позволяющую пользователям исключать конкретные элементы из создаваемых изображений. В этой статье мы рассмотрим недавний прорыв, который позволяет использовать отрицательные подсказки в FLUX, и предоставим пошаговое руководство по их эффективной реализации.


Что такое отрицательные подсказки?
Отрицательные подсказки — это специфические инструкции, которые направляют ИИ на исключение определенных элементов из изображения. Эта функция важна для создателей, которые хотят иметь больший контроль над результатом, помогая им избежать нежелательных деталей или улучшить конечный продукт. Изначально FLUX не поддерживала отрицательные подсказки и не разрешала значения Классификатора без Руководства (CFG), кроме 1. В результате пользователи были ограничены в возможности тонкой настройки изображений.
Динамическое пороговое значение: решение для отрицательных подсказок в FLUX
Решение, разработанное сообществом пользователей, позволило использовать отрицательные подсказки и настраивать значения CFG в FLUX. Этот метод, называемый Динамическим пороговым значением, значительно расширяет возможности FLUX, предоставляя пользователям больше гибкости и контроля.
Как работает Динамическое пороговое значение
Динамическое пороговое значение работает, изменяя масштаб латентных значений и фиксируя крайние значения. Это предотвращает перенасыщение и ухудшение качества изображения при использовании более высоких значений CFG. Управляя этими латентными значениями, оно обеспечивает сбалансированность и визуальную привлекательность изображения, даже при более детализированных инструкциях.
Реализация Динамического порогового значения в FLUX
Чтобы реализовать Динамическое пороговое значение, пользователям необходимо установить расширение sd-dynamic-thresholding в их установку FLUX. Это обычно делается через интерфейсы, такие как ComfyUI или аналогичные платформы, позволяя бесшовную интеграцию этой мощной функции.
Настройка для отрицательных подсказок для FLUX
Что вам нужно:
- Модель FLUX
- ComfyUI или аналогичный интерфейс
- расширение sd-dynamic-thresholding
Теперь давайте начнем!
- Установите расширение sd-dynamic-thresholding.
- В ComfyUI добавьте узел DynamicThresholdingFull.
- Подключите вашу модель FLUX к входу узла DynamicThresholdingFull.
- Сопрягите выходные данные с входом вашего KSampler.
Как оптимизировать параметры Динамического порогового значения
В основном, вам нужно обратить внимание на следующие параметры:
- CFG Scale: Обычно устанавливается в диапазоне от 3 до 7. Более высокие значения увеличивают adherence к подсказкам, но могут привести к перенасыщению.
- Interpolate Phi: Управляет насыщенностью изображения. Значения от 0.7 до 0.9, как правило, дают лучшие результаты.
- Mimic Scale и CFG Mode: "Half Cosine Up" для обоих параметров показывает оптимальные результаты.
Хотя увеличение CFG улучшает adherence к подсказкам, это может замедлить генерацию. Найдите баланс между CFG и встроенным шкалированием Flux Guidance для получения оптимальных результатов.
Вот еще несколько советов по значениям CFG:
- Реалистичные изображения: Более низкий CFG (около 2–3) и уменьшите Interpolate Phi (0.6–0.7).
- Художественные изображения: Более высокий CFG (4–6) и увеличьте Interpolate Phi (0.8–0.9).
- Абстрактные концепции: Экспериментируйте с крайними значениями CFG (7+), но будьте готовы к менее предсказуемым результатам.
Вот некоторые примеры настроек, которые вы можете использовать:
CFG Scale: 3
Interpolate Phi: 0.7
Mimic Scale: Half Cosine Up
CFG Mode: Half Cosine Up
Как написать лучшие подсказки для FLUX
Большинство отрицательных подсказок из Stable Diffusion работают в FLUX. Вот пример:
размыто, перенасыщенные цвета, современные здания, люди, животные, кроме карпов кои, текст, логотипы, водяные знаки, искаженные пропорции, нереалистичное освещение
Всегда лучше создавать отрицательные подсказки в зависимости от типа изображений, которые вы хотите создать. Для портретной фотографии:
Положительные подсказки: Профессиональный портрет пожилой женщины с короткими серыми волосами, теплой улыбкой и добрыми глазами. Естественное освещение на улице, малый глубина резкости, боке на фоне парка. Высококачественное фото на DSLR, четкий фокус на лице.
Отрицательные подсказки: молодой вид, длинные волосы, внутри помещения, резкое освещение, размытый фокус, несколько людей, аксессуары, шляпы, очки
Вот результат теста:
Вы можете протестировать это здесь на Anakin AI:
FLUX Realism LoRA Online | Anakin
Повышайте качество ваших изображений, созданных ИИ, с непревзойденным фотореализмом с помощью FLUX Realism LoRA.
app.anakin.ai
Как писать лучшие подсказки для FLUX, в общем
- Перенасыщение: Если изображения выглядят слишком насыщенными, уменьшите значение Interpolate Phi.
- Отсутствие adherence к подсказкам: Постепенно увеличивайте масштаб CFG, но будьте внимательны к влиянию на производительность.
- Медленная генерация: Рассмотрите возможность использования более низкого разрешения для первых тестов, а затем увеличьте разрешение для окончательных выводов.
- Непоследовательные результаты: Экспериментируйте с различными значениями семян, чтобы найти оптимальные стартовые точки.
Также можете рассмотреть эти техники для улучшения качества ваших изображений:
- Интеграция LoRA: Скомбинируйте Динамическое пороговое значение с моделями LoRA для еще более точного контроля.
