FLUX, một mô hình tạo hình ảnh AI đột phá, đang nhanh chóng trở nên phổ biến trong thế giới nghệ thuật kỹ thuật số. Được khen ngợi vì khả năng đáng kinh ngạc trong việc tạo ra hình ảnh chất lượng cao từ các văn bản đơn giản, nó đã nhanh chóng trở thành công cụ được các nghệ sĩ và người sáng tạo ưa chuộng. Tuy nhiên, một hạn chế đáng chú ý là nó thiếu hỗ trợ cho các prompt tiêu cực — một tính năng cho phép người dùng loại trừ các yếu tố cụ thể khỏi hình ảnh được tạo ra. Trong bài viết này, chúng ta sẽ khám phá một đột phá gần đây cho phép sử dụng các prompt tiêu cực trong FLUX và cung cấp hướng dẫn từng bước về cách thực hiện chúng hiệu quả.


Prompt Tiêu Cực Là Gì?
Prompt tiêu cực là các hướng dẫn cụ thể giúp AI loại trừ những yếu tố nhất định khỏi một hình ảnh. Tính năng này rất cần thiết cho những người sáng tạo muốn kiểm soát nhiều hơn đối với sản phẩm đầu ra, giúp họ tránh những chi tiết không mong muốn hoặc tinh chỉnh sản phẩm cuối cùng. Ban đầu, FLUX không hỗ trợ prompt tiêu cực hoặc cho phép các giá trị Hướng dẫn Không Phân Loại (CFG) khác ngoài 1. Do đó, người dùng bị giới hạn trong khả năng tinh chỉnh hình ảnh.
Ngưỡng Động: Một Giải Pháp Cho Prompt Tiêu Cực Trong FLUX
Một giải pháp do cộng đồng người dùng phát triển đã làm cho việc sử dụng các prompt tiêu cực và điều chỉnh các giá trị CFG trong FLUX trở nên khả thi. Phương pháp này, được gọi là Ngưỡng Động, nâng cao đáng kể khả năng của FLUX bằng cách cung cấp cho người dùng nhiều sự linh hoạt và kiểm soát hơn.
Ngưỡng Động Hoạt Động Như Thế Nào
Ngưỡng Động hoạt động bằng cách điều chỉnh lại các giá trị tiềm ẩn và kẹp các giá trị cực đoan. Điều này ngăn chặn tình trạng bão hòa quá mức và sự suy giảm chất lượng hình ảnh khi sử dụng các giá trị CFG cao hơn. Bằng cách quản lý những giá trị tiềm ẩn này, nó đảm bảo rằng hình ảnh vẫn cân bằng và hấp dẫn về mặt thị giác, ngay cả khi có những hướng dẫn chi tiết hơn được cung cấp.
Triển Khai Ngưỡng Động Trong FLUX
Để triển khai Ngưỡng Động, người dùng cần cài đặt tiện ích mở rộng sd-dynamic-thresholding trong thiết lập FLUX của họ. Điều này thường được thực hiện thông qua các giao diện như ComfyUI hoặc các nền tảng tương tự, cho phép tích hợp liền mạch tính năng mạnh mẽ này.
Cài Đặt Cho Những Prompt Tiêu Cực Trong FLUX
Những gì bạn cần:
- Mô hình FLUX
- Giao diện ComfyUI hoặc giao diện tương tự
- Tiện ích mở rộng sd-dynamic-thresholding
Giờ thì hãy cùng làm việc với điều này!
- Cài đặt tiện ích mở rộng sd-dynamic-thresholding.
- Trong ComfyUI, thêm nút DynamicThresholdingFull.
- Kết nối mô hình FLUX của bạn với đầu vào của nút DynamicThresholdingFull.
- Kết nối đầu ra với đầu vào của KSampler của bạn.
Cách Tối Ưu Hóa Tham Số Ngưỡng Động
Cơ bản, bạn cần chăm sóc những tham số này:
- Thang CFG: Thường được đặt trong khoảng 3–7. Giá trị cao hơn tăng cường sự tuân thủ của prompt nhưng có thể dẫn đến tình trạng bão hòa quá mức.
- Giá trị Interpolate Phi: Kiểm soát độ bão hòa hình ảnh. Các giá trị trong khoảng 0.7–0.9 thường mang lại kết quả tốt nhất.
- Thang Mimic và Chế Độ CFG: “Nửa Cosine Lên” cho cả hai tham số đã cho thấy tạo ra kết quả tối ưu.
Khi tăng CFG cải thiện sự tuân thủ của prompt, nó có thể làm chậm quá trình tạo hình. Tìm một sự cân bằng giữa CFG và Thang Hướng Dẫn Flux tích hợp để có kết quả tốt nhất.
Dưới đây là một số mẹo khác về các giá trị CFG:
- Hình Ảnh Thực Tế: CFG thấp hơn (khoảng 2–3) và giảm giá trị Interpolate Phi (0.6–0.7).
- Hình Ảnh Nghệ Thuật: CFG cao hơn (4–6) và tăng giá trị Interpolate Phi (0.8–0.9).
- Các Khái Niệm Trừu Tượng: Thử nghiệm với các giá trị CFG cực đoan (7+) nhưng hãy chuẩn bị cho những kết quả khó lường hơn.
Dưới đây là một số cài đặt ví dụ bạn có thể sử dụng:
Thang CFG: 3
Giá trị Interpolate Phi: 0.7
Thang Mimic: Nửa Cosine Lên
Chế Độ CFG: Nửa Cosine Lên
Cách Viết Các Prompt Tốt Nhất Cho FLUX
nhòe, màu sắc bão hòa quá mức, tòa nhà hiện đại, người, động vật khác cá koi, văn bản, logo, dấu nước, tỷ lệ bị biến dạng, ánh sáng không thực tế
Luôn là tốt nhất khi tạo các prompt tiêu cực dựa trên loại hình ảnh bạn muốn tạo ra. Đối với Ảnh Chân Dung:
Prompt Tích Cực: Chân dung chuyên nghiệp của một người phụ nữ trung niên có tóc ngắn màu xám, nụ cười ấm áp và ánh mắt dịu dàng. Ánh sáng tự nhiên ngoài trời, độ sâu trường ảnh nông, hậu cảnh bokeh của một công viên. Ảnh chất lượng cao bằng DSLR, tiêu điểm sắc nét vào khuôn mặt.
Prompt Tiêu Cực: vẻ ngoài trẻ trung, tóc dài, bối cảnh trong nhà, ánh sáng gay gắt, tiêu điểm mờ, nhiều người, phụ kiện, mũ, kính
Dưới đây là kết quả thử nghiệm:
Bạn có thể thử nghiệm tại đây tại Anakin AI:
FLUX Realism LoRA Online | Anakin
Nâng tầm hình ảnh AI của bạn với độ photorealism vô song bằng cách sử dụng FLUX Realism LoRA.
app.anakin.ai
Cách Viết Các Prompt FLUX Tốt Hơn, Nói Chung
- Bão Hòa Quá Mức: Nếu hình ảnh xuất hiện quá bão hòa, giảm giá trị Interpolate Phi.
- Thiếu Sự Tuân Thủ Prompt: Tăng dần thang CFG, nhưng hãy cẩn thận với tác động đến hiệu suất.
- Quá Trình Tạo Chậm: Xem xét việc sử dụng độ phân giải thấp hơn cho các bài thử nghiệm ban đầu, sau đó tăng lên cho các sản phẩm đầu ra cuối cùng.
- Kết Quả Không Nhất Quán: Thử nghiệm với các giá trị hạt giống khác nhau để tìm điểm bắt đầu tối ưu.
Và bạn cũng nên xem xét các kỹ thuật này để cải thiện chất lượng hình ảnh của bạn:
- Tích Hợp LoRA: Kết hợp Ngưỡng Động với các mô hình LoRA để có sự kiểm soát chính xác hơn.
