Cách Sử Dụng WAN 2.1 với Comfy UI trên Mac, Windows và Linux: Hướng Dẫn Toàn Diện

Vào ngày 25 tháng 2 năm 2025, Alibaba Cloud đã gây xôn xao ngành công nghiệp bằng việc phát hành mã nguồn mở Wan 2.1, một mô hình tạo video AI tiên tiến từ bộ sản phẩm nổi tiếng Tongyi. Mô hình đổi mới này biến các gợi ý

Build APIs Faster & Together in Apidog

Cách Sử Dụng WAN 2.1 với Comfy UI trên Mac, Windows và Linux: Hướng Dẫn Toàn Diện

Start for free
Inhalte

Vào ngày 25 tháng 2 năm 2025, Alibaba Cloud đã gây xôn xao ngành công nghiệp bằng việc phát hành mã nguồn mở Wan 2.1, một mô hình tạo video AI tiên tiến từ bộ sản phẩm nổi tiếng Tongyi. Mô hình đổi mới này biến các gợi ý văn bản thành những video ấn tượng về mặt hình ảnh, xử lý các chuyển động phức tạp và chi tiết không gian một cách dễ dàng. Với điểm số VBench nổi bật là 84.7%, hỗ trợ đa ngôn ngữ và truy cập miễn phí, Wan 2.1 đã trở thành một đối thủ mạnh trong một lĩnh vực có sự góp mặt của Sora của OpenAI, Minimax, Kling từ Kuaishou và Veo 2 của Google.

Nếu bạn muốn bỏ qua các rắc rối trong việc thiết lập và bắt đầu tạo video ngay lập tức, hãy kiểm tra Anakin AI—một nền tảng AI toàn diện giúp việc sử dụng Wan 2.1 trở nên dễ dàng. Nếu không, hướng dẫn này sẽ hướng dẫn bạn cách sử dụng WAN 2.1 với Comfy UI trên Mac, Windows và Linux, bao gồm cài đặt, cấu hình và các kỹ thuật tạo video nâng cao. Chúc bạn khám phá tương lai của việc tạo video AI!

Anakin.ai - One-Stop AI App Platform
Generate Content, Images, Videos, and Voice; Craft Automated Workflows, Custom AI Apps, and Intelligent Agents. Your exclusive AI app customization workstation.

Giới thiệu và Chuẩn bị Hệ thống

Khi bạn đã sẵn sàng để tìm hiểu cách sử dụng WAN 2.1 với Comfy UI, bước đầu tiên là đảm bảo hệ thống của bạn đáp ứng các yêu cầu phần cứng và phần mềm cần thiết. Hãy tin tôi—bắt đầu với một nền tảng vững chắc sẽ giúp toàn bộ quá trình diễn ra suôn sẻ hơn.

Thông số Kỹ thuật Phần cứng

  • Tối thiểu:
  • GPU: NVIDIA GTX 1080 (8GB VRAM) hoặc Apple M1
  • RAM: 16GB DDR4
  • Bộ nhớ: 15GB dung lượng SSD cho các mô hình và phụ thuộc
  • Đề xuất:
  • GPU: NVIDIA RTX 4090 (24GB VRAM) hoặc Apple M3 Max
  • RAM: 32GB DDR5
  • Bộ nhớ: NVMe SSD với dung lượng tối thiểu 50GB

Phụ thuộc Phần mềm

  • Python: Phiên bản 3.10 đến 3.11 (3.11.6 hoạt động tốt nhất cho Apple Silicon)
  • PyTorch: Phiên bản 2.2+ với CUDA 12.1 (dành cho Windows/Linux) hoặc hỗ trợ Metal (dành cho macOS)
  • FFmpeg: Phiên bản 6.1 cho mã hóa/giải mã video
  • Driver: NVIDIA Studio Drivers 550+ cho Windows/Linux

Cài đặt ComfyUI trên Các Nền tảng Khác Nhau

Hãy làm theo những bước chi tiết này để thiết lập ComfyUI, một phần quan trọng trong cách sử dụng WAN 2.1 với Comfy UI.

Cài đặt trên Windows

Phương pháp A: ComfyUI Desktop (Beta Chính thức)

  1. Tải về: Tải ComfyUI_Desktop_Windows_0.9.3b.exe từ comfyui.org/downloads.
  2. Chạy Trình cài đặt: Thực hiện trình cài đặt và đảm bảo tăng tốc GPU NVIDIA được kích hoạt.
  3. Xác minh: Mở một dòng lệnh và chạy:

Kiểm tra nhanh này xác nhận rằng mọi thứ đã được thiết lập đúng cách.

Phương pháp B: Xây dựng Thủ công

  1. Sao chép Kho lưu trữ:
https://github.com/comfyanonymous/ComfyUI

2. Thiết lập Môi trường Ảo:


3. Cài đặt PyTorch:

https://download.pytorch.org/whl/torch_stable.html

4. Cài đặt các yêu cầu:

pip install -r requirements.txt

Cài đặt macOS (M1/M2/M3)

  1. Cài đặt Homebrew (nếu cần):
https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh

2. Cài đặt Python & FFmpeg:

brew install python@3.11 ffmpeg

3. Sao chép và Thiết lập ComfyUI:

https://github.com/comfyanonymous/ComfyUI

https://download.pytorch.org/whl/torch_stable.html

Cài đặt Linux (Native/WSL2)

Dành cho WSL2:

  1. Cài đặt WSL2 với Ubuntu 22.04:
wsl --install -d Ubuntu-22.04

2. Cập nhật và Nâng cấp:

sudo apt update && sudo apt full-upgrade -y

Triển khai ComfyUI:

  1. Sao chép Kho lưu trữ:
https://github.com/comfyanonymous/ComfyUI

2. Thiết lập Môi trường Conda (Đề xuất):


3. Cài đặt PyTorch với CUDA:

https://download.pytorch.org/whl/torch_stable.html

4. Cài đặt các yêu cầu:

pip install -r requirements.txt

Tích hợp Mô hình WAN 2.1

Với ComfyUI đã hoạt động, bước tiếp theo trong cách sử dụng WAN 2.1 với Comfy UI là tích hợp mô hình WAN 2.1.

Lấy và Thiết lập Mô hình

  • Tải về Trọng số:
  • wan_2.1_base.safetensors (khoảng 8.4GB)
  • wan_2.1_vae.pth (khoảng 1.2GB)
    Tải các tập tin này bằng phương pháp ưa thích của bạn (ví dụ, wget).
  • Đặt Tập tin:
  • Đặt wan_2.1_base.safetensors vào ComfyUI/models/checkpoints/
  • Đặt wan_2.1_vae.pth vào ComfyUI/models/vae/

Cài đặt Nút Tùy Chỉnh

Nâng cao quy trình làm việc của bạn bằng cách cài đặt các nút tùy chỉnh:

  1. Đi đến Thư mục Nút Tùy Chỉnh
cd ComfyUI/custom_nodes
  1. Sao chép Các Tiện ích Cần thiết:
git clone https://github.com/WASasquatch/was-node-suite-comfyui git clone https://github.com/Kosinkadink/ComfyUI-VideoHelperSuite

Các nút này cung cấp các tính năng hữu ích như nội suy khung hình video và xử lý hàng loạt.


Cấu hình Quy trình làm việc của bạn cho WAN 2.1

Xây dựng đúng pipeline là chìa khóa khi học cách sử dụng WAN 2.1 với Comfy UI.

Thiết lập Pipeline Chuyển đổi Văn bản thành Video

Dưới đây là cấu trúc pipeline đơn giản:

  • Tải Nút Kiểm tra: Tải trọng số mô hình WAN 2.1 của bạn.
  • Nút CLIPTextEncode: Chuyển đổi các gợi ý văn bản (ví dụ, “Một con rồng cybernetic bay qua những đám mây tinh vân”) thành dữ liệu điều kiện.
  • Nút WANSampler: Mẫu không gian tiềm ẩn với các tham số như:

Độ phân giải: 1024×576 khung hình

Khung hình: 48 (có thể điều chỉnh theo nhu cầu)

Tỷ lệ Chuyển động: Thường nằm trong khoảng từ 1.2 đến 2.5 để có các chuyển tiếp mượt mà.

  • Nút VAEDecode: Giải mã dữ liệu tiềm ẩn thành đầu ra video cuối cùng.

Tùy chỉnh Tham số & Tối ưu hóa

  • Tỷ lệ Chuyển động: Nhiều người dùng ưa thích khoảng 1.8 để cân bằng giữa các chuyển tiếp mượt mà và tính nhất quán.
  • Sự chú ý theo Thời gian: Hướng đến các cài đặt giữa 0.85 và 0.97 để duy trì độ ổn định chuyển động xa.
  • Lịch trình Noise & Nội suy Khung hình: Các tùy chọn như Karras và FilmNet giúp giảm các hiện tượng không mong muốn.
  • Đầu vào Kết hợp: Kết hợp hình ảnh tham khảo và bản đồ độ sâu để nâng cao việc chuyển giao phong cách và tạo hiệu ứng 3D.

Kỹ thuật Tạo Video Nâng cao

Đưa các dự án của bạn xa hơn với những mẹo nâng cao này:

Tham khảo Đa Hình ảnh

  • Chuyển giao Phong cách: Sử dụng nhiều hình ảnh tham khảo để thay đổi phong cách nghệ thuật.
  • Điều kiện Bản đồ Độ sâu: Kết hợp các bản đồ độ sâu để tạo cảm giác 3D giả.
  • ControlNet & Ước lượng Tư thế: Điều khiển mô hình bằng các tư thế con người hoặc vị trí đối tượng để có những đầu ra tinh tế hơn.

Mô phỏng Chuyển động Camera

Mô phỏng các chuyển động camera động với nút CameraController:

  • Tốc độ Quay: ví dụ, 0.12
  • Zoom: ví dụ, -0.05
  • Biến đổi Lăn: ví dụ, 2.7
    Những điều chỉnh này mang lại cho video của bạn vẻ đẹp điện ảnh.

Tối ưu hóa Hiệu suất & Khắc phục Sự cố

Kỹ thuật Quản lý VRAM

Giữ cho hệ thống của bạn hoạt động hiệu quả:

  • Bộ đệm Khung hình: Kích hoạt bằng cách đặt enable_offload_technique = True và chọn chế độ tối ưu hóa VRAM mạnh mẽ.
  • Độ Chính xác Kết hợp: Tăng cường hiệu suất bằng:
torch.set_float32_matmul_precision('medium')

Khắc phục Sự cố Thông thường

  • Đầu ra Khung hình Đen: Xác minh rằng tập tin VAE của bạn (wan_2.1_vae.pth) phù hợp với phiên bản mô hình của bạn và kiểm tra các cài đặt chú ý theo thời gian của bạn.
  • Tràn VRAM: Khởi động ComfyUI với các cờ --medvram--xformers.
  • Phân tích Nhật ký: Kiểm tra comfy.log để tìm bất kỳ thông điệp ERROR hoặc CRITICAL nào để nhanh chóng xác định vấn đề.

Sự khác biệt trong Cài đặt theo Nền tảng

Dưới đây là tóm tắt nhanh về những khác biệt chính giữa việc cài đặt ComfyUI trên Windows, macOS và Linux—quan trọng để hiểu khi tìm hiểu cách sử dụng WAN 2.1 với Comfy UI:

Windows

  • Phương pháp Truyền thống:
  • Cần khai thác ZIP di động, thiết lập môi trường Python thủ công và thực thi file batch (như chạy run_nvidia_gpu.bat).
  • Cần cài đặt 7‑Zip riêng và cấu hình thủ công bộ công cụ CUDA.
  • Ứng dụng Desktop V1:
  • Một trình cài đặt chỉ cần một cú nhấp chuột (gói khoảng 200MB) tự động giải quyết các phụ thuộc và thiết lập.

macOS

  • Phương pháp Truyền thống:
  • Sử dụng Homebrew để cài đặt các gói cốt lõi và yêu cầu cấu hình thủ công Python/MPS.
  • Khởi động qua Terminal, và Python 3.11+ là bắt buộc để tối ưu hóa trên Apple Silicon.
  • Ứng dụng Desktop V1:
  • Đến dưới dạng gói .dmg phổ quát với môi trường Python tích hợp, đơn giản hóa đáng kể cài đặt.

Linux

  • Phương pháp Truyền thống:
  • Dựa vào sao chép dựa trên terminal, quản lý conda hoặc pip, và cài đặt thủ công các driver NVIDIA/AMD.
  • Có thể cần một số tinh chỉnh bổ sung cho các chính sách AppArmor/SELinux.
  • Ứng dụng Desktop V1:
  • Cung cấp các tệp nhị phân có chữ ký mã (qua AppImage/DEB packages) giúp đơn giản hóa quản lý phụ thuộc và cập nhật.

Ứng dụng Desktop V1 giảm thiểu đáng kể những rắc rối trong việc cài đặt bằng cách cung cấp việc giải quyết phụ thuộc tự động và các thư viện mô hình thống nhất trên tất cả các nền tảng.


Những Suy Nghĩ Cuối Cùng

Tóm lại, hướng dẫn này đã hướng dẫn bạn cách sử dụng WAN 2.1 với Comfy UI—từ việc chuẩn bị hệ thống của bạn đến việc tìm hiểu các kỹ thuật tạo video nâng cao. Dù bạn đang sử dụng Windows, macOS hay Linux, bạn giờ đây đã được trang bị để thiết lập, tùy chỉnh và tối ưu hóa quy trình video AI của mình như một chuyên gia.

Vậy hãy lấy hệ thống của bạn, thử nghiệm nó, và tận hưởng hành trình sáng tạo. Chúc bạn thực hiện video vui vẻ và chúc bạn đưa dự án của mình lên những đỉnh cao mới!