Как использовать WAN 2.1 с Comfy UI на Mac, Windows и Linux: Полное руководство

25 февраля 2025 года Alibaba Cloud произвела фурор в отрасли, открыв исходный код Wan 2.1, продвинутой модели генерации видео на основе ИИ из известной серии Tongyi. Эта инновационная модель преобразует текстовые подсказки в зрелищные видео, легко справляясь со сложными движениями и пространственными деталями. С выдающимся баллом VBench в 84,

Build APIs Faster & Together in Apidog

Как использовать WAN 2.1 с Comfy UI на Mac, Windows и Linux: Полное руководство

Start for free
Inhalte

25 февраля 2025 года Alibaba Cloud произвела фурор в отрасли, открыв исходный код Wan 2.1, продвинутой модели генерации видео на основе ИИ из известной серии Tongyi. Эта инновационная модель преобразует текстовые подсказки в зрелищные видео, легко справляясь со сложными движениями и пространственными деталями. С выдающимся баллом VBench в 84,7%, многязычной поддержкой и бесплатным доступом Wan 2.1 уже является сильным претендентом в области, в которую входят Sora от OpenAI, Minimax, Kling от Kuaishou и Veo 2 от Google.

Если вы предпочитаете избежать сложностей с настройкой и сразу начать генерировать видео, ознакомьтесь с Anakin AI—все-в-одном платформой на базе ИИ, которая упрощает использование Wan 2.1. В противном случае, этот гид проведет вас через процесс использования WAN 2.1 с Comfy UI на Mac, Windows и Linux, охватывая установку, конфигурацию и продвинутые техники создания видео. Наслаждайтесь исследованием будущего создания видео с ИИ!

Anakin.ai - One-Stop AI App Platform
Generate Content, Images, Videos, and Voice; Craft Automated Workflows, Custom AI Apps, and Intelligent Agents. Your exclusive AI app customization workstation.

Введение и подготовка системы

Когда вы будете готовы погрузиться в использование WAN 2.1 с Comfy UI, первым шагом необходимо убедиться, что ваша система соответствует необходимым аппаратным и программным требованиям. Поверьте: начать с надежной основы делает весь процесс намного проще.

Аппаратные спецификации

  • Минимальные:
  • GPU: NVIDIA GTX 1080 (8 ГБ VRAM) или Apple M1
  • ОЗУ: 16 ГБ DDR4
  • Хранилище: 15 ГБ SSD-накопитель для моделей и зависимостей
  • Рекомендуемые:
  • GPU: NVIDIA RTX 4090 (24 ГБ VRAM) или Apple M3 Max
  • ОЗУ: 32 ГБ DDR5
  • Хранилище: NVMe SSD с минимальным объемом 50 ГБ

Программные зависимости

  • Python: Версии 3.10 до 3.11 (3.11.6 лучше всего работает для Apple Silicon)
  • PyTorch: Версия 2.2+ с поддержкой CUDA 12.1 (для Windows/Linux) или Metal (для macOS)
  • FFmpeg: Версия 6.1 для кодирования/декодирования видео
  • Драйверы: NVIDIA Studio Drivers 550+ для Windows/Linux

Установка ComfyUI на разных платформах

Следуйте этим подробным шагам, чтобы настроить ComfyUI, что является важной частью использования WAN 2.1 с Comfy UI.

Установка Windows

Метод A: ComfyUI Desktop (Официальная бета)

  1. Скачать: Получите ComfyUI_Desktop_Windows_0.9.3b.exe с comfyui.org/downloads.
  2. Запустите установщик: Запустите установщик и убедитесь, что ускорение NVIDIA GPU включено.
  3. Проверка: Откройте командную строку и выполните:

Эта быстрая проверка подтверждает, что все настроено правильно.

Метод B: Ручная сборка

  1. Клонируйте репозиторий:
https://github.com/comfyanonymous/ComfyUI

2. Настройте виртуальную среду:


3. Установите PyTorch:

https://download.pytorch.org/whl/torch_stable.html

4. Установите зависимости:

pip install -r requirements.txt

Установка macOS (M1/M2/M3)

  1. Установите Homebrew (если нужно):
https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh

2. Установите Python и FFmpeg:

brew install python@3.11 ffmpeg

3. Клонируйте и настройте ComfyUI:

https://github.com/comfyanonymous/ComfyUI

https://download.pytorch.org/whl/torch_stable.html

Установка Linux (Нативная/WSL2)

Для WSL2:

  1. Установите WSL2 с Ubuntu 22.04:
wsl --install -d Ubuntu-22.04

2. Обновите и усовершенствуйте:

sudo apt update && sudo apt full-upgrade -y

Развертывание ComfyUI:

  1. Клонируйте репозиторий:
https://github.com/comfyanonymous/ComfyUI

2. Настройте окружение Conda (рекомендуется):


3. Установите PyTorch с CUDA:

https://download.pytorch.org/whl/torch_stable.html

4. Установите зависимости:

pip install -r requirements.txt

Интеграция модели WAN 2.1

Теперь, когда ComfyUI настроен и работает, следующим шагом в использовании WAN 2.1 с Comfy UI является интеграция модели WAN 2.1.

Получение и настройка модели

  • Скачать веса:
  • wan_2.1_base.safetensors (примерно 8.4 ГБ)
  • wan_2.1_vae.pth (примерно 1.2 ГБ)
    Скачайте эти файлы любым удобным способом (например, с помощью wget).
  • Размещение файлов:
  • Поместите wan_2.1_base.safetensors в ComfyUI/models/checkpoints/
  • Поместите wan_2.1_vae.pth в ComfyUI/models/vae/

Установка пользовательских узлов

Улучшите свой рабочий процесс, установив пользовательские узлы:

  1. Перейдите в директорию пользовательских узлов
cd ComfyUI/custom_nodes
  1. Клонируйте необходимые расширения:
git clone https://github.com/WASasquatch/was-node-suite-comfyui git clone https://github.com/Kosinkadink/ComfyUI-VideoHelperSuite

Эти узлы предоставляют полезные функции, такие как интерполяция кадров видео и пакетная обработка.


Конфигурирование вашего рабочего процесса для WAN 2.1

Создание правильного конвейера является ключевым моментом в изучении использования WAN 2.1 с Comfy UI.

Настройка конвейера «текст в видео»

Вот упрощенная структура конвейера:

  • Узел загрузки контрольной точки: Загружает веса вашей модели WAN 2.1.
  • Узел кодирования текста CLIP: Преобразует текстовые подсказки (например, “Кибернетический дракон, парящий сквозь облака туманностей”) в данные условности.
  • Узел выборки WAN: Выполняет выборку латентного пространства с параметрами, такими как:

Разрешение: 1024×576 кадров

Кадры: 48 (изменяемое в зависимости от нужд)

Масштаб движения: Обычно от 1.2 до 2.5 для плавных переходов.

  • Узел декодирования VAE: Декодирует латентные данные в окончательный видео-выход.

Настройки параметров & Оптимизация

  • Масштаб движения: Многие пользователи предпочитают около 1.8 для балансировки плавных переходов и согласованности.
  • Темпоральное внимание: Стремитесь к настройкам от 0.85 до 0.97 для поддержания стабильности длинных движений.
  • Расписание шума и интерполяция кадров: Опции, такие как Karras и FilmNet, помогают уменьшить нежелательные артефакты.
  • Гибридные входы: Сочетайте эталонные изображения и карты глубины для улучшения переноса стиля и создания эффекта 3D.

Продвинутые техники генерации видео

Доведите свои проекты до новых высот с помощью этих продвинутых советов:

Множественные изображения для ссылки

  • Перенос стиля: Используйте несколько эталонных изображений для изменения художественного стиля.
  • Условия по картам глубины: Включайте карты глубины для создания псевдо-3D ощущения.
  • ControlNet и оценка позы: Управляйте моделью с помощью человеческих поз или позиционирования объектов для более точных результатов.

Симуляция движения камеры

Симулируйте динамические движения камеры с узлом CameraController:

  • Скорость орбиты: например, 0.12
  • Долли зум: например, -0.05
  • Вариация наклона: например, 2.7
    Эти настройки придают вашим видео кинематографичный вид.

Оптимизация производительности & Устранение неполадок

Методы управления VRAM

Поддерживайте эффективную работу своей системы:

  • Кэширование кадров: Включите, установив enable_offload_technique = True и выбрав агрессивную оптимизацию VRAM.
  • Смешанная точность: Увеличьте производительность с помощью:
torch.set_float32_matmul_precision('medium')

Устранение распространенных проблем

  • Черный кадровый вывод: Убедитесь, что ваш файл VAE (wan_2.1_vae.pth) соответствует вашей версии модели, и проверьте настройки временного внимания.
  • Переполнение VRAM: Запустите ComfyUI с флагами --medvram и --xformers.
  • Анализ логов: Проверьте comfy.log на наличие сообщений ERROR или CRITICAL, чтобы быстро определить проблемы.

Различия в установке для разных платформ

Вот краткий обзор основных различий между установкой ComfyUI на Windows, macOS и Linux—важно понимать это, когда вы разбираетесь в использовании WAN 2.1 с Comfy UI:

Windows

  • Традиционный метод:
  • Включает извлечение портативного ZIP, ручную настройку окружения Python и выполнение пакетного файла (например, запуск run_nvidia_gpu.bat).
  • Требует отдельной установки 7‑Zip и ручной настройки набора инструментов CUDA.
  • V1 настольное приложение:
  • Установщик в один клик (около 200 МБ упакованного пакета), который автоматизирует решение зависимостей и настройку.

macOS

  • Традиционный метод:
  • Использует Homebrew для установки основных пакетов и требует ручной настройки Python/MPS.
  • Запускается через Терминал, Python 3.11+ обязателен для оптимизации на Apple Silicon.
  • V1 настольное приложение:
  • Поставляется в виде универсального .dmg пакета с интегрированной средой Python, значительно упрощая установку.

Linux

  • Традиционный метод:
  • Зависит от командного клонирования, управления conda или pip и ручной установки драйверов NVIDIA/AMD.
  • Может потребовать дополнительных настроек для политик AppArmor/SELinux.
  • V1 настольное приложение:
  • Предлагает кодовые бинарные файлы (через AppImage/DEB пакеты), которые упрощают управление зависимостями и обновлениями.

Настольное приложение V1 значительно сокращает нагрузку по установке, обеспечивая автоматическое решения зависимостей и унифицированные библиотеки моделей на всех платформах.


Заключительные мысли

В заключение, этот гид провел вас через использование WAN 2.1 с Comfy UI—от подготовки вашей системы до погружения в продвинутые техники генерации видео. Независимо от того, используете ли вы Windows, macOS или Linux, теперь вы готовы настраивать, кастомизировать и оптимизировать свой рабочий процесс видео с ИИ как профессионал.

Итак, поднимитесь на свою систему, дайте ей испытать, и наслаждайтесь творческими приключениями. Удачи в создании видео, и пусть ваши проекты поднимутся на новые высоты!