25 февраля 2025 года Alibaba Cloud произвела фурор в отрасли, открыв исходный код Wan 2.1, продвинутой модели генерации видео на основе ИИ из известной серии Tongyi. Эта инновационная модель преобразует текстовые подсказки в зрелищные видео, легко справляясь со сложными движениями и пространственными деталями. С выдающимся баллом VBench в 84,7%, многязычной поддержкой и бесплатным доступом Wan 2.1 уже является сильным претендентом в области, в которую входят Sora от OpenAI, Minimax, Kling от Kuaishou и Veo 2 от Google.
Если вы предпочитаете избежать сложностей с настройкой и сразу начать генерировать видео, ознакомьтесь с Anakin AI—все-в-одном платформой на базе ИИ, которая упрощает использование Wan 2.1. В противном случае, этот гид проведет вас через процесс использования WAN 2.1 с Comfy UI на Mac, Windows и Linux, охватывая установку, конфигурацию и продвинутые техники создания видео. Наслаждайтесь исследованием будущего создания видео с ИИ!

Введение и подготовка системы
Когда вы будете готовы погрузиться в использование WAN 2.1 с Comfy UI, первым шагом необходимо убедиться, что ваша система соответствует необходимым аппаратным и программным требованиям. Поверьте: начать с надежной основы делает весь процесс намного проще.
Аппаратные спецификации
- Минимальные:
- GPU: NVIDIA GTX 1080 (8 ГБ VRAM) или Apple M1
- ОЗУ: 16 ГБ DDR4
- Хранилище: 15 ГБ SSD-накопитель для моделей и зависимостей
- Рекомендуемые:
- GPU: NVIDIA RTX 4090 (24 ГБ VRAM) или Apple M3 Max
- ОЗУ: 32 ГБ DDR5
- Хранилище: NVMe SSD с минимальным объемом 50 ГБ
Программные зависимости
- Python: Версии 3.10 до 3.11 (3.11.6 лучше всего работает для Apple Silicon)
- PyTorch: Версия 2.2+ с поддержкой CUDA 12.1 (для Windows/Linux) или Metal (для macOS)
- FFmpeg: Версия 6.1 для кодирования/декодирования видео
- Драйверы: NVIDIA Studio Drivers 550+ для Windows/Linux
Установка ComfyUI на разных платформах
Следуйте этим подробным шагам, чтобы настроить ComfyUI, что является важной частью использования WAN 2.1 с Comfy UI.
Установка Windows
Метод A: ComfyUI Desktop (Официальная бета)
- Скачать: Получите
ComfyUI_Desktop_Windows_0.9.3b.exe
с comfyui.org/downloads. - Запустите установщик: Запустите установщик и убедитесь, что ускорение NVIDIA GPU включено.
- Проверка: Откройте командную строку и выполните:
Эта быстрая проверка подтверждает, что все настроено правильно.
Метод B: Ручная сборка
- Клонируйте репозиторий:
https://github.com/comfyanonymous/ComfyUI
2. Настройте виртуальную среду:
3. Установите PyTorch:
https://download.pytorch.org/whl/torch_stable.html
4. Установите зависимости:
pip install -r requirements.txt
Установка macOS (M1/M2/M3)
- Установите Homebrew (если нужно):
https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh
2. Установите Python и FFmpeg:
brew install python@3.11 ffmpeg
3. Клонируйте и настройте ComfyUI:
https://github.com/comfyanonymous/ComfyUI
https://download.pytorch.org/whl/torch_stable.html
Установка Linux (Нативная/WSL2)
Для WSL2:
- Установите WSL2 с Ubuntu 22.04:
wsl --install -d Ubuntu-22.04
2. Обновите и усовершенствуйте:
sudo apt update && sudo apt full-upgrade -y
Развертывание ComfyUI:
- Клонируйте репозиторий:
https://github.com/comfyanonymous/ComfyUI
2. Настройте окружение Conda (рекомендуется):
3. Установите PyTorch с CUDA:
https://download.pytorch.org/whl/torch_stable.html
4. Установите зависимости:
pip install -r requirements.txt
Интеграция модели WAN 2.1
Теперь, когда ComfyUI настроен и работает, следующим шагом в использовании WAN 2.1 с Comfy UI является интеграция модели WAN 2.1.
Получение и настройка модели
- Скачать веса:
wan_2.1_base.safetensors
(примерно 8.4 ГБ)wan_2.1_vae.pth
(примерно 1.2 ГБ)
Скачайте эти файлы любым удобным способом (например, с помощьюwget
).- Размещение файлов:
- Поместите
wan_2.1_base.safetensors
вComfyUI/models/checkpoints/
- Поместите
wan_2.1_vae.pth
вComfyUI/models/vae/
Установка пользовательских узлов
Улучшите свой рабочий процесс, установив пользовательские узлы:
- Перейдите в директорию пользовательских узлов
cd ComfyUI/custom_nodes
- Клонируйте необходимые расширения:
git clone https://github.com/WASasquatch/was-node-suite-comfyui git clone https://github.com/Kosinkadink/ComfyUI-VideoHelperSuite
Эти узлы предоставляют полезные функции, такие как интерполяция кадров видео и пакетная обработка.
Конфигурирование вашего рабочего процесса для WAN 2.1
Создание правильного конвейера является ключевым моментом в изучении использования WAN 2.1 с Comfy UI.
Настройка конвейера «текст в видео»
Вот упрощенная структура конвейера:
- Узел загрузки контрольной точки: Загружает веса вашей модели WAN 2.1.
- Узел кодирования текста CLIP: Преобразует текстовые подсказки (например, “Кибернетический дракон, парящий сквозь облака туманностей”) в данные условности.
- Узел выборки WAN: Выполняет выборку латентного пространства с параметрами, такими как:
Разрешение: 1024×576 кадров
Кадры: 48 (изменяемое в зависимости от нужд)
Масштаб движения: Обычно от 1.2 до 2.5 для плавных переходов.
- Узел декодирования VAE: Декодирует латентные данные в окончательный видео-выход.
Настройки параметров & Оптимизация
- Масштаб движения: Многие пользователи предпочитают около 1.8 для балансировки плавных переходов и согласованности.
- Темпоральное внимание: Стремитесь к настройкам от 0.85 до 0.97 для поддержания стабильности длинных движений.
- Расписание шума и интерполяция кадров: Опции, такие как Karras и FilmNet, помогают уменьшить нежелательные артефакты.
- Гибридные входы: Сочетайте эталонные изображения и карты глубины для улучшения переноса стиля и создания эффекта 3D.
Продвинутые техники генерации видео
Доведите свои проекты до новых высот с помощью этих продвинутых советов:
Множественные изображения для ссылки
- Перенос стиля: Используйте несколько эталонных изображений для изменения художественного стиля.
- Условия по картам глубины: Включайте карты глубины для создания псевдо-3D ощущения.
- ControlNet и оценка позы: Управляйте моделью с помощью человеческих поз или позиционирования объектов для более точных результатов.
Симуляция движения камеры
Симулируйте динамические движения камеры с узлом CameraController
:
- Скорость орбиты: например, 0.12
- Долли зум: например, -0.05
- Вариация наклона: например, 2.7
Эти настройки придают вашим видео кинематографичный вид.
Оптимизация производительности & Устранение неполадок
Методы управления VRAM
Поддерживайте эффективную работу своей системы:
- Кэширование кадров: Включите, установив
enable_offload_technique = True
и выбрав агрессивную оптимизацию VRAM. - Смешанная точность: Увеличьте производительность с помощью:
torch.set_float32_matmul_precision('medium')
Устранение распространенных проблем
- Черный кадровый вывод: Убедитесь, что ваш файл VAE (
wan_2.1_vae.pth
) соответствует вашей версии модели, и проверьте настройки временного внимания. - Переполнение VRAM: Запустите ComfyUI с флагами
--medvram
и--xformers
. - Анализ логов: Проверьте
comfy.log
на наличие сообщений ERROR или CRITICAL, чтобы быстро определить проблемы.
Различия в установке для разных платформ
Вот краткий обзор основных различий между установкой ComfyUI на Windows, macOS и Linux—важно понимать это, когда вы разбираетесь в использовании WAN 2.1 с Comfy UI:
Windows
- Традиционный метод:
- Включает извлечение портативного ZIP, ручную настройку окружения Python и выполнение пакетного файла (например, запуск
run_nvidia_gpu.bat
). - Требует отдельной установки 7‑Zip и ручной настройки набора инструментов CUDA.
- V1 настольное приложение:
- Установщик в один клик (около 200 МБ упакованного пакета), который автоматизирует решение зависимостей и настройку.
macOS
- Традиционный метод:
- Использует Homebrew для установки основных пакетов и требует ручной настройки Python/MPS.
- Запускается через Терминал, Python 3.11+ обязателен для оптимизации на Apple Silicon.
- V1 настольное приложение:
- Поставляется в виде универсального .dmg пакета с интегрированной средой Python, значительно упрощая установку.
Linux
- Традиционный метод:
- Зависит от командного клонирования, управления conda или pip и ручной установки драйверов NVIDIA/AMD.
- Может потребовать дополнительных настроек для политик AppArmor/SELinux.
- V1 настольное приложение:
- Предлагает кодовые бинарные файлы (через AppImage/DEB пакеты), которые упрощают управление зависимостями и обновлениями.
Настольное приложение V1 значительно сокращает нагрузку по установке, обеспечивая автоматическое решения зависимостей и унифицированные библиотеки моделей на всех платформах.
Заключительные мысли
В заключение, этот гид провел вас через использование WAN 2.1 с Comfy UI—от подготовки вашей системы до погружения в продвинутые техники генерации видео. Независимо от того, используете ли вы Windows, macOS или Linux, теперь вы готовы настраивать, кастомизировать и оптимизировать свой рабочий процесс видео с ИИ как профессионал.
Итак, поднимитесь на свою систему, дайте ей испытать, и наслаждайтесь творческими приключениями. Удачи в создании видео, и пусть ваши проекты поднимутся на новые высоты!