El 25 de febrero de 2025, Alibaba Cloud anunció que Wan 2.1, su avanzado modelo de generación de video con IA, ahora es de código abierto. Este modelo, parte de la serie Tongyi, transforma solicitudes de texto en videos de alta calidad, destacándose en movimientos complejos y relaciones espaciales. Su apertura al código marca un paso significativo hacia la democratización de la creación de videos impulsada por IA.
Wan 2.1 entra en un paisaje competitivo dominado por modelos como: Sora de OpenAI, Minimax, Kling de Kuaishou, Veo 2 de Google
Con un puntaje líder en VBench del 84.7%, soporte multilingüe para chino e inglés, y la promesa de acceso gratuito, Wan 2.1 está preparado para tener un impacto significativo. Este artículo profundiza en el rendimiento, características, precios, experiencia del usuario de Wan 2.1, y cómo se compara con sus rivales, explorando en última instancia lo que su estado de código abierto significa para el futuro de la generación de video con IA.
Regístrate en Anakin AI hoy en anakin.ai y empieza gratis. Únete a creadores de todo el mundo y prepárate para Wan 2.1 — ¡mantente a la vanguardia con Anakin!

Wan 2.1: ¿Qué lo hace destacar?
Wan 2.1, también conocido como Wanx 2.1 o Tongyi Wanxi, es parte de la serie Tongyi de modelos de IA multimodal de Alibaba. Convierte solicitudes de texto en videos sorprendentes, dominando movimientos complejos — como patinaje artístico o interacciones entre múltiples objetos — y relaciones espaciales. Según Alibaba y la tabla de clasificación de VBench, lidera con un puntaje del 84.7%, superando a sus rivales en movimiento dinámico, suavidad y estética, ofreciendo visuales realistas de bailarines girando o coches de carreras que coinciden con tus descripciones.
Una característica destacada es su soporte multilingüe para chino e inglés, perfecto para creadores que apuntan a mercados diversos. Produce videos nítidos en 1080p a 30 FPS, rivalizando con visuales de calidad profesional. Anunciado como de código abierto el 25 de febrero de 2025, Wan 2.1 podría inspirar innovaciones similares a las de Stable Diffusion, planteando preguntas sobre su impacto en el mundo real y su ventaja sobre los competidores.
Comparando Wan 2.1 con Sora, Minimax, Kling y Google Veo 2
Para entender el lugar de Wan 2.1 en el paisaje de generación de video con IA, vamos a compararlo con algunos de los nombres más grandes: Sora de OpenAI, Minimax, Kling (de Kuaishou) y Veo 2 de Google. Cada uno de estos modelos tiene sus fortalezas, pero Wan 2.1 aporta ventajas únicas que podrían hacerlo un fuerte contendiente.
Sora de OpenAI

Sora, lanzado a finales de 2024, genera videos de 20 segundos de alta calidad para redes sociales y marketing, empaquetados con ChatGPT Plus/Pro ($20/$200 mensuales). Ofrece acceso ilimitado a vacaciones y resoluciones más altas para usuarios Pro, destacándose en clips cortos y sorprendentes. Limitado al inglés y a la brevedad, obtiene un 82% en VBench, mientras que el 84.7% de Wan 2.1 y su soporte multilingüe sugieren mayor versatilidad para secuencias largas y complejas.
Minimax

Minimax, una IA multimodal china, integra la generación de video con la eficiencia de texto a imagen. Se queda atrás de Wan 2.1 en escenas dinámicas según VBench, y su acceso global es restringido, a menudo necesitando suscripciones empresariales. La ventaja de código abierto de Wan 2.1 amplía su alcance, aunque Minimax podría destacarse en la edición en tiempo real debido a su velocidad.
Kling (Kuaishou)

Kling, de Kuaishou, brilla en contenido de formato corto como Douyin con salidas de alta resolución y movimiento suave. Limitado a China y no de código abierto, es menos global que Wan 2.1, que ofrece soporte multilingüe y un potencial más amplio, aunque Kling se beneficia del ecosistema regional de Kuaishou.
Google Veo 2

Veo 2, lanzado después de Sora en diciembre de 2024, se dirige a usuarios de acceso anticipado en EE. UU. a través de Vertex AI de Google Cloud, con precios basados en el uso (por ejemplo, $0.00003/1k caracteres). Fuerte en realismo y estética, su puntaje del 83% en VBench es inferior al 84.7% de Wan 2.1. La flexibilidad de código abierto de Wan 2.1 atrae a desarrolladores, mientras que Veo 2 se adapta a las necesidades empresariales con infraestructura robusta.
¿Qué tan bueno será Wan 2.1?
Basado en su liderazgo en VBench y especificaciones técnicas, Wan 2.1 está preparado para ser uno de los mejores modelos de video con IA de código abierto disponibles. Su puntaje del 84.7% en VBench indica que maneja movimientos complejos, interacciones entre múltiples objetos y relaciones espaciales mejor que la mayoría de los competidores. Para los creadores, esto significa videos con menos artefactos, transiciones más suaves y una mayor precisión en la adherencia a las solicitudes — ya sea animando una batalla de ciencia ficción o una escena serena de la naturaleza.
Sin embargo, ningún modelo es perfecto. Wan 2.1 podría tener dificultades con secuencias extremadamente largas o solicitudes altamente abstractas, áreas donde modelos propietarios como Sora o Veo 2 podrían tener una ventaja debido a sus optimizaciones de sistema cerrado. Su naturaleza de código abierto también significa que su rendimiento podría variar dependiendo de cómo los desarrolladores lo ajusten, lo que podría llevar a resultados inconsistentes si no se gestiona bien. Aún así, para la mayoría de los usuarios — especialmente aquellos en industrias creativas o pequeñas empresas — la combinación de calidad, accesibilidad y rentabilidad de Wan 2.1 se ve increíblemente prometedora.
Precio, Rendimiento, Características y Experiencia del Usuario
Precios
¿Cuánto costará Wan 2.1? Como modelo de código abierto, su núcleo probablemente será gratuito para usar, descargar y modificar, al igual que Stable Diffusion o LLaMA. Alibaba Cloud puede cobrar por características premium, alojamiento en la nube o acceso a la API — posiblemente $100–$500/mes para uso empresarial, similar a Sora o Veo 2. Actualmente es gratuito en el Model Studio de Alibaba, y el alojamiento comunitario podría reducir aún más los costos para los aficionados.
Rendimiento
Wan 2.1 sobresale con un puntaje de 84.7% en VBench, manejando escenas dinámicas, consistencia espacial y estética de manera efectiva. Ofrece 1080p a 30 FPS con movimiento realista a través de su mecanismo de atención espacio-temporal, liderando la generación de video de código abierto, aunque modelos propietarios como Sora podrían superarlo en áreas específicas.
Características
Wan 2.1 apoya texto multilingüe (chino e inglés), resolución personalizable y tasas de fotogramas, integrándose con el ecosistema de Alibaba. Es fácil de usar, no necesita habilidades técnicas, y su potencial de código abierto podría añadir características, aunque podría perder beneficios propietarios como la edición en tiempo real.
Experiencia del Usuario
Su interfaz es simple — ingresa texto, ajusta configuraciones y descarga videos — genial para usuarios no técnicos. La configuración de código abierto podría necesitar algo de conocimiento, a diferencia de la facilidad de ChatGPT de Sora o el pulido de Google Cloud de Veo 2, pero el crecimiento de la comunidad podría mejorarla con el tiempo.
El Anuncio de Código Abierto: Un Punto de Inflexión
El anuncio del 25 de febrero de 2025, por parte de Alibaba_Wan (“¡Esto no es un simulacro — Wan 2.1 CÓDIGO ABIERTO finalmente está aquí!”) ha generado emoción global. La transmisión en vivo a las 11:00 PM UTC+8 probablemente cubrió términos de código abierto, disponibilidad y restricciones. Esto podría hacer que la generación de video con IA sea accesible para aficionados, startups e investigadores, similar al impacto de Stable Diffusion, pero los riesgos de código abierto incluyen calidad inconsistente o seguridad si no se gestiona adecuadamente.
Para los usuarios, ofrece una herramienta potente y, potencialmente, gratuita, pero plantea preocupaciones sobre el soporte a largo plazo, actualizaciones y confiabilidad empresarial. La reputación de Alibaba en IA y en la nube sugiere un respaldo sólido, aunque el papel de la comunidad será crucial para el éxito de Wan 2.1.
Conclusión: El Lugar de Wan 2.1 en la Revolución del Video con IA
Wan 2.1 no es solo otro modelo de IA — es un potencial cambio en las reglas del juego, especialmente con su estado de código abierto. Su rendimiento líder en VBench, soporte multilingüe y accesibilidad lo convierten en un fuerte rival para Sora, Minimax, Kling y Veo 2, particularmente para creadores y desarrolladores que buscan flexibilidad y ahorro de costos. Aunque podría no igualar a los modelos propietarios en cada nicho (por ejemplo, edición en tiempo real o integraciones empresariales), su naturaleza de código abierto podría fomentar una comunidad vibrante, impulsando la innovación y la adopción.
Para los usuarios comunes, Wan 2.1 ofrece la oportunidad de crear videos de calidad profesional con un esfuerzo y costo mínimos, ya sea que seas un especialista en marketing creando anuncios, un educador haciendo lecciones, o un cineasta experimentando con nuevas ideas. Su estructura de precios (potencialmente gratuita o de bajo costo para características premium), rendimiento de primer nivel y experiencia fácil de usar lo posicionan como un candidato destacado en el espacio de video con IA. A medida que se desarrolla la transmisión en vivo y emergen más detalles, Wan 2.1 podría redefinir nuestra forma de pensar sobre la creatividad impulsada por IA — abierta, accesible y adaptable sin límites.