Wan 2.1 es un modelo de IA de Alibaba para generar video, imágenes y música a partir de prompts de texto. Lanzado en febrero de 2025 como código abierto bajo la licencia Apache 2.0, está disponible para descarga gratuita en GitHub y HuggingFace y puede ejecutarse tanto en línea como localmente en tu computadora.
Qué puede hacer Wan 2.1
Generar video a partir de una descripción de texto
Editar clips de video existentes
Generar audio para videos creados
Los usuarios señalan una buena calidad de video, incluidos efectos físicos realistas (por ejemplo, simulación del movimiento del agua). Según se informa, generar un video de 5 segundos en 480p tarda unos 4 minutos en una NVIDIA RTX 4090.
Disponibilidad, idiomas y configuración
Wan 2.1 admite interfaz en chino e inglés, y aunque no hay una interfaz en ruso, puede entender prompts en ruso. La plataforma ofrece 50 créditos gratis al día.
Para uso local, puedes descargar Wan 2.1 desde GitHub o HuggingFace. También hay una versión más ligera T2V-1.3B que requiere 8.19 GB de VRAM y puede generar hasta 5 segundos de video en 480p.
Detalles clave
Licencia de código abierto: Apache 2.0
Incluye un componente de arquitectura video-VAE
El código puede usarse, estudiarse, modificarse y redistribuirse

