AvatarFX es un modelo multimodal de Character.AI que anima una sola foto para convertirla en un video más largo y fotorrealista. Se centra en expresiones faciales de aspecto natural, sincronización del habla y movimiento coherente en la cara, las manos y el cuerpo, incluidas escenas con más de un hablante.
Cómo acceder
AvatarFX está actualmente en beta cerrada. Para probarlo:
Ve al sitio oficial e inicia sesión
Solicita acceso a la beta cerrada
Sube una imagen de origen y un archivo de audio, o usa el texto a voz integrado
Haz clic en Generate para recibir el video
Funciones clave
Genera video a partir de una sola foto con expresiones, gestos y audio realistas
Mantiene un movimiento coherente de cara, manos y cuerpo en clips más largos
Admite varios hablantes y diálogo dinámico en un solo video
Tecnología, disponibilidad y seguridad
AvatarFX usa difusión basada en flujo sobre una arquitectura DiT y se entrena con datos de video diversos, filtrando contenido de baja calidad. La inferencia se acelera mediante destilación para reducir pasos sin sacrificar calidad. El acceso completo inicial está previsto para suscriptores de C.ai+ ($10/mes), con una lista de espera en character.ai/video. Character.AI aplica filtros de políticas (incluidos bloqueos para menores, figuras públicas y contenido prohibido) y añade una marca de agua a los videos generados.

