Cartesia es una herramienta de IA para crear y procesar contenido de audio. Puede generar voz realista a partir de texto y ayudar a los desarrolladores a trabajar con datos de audio con un enfoque en la velocidad y la precisión.
Qué puedes hacer con Cartesia
Generar voces con sonido natural a partir de texto
Trabajar con varios idiomas y acentos
Crear modelos de voz personalizados
Integrar funciones de voz y audio en aplicaciones mediante API
Procesar audio con latencia mínima
Productos y opciones de implementación
Cartesia ofrece soluciones diseñadas para distintas necesidades de rendimiento y privacidad:
Sonic: una API de voz generativa rápida y ultra realista que puede producir voz de alta calidad con una latencia de unos 90 ms
On-Device: modelos que se ejecutan directamente en los dispositivos del usuario para un procesamiento rápido, privado y sin conexión
Cómo empezar
Cartesia está disponible mediante una interfaz web y una API. La configuración típica incluye:
Crear una cuenta en el sitio web oficial
Elegir un producto (por ejemplo, Sonic o On-Device)
Revisar la documentación de la API e integrarla en tu aplicación
Configurar los ajustes del modelo para tu proyecto
Probar e implementar
El acceso es de pago; los detalles de precios figuran en el sitio web. La interfaz y la documentación están en inglés.

