Run es una plataforma para optimizar y gestionar infraestructura de IA, con un enfoque en obtener más valor de los recursos de GPU. Basada en Kubernetes, ayuda a los equipos a asignar cómputo de forma eficiente entre usuarios, proyectos y cargas de trabajo, y requiere conocimientos básicos de Kubernetes para implementarla y operarla.
Capacidades clave
Distribuye dinámicamente cargas de trabajo de IA entre usuarios y proyectos
Supervisa la utilización de la infraestructura, el uso de GPU y la actividad de los usuarios
Crea espacios de trabajo configurables con herramientas y marcos seleccionados
Gestiona cuotas y políticas de acceso con controles flexibles
Programa trabajos con un programador de cargas de trabajo de IA
Usa el fraccionamiento de GPU para ejecutar varias tareas en una sola GPU
Dónde encaja
Run se integra con entornos en la nube y locales, admite operación multiusuario y escala para infraestructuras grandes de IA y aprendizaje automático. Se requiere un clúster de Kubernetes en ejecución.
Usuarios habituales
Laboratorios de investigación y centros de cómputo
Empresas que ejecutan proyectos grandes de IA
Equipos que operan infraestructura compartida de ML

