RODIN Diffusion es una red neuronal de investigación de un equipo asociado con Microsoft. Usa un enfoque basado en difusión para generar avatares 3D a partir de una foto de retrato o de una descripción de texto. El sitio oficial no ofrece una interfaz pública ni un botón de “probar”, así que se entiende mejor como una demo de investigación y no como un servicio listo para consumidores.
Cómo funciona
El modelo construye una figura 3D en varias etapas:
Una pasada inicial que establece la estructura básica del cuerpo y del rostro
Un refinamiento que añade volumen, texturas e iluminación
Este proceso por etapas ayuda a preservar detalles de apariencia incluso cuando la entrada es solo una foto.
Modos de generación y edición
RODIN Diffusion admite varios flujos de trabajo:
Reconstruir un avatar a partir de una foto
Generar una figura a partir de indicaciones de texto (por ejemplo, color de cabello, detalles de ropa, rasgos faciales)
Editar una figura ya generada (por ejemplo, cambiar el peinado o añadir accesorios)
Limitaciones y notas de seguridad
No hay una versión abierta o pública disponible, así que no puedes subir una foto y recibir un avatar 3D personal mediante una herramienta en línea. El proyecto comparte solo materiales de investigación y ejemplos. Los autores también señalan el riesgo de uso indebido para falsificaciones y recomiendan etiquetar los resultados generados para reducir el fraude y la desinformación.

