RODIN Diffusion — исследовательская нейросеть от команды, связанной с Microsoft. Она создаёт 3D-аватары из портрета или текста, используя диффузионную архитектуру. На официальном сайте нет кнопок и инструментов для широкой аудитории, это больше научный проект, чем готовый к массовому применению сервис.
Ознакомиться с другими визуализаторами тела
Как устроено
Авторы обучили модель строить фигуру в несколько этапов. Сначала идёт черновая проработка, где система формирует ключевые черты тела и лица. Затем к результату добавляются объём, текстуры и свет. Такая многоуровневая схема помогает передать нюансы внешности, даже если изначально есть только одна фотография.
Способы генерации
Алгоритм умеет реконструировать аватар из одной фотографии или создавать фигуры по текстовому описанию. Можно указать цвет волос, детали одежды, черты лица. Модель также меняет уже сгенерированную фигуру, если нужно отредактировать причёску или добавить аксессуары. Но всё это остаётся на уровне демонстрации разработчиков — нет кнопки «попробовать».
Ограничения
Открытой версии RODIN Diffusion не существует, а значит, нельзя просто загрузить фото и получить свой 3D-аватар. Проект публикует только исследовательские наработки и примеры. Авторы предупреждают о возможной опасности подделок. Рекомендуют помечать сгенерированные результаты, чтобы избежать случаев мошенничества или распространения дезинформации.
RODIN Diffusion показывает будущее 3D-генерации, но остаётся лабораторной разработкой. Нельзя зайти на сайт Microsoft и создать аватар. Публикации и примеры лишь иллюстрируют потенциал диффузионных моделей в объёмной графике, а для широкого использования придётся ждать отдельного релиза или решений на базе этой технологии.