Logo
Ebook2audiobook Нейросеть Лого

Ebook2audiobook

Решение для создания аудиокниг с использованием ИИ и клонирования голоса

Описание

Ebook2audiobook — программное обеспечение с открытым исходным кодом, предназначенное для преобразования электронных книг в аудиоформат с использованием динамических моделей искусственного интеллекта и технологии клонирования голоса. Поддерживает более 1107 языков и бесплатно доступно на платформе GitHub.

Создание аудиокниг
  • Нейросеть способна имитировать различные голоса, создавая впечатление, что аудиокнигу читает профессиональный диктор.
  • Программа автоматически разбивает текст на главы и добавляет необходимую информацию для удобной навигации по аудиокниге.
  • DrewThomasson Ebook2audiobook охватывает самые популярные языки, включая русский, благодаря чему доступна для пользователей по всему миру.
  • Открытый исходный код доступен на GitHub, позволяет разработчикам вносить свои изменения и улучшения.
Как пользоваться Ebook2audiobook
  1. Вы загружаете свой файл в нужном формате, например, EPUB, MOBI.
  2. Нейросеть анализирует текст и разбивает на отдельные предложения.
  3. Искусственный интеллект генерирует речь, имитируя выбранный голос.
  4. Готовое аудио сохраняется в выбранном формате, например, MP3.
Требования к системе
  • Минимум 4 ГБ оперативной памяти.
  • Включенная виртуализация для Windows, только для Docker.
Доступность и лицензия
  • Является бесплатным и распространяется по лицензии Apache 2.0.
  • На GitHub Ebook2audiobook доступна для скачивания и установки.
Способы использования
  • Запуск через командную строку с использованием скриптов для Windows и Linux/MacOS.
  • Веб-интерфейс на основе Gradio для удобного взаимодействия.
  • Поддержка Docker для изолированной установки и запуска.
Дополнительные возможности
  • Опциональное клонирование голоса с использованием пользовательских аудиофайлов.
  • Настраиваемые параметры синтеза речи, включая скорость, температуру и другие.
  • Поддержка пользовательских моделей XTTS для улучшенного синтеза речи.
Особенности
  • конвертация электронных книг в аудиоформат с сохранением глав и метаданных;
  • использование динамических моделей ИИ для синтеза речи;
  • поддержка клонирования голоса с использованием пользовательских аудиофайлов;
  • поддержка более 1107 языков, включая русский;
  • создание аудиофайлов в формате .m4b с метаданными и разделением на главы.
  • нейросеть доступна для скачивания с GitHub бесплатно.

Рассылка

Расскажем о выходе новых нейросетей

Присоединяйтесь к сообществу.