Ebook2audiobook — программное обеспечение с открытым исходным кодом, предназначенное для преобразования электронных книг в аудиоформат с использованием динамических моделей искусственного интеллекта и технологии клонирования голоса. Поддерживает более 1107 языков и бесплатно доступно на платформе GitHub.
Создание аудиокниг
- Нейросеть способна имитировать различные голоса, создавая впечатление, что аудиокнигу читает профессиональный диктор.
- Программа автоматически разбивает текст на главы и добавляет необходимую информацию для удобной навигации по аудиокниге.
- DrewThomasson Ebook2audiobook охватывает самые популярные языки, включая русский, благодаря чему доступна для пользователей по всему миру.
- Открытый исходный код доступен на GitHub, позволяет разработчикам вносить свои изменения и улучшения.
Как пользоваться Ebook2audiobook
- Вы загружаете свой файл в нужном формате, например, EPUB, MOBI.
- Нейросеть анализирует текст и разбивает на отдельные предложения.
- Искусственный интеллект генерирует речь, имитируя выбранный голос.
- Готовое аудио сохраняется в выбранном формате, например, MP3.
Требования к системе
- Минимум 4 ГБ оперативной памяти.
- Включенная виртуализация для Windows, только для Docker.
Доступность и лицензия
- Является бесплатным и распространяется по лицензии Apache 2.0.
- На GitHub Ebook2audiobook доступна для скачивания и установки.
Способы использования
- Запуск через командную строку с использованием скриптов для Windows и Linux/MacOS.
- Веб-интерфейс на основе Gradio для удобного взаимодействия.
- Поддержка Docker для изолированной установки и запуска.
Дополнительные возможности
- Опциональное клонирование голоса с использованием пользовательских аудиофайлов.
- Настраиваемые параметры синтеза речи, включая скорость, температуру и другие.
- Поддержка пользовательских моделей XTTS для улучшенного синтеза речи.
Особенности
- конвертация электронных книг в аудиоформат с сохранением глав и метаданных;
- использование динамических моделей ИИ для синтеза речи;
- поддержка клонирования голоса с использованием пользовательских аудиофайлов;
- поддержка более 1107 языков, включая русский;
- создание аудиофайлов в формате .m4b с метаданными и разделением на главы.
- нейросеть доступна для скачивания с GitHub бесплатно.