AIDive
Назад к глоссарию

Что такое автоматическое распознавание речи

ГлоссарийОбработка естественного языка

Технология, которая превращает устную речь в текст с помощью обработки звука и моделей языка.

Определение

Автоматическое распознавание речи используется в субтитрах, голосовых ассистентах, диктовке, аналитике звонков, протоколах встреч и доступности контента. Система должна обработать звук, отделить речь от шума, распознать слова и собрать их в осмысленный текст.

Пример

После онлайн-встречи сервис автоматически создаёт расшифровку разговора и краткое резюме.

Почему важно

Термин важен для пользователей, которые ищут инструменты транскрибации, голосового ввода, анализа звонков или создания субтитров.

Как работает

Система анализирует аудиосигнал, выделяет речевые признаки, сопоставляет их с вероятными словами и использует контекст, чтобы выбрать наиболее правдоподобную фразу.

Где применяется

  • транскрибация
  • субтитры
  • голосовые ассистенты и колл-центры

Ограничения

Качество зависит от языка, акцента, шума, микрофона, перекрывающихся голосов и специальной терминологии.