AIDive
Назад к глоссарию

Что такое акустическое моделирование

ГлоссарийОбработка естественного языка

Подход в распознавании речи, который связывает звуковой сигнал с вероятными звуками, слогами или словами.

Определение

Акустическое моделирование лежит в основе систем, которые превращают речь в текст. Модель анализирует частоты, паузы, интонацию, шумы и особенности произношения, а затем оценивает, какие речевые единицы были произнесены. Современные системы часто объединяют акустическую часть с языковой моделью, чтобы выбирать более естественный вариант фразы.

Пример

Когда человек говорит «поставь встречу на пять», система распознавания речи должна отличить команду от похожих по звучанию слов и учесть контекст.

Почему важно

Термин важен для выбора сервисов транскрибации, голосовых ассистентов, субтитров, колл-центров и анализа звонков.

Как работает

Звук разбивают на короткие фрагменты, извлекают признаки и подают их в модель. Она оценивает вероятности звуковых последовательностей, а система собирает их в слова с учётом словаря и контекста.

Где применяется

  • распознавание речи
  • автоматические субтитры
  • голосовые помощники и аналитика звонков

Ограничения

Качество падает при сильном шуме, плохом микрофоне, редких акцентах, быстрой речи и специализированной лексике. Для бизнеса часто нужна адаптация под домен.