AIDive
Назад к глоссарию

Что такое языковые модели

ГлоссарийОбработка естественного языка

модели, которые работают с текстом и оценивают вероятности последовательностей токенов

Определение

Языковые модели — это модели, которые работают с текстом и оценивают вероятности последовательностей токенов. Проще говоря, помогают генерировать, анализировать, переводить, суммировать и классифицировать текст. В практике ИИ этот термин помогает понять, как устроены данные, модель, инфраструктура или правила вокруг результата. Например, ассистент получает вопрос пользователя и строит ответ, опираясь на контекст и вероятности следующих токенов.

Пример

ассистент получает вопрос пользователя и строит ответ, опираясь на контекст и вероятности следующих токенов

Почему важно

помогают генерировать, анализировать, переводить, суммировать и классифицировать текст. Поэтому термин полезен не только разработчикам, но и редакторам, предпринимателям и пользователям, которые выбирают ИИ-инструмент под конкретную задачу.

Как работает

Понятие помогает разобрать пользовательский сценарий: что модель получает на вход, что возвращает на выход, где нужен контекст, какие есть ограничения и где человек должен проверять результат.

Где применяется

Используется в пользовательских ИИ-сервисах, чат-ботах, генеративных инструментах, поиске, автоматизации и объяснении возможностей моделей.

Ограничения

языковая модель может уверенно выдавать ошибочный ответ, если не проверять источники и контекст. Кроме того, термин «Языковые модели» нельзя оценивать только по названию: нужны данные, сценарий применения, метрики качества, стоимость и проверка человеком там, где ошибка может навредить.