AIDive
Назад к глоссарию

Что такое большие языковые модели (LLM)

ГлоссарийЯзыковые модели и обработка естественного языка

крупные модели, обученные на больших корпусах текста и других данных для работы с языком и инструкциями

Определение

Большие языковые модели (LLM) — это крупные модели, обученные на больших корпусах текста и других данных для работы с языком и инструкциями. Проще говоря, объясняют основу современных чат-ботов, ассистентов, генераторов текста, инструментов кода и поиска по знаниям. В практике ИИ этот термин помогает понять, как устроены данные, модель, инфраструктура или правила вокруг результата. Например, LLM отвечает на вопрос, пишет черновик письма, объясняет код или суммирует документ.

Пример

LLM отвечает на вопрос, пишет черновик письма, объясняет код или суммирует документ

Почему важно

объясняют основу современных чат-ботов, ассистентов, генераторов текста, инструментов кода и поиска по знаниям. Поэтому термин полезен не только разработчикам, но и редакторам, предпринимателям и пользователям, которые выбирают ИИ-инструмент под конкретную задачу.

Как работает

Понятие помогает разобрать пользовательский сценарий: что модель получает на вход, что возвращает на выход, где нужен контекст, какие есть ограничения и где человек должен проверять результат.

Где применяется

Используется в пользовательских ИИ-сервисах, чат-ботах, генеративных инструментах, поиске, автоматизации и объяснении возможностей моделей.

Ограничения

модели могут ошибаться, устаревать, галлюцинировать и требовать защиты данных и контроля качества. Кроме того, термин «Большие языковые модели (LLM)» нельзя оценивать только по названию: нужны данные, сценарий применения, метрики качества, стоимость и проверка человеком там, где ошибка может навредить.