AIDive
Назад к глоссарию

Что такое поисково-дополненная генерация (RAG)

ГлоссарийИнфраструктура ИИ

подход, где языковая модель перед ответом получает найденные документы или фрагменты базы знаний

Определение

Поисково-дополненная генерация (RAG) — это подход, где языковая модель перед ответом получает найденные документы или фрагменты базы знаний. Проще говоря, помогает уменьшать галлюцинации, обновлять знания без переобучения модели и связывать ответы с источниками. Например, ассистент ищет нужные пункты в базе инструкций компании, а затем формирует ответ клиенту с опорой на найденный текст.

Пример

ассистент ищет нужные пункты в базе инструкций компании, а затем формирует ответ клиенту с опорой на найденный текст

Почему важно

Помогает уменьшать галлюцинации, обновлять знания без переобучения модели и связывать ответы с источниками.

Как работает

На практике это проявляется в цепочках данных, окружениях запуска, API, контейнерах, ускорителях, мониторинге и правилах доступа. В случае термина «Поисково-дополненная генерация (RAG)» важно показать не только техническое определение, но и то, как это проявляется в реальном продукте, данных, интерфейсе или процессе внедрения.

Где применяется

Используется в рабочих процессах машинного обучения: от подготовки данных и запуска моделей до API, мониторинга, безопасности и масштабирования.

Ограничения

Инфраструктура может быть дороже и сложнее самой модели. Нужно учитывать безопасность, отказоустойчивость, права доступа и стоимость масштабирования. Для «Поисково-дополненная генерация (RAG)» особенно важно проверять качество на своей задаче, потому что демонстрация, общий рейтинг или одно определение не гарантируют пригодность инструмента.