AIDive
Назад к глоссарию

Что такое защитные ограничения ИИ

ГлоссарийЭтика и безопасность ИИ

Правила, фильтры и технические барьеры, которые помогают удерживать ИИ-систему в безопасных и допустимых рамках.

Определение

Защитные ограничения ИИ нужны, чтобы модель не выдавала опасные инструкции, не раскрывала данные, не нарушала политику продукта и не выполняла действия без разрешения. В агентных системах это особенно важно, потому что модель может работать с инструментами, файлами и внешними сервисами.

Пример

Корпоративный ассистент может быть настроен так, чтобы не отправлять письмо клиенту без подтверждения человека и не показывать данные, к которым у пользователя нет доступа.

Почему важно

Термин важен для пользователей и владельцев ИИ-сервисов: безопасный продукт должен иметь не только сильную модель, но и понятные границы поведения.

Как работает

Ограничения строят из системных инструкций, фильтров контента, прав доступа, проверки входных данных, журналирования, тестирования и ручного подтверждения рискованных действий.

Где применяется

  • корпоративные ассистенты
  • чат-боты поддержки
  • автономные ИИ-агенты

Ограничения

Ограничения могут ошибаться: блокировать нормальные запросы или пропускать опасные. Их нужно тестировать и обновлять под реальные сценарии.