AIDive
Назад к глоссарию

Что такое кража модели

ГлоссарийЭтика и безопасность ИИ

атака, при которой злоумышленник пытается восстановить поведение или параметры модели по запросам, ответам или утечкам.

Определение

Кража модели — это атака, при которой злоумышленник пытается восстановить поведение или параметры модели по запросам, ответам или утечкам. Проще говоря, термин помогает понять, какую роль эта технология, метод, метрика или идея играет в ИИ-системах и почему она влияет на результат. Например, конкурент массово отправляет запросы к закрытой модели и обучает копию на ее ответах. Используется при оценке рисков, приватности, безопасности, ответственности, прозрачности и последствий внедрения ИИ.

Пример

конкурент массово отправляет запросы к закрытой модели и обучает копию на ее ответах

Почему важно

Термин важен, потому что помогает выбирать ИИ-инструменты не по названию, а по реальной функции: атака, при которой злоумышленник пытается восстановить поведение или параметры модели по запросам, ответам или утечкам.

Как работает

Обычно проверяют данные, права доступа, сценарии вреда, прозрачность решения, возможность человеческого пересмотра и соответствие правилам. В случае термина «Кража модели» это особенно важно проверять на конкретном сценарии: какие входные данные есть, какой результат ожидается, какую метрику качества выбрать и кто будет контролировать ошибку.

Где применяется

Используется при оценке рисков, приватности, безопасности, ответственности, прозрачности и последствий внедрения ИИ.

Ограничения

Оценка рисков зависит от страны, отрасли, данных и пользователей. Для чувствительных сценариев нужны юридическая проверка, документация и механизм исправления ошибок.