AIDive
Назад к глоссарию

Что такое отравление данных

ГлоссарийЭтика и безопасность

Атака или ошибка, при которой вредные данные попадают в обучение и ухудшают поведение модели.

Определение

Отравление данных — это атака или ошибка, при которой вредные данные попадают в обучение и ухудшают поведение модели. Если говорить проще, это понятие помогает оценивать риски, ответственность, безопасность и соответствие требованиям. Практический смысл в том, чтобы понимать, какие возможности у инструмента действительно нужны, какие данные ему понадобятся и какие ограничения стоит проверить до внедрения.

Пример

Злоумышленник добавляет в обучающую выборку специально искаженные примеры, чтобы модель ошибалась в нужных случаях.

Почему важно

Отравление данных важно для безопасности ИИ, особенно когда модель учится на пользовательском контенте. Это помогает выбирать ИИ-инструменты не по громким обещаниям, а по тому, как они работают в реальной задаче.

Как работает

Сначала определяют заинтересованные стороны, данные и возможный вред, затем вводят проверки, ограничения, аудит и ответственность. В случае термина «Отравление данных» важно отдельно смотреть на данные, критерии качества и условия применения.

Где применяется

Важно в продуктах, где ИИ влияет на людей, персональные данные, безопасность, юридические риски или принятие решений.

Ограничения

Риски меняются вместе с законами, продуктом и данными, поэтому такие страницы требуют регулярной редакционной проверки.