Снижение алгоритмической предвзятости

Определение

Снижение предвзятости начинается не с модели, а с понимания задачи и данных. Нужно проверить, какие группы представлены хуже, какие признаки могут приводить к дискриминации, как распределены ошибки и какие критерии справедливости важны. Затем применяют очистку данных, балансировку, ограничения, аудит и мониторинг.

Пример

При модели найма команда проверяет, не ухудшается ли качество рекомендаций для кандидатов из разных регионов, возрастных групп или образовательных траекторий.

Почему это важно

Термин важен для ответственного ИИ: модель может быть точной в среднем, но несправедливой для отдельных групп.

Как работает

Подходы бывают до обучения, во время обучения и после него: улучшение данных, изменение функции потерь, калибровка результатов и регулярный аудит.

Где применяется

найм и HR
кредитный скоринг
модерация и рекомендации

Ограничения

Нельзя просто «удалить чувствительный признак» и считать проблему решённой: другие признаки могут косвенно его воспроизводить.

Что такое снижение алгоритмической предвзятости