AIDive
Назад к глоссарию

Что такое интерпретируемость

ГлоссарийЭтика и безопасность

способность понять, почему модель дала конкретный результат или какие факторы на него повлияли

Определение

Интерпретируемость — это способность понять, почему модель дала конкретный результат или какие факторы на него повлияли. Проще говоря, важна для доверия, аудита, поиска ошибок и решений, которые затрагивают людей или деньги. В практике ИИ этот термин помогает понять, как устроены данные, модель, инфраструктура или правила вокруг результата. Например, команда смотрит, какие признаки сильнее повлияли на отказ скоринговой модели по заявке.

Пример

команда смотрит, какие признаки сильнее повлияли на отказ скоринговой модели по заявке

Почему важно

важна для доверия, аудита, поиска ошибок и решений, которые затрагивают людей или деньги. Поэтому термин полезен не только разработчикам, но и редакторам, предпринимателям и пользователям, которые выбирают ИИ-инструмент под конкретную задачу.

Как работает

Понятие помогает разобрать пользовательский сценарий: что модель получает на вход, что возвращает на выход, где нужен контекст, какие есть ограничения и где человек должен проверять результат.

Где применяется

Используется в пользовательских ИИ-сервисах, чат-ботах, генеративных инструментах, поиске, автоматизации и объяснении возможностей моделей.

Ограничения

объяснение может быть приблизительным и не всегда раскрывает реальную внутреннюю логику сложной модели. Кроме того, термин «Интерпретируемость» нельзя оценивать только по названию: нужны данные, сценарий применения, метрики качества, стоимость и проверка человеком там, где ошибка может навредить.