Что такое хранилище признаков ИИ
Система для хранения, переиспользования и управления признаками данных, которые используются в машинном обучении.
Определение
Хранилище признаков помогает командам не пересчитывать одни и те же признаки заново и не получать разные версии данных для обучения и продакшна. Признак — это подготовленная характеристика объекта: например, средний чек клиента, число визитов за неделю или последние действия пользователя.
Пример
Рекомендательная система использует признаки пользователя: историю просмотров, покупки, время последнего визита и интересы.
Почему важно
Термин важен для инфраструктуры ИИ: качество модели часто зависит не только от алгоритма, но и от стабильной подготовки данных.
Как работает
Хранилище признаков собирает данные из разных источников, рассчитывает признаки, версионирует их и отдаёт одинаковые значения для обучения модели и реальных предсказаний.
Где применяется
- рекомендательные системы
- скоринговые модели
- MLOps и продакшн машинного обучения
Ограничения
Система требует дисциплины данных. Если признаки плохо определены, устарели или считаются с задержкой, модель будет ошибаться.
