Что такое бэггинг
Метод ансамблевого обучения, где несколько моделей обучаются на разных подвыборках данных, а затем их ответы объединяются.
Определение
Бэггинг помогает снизить разброс и сделать модель устойчивее. Вместо одной модели обучают много похожих моделей на случайных выборках с возвращением. Затем ответы усредняют или выбирают большинством голосов. Известный пример подхода — случайный лес.
Пример
Для классификации заявок обучают несколько деревьев решений на разных частях данных, а итоговый ответ выбирают голосованием.
Почему важно
Термин важен для понимания ансамблей: иногда группа простых моделей работает надёжнее одной сложной.
Как работает
Алгоритм создаёт несколько обучающих наборов из исходных данных, обучает отдельные модели и агрегирует их предсказания.
Где применяется
- классификация
- регрессия
- устойчивые модели на табличных данных
Ограничения
Бэггинг увеличивает вычислительные затраты и не всегда помогает, если базовые модели слишком простые или данные плохо подготовлены.
