AIDive
Назад к глоссарию

Что такое агломеративная кластеризация

ГлоссарийМашинное обучение

Метод группировки данных, который постепенно объединяет похожие объекты в кластеры.

Определение

Агломеративная кластеризация начинает с того, что каждый объект считается отдельной группой. Затем алгоритм шаг за шагом объединяет самые похожие группы, пока не получится нужное число кластеров или иерархия. Такой подход полезен, когда заранее неизвестно, как именно данные делятся на группы.

Пример

Сервис аналитики может сгруппировать пользователей по похожему поведению: частоте визитов, интересам и покупкам.

Почему важно

Термин важен для сегментации клиентов, анализа документов, поиска похожих объектов и первичного исследования данных без готовых меток.

Как работает

Алгоритм выбирает меру расстояния и правило объединения кластеров. Результат часто показывают в виде дерева, где видно, какие группы близки друг к другу.

Где применяется

  • сегментация клиентов
  • кластеризация документов
  • анализ похожих объектов

Ограничения

Метод может быть медленным на больших данных и чувствительным к выбору расстояния. Результат не всегда легко интерпретировать без проверки экспертом.