Что такое активное обучение
Метод машинного обучения, при котором модель сама выбирает самые полезные примеры для разметки человеком.
Определение
Активное обучение помогает экономить время и бюджет на разметке данных. Вместо того чтобы размечать тысячи случайных примеров, система находит случаи, в которых модель сомневается сильнее всего. Эксперт размечает именно их, и модель быстрее улучшает качество.
Пример
Для системы модерации изображений модель может попросить человека разметить спорные картинки, где она не уверена: это допустимый контент или нарушение.
Почему важно
Это важно для проектов, где разметка дорогая: медицина, юридические документы, промышленный контроль, редкие языки или сложная модерация.
Как работает
Модель обучается на небольшой выборке, оценивает неразмеченные данные, выбирает самые неопределённые или информативные примеры, получает ответы эксперта и повторяет цикл.
Где применяется
- разметка данных
- обучение моделей с экспертом
- улучшение качества при малом бюджете
Ограничения
Метод не спасает, если исходные данные плохие или эксперт размечает непоследовательно. Важно следить, чтобы модель не зациклилась на узкой группе сложных примеров.
