Что такое описательная статистика
Набор показателей вроде среднего, медианы, разброса, частот и распределений
Определение
Описательная статистика — это набор показателей вроде среднего, медианы, разброса, частот и распределений. Проще говоря, помогает понять данные до сложных моделей и быстро найти пропуски, выбросы и перекосы. В аналитике это помогает не строить модель вслепую и заранее увидеть качество исходных данных.
Пример
Перед прогнозом продаж аналитик смотрит медиану заказа, разброс цен и долю пропущенных значений
Почему важно
Помогает понять данные до сложных моделей и быстро найти пропуски, выбросы и перекосы
Как работает
Сначала изучают данные и цель анализа, затем выбирают подходящие показатели, проверки и представления. После этого результат сравнивают с исходной задачей и ищут, не скрывают ли данные пропуски, выбросы или перекосы.
Где применяется
Используется в аналитике, отчетности, разведочном анализе, подготовке данных, проверке качества и построении моделей на табличных данных.
Ограничения
Главный риск — принять красивую аналитику за доказательство. Нужны проверка качества данных, понимание источников и осторожность с причинными выводами. Для «Описательная статистика» это значит: пример и метрики нужно проверять на своей задаче, а не переносить выводы из демонстрации напрямую.
