Для работы Нужно проанализировать датасет: - Рассчитываем кол-во уникальных значений ,нулевых и пустых значений+доля в % от общего кол-ва; - Среднее значение, медиана, стандартное отклонение, минимум, максимум, тип данных по каждому показателю в предоставленных данных; - Исследуем распределение данных по полу, возрасту и другим категориальным показателям; Делаем проверку на: Полноту данных по клиентам; Пропущенные и нулевых значения в полях; Наличие некорректных знаков; Готовим итоговую витрину данных для сегментации При необходимости: • Корректируем данные – исправляем ошибк ; • Исключаем клиентов с большим числом пропусков или восстанавливаем пропущенные значения • Переводим категориальные показатели в целочисленные;.