Вход Блог
Строительство и ремонт
Репетиторы
Красота
Фрилансеры
Разные специалисты
Тренеры
Уход за животными
Автоинструкторы

Машинное обучение — работа в Москве

Дата: 2025-12-18
Детали
Регион
Москва
Занятость
дистанционно
Стоимость
договорная
Дата публикации
2025-12-18
Описание
Для себя Есть датасет и первые пять пунктов вроде сделаны, но с остальными не получается Сделать надо сегодня-завтра Прогнозирование выручки с использованием моделей временных рядов 1. Подготовка данных ? Создайте датафрейм из двух столбцов: date (дата) и sales (продажи/выручка). ? Преобразуйте столбец date в тип datetime. ? Установите date в качестве индекса датафрейма (df.set_index('date', inplace=True)). ? Проверьте данные на пропуски и дубликаты. Решите, как их обработать (интерполяция, заполнение средним и т.д.). 2. Агрегация и первичный анализ ? Используйте df.resample('M').sum() (или 'W', 'Q') для выбора периода (месяц — оптимально для большинства бизнес-задач). Обоснуйте выбора периода. ? Постройте линейный график агрегированного ряда (plot()). Оцените визуально: есть ли тренд, сезонность, выбросы, структурные изменения. 3. Декомпозиция ряда ? Выполните декомпозицию (аддитивную или мультипликативную) с помощью seasonal_decompose. Мультипликативная модель подходит, если амплитуда сезонных колебаний растет со временем. ? Визуализируйте тренд, сезонную компоненту и остаток. 4. Проверка на стационарность и стационаризация ? Определите тип колеблемости с помощью автокорреляции первого порядка по отклонению от тренда. ? Определите стационарность набора данных с помощью теста Дики-Фуллера (ADF). Если p-value > 0.05, ряд нестационарен. ? Примените первое дифференцирование: df_diff = df.diff().dropna(), если ряд нестационарен. ? Повторно провести ADF-тест для df_diff. Если ряд все еще нестационарен, применить второе дифференцирование. Порядок дифференцирования d = 1 (реже 2). 5. Идентификация модели ? Постройте графики ACF и PACF для стационарного ряда (df_diff). ? Определите p (порядок AR). Смотреть на график PACF. Порядок p — это количество значимых выбросов до того, как корреляции перестанут быть значимыми (окажутся внутри доверительного интервала). ? Определите q (порядок MA). Смотреть на график ACF. Порядок q — это количество значимых выбросов до того, как корреляции перестанут быть значимыми. ? Определите наличие сезонности. Если на графике ACF исходного ряда есть значимые пики на лагах, кратных периоду (например, на 12, 24, 36 для месячных данных), нужна SARIMA с сезонными параметрами (P, D, Q, S), где S — период сезонности (12 для месяцев). 6. Разделение данных и обучение модели ? Разделите ряд на обучающую (70-80%) и тестовую (20-30%) выборки. Не перемешивать! Тестовая часть — это последние периоды временного ряда. ? Подберите несколько моделей-кандидатов на основе шага 5 (например, ARIMA(1,1,1), ARIMA(0,1,2), SARIMA(1,1,1)(1,1,1,12)). ? Обучите каждую модель на тренировочных данных. 7. Валидация и выбор лучшей модели ? Сделайте прогноз по каждой модели на длину тестовой выборки. ? Рассчитайте метрики ошибок (MAE, RMSE, MAPE) на тестовой выборке, сравнив прогноз с реальными значениями. ? Выберите модель с наименьшими ошибками. ? Визуализируйте: на одном графике тренировочные данные, тестовые данные и прогноз выбранной модели. 8. Диагностика остатков ? Получите остатки (ошибки) финальной модели: residuals = model_fit.resid. ? Проверьте на нормальность полученные ошибки. Постройте гистограмму с кривой распределения и/или Q-Q plot. Выполнить тест Шапиро-Уилка (если данных не очень много). ? Проверьте на автокорреляцию полученные остатки. Постройте график ACF для остатков. Выполнить тест Льюнга-Бокса (p-value должен быть > 0.05, что говорит об отсутствии автокорреляции). ? Проверьте остатки на гомоскедастичность. Постройте график остатков от времени. Не должно быть какой-либо структуры (например, увеличения разброса со временем). Хорошие остатки похожи на “белый шум“. 9. Финальное прогнозирование ? Если диагностика остатков удовлетворительная, переобучите выбранную модель на всем доступном наборе данных (train + test). ? Постройте прогноз на нужное количество шагов вперед. ? Постройте график итогового прогноза с доверительными интервалами.
Похожие заказы

Машинное обучение

дистанционно
договорная
Подготовка к экзамену
Москва Репетиторы

Машинное обучение

дистанционно
договорная
Для себя
Москва Репетиторы

Машинное обучение

дистанционно
договорная
Для работы Репетиторство, разбор заданий совместно
Москва Репетиторы

Машинное обучение

дистанционно
договорная
Подготовка к экзамену
Москва Репетиторы

Машинное обучение

дистанционно
от 500.00 руб.
Для работы Привет, меня зовут Ислам, я практикующий специалист в области Data Science. На данный момент работаю Senior ML-инженером в отделе развития искусственного интеллекта в Сбере. До этого работал в ВК. Я имею большой опыт в DS и прохождении интервью на middle/senior позиции в топ - российских Big Tech компании. Я помогаю студентам и разработчикам пройти путь от базовых концепций до уверенного владения продвинутыми ML-инструментами. Моя цель - не просто дать теорию, а сделать вас конкурентоспособным кандидатом, который пройдет собеседование и начнет зарабатывать. ML и DL без глубокого понимания теории остается лишь набором знаний каких-то фактов, в которых ты не ориентируешься. Я на понятном и доступном языке буду объяснять материал, в результате чего ты начнешь видеть суть вещей и глубоко понимать машинное и глубокое обучение. Мой опыт из многочисленных собеседований в различные топ-российских компаний позволяет мне давать тебе реальные практичные кейсы и теорию. Чему вы научитесь на практике: — Machine Learning: от линейной регрессии до ансамблей и бустинга. Научимся строить модели, которые реально работают в продакшене, а так же исчерпывающе их понимать. — Deep Learning: нейронные сети, трансформеры, CV и NLP — не просто «посмотрим код», а разберем архитектуру и напишем свою. — Продвинутые бизнес-инструменты: ранжирование, uplift-моделирование, динамическое ценообразование. Это то, за что компании платят Senior-специалистам. — Математика под капотом: эконометрика, A/B-тестирование, статистика — чтобы вы не просто нажимали fit/predict, а понимали, почему модель ошибается. — Алгоритмы и структуры данных: без них не берут в топ-компании. Подготовим к техническим собеседованиям на 100%. - ML-design для собеседований. Как проходят занятия: — 70% времени — разбор теории без занудства, с визуализациями и понятными аналогиями, кодим и решаем реальные задачи (Kaggle, ваши проекты, бизнес-кейсы) под изучаемую тему. — 20-30%— разбираем вопросы из собеседований по изучаемой теме, решаем и изучаем алгоритмы и структуры данных. Разбираем домашку. — 0-10% — разбор вакансий, собеседований , составление резюме, и «подводных камней» на пути к офферу. Для кого: — Новички, которые хотят войти в IT с сильной базой. — Junior-специалисты, которым надоело топтаться на месте и хочется быстрого карьерного роста. — Аналитики и разработчики, желающие перейти в DS/ML. ?? Формат: онлайн индивидуально или в мини-группах. ?? Результат после обучения: портфолио из 3–5 проектов, прокачанный GitHub и четкое понимание, как расти до Senior.
Москва Репетиторы

Машинное обучение

дистанционно
договорная
Для себя Консультация по правильной постановке задачи для ml инженера
Москва Репетиторы

Машинное обучение

без разницы
от 1000.00 руб.
Подготовка к экзамену
Москва Репетиторы