Машинное обучение — работа в Москве

Дата: 2025-12-18

Детали

Регион

Москва

Занятость

дистанционно

Стоимость

договорная

Дата публикации

2025-12-18

Описание

Для себя Есть датасет и первые пять пунктов вроде сделаны, но с остальными не получается Сделать надо сегодня-завтра Прогнозирование выручки с использованием моделей временных рядов 1. Подготовка данных ? Создайте датафрейм из двух столбцов: date (дата) и sales (продажи/выручка). ? Преобразуйте столбец date в тип datetime. ? Установите date в качестве индекса датафрейма (df.set_index('date', inplace=True)). ? Проверьте данные на пропуски и дубликаты. Решите, как их обработать (интерполяция, заполнение средним и т.д.). 2. Агрегация и первичный анализ ? Используйте df.resample('M').sum() (или 'W', 'Q') для выбора периода (месяц — оптимально для большинства бизнес-задач). Обоснуйте выбора периода. ? Постройте линейный график агрегированного ряда (plot()). Оцените визуально: есть ли тренд, сезонность, выбросы, структурные изменения. 3. Декомпозиция ряда ? Выполните декомпозицию (аддитивную или мультипликативную) с помощью seasonal_decompose. Мультипликативная модель подходит, если амплитуда сезонных колебаний растет со временем. ? Визуализируйте тренд, сезонную компоненту и остаток. 4. Проверка на стационарность и стационаризация ? Определите тип колеблемости с помощью автокорреляции первого порядка по отклонению от тренда. ? Определите стационарность набора данных с помощью теста Дики-Фуллера (ADF). Если p-value > 0.05, ряд нестационарен. ? Примените первое дифференцирование: df_diff = df.diff().dropna(), если ряд нестационарен. ? Повторно провести ADF-тест для df_diff. Если ряд все еще нестационарен, применить второе дифференцирование. Порядок дифференцирования d = 1 (реже 2). 5. Идентификация модели ? Постройте графики ACF и PACF для стационарного ряда (df_diff). ? Определите p (порядок AR). Смотреть на график PACF. Порядок p — это количество значимых выбросов до того, как корреляции перестанут быть значимыми (окажутся внутри доверительного интервала). ? Определите q (порядок MA). Смотреть на график ACF. Порядок q — это количество значимых выбросов до того, как корреляции перестанут быть значимыми. ? Определите наличие сезонности. Если на графике ACF исходного ряда есть значимые пики на лагах, кратных периоду (например, на 12, 24, 36 для месячных данных), нужна SARIMA с сезонными параметрами (P, D, Q, S), где S — период сезонности (12 для месяцев). 6. Разделение данных и обучение модели ? Разделите ряд на обучающую (70-80%) и тестовую (20-30%) выборки. Не перемешивать! Тестовая часть — это последние периоды временного ряда. ? Подберите несколько моделей-кандидатов на основе шага 5 (например, ARIMA(1,1,1), ARIMA(0,1,2), SARIMA(1,1,1)(1,1,1,12)). ? Обучите каждую модель на тренировочных данных. 7. Валидация и выбор лучшей модели ? Сделайте прогноз по каждой модели на длину тестовой выборки. ? Рассчитайте метрики ошибок (MAE, RMSE, MAPE) на тестовой выборке, сравнив прогноз с реальными значениями. ? Выберите модель с наименьшими ошибками. ? Визуализируйте: на одном графике тренировочные данные, тестовые данные и прогноз выбранной модели. 8. Диагностика остатков ? Получите остатки (ошибки) финальной модели: residuals = model_fit.resid. ? Проверьте на нормальность полученные ошибки. Постройте гистограмму с кривой распределения и/или Q-Q plot. Выполнить тест Шапиро-Уилка (если данных не очень много). ? Проверьте на автокорреляцию полученные остатки. Постройте график ACF для остатков. Выполнить тест Льюнга-Бокса (p-value должен быть > 0.05, что говорит об отсутствии автокорреляции). ? Проверьте остатки на гомоскедастичность. Постройте график остатков от времени. Не должно быть какой-либо структуры (например, увеличения разброса со временем). Хорошие остатки похожи на “белый шум“. 9. Финальное прогнозирование ? Если диагностика остатков удовлетворительная, переобучите выбранную модель на всем доступном наборе данных (train + test). ? Постройте прогноз на нужное количество шагов вперед. ? Постройте график итогового прогноза с доверительными интервалами.

Откликнуться

Похожие заказы

Машинное обучение

дистанционно

договорная

Подготовка к экзамену

Москва Репетиторы

2026-06-21 Откликнуться

Машинное обучение

дистанционно

договорная

Для себя

Москва Репетиторы

2026-06-21 Откликнуться

Машинное обучение

дистанционно

договорная

Для работы Репетиторство, разбор заданий совместно

Москва Репетиторы

2026-06-20 Откликнуться

Машинное обучение

дистанционно

договорная

Подготовка к экзамену

Москва Репетиторы

2026-06-20 Откликнуться

Машинное обучение

дистанционно

от 500.00 руб.

Для работы Привет, меня зовут Ислам, я практикующий специалист в области Data Science. На данный момент работаю Senior ML-инженером в отделе развития искусственного интеллекта в Сбере. До этого работал в ВК. Я имею большой опыт в DS и прохождении интервью на middle/senior позиции в топ - российских Big Tech компании. Я помогаю студентам и разработчикам пройти путь от базовых концепций до уверенного владения продвинутыми ML-инструментами. Моя цель - не просто дать теорию, а сделать вас конкурентоспособным кандидатом, который пройдет собеседование и начнет зарабатывать. ML и DL без глубокого понимания теории остается лишь набором знаний каких-то фактов, в которых ты не ориентируешься. Я на понятном и доступном языке буду объяснять материал, в результате чего ты начнешь видеть суть вещей и глубоко понимать машинное и глубокое обучение. Мой опыт из многочисленных собеседований в различные топ-российских компаний позволяет мне давать тебе реальные практичные кейсы и теорию. Чему вы научитесь на практике: — Machine Learning: от линейной регрессии до ансамблей и бустинга. Научимся строить модели, которые реально работают в продакшене, а так же исчерпывающе их понимать. — Deep Learning: нейронные сети, трансформеры, CV и NLP — не просто «посмотрим код», а разберем архитектуру и напишем свою. — Продвинутые бизнес-инструменты: ранжирование, uplift-моделирование, динамическое ценообразование. Это то, за что компании платят Senior-специалистам. — Математика под капотом: эконометрика, A/B-тестирование, статистика — чтобы вы не просто нажимали fit/predict, а понимали, почему модель ошибается. — Алгоритмы и структуры данных: без них не берут в топ-компании. Подготовим к техническим собеседованиям на 100%. - ML-design для собеседований. Как проходят занятия: — 70% времени — разбор теории без занудства, с визуализациями и понятными аналогиями, кодим и решаем реальные задачи (Kaggle, ваши проекты, бизнес-кейсы) под изучаемую тему. — 20-30%— разбираем вопросы из собеседований по изучаемой теме, решаем и изучаем алгоритмы и структуры данных. Разбираем домашку. — 0-10% — разбор вакансий, собеседований , составление резюме, и «подводных камней» на пути к офферу. Для кого: — Новички, которые хотят войти в IT с сильной базой. — Junior-специалисты, которым надоело топтаться на месте и хочется быстрого карьерного роста. — Аналитики и разработчики, желающие перейти в DS/ML. ?? Формат: онлайн индивидуально или в мини-группах. ?? Результат после обучения: портфолио из 3–5 проектов, прокачанный GitHub и четкое понимание, как расти до Senior.

Москва Репетиторы

2026-06-19 Откликнуться

Машинное обучение

дистанционно

договорная

Для себя Консультация по правильной постановке задачи для ml инженера

Москва Репетиторы

2026-06-19 Откликнуться

Машинное обучение

без разницы

от 1000.00 руб.

Подготовка к экзамену

Москва Репетиторы

2026-06-18 Откликнуться