Получить доступ
Эксклюзивный партнер
SkillFactory в России
burger
Онлайн-курс «Data Scientist с нуля до PRO» совместно с академиком РАН из МГУ
Разработан совместно с академиком РАН из МГУ им. М.В. Ломоносова
→ Освойте продвинутую математику с самых азов
→ Научитесь создавать ML-модели и работать с нейронными сетями
Получите реальный опыт на практических проектах

Data Scientist с нуля до PRO

Углубленный курс науки о данных
Длительность:
Старт обучения:
Формат:
онлайн в любое время
Уровень подготовки:
с нуля

Углубленный курс «Data Scientist с нуля до PRO» от МГУ

Не требуется опыт в программировании
каждый месяц
25 мес

Курс разработан совместно с академиком РАН из МГУ им. Ломоносова

Алексей Львович Семенов — заведующий кафедрой математической логики и теории алгоритмов МГУ.

Участник разработок ПО для ИИ и для суперкомпьютеров, лауреат премии ЮНЕСКО в области цифровых технологий в образовании и премии им. А. Н. Колмогорова за выдающиеся достижения в области математики.
Московский государственный университет им.⦁М.В. Ломоносова
В топ-25
По качеству образования в Рейтинге лучших университетов мира Times Higher Education (THE) 2021
В топ-110
По критерию «Успешность выпускников» в Мировом рейтинге QS 2020
В топ-34
Cреди вузов мира по математике в QS World University Rankings by Subject-2021
Московский государственный университет им. М.В. Ломоносова
Лучший ВУЗ России по версии RAEX
Это специалист, который обрабатывает большие объемы неструктурированной информации и превращает ее в упорядоченный набор данных.

Дата-сайентист может:

Кто такой Data Scientist

Предсказать, окупится ли новый проект
Оценить будущий спрос на товары и услуги
Улучшить системы рекомендаций в соцсетях и сервисах
Создать приборы для автоматической постановки диагноза пациенту
Усовершенствовать транспортное движение
Построить систему распознавания лиц
Дата-сайентист использует методы науки о данных (Data Science), строит и тестирует математические модели. Он находит закономерности, дает прогнозы и предлагает лучшие решения в разных сферах.

Вы вспомните школьную математику и освоите углубленный уровень для Data Science, чтобы:

Научиться не просто работать с алгоритмами машинного обучения, но и создавать и развивать их
Использовать в работе фундаментальные основы анализа данных
Успешно проходить технические собеседования в компаниях уровня Google и Яндекс
Решать сложные бизнес-задачи и иметь конкурентное преимущество на рынке
Общаться с другими дата-сайентистами на одном языке

Как Data Science применяется в жизни

Специалисты подразделения Google AI, занимающегося искусственным интеллектом, создали модель глубокого обучения (Deep Learning) для распознавания кожных болезней. DL-модель может диагностировать 26 болезней кожи с точностью 97%.
Компания Frontier Development Lab вместе со студентами из разных стран и специалистами Nvidia, разработала алгоритм, способный создать 3D-модель астероида за четыре дня. Этот метод используют сегодня для моделирования формы астероидов в реальном времени. А NASA применяет алгоритм NASA визуализации данных о космическом мусоре.
Компания Google создала приложение, которое позволяет слабовидящим и слепым узнавать об объектах рядом с ними — оно в реальном времени распознает на изображении с камеры объекты и передает информацию пользователю. Еще оно умеет зачитывать текст, знаки, штрих-коды и другие визуальные объекты.

Распознавание кожных заболеваний

Алгоритм моделирования астероидов

Распознавание объектов для слабовидящих и слепых

Новичок

Программа расчитана на обучение науке о данных с нуля. Вы начнете с SQL и Python. Получите необходимую теорию по математике, статистике и теории вероятности и отработаете ее на практике. А через год легко сможете решать задачи.

Программист

Научитесь работать с моделями машинного обучения, анализировать данные на Python и прокачаете аналитическое мышление.

Вам подойдет этот курс, если вы

Аналитик

Начнете анализировать данные на продвинутом уровне, автоматизировать процесс сбора данных. Научитесь обучать модели и делать прогнозы, а также применять это для решения бизнес-задач.

Кем вы станете

После базового курса вы сможете выбрать более узкую специализацию в Data Science — ML Engineer, CV Engineer или NLP Engineer
  • Разработаете модель предсказания кредитного рейтинга
  • Решите задачу классификации спама СМС-сообщений
  • Разработаете систему рекомендаций подходящих товаров при покупке
  • Построите модель для увеличения продаж в розничном бизнесе
  • Создадите изображения по текстовому описанию с помощью нейросети DALL-E
ML Engineer — Разработчик машинного обучения

ML Engineer — Разработчик машинного обучения

  • Научитесь решать все базовые задачи в сфере Computer Vision
  • Приобретёте знание реального флоу работы с моделями CV, актуальных подходов и продвинутых инструментов, необходимых для создания CV-сервисов
  • В итоговом проекте создадите виртуального коуча, способного оценивать правильность выполнения упражнений на видео

CV Engineer — Специалист по компьютерному зрению

CV Engineer — Специалист по компьютерному зрению

Эффективный формат онлайн-обучения

Занимайтесь в своем темпе

Наши курсы ориентированы на тех, кто работает и хочет сам регулировать нагрузку. Занимайтесь без отрыва от работы и выделяйте на учебу столько времени, сколько есть прямо сейчас (15 минут или 2 часа в день).

20% обучения — интересная и важная теория

Теория разбита на короткие блоки, после которых обязательно идет практика.

Вы смотрите короткие видео, изучаете текстовые материалы и приступаете к заданиям, чтобы закрепить знания.

80% обучения — практика в разных форматах

Для развития навыков у нас есть 5 видов практики: тренажеры, тесты, домашние задания, проекты и хакатоны. Разнообразие форматов помогает усваивать знания максимально эффективно.

Менторы и координаторы помогут дойти до конца

Все менторы — опытные практики из IT-индустрии. Они дают качественную обратную связь на задания, отвечают на вопросы и помогают студенту достичь своих целей во время обучения. Выпускники оценивают менторскую поддержку на 9,1 балла из 10.

Координаторы постоянно на связи, чтобы решить любой организационный вопрос. Их задача — мотивировать студентов и помочь пройти курс до конца.

БАЗА
На этом этапе вы изучите основы программирования на Python, научитесь предобрабатывать и анализировать данные, а также познакомитесь с основными задачами дата-сайентиста.

Программа курса
«Data Scientist с нуля до PRO»

Введение

1 неделя
Вы сможете сформулировать для себя реальные цели обучения, узнаете, в чем ценность DS для бизнеса, познакомитесь с основными задачами дата-сайентиста и разберетесь, как строится разработка любого DS-проекта.
  • INTRO-1. Как учиться эффективно — онбординг в обучение
  • INTRO-2. Обзор профессии. Типы задач в Data Science. Этапы и подходы к разработке Data Science проекта

Проектирование разработки

5 недель
Вы научитесь работать с основными типами данных с помощью языка Python и сможете применять в повседневной работе циклические конструкции, условные операторы и функции.
  • PYTHON-1. Основы Python
  • PYTHON-2. Погружение в типы данных
  • PYTHON-3. Условные операторы
  • PYTHON-4. Циклы
  • PYTHON-5. Функции и функциональное программирование
  • PYTHON-6. Практика
  • PYTHON-7. Гид по стилю в среде Python (бонусный)

Основы математики

7 недель
  • MATH-1. Числа и выражения
  • MATH-2. Уравнения и неравенства
  • MATH-3. Основные понятия теории функций
  • MATH-4. Основы геометрии: планиметрия, тригонометрия и стереометрия
  • MATH-5. Множества, логика и элементы статистики
  • MATH-6. Комбинаторика и основы теории вероятности
  • MATH-7. Решение задач

Работа с данными

8 недель
На этом этапе вы овладеете базовыми навыками работы с данными: научитесь подготавливать, очищать и преобразовывать данные так, чтобы они были пригодны для анализа. Кстати, об анализе: вы будете анализировать данные с помощью популярных библиотек Matplotlib, Seaborn, Plotly.
  • PYTHON-8. Инструменты Data Science
  • PYTHON-9. Библиотека NumPy
  • PYTHON-10. Введение в Pandas
  • PYTHON-11. Базовые приемы работы с данными в Pandas
  • PYTHON-12. Продвинутые приемы работы с данными в Pandas
  • PYTHON-13. Очистка данных
  • PYTHON-14. Визуализация данных
  • PYTHON-15. Принципы ООП в Python и отладка кода (дополнительный модуль)
  • Проект 1. Аналитика датасета по закрытым вопросам

Подгрузка данных

6 недель
Вы сможете выгружать данные из разных форматов и источников. А поможет вам в этом SQL — язык структурированных запросов. Вы научитесь использовать агрегатные функции, соединения таблиц и сложные объединения.
  • PYTHON-16. Как выгружать данные из файлов разных форматов
  • PYTHON-17. Получение данных из веб-источников и API
  • SQL-0. Привет, SQL!
  • SQL-1. Основы SQL
  • SQL-2. Агрегатные функции
  • SQL-3. Соединение таблиц
  • SQL-4. Сложные объединения
  • Проект 2. Подгрузка новых данных. Уточнение анализа

Статистический анализ данных

7 недель
Разведывательный анализ данных (EDA) — вот, что окажется в центре вашего внимания. Вы познакомитесь со всеми этапами такого анализа и научитесь проводить его с помощью библиотек Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Кроме того, вам удастся поработать на Kaggle, популярном сервисе по участию в соревнованиях.
  • EDA-1. Введение в разведывательный анализ данных. Алгоритмы и методы EDA
  • EDA-2. Математическая статистика в контексте EDA. Типы признаков
  • EDA-3. Проектирование признаков (Feature Engineering)
  • EDA-4. Статистический анализ данных на Питоне
  • EDA-5. Статистический анализ данных на Питоне. Часть 2
  • EDA-6. Проектирование экспериментов
  • EDA-7. Kaggle площадка
  • Проект 2

Введение в машинное обучение

9 недель
Вы познакомитесь с ML-библиотеками для моделирования зависимостей в данных. Вы сможете обучить основные виды ML-моделей, провести валидацию, интерпретировать результаты работы и выбрать важные признаки (feature importance).
  • ML-1. Теория машинного обучения
  • ML-2. Обучение с учителем: Регрессия
  • ML-3. Обучение с учителем: Классификация
  • ML-4. Обучение без учителя: Кластеризация и техники понижение размерности
  • ML-5. Валидация данных и оценка модели
  • ML-6. Отбор и селекция признаков
  • ML-7. Оптимизация гиперпараметров модели
  • ML-8. ML Cookbook
  • Проект 3. Задача классификации
ОСНОВНОЙ БЛОК
Линейная алгебра, математический анализ, дискретная математика — звучит страшно, но не пугайтесь: разберем все эти предметы и научим с ними работать! На втором этапе вы погрузитесь в математику и основы машинного обучения, узнаете больше о профессиях DS, а также благодаря профориентации выберите трек обучения второго года.

Математика и машинное обучение. Часть 1

6 недель
Вы сможете решать практические задачи с помощью ручного счета и Python (векторные и матричные вычисления, работа с множествами, исследование функций с помощью дифференциального анализа).
  • MATH&ML-1. Линейная алгебра в контексте Линейных методов. Часть 1
  • MATH&ML-2. Линейная алгебра в контексте Линейных методов. Часть 2
  • MATH&ML-3. Математический анализ в контексте задачи оптимизации Часть 1
  • MATH&ML-4. Математический анализ в контексте задачи оптимизации. Часть 2
  • MATH&ML-5. Математический анализ в контексте задачи оптимизации. Часть 3
  • Проект 4. Задача регрессии

Математика и машинное обучение. Часть 2

6 недель
Вы познакомитесь с основными понятиями теории вероятности и математической статистики, алгоритмами кластеризации, а также научитесь оценивать качество произведенной кластеризации и представлять результаты в графическом виде.
  • MATH&ML-6. Теория вероятностей в контексте Наивного Байесовского классификатора
  • MATH&ML-7. Алгоритмы на основе Деревьев решений
  • MATH&ML-8. Бустинг & Стекинг
  • MATH&ML-9. Кластеризация и техники понижение размерности. Часть 1
  • MATH&ML-10. Кластеризация и техники понижение размерности. Часть 2
  • Проект 5. Ансамблевые методы

Дискретная математика

4 недели
  • MATH&MGU-1 Множества и комбинаторика
  • MATH&MGU-2 Логика
  • MATH&MGU-3 Графы. Часть 1
  • MATH&MGU-4 Графы. Часть 2

ML в бизнесе

8 недель
Вы научитесь использовать ML-библиотеки для решения задачи временных рядов и рекомендательных систем. Вы сможете обучить ML-модель и провести её валидацию, а также создать работающий прототип и запустить модель в веб-интерфейсе. А ещё получите навыки A/B-тестирования, чтобы можно было оценить модель.
  • MATH&ML-11. Временные ряды. Часть 1
  • MATH&ML-12. Временные ряды. Часть 2
  • MATH&ML-13. Рекомендательные системы. Часть 1
  • MATH&ML-14. Рекомендательные системы. Часть 2
  • PROD-1. Подготовка модели к Production
  • PROD-2. Прототип Streamlit+Heroku
  • PROD-3. Бизнес понимание. Кейс
  • Проект 6. Тема на выбор: Временные ряды или Рекомендательные системы
УРОВЕНЬ PRO
На третьем этапе вы познакомитесь с одним из методов машинного обучения — глубоким обучением (DL). А также вас ждет полноценный блок выбранной специализации: вы можете освоить навыки машинного обучения (ML), познакомиться с рутиной CV (компьютерного зрения) или прокачаться в NLP*, обработке естественного языка.
При выборе CV или ML вы сможете пройти курс по NLP без менторской поддержки бесплатно
Второй год обучения - 2 специализации на выбор

Профориентация

10 недель
ML, CV или NLP: на этом этапе вам наконец предстоит сделать выбор, по какому пути двигаться дальше. Мы расскажем о каждой специализации и предложим решить несколько практических задач, чтобы вам было проще определиться.

Трек ML - Engineer

29 недель
В ML-треке вы научитесь решать углубленные задачи машинного обучения, овладеете компетенциями дата-инженера, отточите навык работы с библиотеками Python. Также вы научитесь создавать MVP (минимально жизнеспособную версию продукта), узнаете все тонкости вывода ML-модели в продакшн и узнаете, как работают ML-инженеры в реальной жизни.
  • Введение в Deep Learning
  • Основы Data Engineering
  • Дополнительные главы Python и ML
  • Экономическая оценка эффектов и разработка MVP
  • ML в Production
  • Углубленное изучение ML-разработки и выпускной проект по выбранной теме

Трек CV - Engineer

29 недель
На CV-треке вы научитесь решать такие задачи компьютерного зрения, как классификация изображений, сегментация и детекция, генерация и стилизация картинок, восстановление и повышение качества фотографий. Кроме того, вы узнаете, как выкатывать нейронные сети в продакшн.
  • Введение в Deep Learning
  • Основы Data Engineering
  • Дополнительные главы Python и ML
  • Экономическая оценка эффектов и разработка MVP
  • ML в Production
  • Углубленное изучение ML-разработки и выпускной проект по выбранной теме

Deep Learning и нейронные сети

БОНУС
Где применяются нейросети? Как обучить нейронную сеть? Что такое Deep Learning? Ответы на эти вопросы вы узнаете в бонусном разделе DL.

Введение в Data Engineering

БОНУС
Вы узнаете, в чём различие ролей дата-сайентиста и дата-инженера, какими инструментами пользуется последний в своей работе, какие задачи ежедневно решает. Слова «снежинка», «звезда» и «озеро» обретут новые значения :)
Не важно, сколько вам лет и какой у вас опыт, — вы справитесь.
Просто следуйте программе обучения.

Преподаватели и авторы курса

Преподаватели и авторы
Алексей Семенов - Академик РАН

Алексей Семенов

Заведующий кафедрой математической логики и теории алгоритмов МГУ
Академик РАН
Алек Леков - Senior ML-Engineer, МТС
Senior ML-Engineer, МТС

Алек Леков

Основные компетенции — временные ряды, Deep Learning и нейронные сети.
Занимается консалтингом в сфере AI.
Эмиль Магеррамов - Ведущий автор разделов ML и DS

Эмиль Магеррамов

Руководитель группы вычислительной химии в BIOCAD.
Создает сервисы и модели машинного обучения, которые помогают химикам быстрее выпускать лекарства.
Ведущий автор разделов ML и DS
Маргарита Бурова - Ведущий автор раздела MATH&ML

Маргарита Бурова

Эксперт по Data Science
Компетенции: Python, машинное обучение, cтатистика, анализ данных
Ведущий автор раздела MATH&ML
Михаил Баранов - Автор раздела курса
Автор раздела курса

Михаил Баранов

Эксперт по Data Science
Компетенции: машинное обучение, большие данные, Python
Александр Рыжков - Автор раздела про KAGGLE

Александр Рыжков

Руководитель команды LightAutoML
Kaggle Grandmaster
Компетенции: ML/DS, Python, математика, статистика, Kaggle
Автор раздела про KAGGLE
Екатерина Трофимова - Автор модулей по EDA

Екатерина Трофимова

Исследователь лаборатории методов анализа больших данных, факультет компьютерных наук НИУ ВШЭ
Компетенции: Python, PyTorch, CV, GNN
Автор модулей по EDA
Антон Киселев - ведущий автор раздела «Введение в DS»

Антон Киселев

Head of Marketing Analytics, Playrix
Эксперт по данным с опытом 15+ лет
Компетенции: Data Science
ведущий автор раздела «Введение в DS»
Андрей Рысистов - Автор модулей по Python и ML

Андрей Рысистов

Эксперт DS, преподаватель Skillfactory, автор курсов, автор и соавтор нескольких научных исследований и работ.
Сфера интересов — искусственный интеллект в авиационных технических системах
Автор модулей по Python и ML
Мария Жарова - Стажер в команде ML Циан + ментор SF
Стажер в команде ML Циан + ментор SF

Мария Жарова

Владимир Горюнов - Ментор SkillFactory на курсах Data Science, Data Engineering и Fullstack-разработчик на Python

Владимир Горюнов

Ментор SkillFactory на курсах Data Science, Data Engineering и Fullstack-разработчик на Python
Елена Мартынова - Ментор SkillFactory

Елена Мартынова

Компетенции: BI, SQL, Python,аналитика
Ментор SkillFactory
Леонид Саночкин - Ментор по NLP

Леонид Саночкин

Научный сотрудник AIRI
10+ лет занимается исследованиями в области NLP
Ментор по NLP
Менторы

Ваши навыки после курса

Иван Петров
Data Scientist
Использую основные алгоритмические конструкции и структуры данных Python для проектирования алгоритмов

Умею получать данные из веб-источников или по API

Умею визуализировать данные с помощью Pandas, Matplotlib

Умею создавать модели с помощью классического машинного и глубокого обучения для решения задач Data Science

Умею оценивать качество модели вне зависимости от задачи

Применяю методы математического анализа, линейной алгебры, статистики и теории вероятности для обработки данных

Строю математические и ML-модели с использованием временных рядов

Применяю алгоритмы для рекомендательных систем (от ассоциативных правил до advanced-алгоритмов)

Специализируюсь на ML/CV/NLP-инженерии (в зависимости от выбранной специализации), применяю современные продвинутые модели для решения отдельных задач

Умею конвертировать бизнес-задачи в технические и наоборот

Умею выводить и поддерживать модели в Production с учетом специфики выбранной специализации

Обладаю дополнительными компетенциями в зависимости от выбранного майнора (продвинутый SQL, продвинутый Python, Reinforcement Learning или Data Engineering)
Записаться на курс
-40%
6 790 ₽/мес
11 317 ₽/мес
В рассрочку на 36 мес
Скидка по промокоду:
Кешбэк 30%: 73 332 балла на Lerna
Data Scientist с нуля до PRO
Длительность: 25 мес
Заполните контактные данные
Имя
Телефон
E-mail
Промокод
Название компании
Отправить заявку
success
error
warning

Часто задаваемые вопросы

С помощью обучающих алгоритмов машинного обучения можно научить программы делать что угодно:

1. Предлагать дополнительные товары, которые пользователь купит с наибольшей вероятностью, на основе его поведения на сайте и покупок. Таким образом увеличивать продажи и прибыль бизнеса. Этому вы научитесь в модулях по рекомендательным системам.

2. Предсказывать события в клиентской базе. Таким образом можно заранее предпринять меры, которые сократят расходы или увеличат прибыль. Возьмем для примера страховую компанию, которая предоставляет услуги ДМС. Если она научит программу предсказывать, кто из клиентов в ближайшее время обратится за дорогостоящей медицинской услугой, то сможет предпринять меры, чтобы сократить расходы по ДМС. Например, позвонить клиенту и предложить ему проконсультироваться с хорошим врачом, чтобы не допустить развития болезни. Прогнозирование вы изучите в блоке «Введение в машинное обучение».

3. Формировать заказы на поставку для магазинов сети с учетом динамики продаж, сезона, прогноза погоды и других параметров. Таким образом не допускать, чтобы в торговых точках было затоваривание или нехватка товара. Построению таких моделей посвящены разделы курса по анализу временных рядов.

4. Сегментировать клиентов, чтобы делать им подходящие предложения. Возьмем для примера банк, который создал новый вид кредита. С помощью машинного обучения он может выявить в базе клиентов тех, кто вероятнее всего воспользуется таким кредитом. Решать такие задачи вы научитесь в блоке «Математика и углубленное машинное обучение».

5. Области применения машинного обучения и Python практически безграничны: от контроля качества товаров до диагностики оборудования на производстве, от продаж до аналитики, от повышения персонализации до аудита. Вы сможете использовать возможности алгоритмов практически в любой сфере. Проекты нашей учебной программы не ограничены какой-то определенной индустрией — вы сможете понять весь спектр применения анализа данных.

Учитесь из любой точки в удобное время
Развивайте профессиональные навыки в онлайн-формате
Взаимодействие с участниками разных направлений, которое способствует развитию soft skills.
• Включаем в курсы задачи и вопросы из реальных собеседований
• Проводим онлайн-тренировки технических собеседований
• Помогаем составить резюме
Во время обучения студенты решают настоящие практические задачи и тренируются на настоящих кейсах.
Определенные направления подготовки дают возможность получить реальный стаж и опыт
Студенты отрабатывают навыки на практике и могут пообщаться с потенциальными работодателями.