Войти

Специализация Машинное обучение и анализ данных

Средний

4 курса для освоения специализации по машинному обучению и анализу данных от МФТИ. Длится 8 месяцев и предполагает 8 часов занятий в неделю. Будет полезен программистам с начальным уровнем. Эксперты расскажут о работе с большим массивом данных – методах классификации и регрессии, экспериментах, основах программирования на Python. После разработки собственной системы студенты получат сертификат и смогут участвовать В программе: трудоустройства.

Подробнее


Средний
Бесплатно

Компания: coursera (курсера)

Язык: ru

Длительность курса

Длительность курса

240 дней

Формат обучения

Формат обучения

Видеолекции, практические упражнения 8 часов в неделю

Обратная связь

Обратная связь

Общение с учащимися и преподавателями на форумах курса

Теория и практика

Теория и практика

323 видео (34.5 часов ) 164 материала для самостоятельного изучения 126 тестов

Чему научитесь

Разбираться в полном цикле анализа: от сбора данных до выбора оптимального решения и оценки его качества

- Пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач
- Владеть основными темами, необходимыми в работе с большим массивом данных
- Понимать работу современных методов классификации и регрессии
- Проводить поиск в структурах в данных
- Владеть инструментами базовой фундаментальной математики
- Программировать на языке Python
- Строить рекомендательную систему
- Оценивать эмоциональную окраску текста
- Прогнозировать спрос на товар
- Оценивать вероятность клика по рекламе
- Разрабатывать проект собственной системы для решения актуальных бизнес-задач

Пройти курс Запишись на курс
прямо сейчас!

в любое время 240 дней Кураторы: нет

О курсе

О курсе

в любое время 240 дней Кураторы: нет
Аналитикам данных

1 курс

Математика и Python для анализа данных

Анализ данных и машинное обучение существенно опираются на результаты из математического анализа, линейной алгебры, методов оптимизации, теории вероятностей. Без фундаментальных знаний по этим наукам невозможно понимать, как устроены методы анализа данных. Задача этого курса — сформировать такой фундамент. Мы обойдёмся без сложных формул и доказательств и сделаем упор на интерпретации и понимании смысла математических понятий и объектов. Для успешного применения методов анализа данных нужно уметь программировать. Фактическим стандартом для этого в наши дни является язык Python. В данном курсе мы предлагаем познакомиться с его синтаксисом, а также научиться работать с его основными библиотеками, полезными для анализа данных, например, NumPy, SciPy, Matplotlib и Pandas. Видео курса разработаны на Python 2. Задания и ноутбуки к ним адаптированы к Python 3.

2 курс

Обучение на размеченных данных

Обучение на размеченных данных или обучение с учителем – это наиболее распространенный класс задач машинного обучения. К нему относятся те задачи, где нужно научиться предсказывать некоторую величину для любого объекта, имея конечное число примеров. Это может быть предсказание уровня пробок на участке дороги, определение возраста пользователя по его действиям в интернете, предсказание цены, по которой будет куплена подержанная машина. В этом курсе вы научитесь формулировать и, конечно, решать такие задачи. В центре нашего внимания будут успешно применяемые на практике алгоритмы классификации и регрессии: линейные модели, нейронные сети, решающие деревья и так далее. Особый акцент мы сделаем на такой мощной технике как построение композиций, которая позволяет существенно повысить качество отдельных алгоритмов и широко используется при решении прикладных задач. В частности, мы узнаем про случайные леса и про метод градиентного бустинга. Построение предсказывающих алгоритмов — это лишь часть работы при решении задачи анализа данных. Мы разберемся и с другими этапами: оценивание обобщающей способности алгоритмов, подбор параметров модели, выбор и подсчет метрик качества. Видео курса разработаны на Python 2. Задания и ноутбуки к ним адаптированы к Python 3.

3 курс

Поиск структуры в данных

В машинном обучении встречаются задачи, где нужно изучить структуру данных, найти в них скрытые взаимосвязи и закономерности. Например, нам может понадобиться описать каждого клиента банка с помощью меньшего количества переменных — для этого можно использовать методы понижения размерности, основанные на матричных разложениях. Такие методы пытаются сформировать новые признаки на основе старых, сохранив как можно больше информации в данных. Другим примером может служить задача тематического моделирования, в которой для набора текстов нужно построить модель, объясняющую процесс формирования этих текстов из небольшого количества тем. Такие задачи назвают обучением без учителя. В отличие от обучения с учителем, в них не предполагают восстановление зависимости между объектами и целевой переменной. Из этого курса вы узнаете об алгоритмах кластеризации данных, с помощью которых, например, можно искать группы схожих клиентов мобильного оператора. Вы научитесь строить матричные разложения и решать задачу тематического моделирования, понижать размерность данных, искать аномалии и визуализировать многомерные данные. Видео курса разработаны на Python 2. Задания и ноутбуки к ним адаптированы к Python 3.

4 курс

Построение выводов по данным

Влияет ли знание методов анализа данных на уровень заработной платы? Работает ли система оценки кредитоспособности клиентов банка? Действительно ли новый баннер лучше старого? Чтобы ответить на такие вопросы, нужно собрать данные. Данные почти всегда содержат шум, поэтому утверждения, которые можно сделать на их основе, верны не всегда, а только с определённой вероятностью. Строить наиболее корректные выводы и численно оценивать степень уверенности в них помогают методы статистики. Как можно оценивать неизвестные параметры системы по небольшому количеству наблюдений? Как измерить точность таких оценок? Какие данные нужны, чтобы ответить на ваш вопрос, и на какие вопросы можно ответить с помощью уже имеющихся данных? Вы узнаете все, что нужно для успешного превращения данных в выводы — организация экспериментов, A/B-тестирование, универсальные методы оценки параметров и проверки гипотез, корреляции и причинно-следственные связи. Видео курса разработаны на Python 2. Задания и ноутбуки к ним адаптированы к Python 3.

5 курс

Прикладные задачи анализа данных

Методы машинного обучения — будь то алгоритмы классификации или регрессии, методы кластеризации или алгоритмы понижения размерности — применяются к подготовленным данным с вычисленными признаками для решения уже сформулированной задачи. Однако специалисты по анализу данных редко оказываются в такой идеальной ситуации. Обычно перед ними ставят задачи, которые нуждаются в уточнении формулировки, выборе метрики качества и протокола тестирования итоговой модели. Данные, с которыми нужно работать, часто представлены в непригодном виде: они зашумлены, содержат ошибки и выбросы, хранятся в неудобном формате и т. д. В этом курсе мы разберем прикладные задачи из различных областей анализа данных: анализ текста и информационный поиск, коллаборативная фильтрация и рекомендательные системы, бизнес-аналитика, прогнозирование временных рядов. На их примере вы узнаете, как извлекать признаки из разнородных данных, какие при этом возникают проблемы и как их решать. Вы научитесь сводить задачу заказчика к формальной постановке задачи машинного обучения и поймёте, как проверять качество построенной модели на исторических данных и в онлайн-эксперименте. На каждой задаче мы изучим плюсы и минусы пройденных алгоритмов машинного обучения. Прослушав этот курс, вы познакомитесь с распространенными типами прикладных задач и будете понимать схемы их решения. Видео курса разработаны на Python 2. Задания и ноутбуки к ним адаптированы к Python 3.

6 курс

Анализ данных: финальный проект

Финальный проект даст вам возможность применить полученные в рамках специализации знания к задаче из реального мира. Под руководством успешных специалистов в науке о данных вы сможете поработать над актуальным проектом в одной из областей: электронная коммерция, социальные медиа, информационный поиск, бизнес-аналитика и др. В отличие от задач, основанных на модельных данных, работа над проектом из реальной жизни даст вам возможность самостоятельно пройти все этапы анализа данных — от подготовки данных до построения финальной модели и оценки её качества. В результате в вашем арсенале появится проект, который вы сможете использовать на практике и самостоятельно развивать в дальнейшем. Наличие такого проекта станет вашим конкурентным преимуществом, ведь вы всегда сможете продемонстрировать успешный проект потенциальному работодателю. Видео курса разработаны на Python 2. Задания и ноутбуки к ним адаптированы к Python 3.

Python

NumPy

SciPy

Matplotlib

Pandas

знание основ Python: синтаксис, основные библиотеки - NumPy, SciPy, Matplotlib и Pandas.

построение предсказывающих алгоритмов

оценивание обобщающей способности алгоритмов

подбор параметров модели

выбор и подсчет метрик качества

пострение матричных разложений

решение задач тематического моделирования

понижение размерности данных

поиск аномалий визуализирование многомерных данных

превращение данных в выводы — организация экспериментов, A/B-тестирование, универсальные методы оценки параметров и проверки гипотез, корреляции и причинно-следственные связи

анализ данных

статистическая проверка гипотез

знание распространенных типов прикладных задач и схем их решения

Компания, проводящая курс

Coursera (Курсера)

126 курсов по 395 темам

Проект в сфере массового онлайн-образования Coursera (Курсера) основан профессорами информатики Стэнфордского университета. Платформа...

Преподаватели курса

преподаватель в Московском физико-технический институт

Evgeny Sokolov is head of the unstructured data analysis group at Yandex Data Factory. He graduated...

преподаватель в Московском физико-технический институте

Evgeniy Riabenko, PhD, is a Research Scientist at Facebook, London. He has more than 10 years of...

Преподаватель на Кафедре алгоритмов и технологий программирования

руководитель группы распознавания образов Яндекс

Доктор физико-математических наук

Доктор физико-математических наук, профессор РАН,...

Ни одного отзыва об этом курсе

Может, вы можете помочь? Вам будут благодарны многие пользователи. И мы тоже.

смотрите также

Похожие курсы

go practice
(29)
45 900 Р
цифровое производство
(5)
skillfactory (скиллфактори)
(1)
29 833 Р
coursera (курсера)
(1)
skillbox (скиллбокс)
(1)
158 000 Р
skillfactory (скиллфактори)
(1)
460 008 Р
учебный центр "специалист"
(1)
9 490 Р
больше курсов

Похожие курсы компании

больше курсов

Другие курсы этих преподавателей