Войти

Обучение на размеченных данных

Средний

81 видеолекция по обучению на размеченных данных от МФТИ. Курс длится 1,5 месяца и предполагает 8 часов занятий в неделю. Способствует развитию в профессии специалистов Data Science. Эксперты научат строить предсказывающие алгоритмы, оценивать обобщающую способность, подбирать параметры модели, подсчитывать метрики качества. Студенты узнают про случайные леса и метод градиентного бустинга. Обратная связь по заданиям. Сертификат по окончании.

Подробнее


Средний
Бесплатно

Компания: coursera (курсера)

Язык: ru

Длительность курса

Длительность курса

35 дней

Формат обучения

Формат обучения

Видеолекции, практические упражнения 8 часов в неделю

Обратная связь

Обратная связь

Общение с учащимися и преподавателями на форумах курса

Теория и практика

Теория и практика

81 видео (9 часов ) 46 материал для самостоятельного изучения 41 тест

Чему научитесь

Предсказывать некоторую величину для любого объекта с помощью линейных моделей

- Решать задачи обучения на размеченных данных
- Разбираться в том, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться
- Ориентироваться в кросс-валидации
- Уменьшать сложность модели и производить отбор признаков с помощью регуляризации
- Работать с новым семейством алгоритмов — решающими деревьями

Пройти курс Запишись на курс
прямо сейчас!

в любое время 35 дней Кураторы: нет

О курсе

О курсе

в любое время 35 дней Кураторы: нет
Начинающим аналитикам

аналитикам

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей.

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных.

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn.

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе.

Нейронные сети и обзор методов

Рады приветствовать вас на последней, пятой неделе курса! Мы расскажем ещё о нескольких подходах к решению задач машинного обучения, которые не были затронуты в предыдущих модулях, но при этом играют важную роль в практических задачах. Это нейронные сети, байесовские модели, метрические методы. Вы узнаете, для чего они нужны, и попробуете самостоятельно применить их в практических заданиях.

Python

scikit-lear

построение предсказывающих алгоритмов

оценивание обобщающей способности алгоритмов

подбор параметров модели

выбор и подсчет метрик качества

применение на практике алгоритмов классификации и регрессии: линейные модели, нейронные сети, решающие деревья

Компания, проводящая курс

Coursera (Курсера)

126 курсов по 395 темам

Проект в сфере массового онлайн-образования Coursera (Курсера) основан профессорами информатики Стэнфордского университета. Платформа...

Преподаватели курса

преподаватель в Московском физико-технический институт

Evgeny Sokolov is head of the unstructured data analysis group at Yandex Data Factory. He graduated...

преподаватель в Московском физико-технический институте

Evgeniy Riabenko, PhD, is a Research Scientist at Facebook, London. He has more than 10 years of...

Преподаватель на Кафедре алгоритмов и технологий программирования

Доктор физико-математических наук

Доктор физико-математических наук, профессор РАН,...

Ни одного отзыва об этом курсе

Может, вы можете помочь? Вам будут благодарны многие пользователи. И мы тоже.

смотрите также

Похожие курсы

go practice
(29)
45 900 Р
цифровое производство
(5)
skillfactory (скиллфактори)
(1)
29 833 Р
coursera (курсера)
(1)
skillbox (скиллбокс)
(1)
158 000 Р
skillfactory (скиллфактори)
(1)
460 008 Р
учебный центр "специалист"
(1)
9 490 Р
больше курсов

Похожие курсы компании

больше курсов

Другие курсы этих преподавателей