Узнаете, что такое библиотека Sklearn и как ею пользоваться. Изучите алгоритмы кластеризации и сможете строить ансамбли моделей. Научитесь оценивать модели и работать с переобучением. Узнаете, как использовать в работе GridSearch и RandomizedSearch, Model Specific CV, Out of Bag approach.
Вы научитесь планировать разработку data science проектов, а также грамотно рассказывать заказчикам о результатах исследований.
В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.
Вы освоите основные техники машинного зрения: извлечение признаков, поиск по картинкам, сегментирование, детекция объектов, а также научитесь строить нейросети.
Обработка естественного языка (NLP)
Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.
На этом интенсивном блоке вы научитесь выявлять происхождение и структуру временного ряда, прогнозировать будущие значения для эффективного принятия решений при построении моделей машинного обучения. Поймёте, что «под капотом» у популярных методик и библиотек.
Завершим обучение состязанием с товарищами по курсу: в составе миникоманды за ограниченное время и на основе датасетов крупных игроков рынка вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.
Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.
В рамках дипломного проекта вы построите ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста, и т. д.
Если в моменте у вас идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний.
Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.
Сбор и подготовка данных для анализа
Генерация текстов и изображений
Создание рекомендательных систем
Выбор и реализация алгоритма под задачу
Выбор и создание фич для модели