Акции школ
Войти

Специалист по data science

8 месяцев изучения инструментов машинного обучения. 300 часов прокачки навыков структурирования больших объёмов данных и обнаружения неочевидных закономерностей. Курс способствует продвижению в профессии специалистов по Data Science. Студенты освоят Python и его библиотеки, Jupyter Notebook, SQL, с помощью знаний смогут улучшать продукты в бизнесе, промышленности и науке. Куратор даёт обратную связь по заданиям. Выпускники получают сертификат.

Подробнее


Компания: яндекс практикум

рейтинг: Язык: ru

Длительность курса

Длительность курса

240 дней

Формат обучения

Формат обучения

теория с закреплением в тренажёре, домашнее задание для самостоятельной практики и работа с наставником над кодом 10 часов в неделю

Обратная связь

Обратная связь

поддержка наставников в чате доступна 24/7

Теория и практика

Теория и практика

программа обучения на 300 часов 17 учебных проектов на реальных данных

Чему научитесь

Анализировать большие объёмы даных и предсказывать события с помощью машинного обучения и нейронных сетей

- Программировать на языке Python
- Работать с библиотекой Pandas, а также средой программирования Jupyter.
- Очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных.
- Применять основы теории вероятностей и статистики
- Анализировать взаимосвязи в данных методами статистики
- Владеть основными концепциями машинного обучения
- Обращаться с несбалансированными данными
- Владеть инструментами бизнес-метрики, KPI и A/B-тестирования
- Разбираться в главных концепциях линейной алгебры
- Применять алгоритмы при решении практических задач с использованием численных методов
- Работать с основными системами хранения данных — реляционными базами и распределёнными хранилищами
- Решать простые задачи компьютерного зрения с привлечением готовых нейронных сетей и библиотеки Keras
- Строить рекомендательную систему

Перейти на страницу курса Запишись на курс
прямо сейчас!

в любое время 240 дней Кураторы: нет

О курсе

О курсе

в любое время 240 дней Кураторы: нет
Начинающим специалистам по Data Science

Специалистам по Data Science

Рассрочка

13000 р. в месяц

Основы Python и анализа данных: бесплатный вводный курс

20 часов

Познакомитесь с языком программирования Python, библиотекой Pandas, а также средой программирования Jupyter. Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики и специалисты по Data Science.

Предобработка данных

20 часов

Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных.

Исследовательский анализ данных

20 часов

Изучите основы теории вероятностей и статистики. Примените их для исследования основных свойств данных, поиска закономерностей, распределений и аномалий. Познакомитесь с библиотеками SciPy и Matplotlib. Отрисуете диаграммы, поупражняетесь в анализе графиков.

Статистический анализ данных

20 часов

Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы.

Введение в машинное обучение

20 часов

Освоите основные концепции машинного обучения. Познакомитесь с библиотекой Scikit-Learn и примените её для создания первого проекта с машинным обучением.

Обучение с учителем (классификация и регрессия)

20 часов

Углубитесь в самую востребованную область машинного обучения — обучение с учителем. Узнаете, как обращаться с несбалансированными данными.

Машинное обучение в бизнесе

20 часов

Примените свои знания о машинном обучении к задачам бизнеса. Узнаете, что такое бизнес-метрики, KPI и A/B-тестирование.

Линейная алгебра

20 часов

Заглянете внутрь нескольких изученных ранее алгоритмов и лучше поймёте, как их применять. На практике освоите с нуля главные концепции линейной алгебры: линейные пространства, линейные операторы, евклидовы пространства.

Численные методы и алгоритмы

20 часов

Разберёте ряд алгоритмов и приспособите их к решению практических задач с использованием численных методов. Приближённые вычисления, оценка сложности алгоритма, градиентный спуск.

Тексты, временные ряды и feature engineering

20 часов

Узнаете, что такое feature engineering в целом. Примените его к текстам и временным рядам. Научитесь векторизировать тексты инструментами word2vec, GloVe, FastText.

Извлечение данных

20 часов

Познакомитесь с основными системами хранения данных — реляционными базами и распределёнными хранилищами. Научитесь извлекать эти данные запросами на языке SQL и методами библиотеки PySpark.

Компьютерное зрение

20 часов

Научитесь решать простые задачи компьютерного зрения с привлечением готовых нейронных сетей и библиотеки Keras. Одним глазком заглянете в Deep learning.

Рекомендации и обучение без учителя

20 часов

Узнаете, что такое рекомендательные системы, и построите свою. Познакомитесь с рядом задач обучения без учителя.

Python

Pandas

SciPy

Matplotlib

Scikit-Learn

XGBoost

Jupyter Notebook

SQL

Word2vec

GloVe

FastText

PySpark

Keras

Предобработка данных: очистка данных от выбросов, пропусков и дубликатов, а также преобразование разных форматов данных.

Знание основ теории вероятностей и статистики.

Знание главных концепций линейной алгебры: линейные пространства, линейные операторы, евклидовы пространства.

Отрисовка диаграмм, анализ графиков.

Оптимизация воронки продаж применяя методы статистики

Векторизация текстов инструментами word2vec, GloVe, FastText.

Извлечение данных методами библиотеки PySpark

Навыки, которые вы получите

 
ОБРАБОТКА ДАННЫХ ТЕОРИЯ ВЕРОЯТНОСТИ ВОРОНКА ПРОДАЖ ВИЗУАЛИЗАЦИЯ ДАННЫХ ВЕКТОРИЗАЦИЯ ТЕКСТОВ

Компания, проводящая курс

Яндекс Практикум

5 курсов по 13 темам

Яндекс Практикум был запущен в феврале 2019 года в партнёрстве со “Школой анализа данных” (бесплатной двухгодичной образовательной...

Отзывы студентов

4.6
Рейтинг курса
79%
14%
0%
7%
0%
больше курсов

Похожие курсы компании

яндекс практикум
(42)
75 000 руб