Войти

Аналитики Big Data

18 месяцев изучения аналитики Big Data. Содержит 7 блоков. Подходит новичкам. Способствует продвижению в профессии аналитиков, востребованных в сферах финансов, торговли, IT, логистики и консалтинга. В программе: освоение языков SQL и Python, баз данных и библиотек под руководством куратора. Совместно с компанией X5 Retail Group студенты обучатся алгоритмам обработки и анализа данных. Разработка 6 крупных проектов для портфолио. Защита диплома.

Подробнее


Компания: geekbrains

рейтинг: Язык: ru

Длительность курса

Длительность курса

540 дней

Формат обучения

Формат обучения

2–4 занятия в неделю

Обратная связь

Обратная связь

Разбор практических заданий с преподавателем и возможность обсуждать проблемные задания с одногруппниками в закрытом чате.

Теория и практика

Теория и практика

7 блоков, 21 тематический модуль

Чему научитесь

Изучать и выявлять взаимовязи в огромных массивах информации: поведении и предпочтениях клиентов, результатах исследований, рыночных тенденциях

- Программировать на языке Python
- Использовать алгоритмы и структуру данных
- Работать в Linux и операционных системах
- Писать чистый код
- Строить ETL-процессы, скоринговые модели, рекомендательные системы, модели прогнозирования цен и спроса
- Сегментировать, кластеризовать и классифицировать клиентскую базу
- Формировать отчёт анализа данных
- Работать с BI-системами
- Владеть методами машинного обучения, прикладной статистики, теории вероятностей
- Разбираться в библиотеках для машинного обучения (Scikit-learn, XGBoost, Vowpal Wabbit, Apache MLlib)
- Работать с технологиями для обработки больших данных (Hadoop, Hive, Spark, Hue, HBase, Kafka, Spark Streaming)
- Работать с SQL и NoSQL СУБД
- Выступать в соревнованиях по Data Mining (Kaggle)
- Разрабатывать дашборды в QlikView

Пройти курс Запишись на курс
прямо сейчас!

540 дней Кураторы: нет

О курсе

О курсе

540 дней Кураторы: нет
Начинающим аналитикам Big Data

Освоите необходимую математическую базу, познакомитесь с инструментами сбора, анализа и визуализации данных, научитесь решать реальные бизнес-задачи.

Рассрочка

9000 р. в месяц

1 год

I четверть. Март - Май

Введение в анализ данных

В первой четверти студенты научатся главному инструменту аналитика — языку SQL. Также изучат основы языка Python и базовые библиотеки Python для анализа данных (NumPy, Pandas, Matplotlib, Scikit-learn). Итогом четверти станет модель по предсказанию непрерывной переменной.

2 год

II четверть. Июнь - Август

Сбор, предобработка и хранение данных

Во второй четверти студенты научатся собирать данные из различных источников. Также проработают процессы предобработки неструктурированных данных и их хранения в различных базах данных для дальнейшего анализа. На заключительном этапе познакомятся с популярным инструментом по работе с большими данными — Hadoop.

III четверть. Сентябрь - Ноябрь

Алгоритмы обработки и анализа данных. Совместно с компанией X5 Retail Group

В третьей четверти студенты начнут изучение теории вероятностей и математической статистики. Узнают, как работают базовые алгоритмы машинного обучения для решения задач анализа данных и научатся реализовать их с помощью Python. В совместном курсе с компанией X5 Retail Group студенты углубятся в методологии А/Б-тестирования и рассмотрят реализацию полного пайплайна для проверки гипотез в офлайн-ритейле. В курсовом проекте студентам будет необходимо на основе предоставленных данных провести А/Б-тестирование изученными методами.

IV четверть. Декабрь - Февраль

Машинное обучение. Рекомендательные системы

В четвертой четверти студенты погрузятся в прикладное машинное обучение: решат несколько бизнес-кейсов с применением ML, а также подробно изучат популярный фреймворк для работы с BigData — Apache Spark. Курсовой проект будет включать разработку рекомендательной системы.

2 год

I четверть. Март - Май

Аналитика Big Data для бизнеса

В пятой четверти студенты научатся решать задачи ML с отзывами клиентов, геоданными и соцсетями. Также освоят несколько задач бизнес-аналитика в современных BI-системах: построение витрин данных, прогнозирование, управление знаниями и отчетность.

II четверть. Июнь - Август

Выпускной проект

В финальной четверти студенты познакомятся с real-time системой обработки и анализа больших данных на основе Kafka и Apache Streaming. Также 2 месяца будут посвящены работе над выпускным проектом.

Курсы вне четверти

Предметы с индивидуальным выбором даты старта

Курсы вне четверти являются частью основной программы обучения и обязательны к прохождению. Вы можете формировать часть расписания самостоятельно и регулировать интенсивность обучения. На прохождение этих предметов у вас есть 2.5 года с момента покупки обучения в GeekUniversity. Проходите параллельно с четвертями или после полутора лет обучения.

Python

Numpy

Pandas

Matplotlib

Scikit-learn

Jupyter

SQL

NoSQL

Linux

HTML

HTTP

Rest API

Hadoop

Hive

HBase

Hue

Apache Spark

Kafka

mongodb

Cassandra

RDBMS

Apache Zeppelin

QuickView

Навыки программирования на Python

Знание алгоритмов и структур данных

Умение работать в Linux и операционных системах

Умение писать «чистый» код

Опыт построения ETL-процессов

Опыт построения скоринговых моделей

Опыт построения рекомендательных систем

Опыт построения моделей прогнозирования цен и спроса

Опыт сегментации, кластеризации и классификации клиентской базы

Опыт формирования отчетов анализа данных

Опыт работы с BI-системами

Знание методов машинного обучения

Знание библиотек для машинного обучения (Scikit-learn, XGBoost, Vowpal Wabbit, Apache MLlib)

Владение методами прикладной статистики, теории вероятностей

Умение работать с технологиями для обработки больших данных

Знание алгоритмов для работы с большими данными (Hadoop, Hive, Spark, Hue, HBase, Kafka, Spark Streaming)

Умение работать с SQL и NoSQL СУБД

Опыт выступлений в соревнованиях по Data Mining (Kaggle)

Опыт разработки дашбордов в QlikView

Компания, проводящая курс

GeekBrains

149 курсов по 483 темам

Онлайн-платформа для обучения GeekBrains работает с 2014 года. Является частью холдинга Mail.Ru Group и резидентом Сколково с 2016 года. Школа...

Преподаватели курса

Руководитель направления образовательных программ GeekBrains

В прошлом – разработчик военных систем связи. Сейчас...

разработчик Ruby

Закончил «Винницкий государственный технический...

Фрилансер

Выпускник физического факультета ПГНИУ. На первом...

Full-stack веб разработчик

Full-stack web-developer Chief technical officer в laatu.solutions Окончил...

Ведущий системный аналитик в DWH

Ведущий системный аналитик в DWH Рекламных технологий...

Data Scientist

Изучал биостатистику в МГУ им. М.В.Ломоносова, там же...

Руководитель в «Продуктивные технологические системы»

Руководитель математического направления в...

Data Scientist в DeliveryClub

Data Scientist в DeliveryClub. Kaggle Master. Преподаватель проекта...

BI Lead Ситимобил

BI Lead Ситимобил. В прошлом - офицер аналитического...

Senior BI Analyst в Ситимобил

Senior BI Analyst в Ситимобил. Руководил отделом маркетинга и...

Отзывы студентов

4.4
Рейтинг курса
56%
33%
11%
0%
0%
смотрите также

Похожие курсы

больше курсов

Похожие курсы компании

больше курсов

Другие курсы этих преподавателей