Войти

Аналитики Big Data

18 месяцев изучения аналитики Big Data. Содержит 7 блоков. Подходит новичкам. Способствует продвижению в профессии аналитиков, востребованных в сферах финансов, торговли, IT, логистики и консалтинга. В программе: освоение языков SQL и Python, баз данных и библиотек под руководством куратора. Совместно с компанией X5 Retail Group студенты обучатся алгоритмам обработки и анализа данных. Разработка 6 крупных проектов для портфолио. Защита диплома.

Подробнее


Компания: geekbrains (гик брейнс)

рейтинг: Язык: ru

Длительность курса

Длительность курса

540 дней

Формат обучения

Формат обучения

2–4 занятия в неделю

Обратная связь

Обратная связь

Разбор практических заданий с преподавателем и возможность обсуждать проблемные задания с одногруппниками в закрытом чате.

Теория и практика

Теория и практика

7 блоков, 21 тематический модуль

Чему научитесь

Изучать и выявлять взаимовязи в огромных массивах информации: поведении и предпочтениях клиентов, результатах исследований, рыночных тенденциях

- Программировать на языке Python
- Использовать алгоритмы и структуру данных
- Работать в Linux и операционных системах
- Писать чистый код
- Строить ETL-процессы, скоринговые модели, рекомендательные системы, модели прогнозирования цен и спроса
- Сегментировать, кластеризовать и классифицировать клиентскую базу
- Формировать отчёт анализа данных
- Работать с BI-системами
- Владеть методами машинного обучения, прикладной статистики, теории вероятностей
- Разбираться в библиотеках для машинного обучения (Scikit-learn, XGBoost, Vowpal Wabbit, Apache MLlib)
- Работать с технологиями для обработки больших данных (Hadoop, Hive, Spark, Hue, HBase, Kafka, Spark Streaming)
- Работать с SQL и NoSQL СУБД
- Выступать в соревнованиях по Data Mining (Kaggle)
- Разрабатывать дашборды в QlikView

Перейти на страницу курса Запишись на курс
прямо сейчас!

540 дней Кураторы: нет

О курсе

О курсе

540 дней Кураторы: нет
Начинающим аналитикам Big Data

Освоите необходимую математическую базу, познакомитесь с инструментами сбора, анализа и визуализации данных, научитесь решать реальные бизнес-задачи.

Рассрочка

9000 р. в месяц

1 год

I четверть. Март - Май

Введение в анализ данных

В первой четверти студенты научатся главному инструменту аналитика — языку SQL. Также изучат основы языка Python и базовые библиотеки Python для анализа данных (NumPy, Pandas, Matplotlib, Scikit-learn). Итогом четверти станет модель по предсказанию непрерывной переменной.

2 год

II четверть. Июнь - Август

Сбор, предобработка и хранение данных

Во второй четверти студенты научатся собирать данные из различных источников. Также проработают процессы предобработки неструктурированных данных и их хранения в различных базах данных для дальнейшего анализа. На заключительном этапе познакомятся с популярным инструментом по работе с большими данными — Hadoop.

III четверть. Сентябрь - Ноябрь

Алгоритмы обработки и анализа данных. Совместно с компанией X5 Retail Group

В третьей четверти студенты начнут изучение теории вероятностей и математической статистики. Узнают, как работают базовые алгоритмы машинного обучения для решения задач анализа данных и научатся реализовать их с помощью Python. В совместном курсе с компанией X5 Retail Group студенты углубятся в методологии А/Б-тестирования и рассмотрят реализацию полного пайплайна для проверки гипотез в офлайн-ритейле. В курсовом проекте студентам будет необходимо на основе предоставленных данных провести А/Б-тестирование изученными методами.

IV четверть. Декабрь - Февраль

Машинное обучение. Рекомендательные системы

В четвертой четверти студенты погрузятся в прикладное машинное обучение: решат несколько бизнес-кейсов с применением ML, а также подробно изучат популярный фреймворк для работы с BigData — Apache Spark. Курсовой проект будет включать разработку рекомендательной системы.

2 год

I четверть. Март - Май

Аналитика Big Data для бизнеса

В пятой четверти студенты научатся решать задачи ML с отзывами клиентов, геоданными и соцсетями. Также освоят несколько задач бизнес-аналитика в современных BI-системах: построение витрин данных, прогнозирование, управление знаниями и отчетность.

II четверть. Июнь - Август

Выпускной проект

В финальной четверти студенты познакомятся с real-time системой обработки и анализа больших данных на основе Kafka и Apache Streaming. Также 2 месяца будут посвящены работе над выпускным проектом.

Курсы вне четверти

Предметы с индивидуальным выбором даты старта

Курсы вне четверти являются частью основной программы обучения и обязательны к прохождению. Вы можете формировать часть расписания самостоятельно и регулировать интенсивность обучения. На прохождение этих предметов у вас есть 2.5 года с момента покупки обучения в GeekUniversity. Проходите параллельно с четвертями или после полутора лет обучения.

Python

Numpy

Pandas

Matplotlib

Scikit-learn

Jupyter

SQL

NoSQL

Linux

HTML

HTTP

Rest API

Hadoop

Hive

HBase

Hue

Apache Spark

Kafka

mongodb

Cassandra

RDBMS

Apache Zeppelin

QuickView

Навыки программирования на Python

Знание алгоритмов и структур данных

Умение работать в Linux и операционных системах

Умение писать «чистый» код

Опыт построения ETL-процессов

Опыт построения скоринговых моделей

Опыт построения рекомендательных систем

Опыт построения моделей прогнозирования цен и спроса

Опыт сегментации, кластеризации и классификации клиентской базы

Опыт формирования отчетов анализа данных

Опыт работы с BI-системами

Знание методов машинного обучения

Знание библиотек для машинного обучения (Scikit-learn, XGBoost, Vowpal Wabbit, Apache MLlib)

Владение методами прикладной статистики, теории вероятностей

Умение работать с технологиями для обработки больших данных

Знание алгоритмов для работы с большими данными (Hadoop, Hive, Spark, Hue, HBase, Kafka, Spark Streaming)

Умение работать с SQL и NoSQL СУБД

Опыт выступлений в соревнованиях по Data Mining (Kaggle)

Опыт разработки дашбордов в QlikView

Навыки, которые вы получите

 
БАЗЫ ДАННЫХ ТЕОРИЯ ВЕРОЯТНОСТИ ФОРМИРОВАНИЕ ОТЧЕТОВ KAGGLE ЧИСТЫЙ КОД QLIKVIEW АЛГОРИТМЫ И СТРУКТУРА ДАННЫХ АНАЛИЗ И ОБРАБОТКА ДАННЫХ+ ещё 10

Компания, проводящая курс

GeekBrains (Гик брейнс)

149 курсов по 483 темам

Онлайн-платформа для обучения GeekBrains (Гик брейнс) работает с 2014 года. Является частью холдинга Mail.Ru Group и резидентом Сколково с 2016...

Преподаватели курса

Руководитель направления образовательных программ GeekBrains

В прошлом – разработчик военных систем связи. Сейчас...

разработчик Ruby

Закончил «Винницкий государственный технический...

Фрилансер

Выпускник физического факультета ПГНИУ. На первом...

Full-stack веб разработчик

Full-stack web-developer Chief technical officer в laatu.solutions Окончил...

Ведущий системный аналитик в DWH

Ведущий системный аналитик в DWH Рекламных технологий...

Data Scientist

Изучал биостатистику в МГУ им. М.В.Ломоносова, там же...

Руководитель в «Продуктивные технологические системы»

Руководитель математического направления в...

Data Scientist в DeliveryClub

Data Scientist в DeliveryClub. Kaggle Master. Преподаватель проекта...

BI Lead Ситимобил

BI Lead Ситимобил. В прошлом - офицер аналитического...

Senior BI Analyst в Ситимобил

Senior BI Analyst в Ситимобил. Руководил отделом маркетинга и...

Отзывы студентов

4.4
Рейтинг курса
56%
33%
11%
0%
0%
больше курсов

Похожие курсы компании

geekbrains (гик брейнс)
(0)
15 990 руб
geekbrains (гик брейнс)
(0)
199 500 руб
geekbrains (гик брейнс)
(14)
134 700 руб
geekbrains (гик брейнс)
(55)
119 700 руб
geekbrains (гик брейнс)
(32)
199 500 руб
geekbrains (гик брейнс)
(29)
122 150 руб
geekbrains (гик брейнс)
(9)
174 500 руб
больше курсов

Другие курсы этих преподавателей

otus (отус)
(5)
65 000 руб
otus (отус)
(1)
80 000 руб
geekbrains (гик брейнс)
(4)
174 500 руб
geekbrains (гик брейнс)
(0)
199 500 руб
geekbrains (гик брейнс)
(14)
134 700 руб
geekbrains (гик брейнс)
(55)
119 700 руб
geekbrains (гик брейнс)
(32)
199 500 руб
geekbrains (гик брейнс)
(1)
157 150 руб
geekbrains (гик брейнс)
(1)
130 000 руб
geekbrains (гик брейнс)
(13)
104 650 руб