Войти

Введение в информационный поиск

Средний

1,5 месяца базового освоения инструментов информационного поиска от МФТИ и Mail.Ru Group. Курс содержит 6 модулей. Занятия 6–8 часов в неделю. Подходит программистам с опытом работы, способствует развитию в профессии. Студенты разберутся, как устроена поисковая система, научатся приёмам обработки естественного языка и машинного обучения, дадут оценку качества. В конце курса они построят работающую модель поисковой системы и получат сертификат.

Подробнее


Средний
Бесплатно

Компания: coursera

рейтинг: Язык: ru

Длительность курса

Длительность курса

42 дня

Формат обучения

Формат обучения

Видеолекции, практические упражнения 6-8 часов в неделю

Обратная связь

Обратная связь

Общение с учащимися и преподавателями на форумах курса

Теория и практика

Теория и практика

60 видео (6 часов) 6 материалов для самостоятельного изучения 18 тестов

Чему научитесь

Строить работающую модель поисковой системы

- Понимать устройство поисковой системы изнутри
- Классифицировать разные поисковые системы
- Исполнять запросы пользователей к Булев-поиску
- Обрабатывать естественный язык и машинное обучение при построении поискового индекса и отвечать на запросы
рассмотреть тему объективной оценки качества поисковой системы

Пройти курс Запишись на курс
прямо сейчас!

42 дней Кураторы: нет

О курсе

О курсе

42 дней Кураторы: нет
Аналитикам данных

Введение, булев поиск

Этим занятием открывается цикл лекций, посвященных информационному поиску. Мы начнем с небольшого экскурса в историю возникновения вэб-поиска, изучим базовые понятия и узнаем, как можно классифицировать разные поисковые системы. Базовый вид поиска – это булев поиск. Мы рассмотрим, как он устроен и как можно исполнять запросы пользователей к такому поиску. Но недостаточно использовать оригинальный текст – чтобы учесть разные морфологические формы одного и того же слова, применяются различные этапы нормализации текста. Это применимо не только к документам, но и к запросам. Отдельно стоит рассмотреть такие важные усовершенствования булева поиска, как координатный поиск, которые учитывает, где именно в тексте находятся конкретные слова, и обработку полноценных фразовых запросов.

Поисковый индекс

В основе текстового информационного поиска лежит концепция обратного индекса. Эта неделя посвящена разным методам его построения, расширения за счет дополнительной информации и улучшения работы с ним благодаря сжатию словаря и ускорению работы с обратным индексом.

Нечёткий поиск

Эта неделя посвящена двум большим темам, связанным между собой: исправление опечаток в запросах пользователей и выполнение неточных запросов, в которых пользователь сознательно скрывает часть слова за специальным знаком – "*".Ранжирование

Выполнение запросов пользователей на большом корпусе документов часто приводит к тому, что запросу удовлетворяет слишком много документов. Для того, чтобы пользователю не пришлось просматривать все найденные документы, поисковая система может отобрать из них только лучшие и показать пользователю в порядке "полезности". Этим занимается ранжирование, о котором и пойдет речь в этой неделе.

Ссылочное и поведенческое ранжирование

Эта неделя посвящена ссылочному и поведенческому ранжированию. Эти виды ранжирования опираются на связь между разными документами и информацию о поведении пользователя.

Оценка качества

В этой неделе мы поговорим о том, зачем нужно оценивать качество поиска и как это можно сделать.

HITS

JRE

Построение работающей модели поисковой системы

История возникновения веб-поиска

Усовершенствования булева поиска

Концепция обратного индекса, его расширение и улучшение

Исправление опечаток в запросах пользователей

Выполнение неточных запросов, в которых пользователь сознательно скрывает часть слова за специальным знаком

Ранжирование

Ссылочное и поведенческое ранжирование

Оценка качества поиска

Компания, проводящая курс

Coursera

126 курсов по 395 темам

Проект в сфере массового онлайн-образования Coursera основан профессорами информатики Стэнфордского университета. Платформа...

Преподаватели курса

преподаватель МФТИ

Математик-программист. Работаю над поиском в...

преподаватель Московского физико-технический института

"Математик-программист. Преподаю курс...

Отзывы студентов

5
Рейтинг курса
100%
0%
0%
0%
0%
смотрите также

Похожие курсы

больше курсов

Похожие курсы компании