MLSP: МАШИННОЕ ОБУЧЕНИЕ В APACHE SPARK

вт, 15 июнь 2021, 07:00 (GMT)
Россия, Москва
Бесплатно

2-дневный практический курс для разработчиков Apache Spark, дата инженеров и аналитиков данных, Data Scientist’ов и других специалистов Big Data, которые используют или планируют использовать Spark для решения задач машинного обучения и подготовки для него данных.

Практический курс по Спарк рассчитан на разработчиков Big Data, дата инженеров и аналитиков данных, Data Scientist’ов и других специалистов по большим данным, которые хотят получить опыт настройки и использования Apache Spark MLLib. На этом курсе мы изучаем предоставляемые спарк возможности в части подготовки данных (векторы в том числе разреженные, работа с пропущенными данными, нормализация, категориальные данные и т.п.) и машинного обучения (стандартные алгоритмы – регрессии, классификации, нейронные сети и т.п. – и конвейерная обработка). Курс будет интересен не только дата сайентистам, но и инженерам данных – на курсе мы покажем, что делают дата сайентисты (на примере Apache Spark). ПРОГРАММА КУРСА

  1. Введение в машинное обучение
  2. Feature Engineering и подготовка данных
  3. Возможности Spark Mllib
  4. Базовый Workflow и конвейеры
  5. Модуль Feature и предоставляемые возможности Более подробно программа курса https://www.bigdataschool.ru/courses/apache-spark-machine-learning