Анализ данных с помощью современного Apache Spark
Mon, 12 May 2025, 14:00 (GMT+03:00) | |
Russia, Moscow | |
96000 |
Tags: #apache spark #big data #dataframes
8-дневный (32 часовой) курс обучения по использованию распределенной платформы Apache Spark для работы с большими массивами данных, в том числе — неструктурированных и потоковой обработки информации.
Вы пройдете путь от основ архитектуры Spark до работы с продвинутыми компонентами, такими как GraphX, ML, Structured Streaming и Delta Lake. Программа охватывает как классические подходы (RDD, DataFrames, Spark SQL), так и актуальные тренды: интеграцию с Kubernetes, pandas API в Spark и управление данными через Delta Lake.
Подробная программа https://bigdataschool.ru/courses/apache-spark-sql