Курс дистанционного обучения CORS: Apache Spark для разработчиков
| пн, 16 март 2026, 14:00 (GMT+03:00) | |
| Россия, Москва | |
| 51200 | |
| Есть трансляция |
Теги: data science и big data spark разработчики big data
4-дневный практический курс для разработчиков Apache Spark, дата инженеров, аналитиков данных, Data Scientist’ов и других специалистов Big Data, которые используют или планируют использовать Spark для обработки и анализа больших данных.
Apache Spark – это фреймворк с открытым исходным кодом для разработки приложений распределённых пакетных и потоковых вычислений над большим объемом неструктурированных и слабоструктурированных данных. Он входит в экосистему проектов Hadoop, поддерживает вычислительную модель MapReduce, но сохраняет промежуточные результаты вычислений в памяти вместо записи на диск. Поэтому Spark работает гораздо быстрее и позволяет создавать высокопроизводительные приложения, способные быстро выполнять множество операций с огромными объемами данных. Фреймворк имеет модульный состав, поддерживая различные сценарии использования распределенных приложений, от интернета вещей до машинного обучения. Поэтому Spark-приложения активно используются в различных бизнес-задачах анализа и обработки больших данных.
Наш курс поможет освоить Apache Spark с нуля или углубить свои знания. В рамках курса вы познакомитесь с архитектурой Spark, его основными компонентами и API, научитесь работать с данными и оптимизировать процессы обработки, сможете самостоятельно разрабатывать и настраивать Spark-приложения, эффективно работать с большими объемами данных и использовать Spark для решения задач анализа и обработки данных.
Практические занятия будут проводиться на языках Python или Scala.