Programa práctico en Desarrollo Big Data con Apache Spark
Curso
En Madrid
¿Necesitas un coach de formación?
Te ayudará a comparar y elegir el mejor curso para ti y a financiar tu matrícula en cómodos plazos.
Descripción
-
Tipología
Curso
-
Nivel
Nivel avanzado
-
Lugar
Madrid
-
Horas lectivas
30h
-
Duración
6 Días
Spark es una plataforma de computación de código abierto para análisis y procesos avanzados, que tiene muchas ventajas sobre Hadoop. Desde el principio, Spark fue diseñado para soportar en memoria algoritmos iterativos que se pudiesen desarrollar sin escribir un conjunto de resultados cada vez que se procesaba un dato.
Este curso busca facilitar el inicio y aprendizaje de la herramienta en los dos puntos clave: procesamiento Batch y procesamiento Real Time, así como conceptos básicos e importantes de Spark. Se enseñarán las mejores prácticas que podrás usar en tus desarrollos para procesamiento de grandes volúmenes de datos.
Instalaciones y fechas
Ubicación
Inicio
Inicio
Opiniones
Materias
- Big Data
- Apache Spark
- Real Time
- Procesamiento batch
- Python
- Apache Kafka
- Dataframes
- Datasets
- SQL API
- Ejecución en cluster
Profesores
Profesionales Profesores DevAcademy
Profesores
Temario
Breve introducción al Big Data
- Qué es BigData
- Ecosistema de tecnologías Big Data y visión global
Conceptos básicos de programación para Spark
- Estructuras de datos en Scala y Python
- Estructuras de control y funciones en Scala y Python
Introducción a Apache Spark
Procesamiento de datos en Batch
-
- Apache Spark
- Instalación
- Dependencias
- Apache Spark
- Apache Spark a fondo
- RDD’s
- Creación
- Operaciones (Tranformaciones, acciones, evaluación lazy)
- Ejercicios prácticos
- Persistencia y almacenamiento
- DataFrames
- Formatos de fichero (CSV, JSON,Parquet..etc)
- Operaciones (Tranformaciones, acciones, evaluación lazy)
- Persistencia y almacenamiento
- Ejercicios prácticos
- DataSets
- Operaciones (Tranformaciones, acciones, evaluación lazy)
- Ejercicios prácticos
- SQL API
- Ejercicios prácticos
- Ejecución en cluster
- Driver y sus ejecutores
- Cluster manager
- Despliegue con spark-submit
- Spark UI
- DAG
- Plan de ejecución
- Optimización
- RDD’s
Procesamiento de datos en Real Time
- Conceptos de procesamiento Real Time
- Apache Kafka
- Productor
- Consumidor
- Apache Spark a fondo
- Spark Streaming
- Operaciones
- Ejercicios prácticos
- Structured Streaming
- Operaciones
- Ejercicios prácticos
- Spark UI Streaming
- Optimización Streaming
- Spark Streaming
¿Necesitas un coach de formación?
Te ayudará a comparar y elegir el mejor curso para ti y a financiar tu matrícula en cómodos plazos.
Programa práctico en Desarrollo Big Data con Apache Spark