Programa práctico en Desarrollo Big Data con Apache Spark

Curso

En Madrid

750 € IVA inc.

Más información

¿Necesitas un coach de formación?

Te ayudará a comparar y elegir el mejor curso para ti, y podrás financiar tu matrícula en cómodos plazos.

900 64 94 94

Llamada gratuita. Lunes a viernes de 9h a 20h.

Descripción

  • Tipología

    Curso

  • Nivel

    Nivel avanzado

  • Lugar

    Madrid

  • Horas lectivas

    30h

  • Duración

    6 Días

Spark es una plataforma de computación de código abierto para análisis y procesos avanzados, que tiene muchas ventajas sobre Hadoop. Desde el principio, Spark fue diseñado para soportar en memoria algoritmos iterativos que se pudiesen desarrollar sin escribir un conjunto de resultados cada vez que se procesaba un dato.

Este curso busca facilitar el inicio y aprendizaje de la herramienta en los dos puntos clave: procesamiento Batch y procesamiento Real Time, así como conceptos básicos e importantes de Spark. Se enseñarán las mejores prácticas que podrás usar en tus desarrollos para procesamiento de grandes volúmenes de datos.

Instalaciones y fechas

Ubicación

Inicio

Madrid
Ver mapa
Barbara de Braganza 11

Inicio

Consultar

Preguntas & Respuestas

Plantea tus dudas y otros usuarios podrán responderte

¿Quién quieres que te responda?

Sólo publicaremos tu nombre y pregunta

Materias

  • Big Data
  • Apache Spark
  • Real Time
  • Procesamiento batch
  • Python
  • Apache Kafka
  • Dataframes
  • Datasets
  • SQL API
  • Ejecución en cluster

Profesores

Profesionales  Profesores DevAcademy

Profesionales Profesores DevAcademy

Profesores

Temario

Breve introducción al Big Data

  • Qué es BigData
  • Ecosistema de tecnologías Big Data y visión global

Conceptos básicos de programación para Spark

  • Estructuras de datos en Scala y Python
  • Estructuras de control y funciones en Scala y Python

Introducción a Apache Spark

Procesamiento de datos en Batch

    • Apache Spark
      • Instalación
      • Dependencias
  • Apache Spark a fondo
    • RDD’s
      • Creación
      • Operaciones (Tranformaciones, acciones, evaluación lazy)
      • Ejercicios prácticos
      • Persistencia y almacenamiento
    • DataFrames
      • Formatos de fichero (CSV, JSON,Parquet..etc)
      • Operaciones (Tranformaciones, acciones, evaluación lazy)
      • Persistencia y almacenamiento
      • Ejercicios prácticos
    • DataSets
      • Operaciones (Tranformaciones, acciones, evaluación lazy)
      • Ejercicios prácticos
    • SQL API
      • Ejercicios prácticos
    • Ejecución en cluster
      • Driver y sus ejecutores
      • Cluster manager
      • Despliegue con spark-submit
    • Spark UI
      • DAG
      • Plan de ejecución
      • Optimización

Procesamiento de datos en Real Time

  • Conceptos de procesamiento Real Time
  • Apache Kafka
    • Productor
    • Consumidor
  • Apache Spark a fondo
    • Spark Streaming
      • Operaciones
      • Ejercicios prácticos
    • Structured Streaming
      • Operaciones
      • Ejercicios prácticos
    • Spark UI Streaming
      • Optimización Streaming

Más información

¿Necesitas un coach de formación?

Te ayudará a comparar y elegir el mejor curso para ti, y podrás financiar tu matrícula en cómodos plazos.

900 64 94 94

Llamada gratuita. Lunes a viernes de 9h a 20h.

Programa práctico en Desarrollo Big Data con Apache Spark

750 € IVA inc.