Programa Práctico en Desarrollo Big Data con Apache Spark

Curso

En Madrid

780 € IVA inc.

Más información

¿Necesitas un coach de formación?

Te ayudará a comparar y elegir el mejor curso para ti, y podrás financiar tu matrícula en cómodos plazos.

900 64 94 94

Llamada gratuita. Lunes a viernes de 9h a 20h.

Descripción

  • Tipología

    Curso

  • Nivel

    Nivel intermedio

  • Lugar

    Madrid

  • Horas lectivas

    30h

  • Duración

    6 Días

  • Inicio

    Fechas a elegir

El Big data es una de las áreas innovadoras del software y procesamiento de datos y en completo crecimiento desde hace muy pocos años, donde el objetivo es procesar todos los datos con el fin de transformarlos en información y así generar conocimiento.

La gran mayoría de los proyectos de Big Data disponen de un stack tecnológico donde no suelen faltar tecnologías innovadoras tanto en la parte de ingestión, almacenamiento y procesamiento. La tecnología más demandada en los proyectos es Apache Spark, pues casi el 80% de los mismos buscan el ingestar, limpiar, transformar y procesar los datos, y esta herramienta es la más socorrida por todos los equipos Big Data.

Spark es una plataforma de computación de código abierto para análisis y procesos avanzados, que tiene muchas ventajas sobre Hadoop. Desde el principio, Spark fue diseñado para soportar en memoria algoritmos iterativos que se pudiesen desarrollar sin escribir un conjunto de resultados cada vez que se procesaba un dato.

Este curso busca facilitar el inicio y aprendizaje de la herramienta en los dos puntos clave: procesamiento Batch y procesamiento Real Time, así como conceptos básicos e importantes de Spark. Se enseñarán las mejores prácticas que podrás usar en tus desarrollos para procesamiento de grandes volúmenes de datos

Instalaciones y fechas

Ubicación

Inicio

Madrid
Ver mapa
Barbara de Braganza 11

Inicio

Fechas a elegirMatrícula abierta

Preguntas & Respuestas

Plantea tus dudas y otros usuarios podrán responderte

¿Quién quieres que te responda?

Sólo publicaremos tu nombre y pregunta

Materias

  • Apache Spark
  • Big Data
  • Batch
  • Hadoop
  • Kafka
  • Flume
  • SQL
  • Procesamiento de datos
  • Real Time
  • Software

Profesores

Profesionales  Profesores DevAcademy

Profesionales Profesores DevAcademy

Profesores

Temario

Breve introducción al Big Data

  • Qué es BigData
  • Ecosistema de tecnologías Big Data y visión global

Introducción a Apache Spark

Procesamiento de datos en Batch

  • Conceptos de procesamiento Batch
  • Tecnologías procesamiento Batch
    • Apache Hadoop
      • Hadoop HDFS
      • Hadoop Map Reduce
      • Ejercicios prácticos
    • Apache Spark
  • Apache Spark a fondo
    • RDD’s
      • Creación
      • Operaciones (Tranformaciones, acciones, evaluación lazy)
      • Persistencia
    • Carga y exportación de datos
      • Formatos de fichero
      • Sistema de fichero
    • Ejecución en cluster
      • Driver y sus ejecutores
      • Cluster manager
      • Despliegue con spark-submit
    • Ejercicios con Spark para asentar las bases
    • Spark SQL
      • Ejercicios prácticos
    • Apache Spark R

Procesamiento de datos en Real Time

  • Conceptos de procesamiento Real Time
  • Tecnologías procesamiento Real Time
    • Storm
    • Apache Flink
    • Apache Spark
    • Kafka
    • Flume
  • Apache Spark a fondo
    • Discretized Streams (DStream)
    • Creación de un DStream
    • Transformación de un DStream
    • Operaciones SQL en Real Time

Información adicional

Fechas: 23/11, 24/11, 30/11, 01/12, 14/12, 15/12 de 2018

Más información

¿Necesitas un coach de formación?

Te ayudará a comparar y elegir el mejor curso para ti, y podrás financiar tu matrícula en cómodos plazos.

900 64 94 94

Llamada gratuita. Lunes a viernes de 9h a 20h.

Programa Práctico en Desarrollo Big Data con Apache Spark

780 € IVA inc.