Big Data + Especialización en Business Intelligence y Especialización en Hadoop
Curso
Online
¿Necesitas un coach de formación?
Te ayudará a comparar y elegir el mejor curso para ti y a financiar tu matrícula en cómodos plazos.
Descripción
-
Tipología
Curso
-
Metodología
Online
-
Horas lectivas
400h
Con el curso online de Big Data de Tokio School te prepararás para trabajar como arquitecto de datos, data scientist, data consultant o big data developer (entre otras profesiones).
Podrás especializarte en Apache Hadoop y Business Intelligence entre otras opciones y alucinar con las oportunidades que crecen cada día para quien está dispuesto a formarse en este sector. Ejerce como científico, ingeniero, analista o arquitecto Big Data entre otras salidas profesionales para especialistas del dato.
Instalaciones y fechas
Ubicación
Inicio
Inicio
A tener en cuenta
En el curso de Big Data te adentrarás en el mundo de la programación, su ecosistema y cómo utilizarlo para la resolución de problemas. Además, te enseñaremos a visualizar e interpretar la información de una manera correcta aplicando diferentes técnicas para la explotación de datos.
¿El objetivo? Ser capaz de preparar proyectos orientados al Big Data de principio a fin. Y para todo ello utilizarás las herramientas de los profesionales: Databricks, Python, Spark, SQL, Hadoop…
Opiniones
Logros de este Centro
Todos los cursos están actualizados
La valoración media es superior a 3,7
Más de 50 opiniones en los últimos 12 meses
Este centro lleva 8 años en Emagister.
Materias
- Datawarehouse
- E-business
- Estadística
- SQL
- Visualización de la información
- Apache
- Análisis de datos
- Redes neuronales
- Algoritmos
- Streaming
- Arquitecto
- Reporting
- Big Data
Temario
Módulo 0: Introducción a la Programación
Unidad 1. Introducción a Python
● Python el nuevo desconocido
● Gráficas estadísticas
● Programación con R
● Manipulación de datos
● Programación orientada a objetos y excepciones
● Estadística bidimensional
● Regresión lineal
● Características básicas del lenguaje
● Principales parámetros estadísticos
● Medidas descriptivas
Unidad 2: Introducción a la Estadística
Unidad 3: Introducción a R
● Tabla de frecuencias
● Gráficos estadísticos con R
● Variables estadísticas
● Manejo de datos
Unidad 4: Introducción a SQL
● Estructura básica de una consulta en SQL
● Funciones de agregación en SQL
● Consultas SQL sobre más de una tabla
● Tipos de consultas en SQL
Modulo 1: Introducción al Big Data
Unidad 1: Ecosistema Big Data
● Definición de componentes y arquitectura
● Introducción a Hadoop y MapReduce
● Disponibilidad, escalabilidad y resiliencia
Unidad 2: Estrategias basadas en datos
● Business Intelligence vs. Big Data
● Cuadros de mando (Dashboards)
Unidad 3: Entornos de procesamiento
● Cloud Computing
Unidad 4: Casos de uso de Big Data: ejemplos en la industria
● Internet de las Cosas (IoT)
Módulo 2. El dato y su ciclo de vida
Unidad 1: Datos
● Calidad del dato
● El dato
● Derechos sobre los datos
Unidad 2: Ciclo de vida del dato
● Fuentes de datos
● Extracción, Tratamiento y Carga
● Análisis para la explotación
● Almacenamiento de datos
● Visualización y storytelling para la explotación
● Tipo de escalabilidad
La selección de los elementos visuales
Escalabilidad vertical
Escalabilidad horizontal
● Toma de decisiones
Módulo 3. Almacenamiento escalable de datos
Unidad 1: Bases de datos distribuidas
● Bases de datos no distribuidas
Unidad 3: NoSQL – Clave valor
Unidad 2: NoSQL
Unidad 4: NoSQL – Columnares
Unidad 5: NoSQL – Orientada a documentos
Unidad 1: El ecosistema Hadoop
Unidad 6: NoSQL – Orientada a grafos
● Arquitectura
● Introducción a Hadoop
● Cassandra Query Languaje – CQL
● Modelado de datos en Casandra
● Herramientas del ecosistema Hadoop
● CQL – Creación de modelo de datos
● Teorema de CAP
● Bases de datos relacionales
Keyspace
Table
Módulo 4. Arquitectura Big Data
Unidad 2: Cluster y sistemas distribuidos (HDFS, MapReduce)
Unidad 3: Análisis de datos con Hive y Pig
Unidad 4: Procesamiento de datos con Spark
● Spark Streaming
● Spark RDD (Resilient Distributed Datsets)
● Spark SQL
Módulo 5. Análisis para la explotación de datos
Unidad 1: Perfiles de datos
● Ingeniero de datos
● Científicos de datos
Unidad 2: Análisis exploratorio de datos
● Distribución de los datos
● Estadística descriptiva
● Correlación
● Exploración de datos categóricos y binarios
● Exploración de 2 o más variables
Unidad 3: Técnicas de muestreo de datos
● Selección aleatoria
● Selección Bias
● Selección por distribución estadística
Unidad 4: Contraste de hipótesis
● Testeo de hipótesis
● Testeo de muestras A/B
● P-Value
● Significancia estadística y P-Value
Unidad 5: Regresión y predicción
● Regresión multilineal
● Regresión linear
● Predecir usando regresión
● Interpretar los resultados de una regresión
Unidad 6: Aprendizaje supervisado
● Algoritmos: árboles de decisión
● Conceptos
Unidad 7: Aprendizaje no supervisado
● Algoritmos: K-Means, clusters jerárquicos
● Componentes principales
Unidad 8: Introducción al Deep Learning
● Redes neuronales
● Conceptos fundamentales
Módulo 6. Presentación de proyectos Big Data y storytelling
Unidad 1: Presentación de un proyecto Big Data
● La audiencia y su importancia
● La importancia del contexto
Unidad 2: Componentes para la presentación de un proyecto Big Data
● Ideas de diseño
Módulo 1. Introducción al BI
Unidad 1: Historia y evolución del BI
● ¿Qué es el BI?
● Componentes BI
● Fuentes de información
Especialización Business Intelligence
Unidad 2: Conceptos básicos BI
● Herramientas/procesos básicos BI
Unidad 3: Modelado de datos
● Modelo en estrella
● Modelo copo de nieve
● Modelo multidimensional
Unidad 4: Aprovisionamiento de datos
● Datawarehouse
● Datamart
● Principales diferencias
Módulo 2. ETL e introducción a la visualización
Unidad 1: Procesos de extracción transformación
y cargas y herramientas.
● Diseño de proceso ETL
● Principales herramientas del mercado y particularidades
Unidad 2: Introducción a la visualización
● Introducción a la visualización de la información
● Beneficios de la visualización
● Categorías de la visualización
Unidad 3: Herramientas y particularidades
● Principales herramientas del mercado y comparativa
Módulo 3. Introducción al PowerBI
Unidad 1: Comprensión básica de PowerBI
Unidad 2: Conexión a orígenes de datos
● ¿Qué es?
● ¿Para qué sirve?
● Interfaz
Unidad 3: Editor Power Query
● Formateo de datos
● Detección de errores
● Pivot
Unidad 4: Creación de gráficos
Unidad 5: Construcción de informe con filtros
● Vinculación y desvinculación en gráficos
Unidad 6: Introducción a DAX (Data Analysis Expressions)
● Introducción a DAX
● Tablas y columnas calculadas, medidas simples
● Filtrado de filas y medidas avanzadas
Unidad 7: Creación de métricas y gráficos avanzados
Módulo 4. Introducción al Tableau: Visualización I
Unidad 1: Tableau I
Unidad 2: Tableau II
● Comprensión básica de Tableau
● Conexión a fuente/base de datos
● Combinación de datos
● Editar y guardar fuente de datos
● Dimensiónes y métricas
● Conversión tipo de datos
● Representación gráfica de los datos
● Filtrado de informes y características
● Creación jerarquías y drill down
Unidad 3: Tableau III
● Creación campos calculados. (medidas y dimensiones)
● Creación de parámetros
● Combinación campos calculados y parámetros
● Descripciones emergentes
Unidad 5. Tableau Avanzado: Visualización II
Unidad 1: Tableau avanzado I
● Creación de grupos
● Creación de conjuntos
● Expresiones LOD
Unidad 2: Tableau avanzado II
● Creación de dashboard
● Objetos dashboard
● Fomatos dashboard
● Interactividad dashboard
Unidad 3: Tableau avanzado III
● Extensiones Tableau
● Configuración extensión
● Gráficos no nativos
Unidad 4: Movilidad y colaboración
● Creación de historias
● Adaptación de informes para móvil y tablet
● Tableau online/Tableau server/Tableau public
Módulo 1. Introducción al Big Data
Unidad 1: Conceptos básicos
● Definición y conceptos
● Evolución de los datos
Especialización Apache Hadoop
Unidad 2: SQL vs. NoSQL
Unidad 3: Preparación entorno de trabajo
Módulo 2: Apache Hadoop (HDFS)
Unidad 1: Conceptos básicos y arquitectura
● Conceptos fundamentales
● Arquitectura Hadoop
Unidad 2: Lectura, escritura y replicación
Unidad 3: Permisos y borrado de datos
Unidad 4: Safemode, snapshots y gestión de caché
Unidad 5: Profundizando con la Shell
Módulo 3: Map reduce & yarn
Unidad 1: Map reduce: el algoritmo
● Arquitectura
● Configuración
Unidad 2: Implementación de algoritmos map reduce
Unidad 3: Maneras de ejecutar el algoritmo
Unidad 4: YARN: Arquitectura, gestión de colas y Zookeeper
Módulo 4: Ecosistema Hadoop
Unidad 1: Apache Hive
● Arquitectura
● Componentes
Unidad 2: Apache Sqoop
● Arquitectura
● Componentes
Unidad 5: Reporting con Zeppelin
● La importancia del reporting
● Creación de reportes con Zeppelin
¿Necesitas un coach de formación?
Te ayudará a comparar y elegir el mejor curso para ti y a financiar tu matrícula en cómodos plazos.
Big Data + Especialización en Business Intelligence y Especialización en Hadoop
