OPSHDSP01ILTData y Business Intelligence
Hadoop y Spark
40 Presencial-Remoto €0.00
Descripción
---
Objetivos
Este curso permite adquirir los conocimientos básicos necesarios para entender y conocer el ecosistema de la distribución de Hadoop Hortonworks/Spark desde el punto de vista de distintos roles profesionales.
Audiencia
Curso dirigido a Ingenieros de software y programadores que quieran conocer las principales tecnologías Big Data, basadas en Hadoop y Spark, para procesar grandes volúmenes de información.
Prerrequisitos
Los asistentes deben tener conocimientos básicos de Linux y de programación.
Temario
**1- Introducción a Big Data**
-Volumen, Variedad y Velocidad
**2- Hortonworks: Hadoop**
-¿Qué es Hadoop?. Hortonworks.
-HDFS
-Comandos de Hadoop desde Shell
-Map Reduce
-Hive, HiveQL
-HBase (DB NoSQL)
-Pig
-Flume (ingesta de datos)
-Sqoop (intercambio de datos entre HDFS y DB relacionales)
- HUE (Cloudera)
- Cloudera Manager
**3- Spark**
-Spark-Shell
-Programación en Scala
-Spark Context
-RDD
-Trasformaciones y Acciones
-Contador de palabras en Scala, Python y Java
-Programas en Spark
**4- Librerías de Spark**
-Spark SQL
-Spark MLlib
-Spark GraphX
-Spark Streams
**5- Machine Learning**
-Aprendizaje supervisado y no supervisado
-Clasificación
-Regresión
-Clustering
**6- Streams**
-Análisis en tiempo real
-Twitter
-Análisis de sentimientos
**7- Casos de uso**
-Categorías de uso
-Ejemplos
-Volumen, Variedad y Velocidad
**2- Hortonworks: Hadoop**
-¿Qué es Hadoop?. Hortonworks.
-HDFS
-Comandos de Hadoop desde Shell
-Map Reduce
-Hive, HiveQL
-HBase (DB NoSQL)
-Pig
-Flume (ingesta de datos)
-Sqoop (intercambio de datos entre HDFS y DB relacionales)
- HUE (Cloudera)
- Cloudera Manager
**3- Spark**
-Spark-Shell
-Programación en Scala
-Spark Context
-RDD
-Trasformaciones y Acciones
-Contador de palabras en Scala, Python y Java
-Programas en Spark
**4- Librerías de Spark**
-Spark SQL
-Spark MLlib
-Spark GraphX
-Spark Streams
**5- Machine Learning**
-Aprendizaje supervisado y no supervisado
-Clasificación
-Regresión
-Clustering
**6- Streams**
-Análisis en tiempo real
-Análisis de sentimientos
**7- Casos de uso**
-Categorías de uso
-Ejemplos