Descripción: Curso Hadoop y Spark
Formación en Big Data
Formación SINENSIA
Detalles
1- Introducción a Big Data
-Volumen, Variedad y Velocidad
2- Hortonworks: Hadoop
-¿Qué es Hadoop?. Hortonworks.
-HDFS
-Comandos de Hadoop desde Shell
-Map Reduce
-Hive, HiveQL
-HBase (DB NoSQL)
-Pig
-Flume (ingesta de datos)
-Sqoop (intercambio de datos entre HDFS y DB relacionales)
- HUE (Cloudera)
- Cloudera Manager
3- Spark
-Spark-Shell
-Programación en Scala
-Spark Context
-RDD
-Trasformaciones y Acciones
-Contador de palabras en Scala, Python y Java
-Programas en Spark
4- Librerías de Spark
-Spark SQL
-Spark MLlib
-Spark GraphX
-Spark Streams
5- Machine Learning
-Aprendizaje supervisado y no supervisado
-Clasificación
-Regresión
-Clustering
6- Streams
-Análisis en tiempo real
-Twitter
-Análisis de sentimientos
7- Casos de uso
-Categorías de uso
-Ejemplos
Curso dirigido a Ingenieros de software y programadores que quieran conocer las principales tecnologías Big Data, basadas en Hadoop y Spark, para procesar grandes volúmenes de información.
Los asistentes deben tener conocimientos básicos de Linux y de programación.
Este curso permite adquirir los conocimientos básicos necesarios para entender y conocer el ecosistema de la distribución de Hadoop Hortonworks/Spark desde el punto de vista de distintos roles profesionales.