OPSHDSP01ILTData y Business Intelligence

    Hadoop y Spark

    40 Presencial-Remoto €0.00

    Descripción

    ---

    Objetivos

    Este curso permite adquirir los conocimientos básicos necesarios para entender y conocer el ecosistema de la distribución de Hadoop Hortonworks/Spark desde el punto de vista de distintos roles profesionales.

    Audiencia

    Curso dirigido a Ingenieros de software y programadores que quieran conocer las principales tecnologías Big Data, basadas en Hadoop y Spark, para procesar grandes volúmenes de información.

    Prerrequisitos

    Los asistentes deben tener conocimientos básicos de Linux y de programación.

    Temario

    **1- Introducción a Big Data**
    -Volumen, Variedad y Velocidad

    **2- Hortonworks: Hadoop**
    -¿Qué es Hadoop?. Hortonworks.
    -HDFS
    -Comandos de Hadoop desde Shell
    -Map Reduce
    -Hive, HiveQL
    -HBase (DB NoSQL)
    -Pig
    -Flume (ingesta de datos)
    -Sqoop (intercambio de datos entre HDFS y DB relacionales)
    - HUE (Cloudera)
    - Cloudera Manager

    **3- Spark**
    -Spark-Shell
    -Programación en Scala
    -Spark Context
    -RDD
    -Trasformaciones y Acciones
    -Contador de palabras en Scala, Python y Java
    -Programas en Spark

    **4- Librerías de Spark**
    -Spark SQL
    -Spark MLlib
    -Spark GraphX
    -Spark Streams

    **5- Machine Learning**
    -Aprendizaje supervisado y no supervisado
    -Clasificación
    -Regresión
    -Clustering

    **6- Streams**
    -Análisis en tiempo real
    -Twitter
    -Análisis de sentimientos

    **7- Casos de uso**
    -Categorías de uso
    -Ejemplos

    Cursos relacionados

    Transformamos empresas a través de la tecnología, la seguridad y la formación especializada. Tu partner de confianza en la era digital.

    Servicios

    Empresa

    © 2026 Sinensia. Todos los derechos reservados.