Big Data Analyitics en Cloudera

  • Big Data
  • curso
  • 40
  • Finalizado

El curso propuesto está dividido en dos módulos que permiten conocer por una parte la gestión de la plataforma Cloudera desplegada en el clúster y, por otra, utilizar los diferentes servicios de Big Data para la explotación de los datos. En concreto, los módulos son:

 

  • Módulo 1. Introducción Big Data y Cloudera: permite conocer la base tecnológica de la plataforma Cloudera (Apache Hadoop), así como su instalación, administración y utilización de los diferentes servicios Big Data que se pueden desplegar.

 

  • Módulo 2. Explotación de datos con Hadoop y Spark: incluye contenidos teóricos y prácticos de utilización de los servicios de explotación de datos de la plataforma Cloudera. Además, permitirá conocer el uso de la tecnología Spark sobre la plataforma Cloudera para el desarrollo e aplicaciones en distribuido. Por último, se orientarán el uso de los servicios para el desarrollo de aplicaciones de utilicen ténicas de Machine Learning para la explotación de datos..

MÓDULO 1. Introducción a Big Data y Cloudera

  • INTRODUCCIÓN A TECNOLOGÍAS BIG DATA
    • ¿Qué es Big Data y qué hay de nuevo?
    • Principales tecnologías Big Data
    • Ecosistema Apache Hadoop
  • APACHE HADOOP
    • Almacenamiento de datos en Hadoop: HDFS.
    • Gestión de recursos y tareas: YARN. Introducción al Seguridad en el Desarrollo
  • CLOUDERA
    • Introducción a Cloudera
    • Instalación, configuración y mantenimiento del clúster Cloudera
    • Descripción de servicios en Cloudera
    • Cloudera Manager

MÓDULO 2. Explotación de datos con Hadoop y Spark

  • SERVICIOS DE INGESTA Y TRANSFORMACIÓN DE DATOS
    • Apache Sqoop: intercambio de datos con bases de datos relacionales.
    • Apache Pig: transformación de datos
    • Apache Hive: acceso y explotación de datos (SQL)
    • Apache Impala: acceso eficiente a datos
  • APACHE SPARK
    • Introducción a Apache Spark
    • Conceptos básicos, RDDs, transformaciones y acciones
    • SpakSQL con Dataframes
    • Introducción a Python y Jupyter
    • Desarrollo de aplicaciones con Spark
  • MACHINE LEARNING
    • Introducción a Big Data Analytics
    • Técnicas de Machine Learning
    • SparkML
    • H20: open source machine learning platform

 

Este curso puede ser bonificado a través de los créditos de formación de la Fundación Tripartita, siendo ITI la entidad Organizadora del curso. Para ello, la inscripción debe realizarse con al menos 7 días de antelación. Inscripciones posteriores no podrán bonificarse. Si necesita que dicha gestión la realice ITI, póngase en contacto con nosotros aquí.

Todos los cursos tienen un precio base específico. Sobre el precio base, se podrán aplicar una
serie de descuentos en los siguientes casos:

  • Inscripción anticipada (30, 20 y 10 días antes de la fecha de fin de inscripción).
  • Inscripción de más de un alumno de una misma organización.
  • Ser asociados de ITI o disponer de un acuerdo de colaboración con ITI.

El precio final tras los descuentos deberá incrementarse con el correspondiente IVA (21%).

Consulta nuestra política de precios


Inscribirse

Rellena los datos de este formulario y nos pondremos en contacto contigo para confirmar la inscripción a este curso

Datos del participante



Datos de la empresa


Empresa asociada al ITI SiNo

Datos Básicos

Inscripción: Del 19/06/2017 al 11/09/2017
Inicio: 26/09/2017
Fin: 27/10/2017
Duración: 40
Horario: 26 y 28 de septiember, 2, 4, 6, 17, 19, 23, 25 y 27 de octubre, de 16 a 20 horas
Lugar: Instituto Tecnológico de Informática- ITI. Ciudad Politécnica de la Innovación, Edificio 8G, Cuarta Planta

Este sitio web utiliza cookies para que tengas una mejor experiencia de usuario. Si continúas navegando estás dando tu consentimiento para la aceptación de cookies y la aceptación de nuestra Política de cookies.

ACEPTAR
Aviso de cookies