Big Data Analytics as a Service: Un nuevo enfoque para la pequeña y mediana empresa

  • Cloud
  • curso
  • 20
  • 04/11/2019

Cada día aumenta la cantidad de pequeñas y medianas empresas que quieren entrar en el mundo del análisis de datos e inteligencia artificial, ya sea para mejorar su productividad, detectar algún tipo de patrón o para predecir la tendencia de consumo del mercado, todo esto, con el objetivo de lograr ser más competitivo en un mundo donde las tecnologías de información están marcando las pautas. Sin embargo, el uso de la tecnología para el análisis de datos conlleva una serie de retos, sobre todo por la gran cantidad y variedad de datos que se generan cada día. Es por ello que muchas empresas han iniciado la búsqueda de soluciones que permitan la adquisición, procesamiento y almacenamiento de estos datos. Una posible solución para la PYME es la que se presenta en este curso, el cual se enfoca a la migración de servicios de Big Data en la nube.

La combinación de Cloud y Big Data ofrece a las empresas una solución viable debido a la reducción de costes en infraestructura, la elasticidad de los servicios y la facilidad de acceso a la tecnología, entre otros. En este sentido, este curso comienza presentando las posibles soluciones que se ofrecen en una plataforma como servicio (PaaS) tanto a nivel de Big Data como a nivel Cloud. Seguido, se muestran ejemplos sobre la aplicación de técnicas de análisis de datos tanto para ejecución por lotes como en tiempo real, todo esto utilizando las diferentes capas para la creación de un servicio en la nube.

 

Objetivo general

El desarrollo de este curso permitirá a la audiencia adquirir los conceptos generales de BigData y de las principales tecnologías utilizadas para el procesamiento de problemas de análisis de datos, tanto para el procesamiento en Batch (ej. procesamientos de ficheros), como en Streaming (ej., inyección desde dispositivos IoT).  Es por esto que, para el desarrollo del curso, se han seleccionado un conjunto de problemas de análisis de datos, con los que se estudiarán las diferentes tecnologías, de modo de indagar sobre las principales ventajas de las herramientas de Big Data más conocidas. Para el estudio de estas tecnologías se utilizará una plataforma de BigData como Servicio sobre Cloud llamada Radiatus. Esta plataforma permite instanciar los servicios de análisis de datos de forma sencilla, rápida, ágil y segura para el usuario, abstrayendo a los usuarios de las complejas configuraciones de los servicios de BigData.  Finalmente, al terminar el curso el participante será capaz de identificar las tecnologías de BigData, así como detectar en qué tipo de problemas de análisis de datos pueden ser utilizadas.

 

Objetivos específicos

  • Enumerar las tecnologías de Big Data y sus principales usos para el procesamiento tanto en Batch como en streaming.
  • Desplegar servicios de Big Data Analytics en la nube.
  • Diseñar, aplicar y gestionar soluciones a problemas de Big Data.
  • Valorar el uso y limitaciones de las herramientas de Big Data dependiendo del tipo de problema a analizar y del entorno a utilizar.
  • Crear un entorno práctico de las herramientas más utilizadas de Big Data con ejemplos reales y sintéticos.
  • Dar una primera visión de cómo gestionar datos de forma rápida y eficaz utilizando las principales características de un proceso de ETL.

Público objetivo

Este curso está enfocado a Analistas de datos, jefes de proyecto, estudiantes de grado o máster que quieran obtener un conocimiento sobre Big Data y Cloud Computing.

 

Prerrequisitos

Tener conocimientos básicos de programación (preferiblemente Python).

Introducción (4 horas)

  1. ¿Qué es Big Data?
    1. Escenarios y retos
    2. Base tecnológica
  2. Herramientas de Big Data
    1. Motores de procesamiento (Spark)
    2. Bases de datos distribuidas (Cassandra)
    3. Sistemas de colas (Kafka)
    4. Editores (Jupyter y Zeppelin)
  3. Uso de Big Data en la Nube
    1. Soluciones existentes (Databricks, Cloudera)
    2. Servicios en la nube (IaaS, PaaS, SaaS, BDaaS)
    3. Radiatus como plataforma de servicios
    4. Capas para la creación de un servicio de Big Data Analytics en el Cloud

(Al finalizar la unidad 1 el participante será capaz de identificar y seleccionar las diferentes herramientas e infraestructuras de acuerdo a las necesidades a resolver)

 

Analítica de datos en el Cloud usando Jupyter como interfaz de usuario (3 horas)

  1. Librerías de manejo de datos en Python (Numpy, Pandas, etc.)
  2. Análisis de variables (Estadísticas básicas)
  3. Exploración de soluciones de visualización de datos.

(Una vez culminada la unidad 2 el participante tendrá una visión general sobre la manipulación y visualización de datos en Python a través de Jupyter.)

 

Motor de procesamiento (Spark) (4 horas)

  1. Modelo de ejecución (DAG, acciones y transformaciones)
  2. Estructuras de datos (RDD y Dataframes)
  3. Uso de RDD y ejemplo básico
  4. Uso de la API DataFrame y Spark SQL
    1. Importación de Datos
    2. Manejo y transformaciones sobre los datos
    3. Exportar datos a Pandas

(Con esta unidad el participante podrá tener una visión del modelo de datos y paralelismo utilizado en el motor de procesamiento de Spark.)

 

Sistema de Ficheros y Base de datos distribuida (HDFS y Cassandra) (4 horas)

  1. Uso de sistema de fichero distribuidos (Hadoop-HDFS)
    1. Carga de datos
    2. Manipulación
    3. Importación y exportación de datos a través de Spark
  2. Base de datos distribuida Cassandra
    1. Modelo de datos en Cassandra
    2. Creación de tablas
    3. Inserción y extracción de datos a través de Jupyter y Spark
    4. Caso práctico de manipulación de datos con Cassandra y Spark

(Al completar este módulo el participante será capaz de hacer una manipulación básica de datos a través del sistema de ficheros de hadoop y la gestión de datos utilizando Cassandra.)

 

Sistema de colas para inyección de datos (Kafka) (3 horas)

  1. Modelo productor-consumidor.
  2. Inyección de datos en Kafka a través de una interfaz REST.
  3. Manipulación de los datos de Kafka.
  4. Caso de uso con Kafka y Spark Streaming (visualización de datos).

(Una vez terminada la unidad el participante tendrá la capacidad de manipular datos en un entorno en Streaming.)

 

Ejemplos de casos de uso para el procesamiento de datos tanto en Batch como en Streaming (2 horas)

(Al terminar esta unidad el participante podrá tener una visión general sobre cómo utilizar las herramientas para el procesamiento en Batch y en Streaming.)

Este curso puede ser bonificado a través de los créditos de formación de la FUNDAE, siendo ITI la entidad Organizadora del curso. Para ello, la inscripción debe realizarse con al menos 7 días de antelación. Inscripciones posteriores no podrán bonificarse. Si necesita que dicha gestión la realice ITI, póngase en contacto con nosotros en formacion@iti.es con una antelación mínima de 10 días antes del inicio del curso.

Todos los cursos tienen un precio base específico. Sobre el precio base, se podrán aplicar una serie de descuentos en los siguientes casos:

  • Inscripción anticipada (30, 20 y 10 días antes de la fecha de fin de inscripción).
  • Inscripción de más de un alumno de una misma organización.
  • Ser asociados de ITI o disponer de un acuerdo de colaboración con ITI.

Consulta nuestra política de precios

 

Importante: Nueva política de contratación de cursos.

Desde el día 20 de marzo de 2019, se dispone de una nueva política de contratación:

Todos los cursos tienen un precio base específico. Sobre el precio base, se podrán aplicar una serie de descuentos en los siguientes casos:

• Inscripción anticipada (30 días antes de la fecha de fin de inscripción).
• Inscripción de más de un alumno de una misma organización*.
• Ser asociados de ITI o disponer de un acuerdo de colaboración con ITI*.

* Estos descuentos no serán de aplicación durante el periodo de inscripción anticipada.

Más información aquí

Datos Básicos

Inscripción: Del 24/02/2019 al 24/10/2019
Inicio: 04/11/2019
Fin: 18/11/2019
Duración: 20
Horario: Lunes y miércoles de 16:00h a 20:00h
Lugar: Instituto Tecnológico de Informática- ITI. Ciudad Politécnica de la Innovación, Edificio 8G, Cuarta Planta

Este sitio web utiliza cookies para que tengas una mejor experiencia de usuario. Si continúas navegando estás dando tu consentimiento para la aceptación de cookies y la aceptación de nuestra Política de cookies.

ACEPTAR
Aviso de cookies