Desarrollo de soluciones Big Data Analytics

  • Big Data
  • curso
  • 40
  • Impartiéndose
PRESENCIAL

AFORO COMPLETO. Si está interesado en la 2ª edición en 2021 simplemente necesitamos que rellene el formulario de inscripción y le mantendremos informado.

Curso de formación realizado en colaboración con la Asociación Valenciana de Ingenieros de Telecomunicación (AVIT)

Son muchas las empresas que hoy en día se están preguntando por la viabilidad de implantar una estrategia Big Data Analytics en la empresa para la optimización de los procesos de fabricación, predicción de distintos indicadores de rendimiento (ventas, demanda, sentimiento), simulación de escenarios (financieros, precios), etc. Pero son también muchas las incertidumbres a las que se enfrentan antes de poder tomar una decisión informada de cara a dicha implantación.

Hablamos de Data Science, IoT, Business Intelligence, Big Data, Data Analytics, Machine Learning e Inteligencia Artificial, pero no todas estas herramientas participan en todas las soluciones, ni en la misma intensidad. Así nos encontramos casos en los que no se pueden aplicar técnicas de aprendizaje automático porque falta digitalizar los procesos (de negocio, de fabricación, etc.). A veces se piensa en digitalizar toda una planta cuando una extracción de datos históricos con unos pocos sensores es suficiente. Hay escenarios que requieren almacenar grandes cantidades de datos. En otros casos es suficiente con desarrollar herramientas auxiliares que capturen métricas para poder aplicar técnicas de aprendizaje automático. Hay mucha heterogeneidad y no hay una solución única.

Para los equipos de desarrollo es un dominio nuevo, por lo que es necesario tener una visión concreta de qué técnicas son necesarias en cada una de las etapas del ciclo de vida de una solución Big Data Analytics para hacerse una idea de la complejidad de estos proyectos y el impacto que tiene la introducción de estas tecnologías en los procesos de la empresa.

Este curso trata de dar visión completa del proceso de desarrollo de una solución de Big Data Analytics, desde el diseño de los procesos de digitalización a la construcción de los cuadros de mando de usuario para la monitorización y explotación de los resultados de los modelos estadísticos, pasando por la adquisición y preparación de los datos, modelado y entrenamiento de modelos, evaluación de resultados, y empaquetado de los modelos como servicio.

Objetivos

El objetivo de este curso es resolver las principales dudas con las que se enfrentan los jefes de proyecto y desarrolladores a la hora de desarrollar una solución de Big Data Analytics en la empresa. Se cubre el ciclo de vida de la ciencia de datos (digitalización, adquisición y preparación de los datos, entrenamiento y evaluación de modelos predictivos, despliegue de modelos, y generación de conocimiento) presentando las principales técnicas a aplicar en cada una de las etapas.

 

Público objetivo

Jefes de Proyecto y desarrolladores que estén interesados en iniciar desarrollos de soluciones Big Data Analytics.

Módulo 1. Introducción

La aparición de nuevos conceptos relacionados con la digitalización y la búsqueda del conocimiento a lo largo de estos últimos años hace que muchos equipos de desarrollo etiqueten equivocadamente su necesidad, lo que conduce a construir sistemas que no van a cumplir con las expectativas.

Nos encontramos casos en los que no se pueden aplicar técnicas de aprendizaje automático porque falta digitalizar los procesos (de negocio, de fabricación, etc.). A veces se desea digitalizar toda una planta cuando una extracción de datos históricos con unos pocos sensores en un cubo multidimensional es suficiente. Hay escenarios que requieren almacenar grandes cantidades de datos. Otros requieren desarrollar herramientas auxiliares que capturen métricas para poder aplicar técnicas de aprendizaje automático. Hay mucha heterogeneidad y no hay una solución única.

En este primer módulo introductorio se presentarán los conceptos clave del dominio y de los proyectos de Big Data Analytics. Se hablará sobre objetivos y expectativas, así como de la evaluación del riesgo asociado a la ejecución del mismo. También se considerarán aspectos transversales como el cambio de cultura en la organización que supone aplicar estas técnicas, el data governance.

  1. Introducción a Big Data Analytics
    • Motivaciones
    • Nuevos conceptos: IoT, BI, IA, Machine Learning, Deep Learning, Data Engineering, Data Science, Data Analytics, Data Governance
    • ¿Qué problema resuelvo con Big Data?
    • Escenarios y retos
  2. Tecnologías Big Data
    • Fundamentos técnicos
    • La era Hadoop
    • Apache Hive
    • La era Spark

Módulo 2. Arquitecturas Big Data

El objetivo de este módulo es resolver las principales dudas con las que se enfrentan los equipos de dirección técnica a la hora de implantar una estrategia de Big Data en su empresa. Así, se cubre desde un vistazo casos prácticos en materia de diseño de infraestructuras Big Data, explotación y analítica de datos, pasando por una revisión de las principales tecnologías que hoy en día pueblan el horizonte de Big Data (para ingesta masiva, consulta, análisis, visualización…), hasta un roadmap para la adopción de dichas técnicas y tecnologías en nuestras empresas.

  1. Quiero ser arquitecto Big Data
    • Ecosistema Hadoop
    • Nuestra pila de servicios
    • Por dónde empezar
    • Despliegue de modelos de Machine Learning
  2. Herramientas disponibles
    • Data Engineer
    • Data Scientist
    • Data Analyst
  3. Casos prácticos
    • La infraestructura de UBER
    • Graph Analytics
    • Procesamiento de Lenguaje Natural
    • Detección de Anomalías
    • Forecasting
  4. Definiendo una estrategia Big Data
    • El equipo Big Data
    • De los datos a las aplicaciones
    • Puesta en marcha

Módulo 3. Adquisición y preparación de los datos

La aplicación de modelos requiere corpus de entrenamiento de calidad que se extraen de las redes de sensores y los sistemas transaccionales.

Se describirán posibles soluciones para capturar, obtener y almacenar la información, en función de la dimensión de los datos y su disponibilidad. Además, se explicarán técnicas de transformación de los datos, prestando especial atención al concepto de calidad del dato.

  1. Ciclo de vida del dato
  2. Digitalización del entorno
    • Instrumentación industrial
    • Sensorización IoT
  3. Extracción de datos
    • Diversidad de orígenes: No SQL, BBDD, ficheros, web, …
  4. Ingesta/Almacenamiento de los datos
    • Data pool, DataLake, DataWarehouse y DataMarts
  5. Entendimiento de los datos
    • Análisis Inicial de los Datos (IDA)
    • Técnicas de formateo
    • Técnicas de limpieza (normalización, estandarización, fusión,...)
    • Adaptación de los datos (imputación de datos faltantes)
  6. Taller: Adquisición y preparación de datos

Módulo 4. Modelos basados en Inteligencia Artificial

La construcción de los modelos que permiten realizar diagnósticos, pronósticos, simulaciones o prescripciones sobre los datos pasa por tres etapas claramente diferenciadas: diagnóstico y análisis exploratorio de datos, construcción y entrenamiento del modelo, y empaquetado para ser consumidos como servicio desde aplicaciones de usuario y cuadros de mando.

En este módulo se presentan las técnicas utilizadas en cada una de las etapas.

  1. Arquitectura de un modelo basado en Inteligencia Artificial
  2. Análisis Exploratorio de Datos (EDA)
  3. Modelado de datos (extracción de características, construcción del modelo, predicción, simulación, prescripción)
  4. Evaluación de resultados
  5. Despliegue de modelos
  6. Taller: Construcción y entrenamiento de Modelos

Módulo 5. Generación de conocimiento

La explotación de los resultados de los modelos es un punto fundamental en los proyectos tanto de BI, como de Data Analytics, dado que permite transformar los datos de entrada y los resultados de los modelos en información y potencialmente en conocimiento para el apoyo a la toma de decisiones. Por ese motivo, en este módulo se mostrarán distintas formas de generación de cuadros de mando para la monitorización en tiempo real de los datos y la explotación de los modelos estadísticos.

  1. Automatización de los mecanismos de captura, limpieza e integración de las fuentes de datos
  2. Soluciones de usuario para el análisis de datos
  3. Integración de modelos estadísticos en cuadros de mandos
  4. Taller: Generación de conocimiento

Este curso puede ser bonificado a través de los créditos de formación de la FUNDAE, siendo ITI la entidad Organizadora del curso. Para ello, la inscripción debe realizarse con al menos 7 días de antelación. Inscripciones posteriores no podrán bonificarse. Si necesita que dicha gestión la realice ITI, póngase en contacto con nosotros en formacion@iti.es con una antelación mínima de 10 días antes del inicio del curso.

Todos los cursos tienen un precio base específico. Sobre el precio base, se podrán aplicar una serie de descuentos en los siguientes casos:

• Inscripción anticipada (30 días antes de la fecha de fin de inscripción).
• Inscripción de más de un alumno de una misma organización*.
• Ser asociados de ITI o disponer de un acuerdo de colaboración con ITI*.

* Estos descuentos no serán de aplicación durante el periodo de inscripción anticipada.

Más información aquí


Inscribirse

Rellena los datos de este formulario y nos pondremos en contacto contigo para confirmar la inscripción a este curso

Datos del participante



Datos de la empresa


Empresa asociada al ITI SiNo


He leído y acepto la política de privacidad

Deseo recibir el Newsletter o boletines de ITI
Deseo recibir el Newsletter o boletines de ITI


Deseo recibir el boletín de formación de ITI
Deseo recibir el boletín de formación de ITI

form-single-oferta-formativa
https://iti.es/gracias-cursos?pid=11161&tipo=formacion

Datos Básicos

Inscripción: Del 04/03/2020 al 09/09/2020
Inicio: 15/09/2020
Fin: 15/10/2020
Duración: 40
Horario: Martes y jueves de 16:00 a 20:00h. AFORO COMPLETO.
Lugar: Aula de formación del Instituto Tecnológico de Informática- ITI. Ciudad Politécnica de la Innovación, Edificio 8G, Cuarta Planta