PROGRAMA

MÁSTER EN BIG DATA Y DATA SCIENCE

Enfoque empresarial y enseñanza de excelencia

Nuestro programa abarca una amplia gama de tecnologías y técnicas de Big Data, desde el uso de sistemas NoSQL, el aprendizaje automático, IA Generativa  y la visualización de datos.

Te convertirás en un experto en la implementación de proyectos de Big Data con Inteligencia Artificial, utilizando herramientas y tecnologías líderes en la industria.

Además, contarás con el respaldo de profesionales que te guiarán a través de los desafíos y las mejores prácticas de las aplicaciones reales.

ASIGNATURAS PRESENCIALES

3 ECTS

Apache Spark es un entorno de ejecución especialmente orientado al entorno de Big Data por sus capacidades de paralelización y sus librerías específicas (SQL, Streaming, Machine Learning y grafos) para escenarios muy comunes en el universo de Big Data.

En esta asignatura se aprende a resolver problemas utilizando el paradigma de computación en paralelo de Apache Spark y manejar las distintas APIs en Spark disponibles en distintos lenguajes de programación.

Coordinador

Paulo Villegas: Experto en Tecnología y Científico de Datos en Telefónica

Profesores

  • Carlos Alaíz Gudín: Escuela Politécnica Superior
  • Gonzalo Martínez Muñoz: Escuela Politécnica Superior
  • Estrella Pulido Cañabate:  Escuela Politécnica Superior
  • Paulo Villegas: Experto en Tecnología y Científico de Datos en Telefónica

4 ECTS

En esta asignatura se revisan las tecnologías más relevantes para modelar y resolver problemas relacionados con datos. Por un lado, se ven las redes neuronales y modelos de aprendizaje automático de la mano de TensorFlow.

Por otro, modelos aplicados a series temporales y su aplicación y casuística en energías renovables

Coordinador

Estrella Pulido Cañabate: Escuela Politécnica Superior

Profesores

  • Carlos Alaíz Gudín: Escuela Politécnica Superior
  • Ángela Fernández Pascual: Escuela Politécnica Superior
  • Ana González Marcos: Escuela Politécnica Superior
  • Sara Martínez Martínez, Ingeniera especialista en IA y Datos, IBM

5 ECTS

La información multimedia es una de las fuentes de datos más importantes e interesantes y encontramos múltiples aplicaciones en la realidad desde el diagnóstico de enfermedades a través de imágenes pasando por la conducción automática o el mantenimiento de conversaciones con ChatGPT o soluciones cognitivas que incluyan, además, voz.

Esta asignatura repasa las principales tecnologías involucradas y su implementación.

Coordinador

Francisco Gómez Arribas: Escuela Politécnica Superior

Profesores

  • Marta Guerrero Nieto: Lingüista Computacional, Coordinadora en Business and Language Analytics en el Instituto de Ingeniería del Conocimiento (IIC)
  • Daniel Ramos Castro: Escuela Politécnica Superior
  • Juan C. Sanmiguel:  Escuela Politécnica Superior
  • Julián Fierrez Aguilar: Escuela Politécnica Superior
  • Rubén Vera Rodríguez: Escuela Politécnica Superior
  • Gonzalo Mancera: Escuela Politécnica Superior
  • Sergio Gil: Data scientist del departamento de Ingeniería algorítmica en el Instituto de Ingeniería del Conocimiento (IIC)

3 ECTS

Aplicación de IA generativa al procesamiento de Imagen

1.1. Introducción a modelos generativos y prompt engineering

1.2. Edición inteligente de imágenes

1.3. Generación de datos sintéticos para entrenamiento de modelos

Aplicación de IA generativa para acceso Inteligente a la Información

2.1. Búsqueda avanzada de información

2.2. Recomendación personalizada de información

2.3. Síntesis y explicación de información recuperada

Inteligencia Artificial Explicable (XAI)

3.1. Introducción a la XAI. Motivación, definiciones

3.2. Algoritmos genéricos de explicabilidad (SHAP y LIME)

3.3. Algoritmos específicos de explicabilidad para Deep Learning DL, basados en gradientes y LRP

3.4. Comparación de algoritmos de explicabilidad: Coeficiente de Explicabilidad-Rendimiento EPC

3.5. Introducción a la Interpretabilidad global de los modelos de DL y RNNs

Aplicación de IA Generativa en la actualidad

4.1. Casos de uso en investigación

4.2. Casos de uso en la empresa

Coordinador

José Luís García Dorado: Escuela Politécnica Superior

Profesores

  • Juan C. Sanmiguel: Escuela Politécnica Superior
  • Ivan Cantador: Escuela Politécnica Superior
  • Alejandro Bellogin: Escuela Politécnica Superior
  • José Luis Jorro Bellogin: Escuela Politécnica Superior
  • Daniel Perdices BurreroEscuela Politécnica Superior
  • Rafael Leira Osuna: Senior Observability Engineer, Naudit HPCN

3 ECTS

La oferta de código libre actual ofrece muchas librerías que son capaces de aplicar, en único paso, múltiples técnicas de modelización para así facilitar la selección de los modelos. Sin embargo, la capacidad de entender los datos, analizarlos, discernir y seleccionar los modelos o técnicas estadísticas, para su aplicación en entornos reales, son fundamentales y son el objetivo de esta asignatura.

Coordinador

Francisco de Borja Rodríguez Ortiz: Escuela Politécnica Superior

Profesores

  • Luis Lago Fernández:  Escuela Politécnica Superior
  • Francisco de Borja Rodríguez Ortiz: Escuela Politécnica Superior

5 ECTS

En esta asignatura se estudian y aplican las técnicas de aprendizaje automático, supervisado y no supervisado, para el análisis de datos, identificando sus fortalezas y debilidades en el contexto de grandes volúmenes de datos.

Se presta especial atención al preprocesamiento de los datos: variables identificadas, limpieza y determinación de valores que faltan o atípicos, etc. El estudio se apoya en las herramientas y bibliotecas disponibles en R y Python.

Coordinador

Gonzalo Martínez Muñoz: Escuela Politécnica Superior

Profesores

  • Carlos Alaíz Gudín:  Escuela Politécnica Superior
  • Ana González Marcos: Escuela Politécnica Superior
  • Luis Lago Fernández: Escuela Politécnica Superior
  • Gonzalo Martínez Muñoz: Escuela Politécnica Superior
  • Christian Oliva Moya: Escuela Politécnica Superior
  • Manuel Sánchez Montañés: Escuela Politécnica Superior

3 ECTS

En el diálogo que se realiza con los datos, durante su análisis para poder extraer el conocimiento que está detrás, juega un papel muy importante su visualización. En esta asignatura se estudia y se aprende a elegir el diagrama más adecuado, en función de los datos que se deseen representar, así como identificar patrones.

Se utilizan plataformas como Tableau, Cognos, CartoDB y las librerías más extendidas dentro de Python.

Coordinadora

Rafael Leira Osuna: Especialista en sistemas de monitorización Big Data, Naudit

Profesores

  • Rafael Leira Osuna: Especialista en sistemas de monitorización Big Data, Naudit
  • Sara Martínez Martínez, Ingeniera especialista en IA y Datos, IBM
  • Alberto Torres Barrán: CTO y co-fundador, Komorebi

5 ECTS

La volumetría y necesidades de explotación de los datos en soluciones Big Data implican un análisis detallado de los requisitos para una implementación eficaz. En esta asignatura se instala y administra un clúster de Big Data así como la puesta en marcha del ecosistema de aplicaciones asociado (Hadoop, Spark entre otras).

Adicionalmente, la nube ha desarrollado toda una infraestructura específica para facilitar los despliegues de nuevas plataformas y servicios y se estudia, también, la instalación y el despliegue en clouds privados y públicos tanto de sistemas como de plataformas como servicio.

Coordinador

Francisco Gómez Arribas: Escuela Politécnica Superior

Profesores

  • José Luís García Dorado: Escuela Politécnica Superior
  • Francisco Gómez Arribas: Escuela Politécnica Superior
  • Iván González Martínez: Escuela Politécnica Superior
  • Miguel Ángel Mora: Escuela Politécnica Superior
  • Javier Ramos de Santiago: Escuela Politécnica Superior

4 ECTS

Los proyectos de Big Data suponen considerar todos los pasos del ciclo de vida analítico del dato: Aprovisionar, Persistir, Analizar y Consumir o explotar el resultado. En esta asignatura se revisarán cada uno de los pasos tomando como ejemplos algunos de los componentes más representativos de la industria alrededor del entorno Hadoop o que sean compatibles con ese ecosistema. La implementación de todas esas fases adquiere una personalidad propia y diferente si se están considerando datos estáticos o en movimiento, dado que estas últimas aportan su propia interpretación que, además, esté alineada con los requerimientos especiales de los datos en movimiento (volatilidad del dato, tiempo real, etc. ).

Los componentes que se pueden involucrar en la solución final pueden ser de muy distinta naturaleza y a lo largo de las distintas asignaturas que se han visto en el Máster se han visto distintas alternativas para poder acometer un mismo resultado final. Es el momento de entender cómo se debe acometer un proyecto con el objetivo de determinar cuáles son los requerimientos que van a permitir discernir qué solución se ajusta mejor a los requerimientos iniciales.

El objetivo de esta asignatura es conocer y entender la problemática de la manipulación del dato desde el origen donde se encuentra, su acceso, control y mejora de su calidad. En ese sentido se estudian y analizan distintas tecnologías involucradas (Apache Nifi, Apache Kafka) así como las problemáticas que aportan distintas fuentes de datos como Internet de las Cosas, Industria 4.0.

Coordinador

Juan José Sánchez Peña: Departamento de Ciberseguridad de Movistar+

Profesores

  • Juan José Sánchez Peña: Departamento de Ciberseguridad de Movistar+
  • Francisco Javier Cano Bailén: Especialista en Ciencia de Datos y Gobierno del Dato. IBM
  • Pedro Luis Pérez Latorre:Smart Metering Technology Expert. Telefónica TechDa
  • Daniel Perdices BurreroEscuela Politécnica Superior
  • Iván González Martínez:Escuela Politécnica Superior

3 ECTS

La búsqueda de la información que necesitamos y la generación de conclusiones y análisis impone una criticidad al hecho de asegurar la confidencialidad, integridad, disponibilidad y autenticidad de los datos. Es fundamental no solo manejar los procedimientos estándar para el cifrado de información sino conocer las principales técnicas para el establecimiento de procedimientos de control de acceso a la información y, también, conocer los principales mecanismos para la anonimización de datos. Además, se analizan los aspectos legales, epistémicos, éticos y de gestión organizativa en el área del Big Data y de los algoritmos de aprendizaje automático.

Coordinador

Estrella Pulido Cañabate: Escuela Politécnica Superior

Profesores

  • Sergio Galán Martín, Analista de Ciberseguridad, Cellnex Telecom
  • Francisco de Borja Rodríguez Ortiz:  Escuela Politécnica Superior.
  • Gonzalo Mancera: Escuela Politécnica Superior

ASIGNATURAS NO PRESENCIALES (ONLINE)

Con tres asignaturas online accesibles a través de la plataforma UAMx

3 ECTS

El objetivo es conocer el sistema operativo Linux, organizar y configurar una red de ordenadores, instalar, configurar y administrar un clúster de ordenadores y conocer y gestionar máquinas virtuales

Coordinador

Francisco Gómez Arribas: Escuela Politécnica Superior

Profesores

  • José Luis García Dorado: Escuela Politécnica Superior
  • Francisco Gómez Arribas: Escuela Politécnica Superior
  • Víctor Moreno Martínez: Principal Data Scientist, TomTom
  • Javier Ramos de Santiago:  Escuela Politécnica Superior

3 ECTS

El objetivo es conocer las técnicas de programación utilizando R y Python, diseñar y utilizar de forma eficiente los tipos y estructuras de datos más adecuados en cada entorno y utilizar las librerías de datos más extendidas en ambos lenguajes

Coordinador

Carlos Alaíz Gudín: Escuela Politécnica Superior

Profesores

  • Carlos Alaíz Gudín: Escuela Politécnica Superior
  • Ángela Fernández Pascual: Escuela Politécnica Superior
  • Gonzalo Martínez Muñoz: Escuela Politécnica Superior
  • Alberto Torres Barrán: CTO y co-fundador, Komorebi

3 ECTS

Es innegable que el entorno tecnológico de Big Data está soportado por repositorios de muy distinta naturaleza y especialmente adaptados a los tipos de datos y a su uso. En esta asignatura se estudian y aplican las características, funcionalidades y estructura de las bases de datos NoSQL para permitir su diseño y uso adecuados, así como la implementación de aplicaciones basadas en ellas.

Coordinador

Juan José Sánchez Peña: Departamento de Ciberseguridad de M+

Profesores

  • Carlos Delgado Calle: Analista de Software en el Instituto de Ingeniería del Conocimiento (IIC)
  • Estrella Pulido Cañabate:  Escuela Politécnica Superior
  • Juan José Sánchez Peña: Departamento de Ciberseguridad de M+