PROGRAMA

MÁSTER EN BIG DATA Y DATA SCIENCE

Enfoque empresarial y enseñanza de excelencia

Nuestro programa abarca una amplia gama de tecnologías y técnicas de Big Data, desde el uso de sistemas NoSQL hasta el aprendizaje automático y la visualización de datos.

Te convertirás en un experto en la implementación de proyectos de Big Data, utilizando herramientas y tecnologías líderes en la industria.

Además, contarás con el respaldo de profesionales que te guiarán a través de los desafíos y las mejores prácticas de las aplicaciones reales.

ASIGNATURAS PRESENCIALES

3 ECTS

Apache Spark es un entorno de ejecución especialmente orientado al entorno de Big Data por sus capacidades de paralelización y sus librerías específicas (SQL, Streaming, Machine Learning y grafos) para escenarios muy comunes en el universo de Big Data.

En esta asignatura se aprende a resolver problemas utilizando el paradigma de computación en paralelo de Apache Spark y manejar las distintas APIs en Spark disponibles en distintos lenguajes de programación.

Coordinador

Paulo Villegas: Experto en Tecnología y Científico de Datos en Telefónica

Profesores

  • Carlos Alaíz Gudín: Escuela Politécnica Superior
  • Gonzalo Martínez Muñoz: Escuela Politécnica Superior
  • Estrella Pulido Cañabate:  Escuela Politécnica Superior
  • Paulo Villegas: Experto en Tecnología y Científico de Datos en Telefónica

4 ECTS

En esta asignatura se revisan las tecnologías más relevantes para modelar y resolver problemas relacionados con datos. Por un lado, se ven las redes neuronales y modelos de aprendizaje automático de la mano de TensorFlow.

Por otro, modelos aplicados a series temporales y su aplicación y casuística en energías renovables

Coordinador

Estrella Pulido Cañabate: Escuela Politécnica Superior

Profesores

  • Carlos Alaíz Gudín: Escuela Politécnica Superior
  • Ángela Fernández Pascual: Escuela Politécnica Superior
  • Jenaro Gallego Gómez:  Arquitecto de Datos y Soluciones cognitivas. Former IBM
  • Ana González Marcos: Escuela Politécnica Superior
  • Sara Martínez Martínez, Ingeniera especialista en IA y Datos, IBM

4 ECTS

La información multimedia es una de las fuentes de datos más importantes e interesantes y encontramos múltiples aplicaciones en la realidad desde el diagnóstico de enfermedades a través de imágenes pasando por la conducción automática o el mantenimiento de conversaciones con ChatGPT o soluciones cognitivas que incluyan, además, voz.

Esta asignatura repasa las principales tecnologías involucradas y su implementación.

Coordinador

Francisco Gómez Arribas: Escuela Politécnica Superior

Profesores

  • Ainhoa Goñi Espinilla: Data scientist del departamento de Ingeniería algorítmica en el Instituto de Ingeniería del Conocimiento (IIC)
  • Marta Guerrero Nieto: Lingüista Computacional, Coordinadora en Business and Language Analytics en el Instituto de Ingeniería del Conocimiento (IIC)
  • Daniel Ramos Castro: Escuela Politécnica Superior
  • Juan C. Sanmiguel:  Escuela Politécnica Superior

3 ECTS

La oferta de código libre actual ofrece muchas librerías que son capaces de aplicar, en único paso, múltiples técnicas de modelización para así facilitar la selección de los modelos. Sin embargo, la capacidad de entender los datos, analizarlos, discernir y seleccionar los modelos o técnicas estadísticas, para su aplicación en entornos reales, son fundamentales y son el objetivo de esta asignatura.

Coordinador

Francisco de Borja Rodríguez Ortiz: Escuela Politécnica Superior

Profesores

  • Luis Lago Fernández:  Escuela Politécnica Superior
  • Francisco de Borja Rodríguez Ortiz: Escuela Politécnica Superior

5 ECTS

En esta asignatura se estudian y aplican las técnicas de aprendizaje automático, supervisado y no supervisado, para el análisis de datos, identificando sus fortalezas y debilidades en el contexto de grandes volúmenes de datos.

Se presta especial atención al preprocesamiento de los datos: variables identificadas, limpieza y determinación de valores que faltan o atípicos, etc. El estudio se apoya en las herramientas y bibliotecas disponibles en R y Python.

Coordinador

Gonzalo Martínez Muñoz: Escuela Politécnica Superior

Profesores

  • Carlos Alaíz Gudín:  Escuela Politécnica Superior
  • Ana González Marcos: Escuela Politécnica Superior
  • Luis Lago Fernández: Escuela Politécnica Superior
  • Gonzalo Martínez Muñoz: Escuela Politécnica Superior
  • Christian Oliva Moya: Escuela Politécnica Superior
  • Manuel Sánchez Montañés: Escuela Politécnica Superior

3 ECTS

En el diálogo que se realiza con los datos, durante su análisis para poder extraer el conocimiento que está detrás, juega un papel muy importante su visualización. En esta asignatura se estudia y se aprende a elegir el diagrama más adecuado, en función de los datos que se deseen representar, así como identificar patrones.

Se utilizan plataformas como Tableau, Cognos, CartoDB y las librerías más extendidas dentro de Python.

Coordinadora

Rafael Leira Osuna: Especialista en sistemas de monitorización Big Data, Naudit

Profesores

  • Rafael Leira Osuna: Especialista en sistemas de monitorización Big Data, Naudit
  • Sara Martínez Martínez, Ingeniera especialista en IA y Datos, IBM
  • Alberto Torres Barrán: CTO y co-fundador, Komorebi

6 ECTS

La volumetría y necesidades de explotación de los datos en soluciones Big Data implican un análisis detallado de los requisitos para una implementación eficaz. En esta asignatura se instala y administra un clúster de Big Data así como la puesta en marcha del ecosistema de aplicaciones asociado (Hadoop, Spark entre otras).

Adicionalmente, la nube ha desarrollado toda una infraestructura específica para facilitar los despliegues de nuevas plataformas y servicios y se estudia, también, la instalación y el despliegue en clouds privados y públicos tanto de sistemas como de plataformas como servicio.

Coordinador

Francisco Gómez Arribas: Escuela Politécnica Superior

Profesores

  • José Luís García Dorado: Escuela Politécnica Superior
  • Francisco Gómez Arribas: Escuela Politécnica Superior
  • Iván González Martínez: Escuela Politécnica Superior
  • Rafael Leira Osuna: Senior Observability Engineer, Naudit HPCN
  • Miguel Ángel Mora: Escuela Politécnica Superior
  • Víctor Moreno Martínez:  Principal Data Scientist, TomTom
  • Javier Ramos de Santiago: Escuela Politécnica Superior

4 ECTS

La riqueza de los proyectos Big Data no es solo extraer el conocimiento de los datos sino combinar aquellos que, procediendo de distintas fuentes, aportan un valor especial en ese conocimiento. El objetivo de esta asignatura es conocer y entender la problemática de la manipulación del dato desde el origen donde se encuentra, su acceso, control y mejora de su calidad. En ese sentido se estudian y analizan distintas tecnologías involucradas (Apache Nifi, Apache Kafka) así como las problemáticas que aportan distintas fuentes de datos como Internet de las Cosas, Industria 4.0, datos biométricos o biomedicina.

Coordinador

Jenaro Gallego Gómez: Arquitecto de Datos y Soluciones cognitivas. Former IBM

Profesores

  • Francisco Javier Cano Bailén:  Especialista en Ciencia de Datos y Gobierno del Dato. IBM
  • Julián Fierrez Aguilar: Escuela Politécnica Superior
  • Jenaro Gallego Gómez: Arquitecto de Datos y Soluciones cognitivas. Former IBM
  • Aythami Morales Moreno: Escuela Politécnica Superior
  • Pedro Luis Pérez Latorre: Smart Metering Technology Expert. Telefónica Tech
  • Rubén Vera Rodríguez: Escuela Politécnica Superior

4 ECTS

Los proyectos de Big Data suponen considerar todos los pasos del ciclo de vida analítico del dato: Aprovisionar, Persistir, Analizar y Consumir o explotar el resultado. En esta asignatura se revisarán cada uno de los pasos tomando como ejemplos algunos de los componentes más representativos de la industria alrededor del entorno Hadoop o que sean compatibles con ese ecosistema. La implementación de todas esas fases adquiere una personalidad propia y diferente si se están considerando datos estáticos o en movimiento, dado que estas últimas aportan su propia interpretación que, además, esté alineada con los requerimientos especiales de los datos en movimiento (volatilidad del dato, tiempo real, etc. ).

Los componentes que se pueden involucrar en la solución final pueden ser de muy distinta naturaleza y a lo largo de las distintas asignaturas que se han visto en el Máster se han visto distintas alternativas para poder acometer un mismo resultado final. Es el momento de entender cómo se debe acometer un proyecto con el objetivo de determinar cuáles son los requerimientos que van a permitir discernir qué solución se ajusta mejor a los requerimientos iniciales. La sesión de Arquitectura final tiene como objetivo conocer qué requerimientos se deben considerar, cómo clasificarlos y cómo documentar en qué medida se han tenido en cuenta en el diseño final de la solución.

Coordinador

Jenaro Gallego Gómez: Arquitecto de Datos y Soluciones cognitivas. Former IBM

Profesores

  • Jenaro Gallego Gómez: Arquitecto de Datos y Soluciones cognitivas. Former IBM
  • Juan José Sánchez Peña: Departamento de Ciberseguridad de Movistar+

3 ECTS

La búsqueda de la información que necesitamos y la generación de conclusiones y análisis impone una criticidad al hecho de asegurar la confidencialidad, integridad, disponibilidad y autenticidad de los datos. Es fundamental no solo manejar los procedimientos estándar para el cifrado de información sino conocer las principales técnicas para el establecimiento de procedimientos de control de acceso a la información y, también, conocer los principales mecanismos para la anonimización de datos. Además, se analizan los aspectos legales, epistémicos, éticos y de gestión organizativa en el área del Big Data y de los algoritmos de aprendizaje automático.

Coordinador

Estrella Pulido Cañabate: Escuela Politécnica Superior

Profesores

  • Sergio Galán Martín, Analista de Ciberseguridad, Cellnex Telecom
  • Aythami Morales Moreno: Escuela Politécnica Superior
  • Francisco de Borja Rodríguez Ortiz:  Escuela Politécnica Superior.

ASIGNATURAS NO PRESENCIALES (ONLINE)

Con tres asignaturas online accesibles a través de la plataforma UAMx

3 ECTS

El objetivo es conocer el sistema operativo Linux, organizar y configurar una red de ordenadores, instalar, configurar y administrar un clúster de ordenadores y conocer y gestionar máquinas virtuales

Coordinador

Francisco Gómez Arribas: Escuela Politécnica Superior

Profesores

  • José Luis García Dorado: Escuela Politécnica Superior
  • Francisco Gómez Arribas: Escuela Politécnica Superior
  • Víctor Moreno Martínez: Principal Data Scientist, TomTom
  • Javier Ramos de Santiago:  Escuela Politécnica Superior

3 ECTS

El objetivo es conocer las técnicas de programación utilizando R y Python, diseñar y utilizar de forma eficiente los tipos y estructuras de datos más adecuados en cada entorno y utilizar las librerías de datos más extendidas en ambos lenguajes

Coordinador

Carlos Alaíz Gudín: Escuela Politécnica Superior

Profesores

  • Carlos Alaíz Gudín: Escuela Politécnica Superior
  • Ángela Fernández Pascual: Escuela Politécnica Superior
  • Gonzalo Martínez Muñoz: Escuela Politécnica Superior
  • Alberto Torres Barrán: CTO y co-fundador, Komorebi

3 ECTS

Es innegable que el entorno tecnológico de Big Data está soportado por repositorios de muy distinta naturaleza y especialmente adaptados a los tipos de datos y a su uso. En esta asignatura se estudian y aplican las características, funcionalidades y estructura de las bases de datos NoSQL para permitir su diseño y uso adecuados, así como la implementación de aplicaciones basadas en ellas.

Coordinador

Juan José Sánchez Peña: Departamento de Ciberseguridad de M+

Profesores

  • Carlos Delgado Calle: Analista de Software en el Instituto de Ingeniería del Conocimiento (IIC)
  • Estrella Pulido Cañabate:  Escuela Politécnica Superior
  • Juan José Sánchez Peña: Departamento de Ciberseguridad de M+